본 연구에서는 영화진흥원 통합전산망의 영화박스오피스자료와 온라인영화사이트의 리뷰자료를 이용하여 온라인구전을 중심으로 주요 영향요인들이 영화확산에 미치는 영향을 분석하였다. 온라인구전이 영화성과에 미치는 영향을 분석한 많은 선행연구들에서는 온라인구전의 주요 차원인 온라인구전의 양과 방향성의 영향력을 비교하고 있으나, 분석결과는 분석에 사용된 자료나 모형에 따라 다르게 제시되고 있다. 2차자료는 연구자가 사전에 정한 연구설계에 따라 변수의 측정단위가 잘 통제될 수 있는 1차자료와 달리 다양한 패널시계열특성들을 지니기에, 2차자료를 이용한 연구에서는 분석모형이 사용되는 자료의 패널시계열특성을 효과적으로 처리할 수 있어야 한다. 그리고, 2차자료를 이용하여 영화성과를 분석한 연구들에서는 일반적으로 높은 왜도를 지니는 영화성과를 조정하기 위해 로그변환한 영화성과를 선형모형으로 분석하고 있다. 매출이나 관람객수가 매우 큰 흥행실적 상위 영화들의 중요성을 분석과정에서 고려하기 위해서는 로그변환을 하지 않은 영화성과 자체를 비선형모형으로 분석할 필요가 있다. 선행연구들 중에서는 비선형모형으로 분류될 수 있는 Bass 모형을 적용한 연구들이 일부 있으나, 상대적으로 많은 연구들에서는 선형모형인 회귀모형이 적용되어 왔다. 이에 본 연구에서는 한국영화시장에서 2018년부터 2021년까지 4년간 개봉된 연도별 박스오피스 상위 30편에 해당하는 총 118편의 영화를 대상으로 한 주별패널자료에 Mixed-effects Bass 모형을 적용하여 로그변환을 하지 않은 영화성과(관람객수) 자체가 나타내는 영화확산에 개봉첫주(더미변수), 스크린수, 리뷰수, 평점 등의 영향요인들이 미치는 영향을 분석하였다. Mixed-effects Bass 모형은 분석에 사용된 영화패널자료에 내재된 주된 시계열적 특성인 장기적 확산과정은 Bass 모형이 내재하고 있는 확산과정을 통해 반영하고, Bass 모형의 모수인 혁신계수와 모방계수가 영화패널별로 고정효과인 스크린수, 리뷰수, 평점 등의 영향요인들과 변동효과인 오차항에 의해 설명될 수 있는 계층적비선형모형이다. 분석결과 영화확산과정의 혁신계수는 개봉첫주와 스크린수에 유의한 정(+)의 영향을 받고, 모방계수는 리뷰수와 평점에 유의한 정(+)의 영향을 받는 것으로 나타났다. 본 연구의 주요 의의는 다음과 같이 요약될 수 있다. 먼저 본 연구는 온라인구전 등이 영화성과(관람객수)에 미치는 영향을 주별패널자료를 이용하여 분석함에 있어 확산과정을 나타내는 Bass 모형에 대한 추정과 여러 영향요인들과 오차항이 Bass 모형의 모수인 혁신계수와 모방계수에 미치는 영향을 나타내는 회귀식에 대한 추정을 통합하여 추정한 Mixed-effects Bass 모형을 처음으로 적용한 연구이다. 그리고 본 연구는 분석결과 온라인구전의 양(리뷰수)과 방향성(평점)이 모두 통계적으로 유의한 영향력을 지니는 것을 확인하였다.
Purpose and Background: In this study, we analyzed the effects of a few key influencing factors, including eWOM (or online word-of-mouth), on the movie diffusion. One of the main interests in many previous researches aiming to analyze the effects of eWOM in the movie industry is comparing the effects of the two key dimensions (volume and valence) of eWOM, but the analysis results vary depending on the data and models used for the analysis. As the use of secondary data, combining the movie box office data and the web-scraping review data from online movie websites, has become more accessible, there has been an increasing number of studies attempting to explain the movie performance (the movie box office revenue or the number of audiences) using those secondary data. And the main focuses of those studies are the effects of the number of reviews (or the volume of the eWOM) and the average rate of reviews (or the valence of the eWOM) on the movie performance. However, unlike the primary data, where the researcher can control the measurement units of variables according to a predefined research design, such secondary data possesses various panel heterogeneity and time series characteristics that should be effectively handled by the research model. And, in many previous studies analyzing movie performance using secondary data, it is a common practice to analyze log-transformed movie performance variable and to apply a linear model, because the move performance variables are highly skewed due to the exceptionally high revenue or number of audience of a few blockbuster movies. In order to increase the explaining power of the research model, it may be necessary to analyze movie performance variable itself, without log-transformation, using a nonlinear model. Some previous study has applied the Bass model, which can be categorized as a nonlinear model, but relatively more studies have used linear regression models. Research model, data, and results: In this study, we applied the Mixed-effects Bass model to analyze the effects of factors such as the number of screens, the number of reviews and the average rate of reviews on the movie diffusion measured by the movie performance (the number of audience) itself without applying log-transformation. The Mixed-effects Bass model effectively captures the panel heterogeneity and time series characteristics of the movie panel data. It incorporates the primary long-term diffusion process, an inherent characteristic of the data, through the diffusion process inherent in the Bass model. The parameters of the Bass model, the innovation coefficient and the imitation coefficient, with regression models, are explained by both fixed effects (such as the number of screens, the number of reviews, and the average rate of reviews) and random effects (represented by error terms). These two levels (Bass model for movie diffusion and regression models to explain the Bass model parameters) are creating a hierarchical non-linear model. In this study, we are using weekly panel data for a total of 118 movies released in the Korean film market from 2018 to 2021. These movies were selected based on the top 30 box office rankings each year. In the analysis using the Mixed-effects Bass model, in addition to the factors of the number of screens, the number of reviews, and the average rate of reviews, an opening week dummy variable reflecting pre-release expectations was added as an influencing factor for the innovation coefficient and imitation coefficient. The analysis results indicated that the innovation coefficient in the Bass model of the movie diffusion is significantly positively influenced by the opening week and the number of screens, and the imitation coefficient is significantly positively influenced by the number of reviews and the average rate of reviews. Conclusions: The implications of this study can be summarized as follows: Firstly, this study represents the first application of the Mixed-effects Bass model to analyze the effects of factors such as eWOM on movie performance (the number of audience) using weekly panel data. This approach integrates the estimation of the Bass model with the estimation of regression equations. Where the Bass model represents the movie diffusion, and regression equations capture the effects of both fixed effects (such as the number of screens, the number of reviews, and the average rate of reviews) and random effects (represented by error terms) on the innovation coefficient and the imitation coefficient of the Bass model. Additionally, the results of this study confirmed that both the volume of eWOM (the number of reviews) and the valence of eWOM (the average rate of reviews) have statistically significant effects on movie performance (the number of audience).