최근 정보기술의 발전과 더불어 인터넷 환경의 급격한 변화는 관광객들의 관광정보 탐색, 여행 계획, 소비에 이르기까지 관광생태계에 다양한 방면으로 변화를 가져왔으며 온라인상에서 생성되는 대용량의 데이터들은 관광객들의 인식에 근거한 관광목적지의 이미지와 관광목적지 선택에 커다란 영향을 미치고 있다. 그러므로 관광생태계의 변화 속에서 관광목적지의 전략적인 이미지 마케팅을 위해서는 오프라인뿐만 아니라 온라인상에서 관광객들이 지각하는 관광목적지의 인식에 대한 파악이 반드시 필요하다. 이러한 온라인상의 데이터는 정량적, 정성적 연구가 동시에 가능한 관광정보 수집의 새로운 원천으로써 실시간 축적되는 대량의 데이터를 활용하여 관광지 이미지 파악에 새로운 시각을 제공할 수 있으며, 관광객들을 더욱 폭넓게 이해할 수 있는 기반이 될 수 있다. 따라서 본 연구는 Web 2.0 환경에서 대표적인 커뮤니케이션 수단인 SNS와 빅데이터를 분석하기에 적합한 방법인 텍스트 마이닝 기법을 활용하여 온라인 여행 커뮤니티인 Tripadvisor에서 리뷰 데이터를 수집하고 분석하여 관광지 이미지에 대한 유의미한 정보를 추출하고 관광지 이미지와 경쟁력에 대한 시사점을 제시하는데 목적이 있다. 또한, 이러한 온라인 데이터의 분석절차를 관광분야에 적용 가능하도록 체계화시키고자 한다. 먼저, 온라인 리뷰 데이터 수집을 위하여 전용 웹 크롤러를 개발하였으며 관광지 평가 사이트인 Tripadvisor로부터 분석에 필요한 표본을 수집하였다. 연구에 사용된 유효 표본은 2013년 1월부터 2015년 7월 31일까지 서울의 관광지 17곳(명동, 동대문, 남대문, 남산/N서울타워, 인사동, 신촌, 홍대, 이태원, 롯데월드, 한국전쟁기념관, 국립중앙박물관, 국립민속박물관, 경복궁, 창덕궁, 덕수궁, 창녕궁)을 대상으로 작성된 7,188건의 온라인 리뷰이며 R Programming을 이용하여 텍스트 마이닝 분석을 하였으며 SPSS 21.0을 이용하여 탐색적 요인분석, 신뢰도 분석, 일원분산분석(One-Way ANOVA), 판별분석, 다중회귀분석을 실시하였다. 연구결과, 관광지의 인지적 이미지에 해당하는 8개의 요인과 정서적 이미지에 해당하는 8개의 요인이 도출되었으며, 도출된 관광지 이미지는 관광지 유형별(쇼핑 관광지, 자연 관광지, 문화 관광지, 위락 관광지, 박물관/전시관, 역사 관광지)로 유의한 차이가 있는 것으로 나타났다. 뿐만 아니라 관광지 이미지로 관광지 유형을 구분할 수 있는 특징적인 요인을 밝혔으며 관광지 이미지와 만족도간의 유의한 영향관계를 검증하였다. 본 연구는 정성적 데이터인 온라인 리뷰에서 데이터를 추출하고 가공하여 정량적 분석을 체계화 시키는데 의의가 있으며 이를 바탕으로 인터넷과 모바일을 통하여 기하급수적으로 증가하고 있는 빅데이터를 관광분야에 적용하기 위한 이론적 기반을 제공한 점에서 시사점을 가진다.
Recently, the tourism ecosystem has been diversified into various directions throughout the tourism information search, travel plan, and consumption by the rapid change of internet environment as well as the development of IT technology. Also, the huge capacity of data generated online is affecting significantly the image and the selection of target tourist destinations based on the perception of tourists. Hence, it is inevitable to understand the tourist’s perception on the target destinations through the on-line space as well as the off-line environment, for the strategic image marketing of the target destinations in such a variation of the tourism ecosystem. The online data is a new source for collecting tourism information that is available for the simultaneous quantitative and qualitative research. The large amount of data, accumulated in realtime-basis, can be used to provide a new viewpoint to understand tourist destinations, which also can be the foundation to understand tourists properly. The purpose of this study is to provide the implication for the image and competitiveness of a tourist destination by collecting and analyzing the travellers’ review data in Tripadvisor, one of the representative online tourism communities, and extracting the significant information of the tourist destinations using the text mining procedure, which is a typical analytic method of the communication media, SNS, and big data in the Web 2.0 environment. Additionally, the study has systematized the online data analysis procedure for its application to the tourism business area. Exclusive web-crawler has been developed to collect online review data, and then the samples have been collected from Tripadvisor for further analysis. The samples effective for the research were 7,188 online reviews written for 17 sightseeing sites in Seoul, Korea (Myeongdong, Dongdaemun, Namdaemun, N Seoul Tower on the Mt. Namsan, Insadong, Shinchon, Hongdae, Itaewon, Lotte World, Korean War Memorial Center, National Central Museum, National Folk Museum, Gyeongbok Palace, Changdeok Palace, Deoksu Palace, and Changnyeong Palace) from January till July 31, 2015. Text mining analysis has been employed using the R-Programming, and SPSS 21.0 has been applied for the exploratory factor analysis, reliability analysis, one-way analysis of variance (One-Way ANOVA), discriminant analysis, and multiple regression analysis. In result, 8 factors of the cognitive image and 8 factors of affective image of tourist sites have been deducted. The deduced images of the tourist sites have shown significant difference according to the type of tourist destinations (shopping tour site, natural tour site, cultural tour site, entertainment tour site, museum/gallery, historical tour site). In addition, it has been clarified that tourism destinations can be classified by their images, and the significant influential relations between the tourism site image and satisfaction has also been verified. A contribution of this study is the systematization of quantitative analysis to explore the qualitative data extracted from the online review. This study provided the theoretical ground to apply the big data increasing geometrically through internet and mobile devices to the tourism business field, based on the research result through both quantitative and qualitative data analysis.
제 1 장 서 론 1제 1 절 연구의 배경 및 문제제기 1제 2 절 연구의 목적 및 기대효과 4제 3 절 연구의 방법 및 구성 6제 2 장 이론적 배경 8제 1 절 텍스트 마이닝과 관광콘텐츠 분석 81. 텍스트 마이닝의 개념 및 정의 82. 텍스트 마이닝의 내용 및 과정 143. 텍스트 마이닝을 이용한 관광콘텐츠 선행연구 16제 2 절 관광지 이미지 191. 관광지 이미지의 개념 및 정의 192. 관광지 이미지의 구성요소 233. 관광지 이미지의 인지적·정서적 이미지 25제 3 절 온라인 리뷰와 온라인 관광정보 311. 온라인 리뷰의 개념 및 정의 312. 온라인 구전 관광정보의 개념 및 특성 343. 온라인 리뷰(tripadvisor.com)를 이용한 선행연구 36제 3 장 연구조사 설계 41제 1 절 연구의 절차 및 방법 41제 2 절 자료수집 대상의 선정 461. 온라인 여행 커뮤니티 조사 472. 자료수집 대상 선정 48제 3 절 자료수집 및 처리 511. 웹 크롤러(Web Crawler)를 통한 자료수집 512. 자료 전처리(Data Preprocessing) 55제 4 절 자료 분석 591. 자료 분석체계 592. TF-IDF를 적용한 텍스트 데이터의 가중치 산출 60제 4 장 연구 결과 63제 1 절 데이터 수집 결과 및 표본의 특성 63제 2 절 관광지 이미지 측정 661. 텍스트 마이닝 결과 662. TF-IDF를 이용한 텍스트의 가중치 산출 683. 관광지 이미지 측정을 위한 변수 70제 3 절 관광지 이미지의 구성요인 측정 731. 인지적 이미지의 구성요인 측정 742. 정서적 이미지의 구성요인 측정 78제 4 절 관광지 유형별 관광지 이미지의 활용 811. 관광지 유형별 인지적 이미지의 차이검증 822. 관광지 유형별 정서적 이미지의 차이검증 833. 관광지 유형별 인지적 이미지의 판별분석 854. 관광지 유형별 정서적 이미지의 판별분석 89제 5 절 관광지 이미지와 만족도간의 영향관계 93제 5 장 결 론 96제 1 절 연구의 요약 96제 2 절 연구의 시사점 및 제언 1011. 학문적 시사점 및 제언 1012. 실무적 시사점 및 제언 102제 3 절 연구의 한계점 및 향후 연구 방향 105참 고 문 헌 1061. 국내문헌 1062. 국외문헌 115부 록 129Abstract 138