최근 빅데이터 분야가 4차 산업혁명의 핵심 기술로 인식됨에 따라 기업과 학계에서 빅데이터에 대한 연구 활동과 기술 개발이 급속히 증가하고 있다. 이에 본 연구는 동시인용분석을 통해 현 시점까지의 빅데이터 관련 문헌을 분석하여 주요 연구 분야를 도출하고, 빅데이터 연구의 진화 과정을 탐색한다. 빅데이터 관련 논문의 동시 인용 관계를 바탕으로 네트워크 형태의 빅데이터 연구 지도를 생성하고, 클러스터링 분석을 수행하여 빅데이터 분야의 유망 연구 분야(research fronts)를 도출한다. SCOPUS에서 2009년부터 2016년 현재까지 “big data” 키워드가 포함된 약 2만 건의 빅데이터 관련 문헌을 수집한 후, 동시인용 분석을 통해 최종적으로 484개의 노드로 구성된 빅 데이터 연구 지도를 추출하였다. 클러스터링 분석을 통해 빅데이터의 유망 연구 분야로써 Cloud Computing, ETL(Extraction, Transformation, Loading), Privacy and Security, Big data Analytics in Social Science, Data Visualization, Data Clustering, Hadoop MapReduce, Semantic Analysis, Trends in Big Data Analytics, Pattern Recognition, Distributed Storage System, Deep Learning, Machine Learning, MapReduce Technology, Sentiment Analysis and Opinion Mining, Review and Survey of Big Data Research, Decision Tree, Online Aggregation, Overview of Big Data Analytics, Image Feature Extraction, Community Detection in Large Networks, Collaborative Filtering의 22개 군집을 도출하였다. 또한 빅데이터 수집, 빅데이터 공유, 빅데이터 저장, 빅데이터 처리, 빅데이터 분석, 빅데이터 시각화의 6개 세부 분야별로 네트워크를 구축하여 핵심 문헌을 탐색하였다. 본 연구를 통해 빅데이터 분야의 연구 현황과 기술 발전 특성을 파악할 수 있으며, 이는 기업 및 대학, 정부의 빅데이터 관련 주요 연구 과제 발굴 및 향후 연구 방향 수립에 활용될 수 있을 것으로 기대된다.
As big data is recognized as core technology for the fourth industrial revolution, research activities and technology developments on big data in industry and academia have been rapidly increasing. This research aims to identify research fronts of big data and explore the evolution of its intellectual structure by using co-citation analysis of the big data literature. About 20,000 articles and proceedings published from year 2009 to 2016 were collected from SCOPUS. As a form of network, the research landscape of big data composed of 484 papers was then constructed based on co-citation relationships. Clustering analysis on the network yielded 22 research fronts of big data research: Cloud Computing, ETL(Extraction, Transformation, Loading), Privacy and Security, Big data Analytics in Social Science, Data Visualization, Data Clustering, Hadoop MapReduce, Semantic Analysis, Trends in Big Data Analytics, Pattern Recognition, Distributed Storage System, Deep Learning, Machine Learning, MapReduce Technology, Sentiment Analysis and Opinion Mining, Review and Survey of Big Data Research, Decision Tree, Online Aggregation, Overview of Big Data Analytics, Image Feature Extraction, Community Detection in Large Networks, and Collaborative Filtering. The six sub-networks of big data research were also constructed and explored. This research revealed the state-of-the-art of big data research and its promising research fronts. The findings of this research are expected to effectively used for research planning and policy making in big data research.
Ⅰ.서론 11.연구의 배경 및 필요성 12.연구 목적 및 범위 2Ⅱ.문헌 연구 31.빅데이터 연구 32.동시인용 분석 연구 63.네트워크 분석 연구 8Ⅲ.연구방법 131.연구 프레임워크 132.연구 데이터 143.분석 방법 15IV.빅데이터 동시인용 네트워크 161.빅데이터 동시인용 네트워크 시각화 162.빅데이터 연구 클러스터 분석 193.빅데이터 동시인용 네트워크 요약 21V.빅데이터 기술별 동시인용 네트워크 241.빅데이터 수집 분야 242.빅데이터 공유 분야 273.빅데이터 저장 분야 314.빅데이터 처리 분야 355.빅데이터 분석 분야 386.빅데이터 시각화 분야 427.빅데이터 기타 분야 44Ⅵ.결론 47참고문헌 49