메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

김시연 (명지대학교, 명지대학교 대학원)

지도교수
권동섭
발행연도
2013
저작권
명지대학교 논문은 저작권에 의해 보호받습니다.

이용수14

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
학술 논문의 발행 편수가 급격히 늘어나고 있다. 이에 따라, 많은 양의 신규 논문이 추가 되고 있는 상황에서 사용자가 직접 논문을 검색하여 자신이 원하는 주제의 논문을 찾는 것은 매우 어려운 일이 되고 있다. 따라서 문서 자동 분류 기법을 활용하여 논문을 분류하려는 연구가 활발히 진행되고 있다.
문서 분류 기법은 미리 정의된 범주들을 사용하여 가장 비슷한 범주로 문서를 분류하는 지도학습 기술이다. 문서 분류 기법은 일반적으로 벡터 공간 모델에서 기계학습 알고리즘을 이용하여 단어간 빈도수를 기반으로 유사도를 비교하는 것이다. 하지만, 이러한 분류 기법은 단순한 단어의 유사도에만 초점을 두고 있어 논문이 가지고 있는 참고 문헌, 저자, 출처등 다양한 구조적 정보를 충분히 활용하지 못하고 있다.
본 논문은 대부분의 논문들이 자신과 유사한 연구 주제를 가진 논문을 참조하고 있다는 사실에 기반하여 참조 관계를 활용한 새로운 논문 분류 기법을 제안한다. 제안 기법은 특정 주제에 해당하는 논문은 해당 주제의 중요 논문을 더욱 자주 참조한다는 가정 아래, 특정 주제의 논문들의 참조 관계를 그래프로 표현하고, 페이지 랭크 알고리즘을 이용하여 각 논문의 중요도를 분석한다. 그리고 분류 대상 논문이 참조하는 특정 주제 논문들의 페이지랭크 점수 합을 기반으로 기계학습 알고리즘을 이용하여 해당 문서를 분류한다. 본 논문에서는 또한 이 제안 기법을 기존의 텍스트 기반 문서 분류 기법과 결합하여 특정 주제의 논문을 보다 정확하게 분류하는 하이브리드 문서 분류 기법을 제안한다.
본 제안 기법은 단순히 많은 논문을 참조했다는 정보보다 특정 주제의 논문 중 얼마나 중요한 논문을 참조하고 있는지에 의하여 논문을 분류하므로 특정 주제의 논문을 보다 정확하게 분류할 수 있다. 뿐만 아니라 기존의 다양한 문서 분류 기법과 결합하여 이용이 가능하다.
본 논문은 제안 분류 기법의 성능을 검증하기 위해서 디지털 라이브러리 CiteSeerX와 DBLP에서 제공하는 실제 논문을 대상으로 다양한 실험을 실시하였다. 실험을 통해 제안 기법이 기존의 방법에 비하여 얼마나 정확히 문서를 분류하는지 검증하였고 이를 통해 제안 기법의 우수성을 증명하였다.

목차

제1장.서론 1
1.연구 배경 1
2.연구 목적 및 실험 방법 3
제2장.관련 연구 5
1.문서 분류 기법 5
가.개요 5
나.대표적인 기계학습 알고리즘 8
다.이전 연구 13
2.페이지랭크 15
제3장.페이지랭크 기반 논문 분류 기법 20
1.페이지랭크기반 분류 기법(PageRank-Based Classification) 20
2.텍스트 기반 분류 기법(Text-Based Classification) 25
3.하이브리드 문서 분류 기법(Hybrid Document Classification) 27
제4장.실험 및 결과 29
1.실험 데이터 29
2.실험 설정 및 환경 32
3.실험 평가 방법 33
가.Precision 과 Recall 33
나.The Area Under the ROC Curve(AUC) 35
4.실험 결과 36
가.Precision, Recall 36
나.The ROC Curve, AUC 40
제5장.결론및 향후 연구 과제 44
1.결론 44
2.향후 연구과제 46
참고 문헌 47
Abstract 50

최근 본 자료

전체보기

댓글(0)

0