메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

이정윤 (인천대학교, 인천대학교 대학원)

지도교수
김재곤
발행연도
2019
저작권
인천대학교 논문은 저작권에 의해 보호받습니다.

이용수1

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (4)

초록· 키워드

오류제보하기
디지털 시대의 도래로 전 세계적으로 웹페이지의 생산과 유통이 폭발적으로 증가하고 있다. 인터넷을 이용하는 사용자들을 중심으로 이러한 방대한 웹페이지들 속에서 자신이 원하는 특정한 정보를 신속하게 찾고 싶어하는 요구가 날이 갈수록 증가하고 있다. 하지만 탐색 대상 정보량이 많아짐에 따라 사용자가 웹서핑을 통해 직접 인터넷 웹페이지에서 원하는 정보를 찾기 위해서는 많은 시간과 노력이 필요하다. 원하는 정보를 얻고자 보편적으로 사용하는 검색엔진은 사용자가 찾고자 하는 정보가 포함된 웹페이지를 인터넷에서 검색하여 사용자에게 제공해 주기는 하나, 검색결과가 방대할 경우 결과 내에서 사용자의 원하는 정보를 찾기 위한 시간과 노력이 추가적으로 많이 요구된다. 따라서 주어진 웹사이트에서 사용자가 필요로 하는 정보를 자동적으로 추출할 수 있는 특정 정보 자동 추출 알고리즘 개발이 필요하다.
본 연구에서는 이런 문제를 해결하고자 머신러닝 기반의 정보 추출 방법을 개발하였다. 머신러닝 기반의 추출기법은 학습 데이터를 사용하여 정보추출 학습 모델을 개발한 뒤 해당 모델을 이용하여 실험 데이터로부터 원하는 정보를 추출하는 방법이다.
본 연구에서는 국제학술대회 웹페이지에서 초록 투고 마감 날짜를 추출하는 문제를 다루도록 한다. 매년 수천 개 이상의 국제학술대회가 세계 곳곳에서 개최된다. 각 국제학술대회는 소개 웹 사이트를 가지고 있으며 개최 날짜, 개최 장소, 인사말, 초록 투고 마감일, 등록 마감일 등과 같은 학`술대회 개최 및 참가에 필요한 전반적인 정보를 제공한다. 이중 초록 투고 마감일은 학술대회 웹 사이트마다 서로 다른 페이지에 다양한 포맷으로 표시되고 해당 정보도 자주 업데이트 되기 때문에 연구자가 정확한 정보를 빨리 파악하기 쉽지 않다.
따라서 본 연구에서는 컨퍼런스 웹사이트에서 논문 초록 마감일을 사람의 개입 없이 자동으로 추출하는 알고리즘을 개발하고자 한다. 컨퍼런스 마다 논문 초록 마감일이 존재하는 경우도 있고 그렇지 않은 경우도 있기 때문에, 해당 웹 사이트가 논문 초록 마감일을 가지고 있는 경우에는 정확한 정보를 추출하고 그렇지 않은 경우에는 원하는 정보가 존재하지 않음을 알려주는 알고리즘을 개발하도록 한다.

목차

제 1 장 서 론 1
1.1 연구배경 1
1.2 관련 연구동향 1
1.3 연구 목적 2
제 2 장 데이터 6
2.1 데이터 수집 6
2.2 데이터 전처리 6
2.3 부분 트리 정렬 20
제 3 장 머신러닝 모델 12
3.1 SVM 모델 12
3.2의사결정 모델 13
3.3 인공신경망 모델 13
제 4 장 실험 및 결과 16
4.1 부분 트리 정렬 모델 실험 16
4.2 머신러닝 모델 실험 17
제 5 장 결론 23

최근 본 자료

전체보기

댓글(0)

0