메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

모경현 (고려대학교, 고려대학교 대학원)

지도교수
강필성
발행연도
2018
저작권
고려대학교 논문은 저작권에 의해 보호받습니다.

이용수0

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
Documents classification aims to analyze keywords or contextual meanings from a given document and classify them into specific categories. In order to successfully perform document classification, it is necessary to accurately extract the word information included in a given document. However, there are many variations of Korean words depending on the types of postposition, rooting and ending. In the case of online documents, these variations become even more severe. Considering the characteristics of these Korean documents, in this paper we propose a document classification method using both word and character information. By using character information, it is possible to consider information that was difficult to express by word set such as typos and emoticons in the document classification process. This model, which combines the features of the whole sentence obtained from the word information and the local features obtained from the character information, experimentally confirmed that it has higher classification performance than the existing models using only word information.

목차

1. 서론 1
2. 선행연구 3
2.1 문법적인 오류 수정 연구 3
2.2 단어 기반 합성곱 신경망을 이용한 문서 분류 연구 4
2.3 자소 기반 합성곱 신경망을 이용한 문서 분류 연구 6
2.4 단어와 자소 기반 신경망을 이용한 문서 분류 연구 7
3. 방법론 9
3.1 양자화 9
3.2 합성곱 신경망 10
3.3 벡터 할당 12
4. 실험 16
4.1 데이터 수집 및 전처리 16
4.2 모델 학습 17
4.3 비교 학습 모형 19
4.4 평가지표 20
5. 실험 결과 22
5.1 분류 성능 22
5.2 모델 소요시간 및 예시 24
6. 결론 및 활용방안 27
[참고문헌] 28

최근 본 자료

전체보기

댓글(0)

0