메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

고운 (이화여자대학교, 이화여자대학교 대학원)

지도교수
조동섭
발행연도
2019
저작권
이화여자대학교 논문은 저작권에 의해 보호받습니다.

이용수20

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
본 연구는 전자 문서 감정을 위한 것으로 전문적인 디지털 포렌식 기술이 요구되는 전자 문서 감정 업무의 효율성과 감정 결과의 신뢰성을 높이는 것을 목적으로 한다. 연구 내용은 전자 문서에서 사용된 한글 폰트 종류를 인식하기 위해 딥러닝(Deep Learning) 기법 중 하나인 CNN(Convolutional Neural Network)을 이용하여 한글 폰트의 분류 기준이 되는 특징을 학습을 통해 자동으로 추출하고 한글 폰트를 인식하고 분류하는 것이다.
전자 문서의 폰트 인식에 사용되는 한글 폰트로 감정 업무에서 활용도가 높은 한글 폰트 12개를 선정하고 약 23만개의 한글 폰트 이미지 데이터 셋을 구축하여 딥러닝 학습 모델의 학습과 검증에 사용한다. 이후 학습 모델의 신뢰성을 검증하기 위해 실제 문서 감정 증거물 형태와 동일한 테스트 셋을 이용하여 학습 모델의 성능을 분석하였다.
본 논문에서 제안하는 CNN 모델인 배치 정규화 기법(Batch Normalization method)을 적용한 간소화 된 VGGNet으로 실험한 결과, 한글 폰트 인식 정확도는 97.0% 이며, 학습된 형태가 아닌 인쇄 후 스캔한 문서에서 추출한 한글 폰트 이미지를 적용했을 때 88.2% 의 인식률을 나타냈다. 이 같은 모델 검증 및 테스트 결과를 통해 본 연구에서 제안하는 방법이 한글 폰트 인식에 활용될 수 있음을 확인하였다. 또한, 컨볼루셔널 레이어의 특징맵과 완전 연결 레이어의 노드 활성화 분석을 통해 한글 폰트 분류 기준이 문자의 끝 부분과 꺾기는 부분에 있다는 것을 알 수 있었다.
제안하는 모델은 실제 전자 문서 감정 업무를 지원할 수 있는 수준이지만 현재 국내에 유통되고 있는 수많은 한글 폰트 종류들을 인식 및 분류하기 위한 최적의 학습 모델이 되려면 데이터 셋의 확보 및 추가적인 학습 모델 개선 과정이 필요하다. 본 연구 결과를 바탕으로 대량의 폰트 분류를 위한 기능 개선 알고리즘 추가 연구를 진행함으로써 제안하는 분류 모델이 다양한 전자 문서 감정 업무에 적용될 수 있는 소프트웨어 모듈로 활용되길 기대한다.

목차

Ⅰ. 서론 1
A. 연구 배경 1
B. 연구 내용 2
C. 논문의 구성 3
Ⅱ. 관련 연구 4
A. 한글 문자 및 글꼴 구성 4
B. 폰트 인식에 관한 연구 5
Ⅲ. 문서 감정용 CNN의 특징 8
A. 기본적인 CNN 구조 8
B. 다양한 CNN 구조 12
C. 정규화 기법 16
Ⅳ. 문서 감정용 한글 폰트 분류 22
A. 제안하는 CNN 모델 22
B. 데이터 셋 25
C. 기존 CNN 모델과의 비교 28
D. 정규화를 통한 모델 별 분류 성능 평가 29
Ⅴ. 한글 폰트 이미지 인식 및 분류 결과 분석 39
A. 전자 문서 이미지에서의 한글 폰트 인식 및 분류 41
B. 인쇄된 문서에서의 한글 폰트 인식 및 분류 44
C. 한글 폰트 인식 및 분류 기준 분석 48
Ⅵ. 결론 53
A. 연구 결과 및 의의 53
B. 향후 연구 54
참고문헌 55
ABSTRACT 58

최근 본 자료

전체보기

댓글(0)

0