메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

이수지 (서울대학교, 서울대학교 대학원)

발행연도
2019
저작권
서울대학교 논문은 저작권에 의해 보호받습니다.

이용수13

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
해당 논문에서는 End-to-End 딥러닝을 활용하여 한국어 음성인식 모형을 구현하였다. End-to-End 딥러닝 중에서도 특히 CTC, Attention 방법을 활용하였으며 각 인코더와 디코더는 CNN, RNN을 기반으로 하였다. 음성 데이터는 우리말샘 온라인 사전과 한국어 낭독체로부터 수집하여 MFCC 변환하였다. 인코더의 입력값으로 한국어 초중종성을 분리하여 모형에 활용하였으며 디코딩하는 과정에서 유한 오토마타와 빔서치를 결합한 알고리즘을 통해 다시 초중종성 순서에 맞게 결합하였다. 실험은 네가지로 진행하였다. 먼저 노이즈 데이터에 대해 어떤 모형이 민감도가 낮은지 알아보았고 Attention 모형에서 인코더와 디코더의 layer 수에 따라 성능이 어떤지 확인해보았다. 또한 변분 베이즈 방식을 활용하여 음성인식에 적용해보아 기존의 방식과 비교하였다. 최종적으로 추가적인 언어모델을 적용했을 때 각 perplexity를 확인해보았다.

목차

Chapter 1 서론 1
Chapter 2 본론
2.1 모형 설명
2.1.1 CTC 3
2.1.2 Seq2Seq와 Attention 4
2.1.3 Bayesian deep learning 7
2.2 분석
2.2.1 데이터 설명 11
2.2.2 데이터 처리 11
2.2.3 모형 설정 16
2.2.4 결과 18
Chapter 3 결론 22
Bibliography 24
Abstract 26

최근 본 자료

전체보기

댓글(0)

0