메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

최재훈 (부산대학교 )

지도교수
권혁철
발행연도
2023
저작권
부산대학교 논문은 저작권에 의해 보호받습니다.

이용수7

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
한국어 발음 변환(Grapheme-to-Phoneme, G2P)은 입력된 문자열에 대해 올바른 발음열을 생성하는 자연어 처리의 분야 중 하나이다. 기존의 발음열 변환 시스템은 발음 규칙과 예외 사전을 이용하여 단어 수준에서 이루어졌다. 이와 같은 시스템은 발음열의 빠른 출력 속도와 일관성 있는 결과를 얻을 수 있다는 장점이 있지만, 규칙과 사전을 구성하는 과정에서 수준 높은 언어학적 지식을 요구하며 시간적 비용이 크다. 또한, 신조어의 지속적인 반영이 필요해 유지보수 측면으로도 좋지 않다. 최근에는 딥러닝(Deep Learning)을 이용해 이와 같은 문제를 해결하려는 시도가 있었다.
본 논문에서는 딥러닝을 이용해 한국어 발음열 변환을 시도하고 출력 생성 방법에 따라 자기 회귀(Autoregressive)와 비자기 회귀(Non-autoregressive) 모델을 비교하고 분석한다. 또한, 표준 발음 규칙에 기반을 둔 음절 제약 방법과 "우리말 샘"을 사용한 기분석 사전의 지식 베이스를 구성하여 한국어 발음열 변환 모델의 성능 변화를 분석한다. 자기 회귀 모델은 문장 정확도가 95.16%를 보였고, 비자기 회귀 모델은 85.72%의 문장 정확도를 보였다. 자기 회귀 모델은 비자기 회귀 모델에 비해 9.69% 더 높은 문장 정확도를 보였지만, 추론 속도는 2.86배 느렸다. 발음열 음절 제약 방법을 적용한 경우, 두 모델 모두 0.25%, 1.21%의 문장 정확도 향상을 보였다. 또한, 기분석 사전을 결합하면 0.06%, 1.21%의 문장 정확도 향상을 보였다. 음절 제약과 기분석 사전을 모두 사용한 경우 자기 회귀 모델은 0.54%의 정확도가 감소했지만 비자기 회귀 모델은 1.5%의 정확도 향상을 보였다.

목차

1. 서론 1
1.1 연구 배경 1
1.2 논문 구성 2
2. 관련 연구 3
2.1 규칙 기반의 발음열 변환 3
2.2 통계 기반의 발음열 변환 5
2.3 딥러닝 기반의 발음열 변환 6
3. 딥러닝 모델과 지식 베이스의 결합 9
3.1 사전 학습된 언어 모델 9
3.2 발음열 어휘의 재구성 13
3.3 발음열 음절 제약 16
3.4 기분석 사전 17
4. 실험 및 평가 19
4.1 실험 환경 및 평가 척도 19
4.2 실험 결과 및 분석 22
5. 결론 및 향후 연구 26
6. 참고 문헌 27
영문 요약 34

최근 본 자료

전체보기

댓글(0)

0