메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
천재윤 (서강대학교) 조찬송 (네이버) 이정필 (서강대학교) 구명완 (서강대학교)
저널정보
Korean Institute of Information Scientists and Engineers Journal of KIISE Journal of KIISE Vol.48 No.5
발행연도
2021.5
수록면
510 - 517 (8page)
DOI
10.5626/JOK.2021.48.5.510

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
한국어의 정규화 작업은 음성 합성 시스템을 위한 텍스트 전처리 과정에서 중요한 요소이다. 특히 한국어에서 숫자는 문맥 요소에 의해 다양하게 읽히므로 숫자를 한국어로 바꾸는 정규화 기술의 성능이 시스템의 성능과 직결된다. 그러나 이와 같은 한국어에서의 숫자 정규화는 논의된 바가 많지 않으며 기존 모델은 규칙에 기반하고 있어 다양한 맥락에서의 숫자를 한국어로 정규화 하는데 한계를 보인다. 이에 본 논문은 딥러닝을 기반으로 한 한국어에서의 숫자 정규화 모델을 제안한다. 제안 모델은 문장의 음절을 입력으로 하는 시퀀스 투 시퀀스 트랜스포머 모델을 사용하였으며 긴 숫자에 대한 정보로써 숫자 자릿수 인코딩을 결합하였다. 성능 비교를 위해 일반적인 숫자, 새로운 숫자, 비표준적 숫자, 긴 숫자 테스트셋을 사용하여 실험하였다. 그 결과 제안 모델이 규칙 기반 모델과 비교해 일반 테스트셋에서 2%, 비표준적 테스트셋에서 19% 이상의 성능 향상이 있었다. 또한 숫자 자릿수 인코딩을 결합한 제안 모델이 다른 딥러닝 모델에 비해 긴 숫자 정규화에 13% 높은 성능을 보였다.

목차

요약
Abstract
1. 서론
2. 관련 연구
3. 한국어에서의 숫자 정규화
4. 모델 설명
5. 실험
6. 결론
References

참고문헌 (15)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0