메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
박중희 (연세대학교) 한광희 (연세대학교)
저널정보
한국콘텐츠학회 한국콘텐츠학회논문지 한국콘텐츠학회논문지 제23권 제12호
발행연도
2023.12
수록면
1 - 22 (22page)
DOI
10.5392/JKCA.2023.23.12.001

이용수

DBpia Top 10%동일한 주제분류 기준으로
최근 2년간 이용수 순으로 정렬했을 때
해당 논문이 위치하는 상위 비율을 의미합니다.
표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
본 연구는 TTS와 성우의 감정 음성을 비교한 후, TTS 음성합성에 필요한 SSML의 각 요인을 감정 요소에 맞게 분류하고, 감정표현에 필요한 요인이 무엇인지 알아보았다. 인공 지능 허브(aihub)의 성우 데이터와 SSML을 적용하여 제작한 TTS 음성을 이용하여 분석한 결과, 서사를 적용한 감정분류과제에서는 놀람(47.2%), 혐오(44.4%), 행복(44.4%)의 감정이 정확도 면에서 높게 나타났다. 다차원척도법으로 각 감정의 위치를 분석한 결과 x축은 음높이(pitch), 주파수변동률(Jitter)이 주요인이었고, y축으로는 음크기변화인 진폭변동률(shimmer)과 말의 속도, 배음 간 잡음비(NHR)가 주요인이었다. 비서사적 감정 음성에 대한 청자들의 심리적 평가결과 Perfect Confirm, Error-Confirm, Correct Confuse, Error Confuse그룹으로 분류하였으며, 그 결과 완벽한 분류를 나타내는 Perfect Confirm이 높은 감정 오디오 데이터는 슬픔(63.89%), 중립(52.78%) 순으로 나타났다. SSML를 이용한 감정제어에서 중요한 요소는 포먼트주파수, 음높이(pitch), 음의 길이(Duration), 주파수변동률(Jitter), 진폭변동률(shimmer), 배음 간 잡음비(NHR)이었다. 따라서, 청자들의 지각 요소와 음향학적 특징을 모두 고려한 TTS에 대한 SSML의 설계는 인공지능 TTS제작시 비용을 줄여주는 음성 활용 시스템 개발에 도움을 줄 것으로 기대한다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 이론적 배경
Ⅲ. 연구 방법 및 절차
Ⅳ. 연구결과
Ⅴ. 논의
참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-151-24-02-089238188