메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
손계원 (비전21테크) 소준섭 (비전21테크) 고주은 (비전21테크) 이진우 (비전21테크) 이정록 (에이아이리더) 신원선 (비전21테크)
저널정보
한국디지털콘텐츠학회 디지털콘텐츠학회논문지 디지털콘텐츠학회논문지 제25권 제2호
발행연도
2024.2
수록면
547 - 555 (9page)
DOI
10.9728/dcs.2024.25.2.547

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
아동의 음성 인식은 인간-컴퓨터 상호 작용, 교육적 기술에서 중요한 연구 주제로 부각 되고 있다. 아동의 발화는 성인의 발화와 다른 특징이 있어, 기존의 자동 음성 인식 (ASR) 모델은 아동의 음성을 정확하게 인식하는데 어려움을 겪는 경우가 많다. 이 연구에서는 Open AI의 Whisper 모델을 기반으로 4-7세 아동의 음성을 텍스트로 변환하였다. 특히, 아동과 성인의 발화 차이를 고려하여 모델의 성능을 개선하기 위해 데이터 정제와 데이터 셋을 구축하였다. 이러한 작업은 Whisper 모델의 성능을 아동 음성에 최적화하기 위한 학습 데이터 관점에서의 방법을 제시한다. 이 연구의 실험적 접근법은 Whisper 모델을 이용하여 아동의 음성 인식 성능을 향상시키는 방법을 탐구한다. 제시한 방법을 통해 아동 한국어 음성인식의 에러율을 84% 개선하였다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 관련 연구
Ⅲ. 연구 과정
Ⅳ. 연구 결과
Ⅴ. 결론
참고문헌

참고문헌 (0)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-151-24-02-089440526