메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
임혜림 (한양대학교) 오창한 (한국전자통신연구원) 강점자 (한국전자통신연구원) 송화전 (한국전자통신연구원) 박기영 (한국전자통신연구원)
저널정보
대한전자공학회 전자공학회논문지 전자공학회논문지 제62권 제3호(통권 제568호)
발행연도
2025.3
수록면
107 - 116 (10page)
DOI
10.5573/ieie.2025.62.3.107

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
다화자 회의 환경에서 음성인식의 정확성은 회의 내용을 이해하고 요약하는 데 매우 중요하다. 그러나 음성인식 시스템은 배경 소음이나 전문 용어와 같은 음향적 및 언어적 요인으로 인해 성능이 저하될 수 있다. 이를 개선하기 위해, 본 연구에서는 특정 도메인에 최적화된 언어모델을 사용하는 기존 방법과는 다르게, 거대언어모델의 풍부한 언어학적 지식을 활용하여 오류를 포함한 인식결과를 후처리하여 음성인식 성능을 향상시키는 방법을 제안한다. 구체적으로, 음성인식 오류가 포함된 텍스트와 이전 문맥 정보를 거대언어모델의 입력으로 사용하여, 사용자가 실제로 발화한 내용을 모델이 더 정확히 예측할 수 있도록 학습한다. 이 접근법을 실제 음성 데이터와 음성인식 시스템에 적용한 결과, 오류가 유의미하게 감소함을 확인하였다. 특히 영어 강연 코퍼스를 활용한 실험에서는 기존 베이스라인 모델 대비 최대 16.1%의 오류 감소율을 기록하였다. 또한 본 논문에서는 실제 사례를 통하여 거대언어모델이 음성인식 오류를 문맥에 맞게 수정하였음을 제시하였다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 본론
Ⅲ. 실험
Ⅳ. 결론
REFERENCES

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-151-25-02-092452366