메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
정도윤 (호남대학교) 정회자 (휴넷가이아) 김남호 (호남대학교)
저널정보
한국멀티미디어학회 멀티미디어학회논문지 멀티미디어학회논문지 제27권 제11호
발행연도
2024.11
수록면
1,416 - 1,423 (8page)
DOI
10.9717/kmms.2024.27.11.1416

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
In this paper aims to develop a lip reading system utilizing deep learning technology to enhance the quality of life for individuals with hearing impairments. Specifically, we sought to establish a speak- er-independent lip reading model using a 3D convolutional neural network(3D CNN) and a video classifier. For the dataset, we utilized four lip reading videos from the AI-HUB lip reading speech rec- ognition dataset, which included both expert and general participants in noisy environments. The data were segmented into clips for training purposes. The 3D CNN architecture effectively captured the spa- tiotemporal features of lip movements, while the video classifier applied a multimodal approach to fuse visual and auditory information. The training results achieved a loss of 0.002, a training loss of 0.013, and a training accuracy of 97.4%. This demonstrates the proposed deep learning-based lip reading sys- tem's potential for speaker independence and adaptability in noisy environments. In this paper presents a practical solution that can support communication and social integration for individuals with hearing impairments.

목차

ABSTRACT
1. 서론
2. 관련 연구
3. 제안한 방법
4. 실험 및 결과 분석
5. 결론
REFERENCE

참고문헌 (11)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-151-25-02-091190492