메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

이종수 (부산대학교, 부산대학교 대학원)

지도교수
백윤주
발행연도
2022
저작권
부산대학교 논문은 저작권에 의해 보호받습니다.

이용수25

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
최근 사용자에게 편의성을 제공하고 접촉을 통한 전염병 감염을 예방을 할 수 있는 언택트 기술인 음성 인터페이스에 대한 연구가 활발하다. 대부분의 음성인식은 연속적 인 음향 스트림에서 발화 정보를 음소 단위로 식별한다. 때문에 음소 단위의 샘플들을 처리할 수 있는 고성능 기기가 필요하다는 문제가 존재한다. 이에 따라 상용화를 위해 경량 임베디드 디바이스에서의 동작을 고려한 연구가 필요하다. 또한, 소음환경에서는 음성인식의 성능이 저하되며 높은 성능을 나타내는 연구들은 대부분 소음환경을 고려 하지 않았다. 또한, 양질의 음성 데이터 수집은 많은 비용과 시간이 소요되므로 음성인 식 시스템 개발의 걸림돌로 작용하고 있다. 강건한 모델을 만들기 위해 학습 시 소음 등을 주입하여 강건성을 높이려는 시도가 있었으며 추가적인 연구가 필요하다.
본 연구에서는 경량 임베디드 디바이스에서 동작이 가능하고 소음환경에 강건성을 가지는 음성 키워드 검출 시스템을 설계 및 구현한다. 이를 위해 경량 딥러닝 모델을 선정하고 경량화를 적용하였다. 소음환경에서의 강건성 증대를 위한 증강기법 및 학습 기법을 제안한다. 제안하는 증강기법은 발화 위치와 마이크 사이의 거리 변화를 고려 하여 학습데이터의 다양성을 증대시키는 방법이다. 또한, 제안하는 학습기법은 다양한 증강기법을 체계적으로 적용하여 모델이 다양한 변이에 대해 충분히 학습할 수 있게 하는 기법이다. 공개 데이터세트 Google speech commands v1로 평가하였다. 제안하 는 학습기법을 적용 한 모델은 무소음 환경에서 95.13%의 정확도를 달성하였다. 소음 환경을 고려하여 학습 한 모델은 두 가지 소음 환경을 가정하고 테스트 하였다. 극심 한 소음 환경과 전체적인 강도의 소음 환경에 대하여 테스트 하였으며 학습된 소음에 대하여 각각 92.37%, 94.7%의 정확도를 달성하였다. 또한, 학습되지 않은 소음에 대하 여 84.19%, 90.1%의 정확도를 달성하였으며 기존 소음환경을 고려한 기법보다 좋은 성능을 나타내었다.

목차

1. 서론 1
2. 연구 배경 및 관련 연구 3
2.1. 연구 배경 3
2.1.1. 음성 키워드 검출 3
2.1.2. 소음환경에서의 음성인식 5
2.2. 관련 연구 6
2.2.1. 키워드 검출 연구 6
2.2.2. 소음환경에서의 음성인식 연구 8
2.2.3. 경량 딥러닝 연구 13
2.3. 문제 정의 및 접근 방법 18
3. 소음환경을 고려한 음성 키워드 검출 시스템 19
3.1. 시스템 설계 20
3.1.1. 음성 데이터 전처리 20
3.1.2. DS-CNN 신경망 23
3.2. 제안하는 모델 학습기법 25
3.2.1. 다이나믹 볼륨 제어 25
3.2.2. 무작위 증강 조합 학습 26
3.3. 온-디바이스 딥러닝 시스템 31
3.3.1. 양자화를 통한 딥러닝 모델 경량화 31
4. 성능평가 32
4.1. 시스템 구현 32
4.2. 실험 데이터 34
4.3. 키워드 검출 시스템 성능평가 36
4.3.1. 제안하는 학습기법 성능평가 38
4.3.2. 제안하는 증강기법 성능평가 40
4.3.3. 경량화에 따른 성능평가 41
4.4. 적용 기법의 영향 실험 42
4.4.1. 음성의 증강기법 적용에 대한 비교 및 분석 42
4.4.2. 소음의 증강기법 적용에 대한 비교 및 분석 43
4.4.3. 소음 주입 방식에 대한 비교 및 분석 44
4.4.4. Sliding window의 size에 대한 비교 및 분석 46
5. 결론 48

최근 본 자료

전체보기

댓글(0)

0