메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

양영하 (서강대학교, 서강대학교 대학원)

지도교수
이철수
발행연도
2020
저작권
서강대학교 논문은 저작권에 의해 보호받습니다.

이용수3

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
로봇은 각종 산업과 서비스 분야에서 활발하게 사용되고 있다. 전통적인 로봇은 고정된 환경에서 반복적인 작업을 수행하는데 사용되었으며 기존의 제어 방식으로는 주변 환경이나 다른 사물 등의 물리적 상호관계가 복잡한 문제를 해결하기는 매우 어렵다. 강화 학습은 그런 문제를 풀기위한 기계 학습의 한 방법으로 활발히 연구되었으며 기존의 방식으로는 로봇이 해결하지 못했던 문제에 대한 해답을 내놓고 있다.
모든 물리적 로봇의 학습에 관한 연구들은 공통적으로 노이즈의 영향을 받는다. 로봇의 제어 오차나 측정 장비 성능의 한계, 주변 환경 및 사물과의 물리적 상호관계의 복잡성 등 복합적으로 발생한 노이즈는 학습을 저하시키는 요소로 작용할 수 있다. 가상의 환경에서는 잘 작동하는 학습 방법이 실제 로봇에서는 학습 속도가 떨어질 수 있다.
이에 본 논문은 노이즈 환경에서도 효과적이고 정확한 학습이 가능한 방법으로 가중 합 방법과 선형 회귀 방법을 제안하고자 한다. 그리고 보틀 플리핑 놀이를 로봇에게 학습시키고 기존의 학습 방법과의 비교하여 제안한 방법의 타당성을 검증하였다.

목차

제1장 서론 1
1.1 연구 배경 1
1.2 기존의 연구 5
1.3 연구의 목적 7
제2장 강화 학습 및 시스템 설계 10
2.1 학습 방법 10
2.2 유한차분법 11
2.3 보틀 플리핑 12
2.4 로봇 시스템 설계 13
2.5 동작의 변수화 15
2.6 보상 함수 16
2.7 보상의 노이즈 19
제3장 노이즈의 영향을 줄이는 정책 탐색 방법 20
3.1 가중 합 방법 20
3.2 선형 회귀 방법 22
3.3 탐색 방법 비교 23
제4장 보틀 플리핑 실험 및 결과 25
4.1 유한차분법의 학습 결과 25
4.2 가중 합 방법의 학습 결과 27
4.3 선형 회귀 방법의 학습 결과 34
제5장 결론 41
참고문헌 44

최근 본 자료

전체보기

댓글(0)

0