노이즈 환경에서 효과적인 로봇 강화 학습의 정책 탐색 방법 :Efficient policy search method for robot reinforcement learning with noisy reward

양영하

추천

검색

자료유형: 학위논문

저자정보: 양영하 (서강대학교, 서강대학교 대학원)

지도교수: 이철수

발행연도: 2020

저작권: 서강대학교 논문은 저작권에 의해 보호받습니다.

이용수3

이 논문의 연구 히스토리 (2)

2022

노이즈 환경에서 효과적인 로봇 강화 학습의 정책 탐색 방법

양영하 , 이철수 로봇학회 논문지 2022.03 학술저널

2020

노이즈 환경에서 효과적인 로봇 강화 학습의 정책 탐색 방법

양영하 기계공학과 2020.01 학위논문

이 논문의 후속연구가 궁금하신가요?
연관 학술논문 또는 학술발표를 통해 보다 발전된 연구결과를 확인하실 수 있습니다.
이 논문의 연구 히스토리 확인하기

초록· 키워드

오류제보하기

로봇은 각종 산업과 서비스 분야에서 활발하게 사용되고 있다. 전통적인 로봇은 고정된 환경에서 반복적인 작업을 수행하는데 사용되었으며 기존의 제어 방식으로는 주변 환경이나 다른 사물 등의 물리적 상호관계가 복잡한 문제를 해결하기는 매우 어렵다. 강화 학습은 그런 문제를 풀기위한 기계 학습의 한 방법으로 활발히 연구되었으며 기존의 방식으로는 로봇이 해결하지 못했던 문제에 대한 해답을 내놓고 있다.
모든 물리적 로봇의 학습에 관한 연구들은 공통적으로 노이즈의 영향을 받는다. 로봇의 제어 오차나 측정 장비 성능의 한계, 주변 환경 및 사물과의 물리적 상호관계의 복잡성 등 복합적으로 발생한 노이즈는 학습을 저하시키는 요소로 작용할 수 있다. 가상의 환경에서는 잘 작동하는 학습 방법이 실제 로봇에서는 학습 속도가 떨어질 수 있다.
이에 본 논문은 노이즈 환경에서도 효과적이고 정확한 학습이 가능한 방법으로 가중 합 방법과 선형 회귀 방법을 제안하고자 한다. 그리고 보틀 플리핑 놀이를 로봇에게 학습시키고 기존의 학습 방법과의 비교하여 제안한 방법의 타당성을 검증하였다.

제1장 서론 1
1.1 연구 배경 1
1.2 기존의 연구 5
1.3 연구의 목적 7
제2장 강화 학습 및 시스템 설계 10
2.1 학습 방법 10
2.2 유한차분법 11
2.3 보틀 플리핑 12
2.4 로봇 시스템 설계 13
2.5 동작의 변수화 15
2.6 보상 함수 16
2.7 보상의 노이즈 19
제3장 노이즈의 영향을 줄이는 정책 탐색 방법 20
3.1 가중 합 방법 20
3.2 선형 회귀 방법 22
3.3 탐색 방법 비교 23
제4장 보틀 플리핑 실험 및 결과 25
4.1 유한차분법의 학습 결과 25
4.2 가중 합 방법의 학습 결과 27
4.3 선형 회귀 방법의 학습 결과 34
제5장 결론 41
참고문헌 44

최근 본 자료

전체보기

구분	그룹	데이터 항목
AI 학습용 데이터	원문	원문 PDF 파일
AI 학습용 데이터	원문 + 메타 (기본/상세)	원문 PDF 파일 및 서지정보 CSV
대량 구매용 데이터	B2B 구독 방식	특정 자료 한정으로 원문 접근 권한 부여
대량 구매용 데이터	URL 전달 방식	바로 PDF 뷰어를 열람할 수 있는 URL 제공

구분	그룹	데이터 항목
AI 학습용 데이터	기본 메타	발행기관명, 간행물명, 권호명, 권(vol), 호(issue), 통권, 발행연도, 발행월, 논문명, 저자명, 시작페이지, 종료페이지, 전체페이지, 상세페이지URL
상세 메타 데이터	발행기관 메타	발행기관 이명, 영문명, 창립연도, 홈페이지URL, 발행기관 소개
	간행물 메타	부제목, 간행물 유형, ISSN, ISBN, 최초발행연도, 폐간연도, 간행빈도, 발행주기, 등재사항, 이용수, 피인용수, 권호수, 논문수, 표지이미지
	논문 메타	작성 언어, 부제목, 대등제목, 목차, 키워드, 초록, 이미지, 참고문헌, 이용수, 피인용수, 논문활용도, DBpia통합주제분류, KDC분류, DDC분류, 한국연구재단분류, UCI, DOI
	저자 메타	소속기관, 소속부서, 직급, 연구분야, 연구키워드, 이용수, 피인용수, 저자 논문활용도

구분	그룹	데이터 항목
※ 결합형/맞춤형 메타 데이터는 신청 내용에 따라 다양하게 제공 가능
이용순위 정보	주제분야별 많이 이용된 논문	“인문학”에서 많이 이용된 논문 TOP100
	이용기관별 많이 이용된 논문	“중고등학교”에서 많이 이용된 논문 TOP100
	세부기관별 많이 이용된 논문	“서울대학교”에서 많이 이용된 논문 TOP100
	키워드별 많이 이용된 논문	“Chat GPT”에서 많이 이용된 논문 TOP100
키워드 정보	많이 이용된 키워드	특정기간/분야/저널 내 많이 이용된 키워드
	많이 발행된 키워드	특정기간/분야/저널 내 많이 발행된 키워드
	많이 검색된 키워드	특정기간/분야/저널 내 많이 검색된 키워드
	연구 트렌드 키워드	특정 키워드 연관 연구동향 분석 데이터 키워드

논문 기본 정보

이 논문의 연구 히스토리 (2)

초록· 키워드

목차

최근 본 자료

댓글(0)