지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
이용수3
제1장 서론 11.1 연구 배경 11.2 기존의 연구 51.3 연구의 목적 7제2장 강화 학습 및 시스템 설계 102.1 학습 방법 102.2 유한차분법 112.3 보틀 플리핑 122.4 로봇 시스템 설계 132.5 동작의 변수화 152.6 보상 함수 162.7 보상의 노이즈 19제3장 노이즈의 영향을 줄이는 정책 탐색 방법 203.1 가중 합 방법 203.2 선형 회귀 방법 223.3 탐색 방법 비교 23제4장 보틀 플리핑 실험 및 결과 254.1 유한차분법의 학습 결과 254.2 가중 합 방법의 학습 결과 274.3 선형 회귀 방법의 학습 결과 34제5장 결론 41참고문헌 44
0