지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
이용수11
제1장 서 론 11.1 연구의 필요성 1제2장 관련 연구 32.1 물리 기반 캐릭터 제어 32.2 심층 강화 학습 3제3장 본 문 53.1 유한 상태 기반 보행 제어기 53.1.1 SIMBICON 53.1.2 SIMBICON을 이용한 강화 학습 환경 83.2 강화 학습 113.2.1 마르코프 결정과정 113.2.2 심층 강화 학습 알고리즘 123.2.3 PPO(proximal policy optimization) 123.3 학습 방식 143.3.1 정책 표현 153.3.2 매개변수 설정 163.3.3 행동 값 제한 183.3.4 Early Termination 183.3.5 매개변수 범위 설정 19제4장 결 과 214.1 보행 동작 생성 214.2 기존 방식을 사용한 학습과의 결과 비교 22제 5장 결 론 26참고문헌 27ABSTRACT 29감사의 글 30연구윤리서약서 (국문) 31연구윤리서약서 (영문) 32
0