지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
이용수15
국문 요지 VI제1장 서 론 11. 1 연구 배경 11. 2 관련 연구 31. 3 연구 목표 및 개요 4제2장 이 론 62. 1 마르코프 결정 프로세스(MARKOV DECISION PROCESS) 62.1.1 정의 62.1.2 MDP의 목표 72.1.3 동적 프로그래밍(Dynamic Programming) 72. 2 몬테카를로 트리 서치(MONTE-CARLO TREE SEARCH) 82.2.1 UCB 알고리즘 92.2.2 연속적인 공간에서의 몬테카를로 트리 서치 102. 3 적대적 생성 연결망(GENERATIVE ADVERSARIAL NETWORK) 112.3.1 GAN 학습 순서 122.3.2 GAN 손실 함수(Loss Function) 122. 4 적대적 생성 연결망을 이용한 경로 예측(SOCIAL-GAN) 132.4.1 Social GAN 모델의 방법론 142.4.2 S-GAN 손실 함수 172. 5 지능형 운전자 모델(INTELLIGENT DRIVER MODEL) 17제3장 방법론 193. 1 마르코프 결정 프로세스 문제 모델링 203.1.1 상태 공간(State Space) 203.1.2 행위 공간(Action Space) 213.1.3 전이 함수(Transition Function) 223.1.4 보상 함수(Reward Function) 233.1.5 삭감 요소(Discount Factor) 253. 2 GAN을 활용한 전이 함수 모델 253. 3 롤아웃(ROLLOUT) 27제4장 결 과 284. 1 생성자(GENERATOR) 검증 284.1.1 학습 데이터 셋(Dataset) 284.1.2 예측 성능 평가 284.1.3 제어차량의 행위에 따른 주변 차량의 반응 검증 304. 2 알고리즘 검증 334.2.1 시뮬레이션 환경 344.2.2 시뮬레이션 354.2.3 성능 지표 평가 39제5장 결 론 43REFERENCES 45ABSTRACT 48
0