지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
이용수
요약
Abstract
1. 서론
2. 확률적인 상태천이를 가진 동적 환경
3. Model-free 강화학습
4. Model-based 강화학습
5. 시뮬레이션 결과 및 분석
6. 결론 및 향후 연구과제
References
논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!
강화학습의 장기간 학습 결과 예측 및 학습 모델 교정 연구
한국통신학회 학술대회논문집
2023 .06
서로 다른 학습 기반을 적용한 강화학습에서의 보상 방법에 관한 연구
한국정보과학회 학술발표논문집
2018 .06
강화학습 알고리즘 기반 실패 상태 도달 성능 비교
Proceedings of KIIT Conference
2022 .12
상태 표현 방식에 따른 심층 강화 학습 기반 캐릭터 제어기의 학습 성능 비교
컴퓨터그래픽스학회논문지
2021 .12
“강화학습” 특집을 내면서
정보과학회지
2019 .11
강화학습 환경에 따른 A2C, DQN 알고리즘의 학습 효율성 비교, 분석
Proceedings of KIIT Conference
2023 .06
실용적 강화학습 기술 동향 : 모방학습부터 오프라인 강화학습까지
한국통신학회논문지
2023 .11
Model-Based Reinforcement Learning with Discriminative Loss
Journal of KIISE
2020 .06
강화학습을 이용한 실내 자율주행 시스템
한국산학기술학회 논문지
2023 .10
Analysis of Reward Functions in Deep Reinforcement Learning for Continuous State Space Control
Journal of KIISE
2020 .01
기계학습 및 기본 알고리즘 연구
한국컴퓨터정보학회 학술발표논문집
2018 .07
심층 Q-네트워크 학습에서 보상 및 학습 진행률 기반 적응형 탐색
한국통신학회 학술대회논문집
2023 .02
강화학습 기반 주식 자동 매매 모델 전략 제안
대한산업공학회지
2021 .08
DQN을 이용한 트레이딩 예측을 위한 강화학습 모델 구현
한국정보기술학회논문지
2019 .04
심층 강화학습 기반 실시간 게임 인공지능 최신 동향
Proceedings of KIIT Conference
2022 .12
학습기반 일사량 예측모델 개발 및 비교
대한설비공학회 학술발표대회논문집
2022 .06
Multi Behavior Learning of Lamp Robot based on Q-learning
디지털콘텐츠학회논문지
2018 .01
Reinforcement Learning for the Consensus of a Multi-agent System with Unknown Time Varying Delays
디지털콘텐츠학회논문지
2022 .07
산업용 사물 인터넷을 위한 프라이버시 보존 연합학습 기반 심층 강화학습 모델
정보보호학회논문지
2023 .12
Improving Retrieval Models through Reinforcement Learning with Feedback
Journal of KIISE
2024 .10
0