메뉴 건너뛰기
내서재 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

강화학습 기반 회전식 도립진자 시스템 실시간 제어
추천
검색
질문

Real-time Control of Rotary Inverted Pendulum System based on Reinforcement Learning

논문 기본 정보

자료유형
학술대회자료
저자정보
김주봉 (한국기술교육대학교) 임현교 (한국기술교육대학교) 허주성 (한국기술교육대학교) 김찬명 (한국기술교육대학교) 한연희 (한국기술교육대학교)
저널정보
한국통신학회 한국통신학회 학술대회논문집 2019년도 한국통신학회 동계종합학술발표회 논문집
발행연도
2019.1
수록면
32 - 33 (2page)

이용수

표지
📌
연구주제
본 연구는 Rotary Inverted Pendulum (RIP) 시스템을 모델 기반 강화학습 에이전트의 타겟 환경으로 활용하여 실시간 제어를 구현하는 것을 목표로 한다.
📖
연구배경
RIP는 비선형 제어 시스템을 설명하기 위한 테스트베드로 널리 사용되며, 기존의 복잡한 수학적 제어 모델 대신 강화학습을 통해 안정적인 제어를 달성하고자 한다.
🔬
연구방법
이 연구에서는 Cyber-Physical System (CPS)을 구축하고, MQTT 프로토콜을 통해 물리적 환경과 가상 환경 간의 실시간 통신을 구현하였다. Double Deep Q-Network (Double DQN) 알고리즘을 사용하여 에이전트가 RIP를 제어하도록 학습시켰다.
🏆
연구결과
실험 결과, 강화학습 에이전트는 600 에피소드에서 학습을 종료하였으며, Loss 값이 약 120 에피소드부터 현저히 줄어들어 모델의 성능이 안정적으로 유지됨을 확인하였다.
강화학습 기반 회전식 도립진자 시스템 실시간 제어
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
등록된 정보가 없습니다.

AI 요약

연구주제

본 연구는 Rotary Inverted Pendulum (RIP) 시스템을 모델 기반 강화학습 에이전트의 타겟 환경으로 활용하여 실시간 제어를 구현하는 것을 목표로 한다.

연구배경

RIP는 비선형 제어 시스템을 설명하기 위한 테스트베드로 널리 사용되며, 기존의 복잡한 수학적 제어 모델 대신 강화학습을 통해 안정적인 제어를 달성하고자 한다.

연구방법

이 연구에서는 Cyber-Physical System (CPS)을 구축하고, MQTT 프로토콜을 통해 물리적 환경과 가상 환경 간의 실시간 통신을 구현하였다. Double Deep Q-Network (Double DQN) 알고리즘을 사용하여 에이전트가 RIP를 제어하도록 학습시켰다.

연구결과

실험 결과, 강화학습 에이전트는 600 에피소드에서 학습을 종료하였으며, Loss 값이 약 120 에피소드부터 현저히 줄어들어 모델의 성능이 안정적으로 유지됨을 확인하였다.

주요내용

목차

등록된 정보가 없습니다.

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

댓글(0)

0

첫번째 댓글을 남겨주세요.

UCI(KEPA) : I410-ECN-0101-2019-567-000532744