메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

정근석 (건국대학교, 건국대학교 대학원)

지도교수
윤경로
발행연도
2021
저작권
건국대학교 논문은 저작권에 의해 보호받습니다.

이용수8

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
키포인트 탐지는 이미지나 비디오를 이용하여 사람의 행동을 이해하기 위해 중요한 역할을 한다. 현재에는 컴퓨팅 기술의 발전에 따라 사람의 행동을 눈으로 직접 판단했던 작업에서 키포인트 탐지를 통해 컴퓨터가 사람의 행동을 이해하려는 많은 연구가 활발히 진행되고 있다. 여기서 컴퓨터가 인간의 행동을 이해하기 위한 키포인트 탐지 작업은 크게 2D 휴먼 키포인트 탐지와 3D 휴먼 키포인트 탐지로 나뉜다. 2D 휴먼 키포인트를 이용하여 인간의 행동을 이해하는 것보다 3D 휴먼 키포인트를 이용하여 인간의 행동을 이해하는 것이 더 정확하다. 하지만 3D 휴먼 키포인트를 탐지하려면 이미지 공간은 3차원 공간으로 재구성하는 작업이 필요할 뿐만 아니라 심층 신경망을 이용하여 학습 시 파라미터가 기하급수적으로 늘어나기 때문에 학습 시 많은 시간을 소요하는 문제가 발생한다.
본 논문은 Azure Kinect의 Color 카메라와 Depth 카메라를 이용하여 촬영한 Color 이미지와 Depth 이미지를 이용하여 3D 휴먼 키포인트 탐지기를 제안한다. 제안하는 3D 휴먼 키포인트 탐지기에서 Color 이미지는 사전 학습된 2D 휴먼 키포인트 탐지기를 이용하여 2D 휴먼 키포인트를 탐지한다. 그런 다음 Color 이미지에서 탐지된 키포인트의 좌표를 Depth 이미지에 투영하여 3D 키포인트를 탐지한다. 하지만 위와 같은 방법으로 3D 휴먼 키포인트를 탐지하였을 때, 인간의 신체 표면만 탐지하는 문제점이 발생했다. 이를 해결하기 위해 Azure Kinect Body Tracking SDK를 이용하여 키포인트의 Depth Value를 보정한다.
3D 휴먼 키포인트 탐지 시스템의 성능 평가를 위해 Ground Truth를 제작한다. 제작 방법은 3대의 Azure Kinect를 삼각형 형태로 배치하여 촬영한 영상에 대한 3D 휴먼 키포인트를 추출한 다음 3가지 방향에서 촬영된 3D 휴먼 키포인트의 월드 좌표계를 통일시킨 방법이다.
평가지표 MJPE를 이용하여 본 논문에서 제안하는 3D 휴먼 키포인트 탐지 시스템과 Azure Kinect의 키포인트 탐지기를 Ground Truth와 비교하여 실험한다. 그 결과 본 논문에서 제안하는 3D 키포인트 탐지 시스템이 약 30mm 정확하다. 그리고 속도 측면에서는 대략적으로 초당 20프레임을 처리하는 것을 확인할 수 있다.

목차

제1장 서론 1
제2장 배경지식 및 관련 연구 3
제1절 Microsoft Azure Kinect DK 3
제2절 2D Pose Estimation 6
1. Parts Based Framework 6
2. Bottom-Up Approach 7
제3절 3D Pose Estimation 9
제4절 포인트 클라우드 10
제5절 좌표변환 12
1. 2D 좌표변환 13
2. 3D 좌표변환 15
제3장 3D 휴먼 키포인트 탐지 시스템 19
제1절 3D 키포인트 탐지 시스템 19
제4장 실험 결과 및 분석 28
제1절 Ground Truth 28
제2절 실험환경 31
제3절 실험 결과 및 분석 32
제5장 결론 및 향후과제 36
참고문헌 37
부록 42
부록1 42
부록2 44
ABSTRACT 46

최근 본 자료

전체보기

댓글(0)

0