메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
채재민 (국민대학교) 이수찬 (국민대학교)
저널정보
대한전자공학회 전자공학회논문지 전자공학회논문지 제58권 제12호(통권 제529호)
발행연도
2021.12
수록면
49 - 56 (8page)
DOI
10.5573/ieie.2021.58.12.49

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
본 논문에서는 비전 트랜스포머(Vision Transformer, ViT)와 합성곱 신경망(Convolution Neural Network, CNN) 구조를 결합한 하이브리드 네트워크를 사용하여 단안 카메라 자세 추정을 위한 비지도 학습 기법을 제안한다. 분류(Classification) 및 분할(Segmentation) 분야에서 최고의 성능을 보여주는 ViT에 영감을 받아서 단안 카메라 자세 추정 문제에 대해 추론하는 부분인 ViT와 Feature를 생성하는 부분인 CNN을 결합하였다. CNN을 통해 생성된 Feature들을 일정한 크기의 패치들로 분할하고 분할된 각 패치들간의 연관성을 ViT의 Self-Attention 연산을 통해 계산하였다. 이때 기존의 ViT와 달리 Self-Attention 연산을 적용 시 패치들의 차원을 점진적으로 축소하여 Self-Attention의 연산량을 감소시켰다. 최종적으로 두 프레임간의 이동, 회전 정보인 6개의 추정값 6DoF를 얻도록 하였다. 실험을 통해 대부분 컨볼루션 층으로만 구성된 이전 CNN 구조와 비교하여 하이브리드 네트워크를 적용하였을 때 성능향상이 있음을 증명하였다. 본 논문은 카메라 자세 추정 문제에 대해 트랜스포머 네트워크와 Self-Attention기반 기법들이 응용될 수 있는 잠재성을 보인다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 본론
Ⅲ. 실험
Ⅳ. 결론
REFERENCES

참고문헌 (11)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0