메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
장지호 (한국전자통신연구원)
저널정보
대한전자공학회 대한전자공학회 학술대회 2020년도 대한전자공학회 하계종합학술대회 논문집
발행연도
2020.8
수록면
1,324 - 1,327 (4page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
이미지 캡셔닝은 주어진 이미지를 가장 잘 설명하는 문장을 생성하는 문제로서 최근에는 bottom-up 및 top-down attention 및 트랜스포머 구조의 조합이 널리 사용되고 있다. 트랜스포머는 자연어 처리와 같은 시퀀스-시퀀스 전환에서 사용되는 것으로 이를 이미지 캡셔닝에서제성능을 향상시키기 위해 다양한 방법이 제안되었다. 이 논문에서는 기존의 자연어 처리를 위한 트랜스포머의 위치 인코딩(posional encoding)과 같은 어텐션 모듈(attention module)을 대체하기 위해 검출된 객체 사이의 관계 인코딩을 사용하여 성능을 향상하고자 한다.
검출된 물체 사이의 관계를 사용하는 방법이 정량적 및 정성적 평가를 통해 이미지 캡셔닝 결과에 어떻게 영향을 미치는지 확인하고 트렌스포머 구조를 사용할 때 성능을 개선하는 방법을 제안하고자 한다.
이 논문에서는 Facebook에서 시퀀스 모델링 툴킷으로 제공되는 FAIRSEQ를 기반으로 MS-coco 2014 캡션 데이터 세트를 사용하여 실험을 수행하여, 다양한 관계를 사용하여 인코딩을 적용한 결과, 정량적 평가에서 개선이 기본 트랜스포머 위치 인코딩보다 크지 않지만 정성적 평가에서 이미지가 훨씬 잘 설명됨을 확인하였다.

목차

Abstract
Ⅰ. 서론
Ⅱ. 관계 인코딩을 사용하는 트랜스포머
Ⅲ. 실험 및 결과
Ⅳ. 결론 및 향후 연구 방향
참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2020-569-001132216