메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

우효창 (경희대학교, 경희대학교 대학원)

지도교수
이영구
발행연도
2020
저작권
경희대학교 논문은 저작권에 의해 보호받습니다.

이용수38

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
수출입 무역업체는 거래하는 제품에 해당되는 HS코드를 결정하여 세관 신고를 해야 한다. 우리나라의 HS코드는 WCO에서 지정한 세계 공통인 6자리 숫자코드에 세분류한 4자리코드를 추가해서 10자리 HSK를 사용하고 있으며, 이는 관세율 부과, 통관요건 결정, 무역통계 작성 등에 활용된다. 그런데 무역업체간에 실제 거래되는 제품명은 관세청에서 정의한 HS코드의 품명과 일치하지 않아 HS코드를 식별하기 쉽지 않다.

본 연구에서는 세관에 신고된 수출입 신고서의 신고품명, 표준품명, 거래품명, 상표명의 데이터를 빅데이터로 구축함을 전제로 실험용 데이터 파일을 만들고 단어 임베딩 기법인 Word2vec를 활용하여 거래되는 제품명의 다양한 입력값과 빅데이터 기반의 HS품명 데이터 사이의 유사도를 계산하여 가장 가까운 거리에 있는 HS코드를 추출하는 실험을 수행하고 그 평가를 통해 가장 신뢰할 수 있는 HS코드 식별 방안에 대해 제안한다.

빅데이터를 활용하여 무역 거래하는 상품명 또는 제품의 구성 요소 등의 문장만으로도 HS코드를 식별하게 되면 무역업체의 오신고를 방지하고 신고업무 신속성, 효율성 제고효과가 기대된다.

목차

Ⅰ. 서 론 1
II. 배경 지식 3
1. 단어 임베딩 3
1.1 희소 표현 3
1.2 밀집 표현 3
1.3 분산 표현 4
2. WORD2VEC 4
2.1 CBOW 모델 5
2.2 Skip-Gram 모델 7
3. TF-IDF 9
4. NLTK 10
Ⅲ. 설계 및 구현 11
1. 데이터 파일 설계 11
2. HS코드 식별 알고리즘 14
2.1 데이터셋 구성 16
2.2 데이터 정제 16
2.3 단어 벡터 생성 18
2.4 HS코드 추출 20
Ⅳ. 실험 평가 21
1. 실험 준비 21
2. 실험 모델 24
2.1 모노그램 벡터 실험 24
2.2 바이그램 벡터 실험 24
2.3 다중 HS코드 추출 실험 24
3. 실험 결과 25
3.1 모노그램 실험결과 25
3.2 바이그램 실험 결과 29
3.3 다중 HS코드 추출 실험 결과 32
Ⅴ. 결론 34
참고 문헌 36

최근 본 자료

전체보기

댓글(0)

0