메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
김윤진 (가천대학교) 서원철 (부경대학교) 최성철 (가천대학교)
저널정보
한국경영과학회 한국경영과학회 학술대회논문집 2018년 한국경영과학회 춘계공동학술대회 논문집 [3개 학회 공동주최]
발행연도
2018.4
수록면
399 - 403 (5page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
빅 데이터와 머신러닝 기술이 발전함에 따라 Scientomatrics 분야에서 문서를 다루는 새로운 기술들은 더욱 집중 받고 있다. 과학문서를 분류하거나 응집하는 것과 같이 문서를 다루는 기술들을 기반으로 한 머신러닝 기술을 적용시키기 위해서 벡터 공간 안에 과학문서들을 표현하는 것은 중요하다. 과학 문서들을 벡터공간에 표현하는 기존의 방법론은 문서에 포함되어 있는 단어들을 활용한다. 이것은 기존의 텍스트 마이닝 기술로서, Bag of Words나 TF-IDF같은 기술 또한 포함된다. 상대적으로 간단한 방법론이다. 하지만 과학문서에는 많은 단어들이 존재하기 때문에, 벡터공간과 같이 문서를 표현하는 공간 안에서 지나치게 크고 희박한 벡터를 생성하는 것은 한계가 있다.
본 연구는 과학 기술 문서에 어떤 방식으로 단어 분산 표현을 적용하는 지를 설명한다. 단어 분산 표현은 최근에 딥러닝 방법론 분야에서 활발히 진행되고 있는 feature representation 기술 중 하나이다. 이전에 제안되었던 기술로는 하나의 과학 문서에 대해 분산된 벡터 표현을 하는 Citation2Vec이 있다. 본 논문에서 제안된 방법론은 과학 문서들에 머신러닝을 적용하기 위한 유용하며 기초적인 feature representation으로 활용 될 수 있다.
많은 양의 과학 기술 문서를 분석하여 의미 있는 결과를 얻는 과학 계측법 분야에서, 급격하게 증가하고 있는 문서와 특허들에 대하여 전문가들은 새로운 가능성과 도전할 만한 가치를 찾는 문제에 직면해 있다. 전문가들은 문서나 문장을 컴퓨터가 처리하기 효율적인 형식으로 바꾸고 있다. 가장 보편적인 방법은 문서에 포함되어 있는 텍스트 타입의 정보를 벡터 공간의 벡터로 표현하여 문서를 벡터화시키는 것이다.
본 논문에서는 특허 문서의 초록 정보, 인용정보 그리고 IPC 정보를 사용하여 벡터공간에 특허 문서를 벡터화시켜 표현하는 Patent2Vec을 제안한다.
본 연구의 구성은 다음과 같다. 2장에서는 선행 연구에 대해 설명하고, 3장에서는 뉴럴임베딩 방법론을 적용한 실험 방법에 대해 설명한다. 4장에서는 실험 결과를 설명한다. 마지막으로 5장에서는 결론 및 향후 연구 과제를 제시한다.

목차

초록
1. 서론
2. 선행 연구
3. 연구방법
4. 실험 결과
5. 결론 및 향후 계획
참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2018-325-002102195