메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
손효빈 (국립창원대학교) 진교홍 (국립창원대학교)
저널정보
한국정보통신학회 한국정보통신학회 종합학술대회 논문집 한국정보통신학회 2024년도 춘계종합학술대회 논문집 제28권 제1호
발행연도
2024.5
수록면
160 - 163 (4page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
최근 개인화 맞춤 서비스가 강조되면서 정보 간의 유사성 평가가 중요해졌다. 그러나 초기 원시데이터는 라벨링이 없는 상태이기 때문에, 문서 유사성 평가를 적용하기 어려움이 있다. 이때 TF-IDF는 계산 효율이 높고 구현이 간단하며 다양한 언어 및 도메인의 텍스트 데이터에 유연하게 적용할 수 있어 자주 사용된다. 그러나 코퍼스 크기가 작을 경우, 중요도가 낮은 단어들의 IDF가 높아져 유사성 평가가 부정확해질 수 있다. 따라서 본 논문은 이를 개선하기 우해 알고리즘 적용 전 코퍼스 단어 집합에 GPT를 사용하여 주제어를 분류하는 방법을 제안한다. 이를 위해 특정 학회의 2년간 SCIE 논문 코퍼스를 사용했고, 알고리즘 평가를 우해 코퍼스 내의 논문을 참조한 외부 논문을 평가요소로 사용했다. 이후 코퍼스 내 논문과 외부 논문과의 유사성 평가 점수로 기본 TF-IDF와 비교하여 알고리즘 간 평가를 진행하였다.

목차

요약
ABSTRACT
Ⅰ. 서론
Ⅱ. TF-IDF 구조
Ⅲ. 코퍼스 크기에 따른 한계점
Ⅳ. GPT API를 이용한 word set 분류
Ⅴ. 결론
References

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

최근 본 자료

전체보기

댓글(0)

0