메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
장건업 (서울시립대학교) 홍의경 (서울시립대학교)
저널정보
Korean Institute of Information Scientists and Engineers 한국정보과학회 학술발표논문집 한국정보과학회 2010 한국컴퓨터종합학술대회 논문집 제37권 제2호(C)
발행연도
2010.11
수록면
41 - 46 (6page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
웹 문서 검색 성능을 향상 시킬 수 있는 방법 중 하나로 검색 결과를 클러스터링 하는 방법을 많이 사용한다. 이는 키워드 입력에 의해 1차 검색된 웹 사이트나 웹 문서들을 다시 문서의 특성을 이용하여 클러스터링하여 보여줌으로써, 보다 정확한 웹 문서를 검색하도록 해 준다. 본 논문에서는 한글 웹 문서의 자질 선택과 클러스터링 실험을 위해 웹 포털에서 제공하는 디렉토리 서비스를 이용하여 인덱스를 생성하고 한글 웹 문서를 수집하여 자질 선택과 선택된 자질로 클러스터링 해 보았다. 그 결과 단어 빈도에 의한 한글 웹 클러스터링 결과에 비해 통계적 방법에 의해 추출한 자질로 클러스터링한 결과가 더 나쁘거나, 자질 선택에 사용된 데이터 셋에 따라 큰 성능의 차이를 보였다. 또한 한글 웹 문서의 특성상 기존의 자질 선택 방법으로는 제거하지 못한 불요어들을 제거하고 대표 자질을 추출하는 방법으로 (1) 한글 웹 문서 단위로 문서 내 자질 추출 방법(FDD), (2) 전체 데이터셋 내 자질 추출 방법(AFDD)을 제시한다. 그 결과 한글 웹 문서 단위 내 자질 추출 방법(FDD)와 전체 한글 웹 문서 내 자질 추출 방법(AFDD) 모두 기존의 추출 방법보다 좋은 성능을 보였다. 특히 단어빈도를 이용한 클러스터링 방법을 사용하면 기존 자질 추출 방법에 의한 클러스터링 보다 아주 좋은 결과를 얻을 수 있다.

목차

요약
1. 서론
2. 기존의 웹 문서의 자질 추출 방법
3. 한글 웹 문서의 자질 추출 방법
4. 실험
5. 실험 결과 및 분석
6. 결론
참고 문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2012-569-003971376