메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

장시영 (서울과학기술대학교, 서울과학기술대학교 대학원)

지도교수
김경옥
발행연도
2017
저작권
서울과학기술대학교 논문은 저작권에 의해 보호받습니다.

이용수0

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
텍스트 분류에서 변수 선택의 목표는 분류의 성능을 향상하기 위해 다른 변수와 구별되는 변수를 선택하는 것이다. NDM(Normalized Difference Measure)은 ACC2(Balanced Accuracy)의 단점을 보완하기 위한 기법으로 특정 클래스의 문서 빈도와 다른 클래스의 문서 빈도의 차이를 비율로 나타내 변수를 평가한다. 그러나 비율로 나타내는 과정에서 클래스 간 절대적인 차이 값의 범위를 크게 벗어나는 점과 대체 값이 필요한 수식의 불안정성의 단점을 가지고 있다. 본 연구에서는 위와 같은 단점을 고려한 TCM(Trigonometric Comparative Measure)을 제안한다. TCM의 성능 비교는 ACC2, NDM, OR(Odds Ratio), GINI(Gini Index) 4가지 기법과 비교한다.

목차

요약 ⅰ
표목차 ⅱ
그림목차 ⅳ
I. 서 론 1
II. 기존 연구 3
III. 새로운 변수 순위 기법 제안 : Trigonometric Comparative Measure (TCM) 6
IV. 실험 계획 9
1. 데이터 세트 9
2. 실험 10
V. 실험 결과 13
1. NDM과 TCM의 한계점 13
1) NDM 13
2) TCM 21
2. 실험 결과 27
Ⅵ. 결론 36
참고문헌 38
영문초록(Abstract) 41

최근 본 자료

전체보기

댓글(0)

0