메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

송성렬 (숭실대학교, 숭실대학교 대학원)

지도교수
길이라
발행연도
2016
저작권
숭실대학교 논문은 저작권에 의해 보호받습니다.

이용수0

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
최근 IT 기기의 소형화, 스마트폰과 센서 기기 등이 발전함에 따라 이러한 기기에서 수집된 데이터를 분석하는 관찰 목적의 모니터링 시스템에 대한 관심이 높아지고 있다. 실시간 데이터를 분석하기 위해 과거의 데이터를 이용하여 모델을 생성해야 하는데 만약 데이터 분포 패턴이 서로 다르다면 모델의 정확도는 떨어 질 수밖에 없다.

따라서 성능을 올리기 위해서는 데이터 분포의 패턴이 바뀔 때 새로운 모델을 생성해 주어야 하며, 새로운 모델을 생성하기 위해서는 전문가가 새로운 학습 데이터에 클래스정보를 입력하는 레이블링을 해야만 한다.

레이블링은 많은 시간과 노력이 요구되며 특히 스트리밍 데이터에서는 더욱 중요한 이슈가 된다. 본 논문에서는 전문가가 입력해야할 레이블링의 양을 줄이면서 분류모델의 성능은 유지할 수 있는 스트리밍 데이터를 위해 군집화를 이용한 앙상블 분류모델을 제안한다. 제안하는 방법은 군집화를 통해 레이블링이 필요한 데이터를 줄일 수 있도록 분류모델을 생성하고 정확도 향상을 위해 k-nn을 모델 개념으로 확장한 방법을 이용하여 앙상블 분류모델을 사용한다. 실험 결과 기존 방법이 사용하는 데이터의 9.8%양 만을 이용하면서도 거의 동등한 정확도를 보였다. 또한 데이터 분포를 사용한 앙상블 방법에 비해 사용되는 데이터가 평균 3% 감소하여 본 논문에서 제안하는 방법이 유용함을 증명하였다.

목차

국문초록 xi
영문초록 xiii
제 1 장 서론 1
1.1 연구의 배경 1
1.2 연구의 필요성 6
1.3 연구 목적 및 범위 10
1.4 논문의 구성 13
제 2 장 관련연구 14
2.1 스트리밍 데이터 14
2.2 스트리밍 데이터를 위한 분류기법 15
2.3 점진적 접근방법 17
2.4 앙상블 접근방법 19
2.3.1 데이터 분포를 적용한 접근방법 24
2.5 k-means 29
2.6 k-NN(k-Nearest Neighbor) 30
제 3 장 연구방법 32
3.1 군집화를 이용한 스트리밍 데이터 분포변화 탐지 34
3.1.1 군집화 기법 비교 34
3.1.2 군집화를 이용한 분류모델 생성 35
3.1.3 군집화를 이용한 분류모델 생성 알고리즘 37
3.2 앙상블 분류결과 융합 40
3.2.1 분류결과 융합 40
3.2.2 분류결과 융합 알고리즘 42
제 4 장 스트리밍 데이터 환경을 위한 분류기 설계 45
4.1 데이터의 분포가 기존과 유사한 경우의 앙상블 분류 46
4.2 데이터의 분포가 기존과 다른 경우의 앙상블 분류 47
4.3 데이터의 분포가 기존과 다른 경우의 군집화 방법 48
4.4 기존 방법과의 비교 50
제 5 장 실험 및 결과 52
5.1 실험 데이터 52
5.2 평가 기준 68 5.3 실험 결과 70
5.3.1 스트리밍 데이터에서 실험결과 71
5.3.2 벤치마크 데이터에서의 TC, RL 실험결과 74
5.3.3 분류기법별 WSF 실험 결과 75
5.3.4 군집수에 따른 WSF 수치 변화 비교 76
5.3.5 사전확률과 분류모델 생성시기 분석 79
5.3.6 WSF값 변화와 모델 생성시기 분석 83
제 6 장 결론 및 향후 연구 86
6.1 결론 86
6.2 향후 연구 88
참고문헌 89
부 록 99

최근 본 자료

전체보기

댓글(0)

0