메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

김대원 (연세대학교, 연세대학교 대학원)

지도교수
임효상
발행연도
2018
저작권
연세대학교 논문은 저작권에 의해 보호받습니다.

이용수2

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
본 논문에서는 기계학습을 이용하여 데이터스트림에서 개념 변화를 검출하는 기법을 제안한다. 데이터스트림의 환경은 과거에 입력된 데이터들의 경향성이 이후에 입력되는 데이터들의 경향성을 보장하지 않는다는 특징을 갖는다. 기존의 데이터 마이닝, 기계 학습, 샘플링과 필터링 등의 데이터베이스 기반 응용들은 입력되는 데이터들이 고정된 상황에서 데이터들의 경향을 미리 파악한 뒤, 파악한 경향성을 바탕으로 이후의 동작을 수행하는 경우가 많다. 이러한 응용들을 데이터스트림 환경에 그대로 적용하는 경우, 기존의 데이터들과 다른 새로운 경향성을 가진 데이터가 입력되면 새롭게 입력되는 데이터의 경향을 제대로 반영하지 못하여 수행 성능 및 품질이 떨어지는 문제가 발생한다. 따라서 데이터스트림 환경의 응용들이 계속해서 성능을 유지하기 위해서는 새로운 경향성을 띠는 데이터가 입력되는 상황인 개념 변화를 정확히 검출하는 것이 중요하다.
본 논문에서는 데이터스트림에 입력되는 데이터들의 개념들 중 시퀀스에 집중하여, 입력되는 데이터들의 시퀀스가 변화하는 시점을 찾는 연구를 수행한다. 본 논문은 데이터스트림에 입력되는 데이터들 중 서로 유사한 데이터들은 시퀀스 또한 유사할 가능성이 높으며, 서로 유사하지 않은 데이터들은 서로 다른 시퀀스를 가질 가능성이 높다는 점에 착안하여 데이터와 시퀀스 사이의 관계를 패턴화한다. 데이터와 시퀀스 사이의 패턴에 따라 데이터를 분류한 결과들을 비교하는 방식으로 개념 변화를 검출하기 위하여 기계학습을 활용한다. 또한 의미 없는 변화는 무시하고 의미 있는 변화를 검출하기 위하여 개념의 일관성과 지속성을 고려하였다.
본 논문에서 제안하는 개념 변화 검출 기법은 다음과 같은 두 가지 과정으로 이루어진다. 첫번째 과정에서는 클러스터링 기법을 사용하여 데이터스트림의 패턴을 구분하고 데이터와 패턴의 관계를 기계학습을 통해 학습하고 분류한다. 두번째 과정에서는 이렇게 만들어진 기계학습 모델을 사용하여 현재 입력되는 데이터스트림의 개념을 식별하고, 일관성과 지속성을 검사하여 보다 정확하게 개념 변화를 검출한다. 먼저, 레이블 변화에 따른 시퀀스의 변화 수준을 정량적으로 측정하는 레이블 조정 방법을 제안하여 개념의 일관성을 검사하기 위해 활용한다. 다음으로 여러 개의 데이터들을 모아 이들 간의 개념의 일관성을 확인하는 방법을 제안하여 개념의 지속성을 고려한다.
실험을 통해 제안하는 기법이 데이터에 대한 사전 지식이 주어지지 않는 상황에서도 데이터스트림의 개념 변화를 정확히 검출함을 보였다. 이러한 결과로 볼 때 본 논문에서 제안하는 기법이 데이터스트림 환경에서 개념 변화를 검출하는데 유용하게 활용될 수 있을 것으로 판단한다.

목차

등록된 정보가 없습니다.

최근 본 자료

전체보기

댓글(0)

0