요즘 시대적 요구에 따라 인공지능 분야가 활발하게 실생활에 기술적으로 녹아들고 있다. 그중 머신 러닝(Machine Learning)의 딥 러닝(Deep Learning) 기법은 사람의 오차를 줄이고 신속 정확하게 판단하기 위해 더욱 깊숙이 실생활 속으로 파고들고 있다. 그 중 하나인 CNN(Convolutional Neural Network)은 오래 전 사용했던 패턴인식 기술에서 보였던 특징 추출 기법을 활용하고 있다. 이미지 특징(feature) 추출용 필터(filter)와 신경망이 잘 조합된 네트워크로 특징을 잘 표현하는 필터와 라벨(Label) 매칭 모델을 잘 정의하여 비전(Vision), 신호/음성 등의 다양한 분야에 적용하고 있다. 특징 전체를 조망하고 학습하는 강점과 범용성을 갖고 있어 다른 응용분야에 기반 기술로 자리 잡혀 가고 있다. 예를 들면, Facebook에서는 기존 RNN(Recurrent Neural Networks) 기반 번역에서 CNN이 포함된 CSSL(Convolutional Sequence to Sequence Learning)을 오픈소스로 GitHub(2017.05.09.)에 공개하여 언어장벽을 쉽게 넘을 수 있도록 하였다. 최근 10여 년 동안 인공지능의 머신 러닝 등은 의료 영상 자동 분석에 필수 기술로 자리매김하고 있다. 의료 영상 분할(segmentation), 영상 정합(registration), 내용기반 검색이 적용된 인공신경망(ANN : Artificial Neural Network), 조건부 엔트로피 등의 연구 등이 이뤄지고 있다. 구글은 2016년에 의료 분야 학술지(JAMA : Journal of the American Medical Association)에 안저 영상을 기반으로 당뇨성 망막병증을 안과 전문의보다 정확하게 진단하는 알고리즘을 발표했고, 스탠포드는 피부 사진을 이용하여 피부암을 피부과 전문의보다 정확하게 탐지하는 결과를 발표하는 등 전문적인 범위에서 연구가 진행되어왔다. 최근에는 일반인들이 피부로 느낄 수 있도록 머신러닝을 활용한 우울감과 불면의 예측 모형 연구나 헬스케어 등의 연구들이 시작되어 있다. 본 논문에서는 국내외적으로 통칭되는 안면 여드름을 분류하기 위해 히든 계층이 3개 이상 적용된 딥 러닝 구조의 CNN 이미지 분류 기법을 적용하였다. 제공되는 관련 데이터 셋이 없어 이에 관련 자료들을 수집하고, 임의의 데이터가 입력되어 정확도에 손실이 가지 않게 학습되도록 데이터 량을 증량하였다. 대상 선정이유는 산업현장의 결함검출을 위해 제공되는 데이터가 없고, 유사한 특성을 갖는 여드름은 눈으로 확인할 수 있는 피부질환 중 발병시기가 10대~30대 초반까지가 대다수를 이루고, 피부 표면에 발현되기에 쉽게 진행 여부 등을 확인할 수 있는 특징이 있는 여드름을 대상으로 딥러닝 분류기술을 접목하고자 하였다. 발현 후 다양한 치료접근이 가능하기에 치명적 피해는 피할 수 있고, 질병분류코드에 L70으로 지정되어 있으며 그 종류도 많지 않기에 비교적 접근하기 쉬웠다. 질환 발현 부위의 면적이 넓고, 각 발현 지점마다 진행정도가 차이가 나는 특징이 있지만 근본원인 지점은 특정화되어 있다는 것이 특징이다. 구현된 모델은 정확도 약96.26%, 손실률 약5.46%의 성능으로 구현되었다. 검증을 위해 예측 5회 실시하여 100% 성공되었다. 이를 시작으로 의료분야의 실생활에 바로 사용가능한 기술적 접목을 시도하였다. 향후, 산업 현장이나 의료 분야에서나 즉시 이상상태 확인이 필요한 다양한 틈새 시장분야에 적합한 다양한 소규모 시스템의 핵심 기능으로써 적용기능을 확대하고자 한다.
The artificial intelligence field has been actively and technically dissolving in real life according to the demands of the times. Among them, Deep Learning technique of Machine Learning is digging deeper into real life to reduce human error and judge quickly and accurately. One of them, CNN (Convolutional Neural Network), utilizes the feature extraction technique that was seen in pattern recognition technology that was used long ago. It is applied to various fields such as vision, signal / voice, etc. by well-defined filter and label matching model that expresses the features in a network in which a feature extraction filter and a neural network are well combined. It has the strength and versatility to look and learn the whole feature and is becoming a base technology for other application fields. For example, Facebook has released CSSN (Convolutional Sequence to Sequence Learning), which includes CNN, in an existing RNN (Recurrent Neural Networks) based translation to open source GitHub (2017.05.09.). In recent 10 years, machine learning of artificial intelligence has become an essential technology for automatic analysis of medical images. Medical image segmentation, image registration, artificial neural network (ANN) with content-based retrieval, and conditional entropy. In 2016, Google announced an algorithm to diagnose diabetic retinopathy more accurately than ophthalmologists based on fundus images in JAMA (Journal of the American Medical Association). Research has been carried out in a professional range, such as presenting the results of detecting dermatologists more accurately. In recent years, studies have been started to study depression and sleepiness using machine learning, such as the prediction model of insomnia, and health care, so that the general public can feel the skin. In this paper, we applied the CNN image classification technique of deep running structure with three or more hidden layers in order to classify facial acne commonly known as domestic and foreign. Since there is no related data set to be provided, related data is collected, and the amount of data is increased so that arbitrary data is inputted and learned so as not to lose accuracy. The reason for the selection is that there is no data provided for the detection of defects in the industrial field. Acne with similar characteristics can be identified by eye, and the onset of the skin diseases occurs in the early 10s to early 30s. The purpose of this study was to apply deep - run classification technology to acne with characteristics that can be easily checked whether it is progressing easily or not. Since the various treatment approaches are possible after the expression, lethal damage can be avoided, and the disease classification code is designated as L70, and it is relatively easy to approach because there are not many kinds thereof. The area of the disease expression site is wide, and the progression degree differs at each expression point, but the root cause point is characterized. The implemented model is realized with about 96.26% accuracy and about 5.46% loss rate. We conducted the prediction 5 times for verification and it was 100% success. I tried to apply the technology that can be used immediately in real life of a medical field. In the future, we intend to extend the application function as a core function of various small-scale systems suitable for various niche market areas that need immediate confirmation in industrial or medical fields.
목차
국문초록 ⅰ목 차 ⅳ그림목차 ⅶ도표목차 ⅸ약 어 ⅹⅠ. 서 론 11.1 연구배경 및 목적 11.2 연구내용 및 범위 21.3 논문의 구성 3Ⅱ. 데이터 셋과 이미지 분류기 개발동향 및 관련 연구 52.1 데이터 셋 현황 52.1.1 이미지 분류기 성능 검증을 위한 데이터 셋 현황 52.1.2 의료 관련 분야의 데이터 셋 현황 62.1.3 여드름 관련 데이터 셋 정의 62.1.4 여드름 관련 데이터 셋 선정기준 102.1.5 수집 데이터 셋의 한계성 132.2 기존 이미지 분류기 연구현황 142.2.1 딥 러닝 152.2.2 컨볼루션 신경망 172.2.3 신경망과 데이터 셋 량의 관계 202.2.4 시사점 21Ⅲ. 데이터 셋 구성과 이미지 분류기 설계 233.1 제안하는 데이터 셋 233.1.1 제안하는 데이터 셋 정의 233.1.2 제안하는 데이터 셋 수집 243.1.3 제안하는 데이터 셋 증량 253.1.4 데이터 셋 량의 범위 263.2 이미지 분류기 설계 273.2.1 이미지 분류기의 개요 273.2.2 이미지 분류기 구현 절차 및 내용 363.2.3 이미지 분류기의 데이터 처리 흐름 41Ⅳ. 제안하는 데이터 셋 구성과 이미지 분류기 구현 및 고찰 444.1 구현 환경 444.2 각 구성단계별 구현 및 결과 454.2.1 데이터 셋 및 데이터 로드 454.2.2 네트워크 정의 및 경과 474.2.3 네트워크 학습 훈련 및 결과 504.2.4 네트워크 평가 및 결과 554.2.5 네트워크 검증 및 결과 574.3 비교실험 및 결과 584.3.1 KECNN 모델과의 비교 실험 결과 584.3.2 KEVGG 모델과의 비교 실험 결과 684.4 고찰 80Ⅴ. 결 론 81참고문헌 83영문초록 88감사의 글(Acknowledgement) 91