초록·
키워드
오류제보하기
두경부암은 전체 암 중에서 여섯 번째로 흔한 암이며, 비교적 드물지 않은 질환이다. 주요 증상은 부위에 따라 설암, 구강암, 후두암 등 다르지만 수개월간의 쉰 목소리, 입안의 궤양, 연하통으로 음식물을 삼키지 못하는 경우도 있다.
후두암의 완치율은 1기 90%, 2기 70%, 3기 50%, 4기 40% 정도이며, 이는 조기 발견할 경우 90% 이상 완치할 수 있다는 의미로서 후두암 조기 진단의 임상적 중요성을 나타낸다. 하지만 대부분의 중소형 의료기관에서는 후두암 전문의가 상주하지 않는 경우가 많아서 후두부 진단영상 판독 시 전문성 부족으로 오진을 할 가능성이 큰 상황이다.
최근 CNN (Convolutional Neural Network) 으로 대표되는 딥러닝 이미지 인식기술의 성능개선이 급속도로 이루어지고 있으며, 이를 의료영상에 활용하고자 하는 매우 많은 시도들이 이루어지고 있다. 하지만, 대부분의 딥러닝 기반 의료영상 연구들이 X-Ray, CT, MR 같은 정형화된 진료영상들을 대상으로 하고 있으며, 영상의 자유도가 높은 내시경 영상을 활용한 인공지능 연구는 아직 초기단계에 있다.
본 연구에서는 후두부 내시경 영상에 VGG16 CNN 모델을 적용하고 영상 내 후두덮개 (Epiglottis), 혀 (Tongue), 성대 (Vocal cord) 부의 정상·비정상 여부에 대한 자가 판정 성능을 정량적으로 분석하였다. CNN 모델의 학습에 필요한 내시경 진단이미지는 양산부산대학교병원 이비인후과 전문의의 도움을 받아 병원 PACS (Picture Archiving and Communication System) 데이터
베이스에서 각 부위별로 대표성을 띄는 총 873개의 영상자료를 추출하였다: 후두덮개 (Normal 50장, Abnormal 50장), 혀 (Normal 121장, Abnormal 102장), 성대 (Normal 170장, Abnormal 280장). 각 부위별 데이터는 6:2:2의 비율로 학습 데이터셋, 검증 데이터셋, 평가 데이터셋으로 구분하여 연구에 활용하였다. 다만, 이 정도의 원 영상 (original image) 수는 일반적으로 CNN 모델의 학습에 충분치 않으므로, VGG16 모델의 효과적인 훈련을 위해 학습 데이터셋과 검증 데이터셋에 데이터 증강기법을 적용하였다.
VGG16 모델에 대한 성능평가 결과, batch size 10, epoch 30 조건에서 모델의 정확도 (accuracy) 와 F1-score가 후두덮개의 경우 0.90, 0.90, 혀의 경우 0.84, 0.84, 성대의 경우 0.57, 0.53인 것으로 조사되었다. 기본 VGG16 모델에 추가적인 Fine tuning 기법을 적용한 경우, 모델의 정확도와 F1-score는 후두덮개의 경우 0.95, 0.94, 혀의 경우 0.95, 0.95, 성대의 경우 0.73, 0.75으로 각각 조사되었다.
이러한 분석결과로 볼 때, 후두 내시경을 이용하여 촬영한 진단영상에 VGG16 모델을 적용할 경우, 후두부 내 특정 영역들의 이상여부에 대한 의사들의 정확한 판단을 돕기 위한 사전 스크리닝 용도로 효과가 있을 것으로 판단된다.