최근 일어난 화재에 대한 유형을 보면, 지역별로 다양하고 복잡한 양상을 갖고 있다. 그 이유로는 우리나라의 급격한 경제성장 및 인구 증가, 그리고 생활환경의 변화로 볼 수 있다. 통계자료를 보더라도 우리나라의 화재건수가 1980년대 초부터 서서히 증가해서 1987년에는 1만건, 1994년 2만건, 1998년에는 3만건을 넘기며, 급격히 증가하다가 2001년 이후 2년간 감소하는 추세였다. 하지만 대구지하철 전동차 내부화재, 경기도 화성 씨랜드 화재, 인현상가 화재 등 화재 위험성이 부각되면서 2004년 6월 소방방재청이 설립되었고, 2007년에는 국가분류체계에 대한 혁신안이 시행되면서, 소방방재청에서는 국가화재정보시스템을 구축하고 화재에 대한 자료들을 체계적으로 관리해 오고 있다. 2007년부터 2012년까지 화재발생 건수가 매년 4만 건이 넘었으며, 2008년에는 4만 9천여건이 발생하였다. 이 후 건 전체건수는 비교적 감소하는 추세이지만, 매년 많은 화재로 인한 인명·재산피해가 발생하고 있다. 또한 화재는 인간의 생명 및 재산과 직결된다는 점에서 실생활과 매우 밀접한 연관성이 있다. 각 지역마다 다른 특성을 갖기 때문에 다양한 조건에 따른 화재발생 예측이 필요하다. 그리고 화재는 사전에 예방·감지함으로써 충분히 피해를 줄일 수 있다. 화재피해로 인한 복구도 중요하지만, 근본적인 이유는 사전에 준비되지 않았거나 안일한 대처가 문제가 될 수 있다. 데이터마이닝은 통계 및 수학적 기술뿐만 아니라 패턴인식 기술들을 이용하여 데이터를 조사함으로써 의미가 있는 새로운 상관관계, 패턴, 추세 등을 발견하는 과정이다. 본 논문에서는 데이터마이닝을 이용하여 소방방재청 국가화재정보시스템(NFDS)에서 제공받은 2007년 1월부터 2012년 6월까지 255,448건의 데이터 가운데 공통적이지 않은 변수들을 제외하고 172개 변수를 대상으로 분석을 수행하였다. 유실데이터와 구조적인 변수 값 오류 수정을 통해 데이터를 보정하였으며, 변수들을 화재피해, 화재원인, 그리고 발화환경으로 분류하고 빈도분석을 실시하였다. 이를 기반으로 분류된 변수들 중 기상 및 시간 관련 변수들과 화재발생과 무관한 변수들을 제외하고, 20개의 변수들로 구성된 화재발생 가능성 산출모델을 개발하였다. 각 변수들의 변수값의 빈도를 이용하여 각각의 빈도분율을 산출하여 적용되는 방식이다. 모델은 화재발생 빈도분석 결과에 기반을 두고 있으며, 입력한 변수 값에 따라 다양한 여러 가지 상황들이 반영된 화재발생 가능성이 산출되도록 설계하였다. 화재는 지역마다 다른 특성을 가지고 있다. 그리고 기상 및 시간에 따라 화재발생률 또한 다르게 나타난다. 연구결과 초기 모델에서는 하나의 화재발생 가능성이 산출되었지만, 지역, 시간 및 기상변수, 가중치를 고려하여 모델을 수정하였고, 이에 따라 다양한 화재발생 가능성이 산출되었다. 우리나라의 다양한 화재발생 특성을 반영한 여러 가지 사례들을 고려한 화재발생 가능성을 산출함으로써, 우리나라의 실정에 맞는 화재예방 및 대응방안에 대한 소방정책 수립을 위한 기초자료로 활용 가능할 것으로 판단된다.
A Study on Fire Prediction Model Development Using Data Mining
Min-jung Kim
Department of Disaster Prevention Graduate School of Disaster Prevention, Kangwon National
Abstract
The types of fire which have occurred recently have showed diverse and complicated aspects. That is because of steep economic development, increasing population and the change of life environment. To deal with the problem, NEMA(National Emergency Management Agency) was established in June, 2006. After carrying out National Fire Classification System, NEMA have synthetically built up National Fire Data System(NFDS) and managed the fire data. This study performed the analysis of 255,448 data made up of 172 factors from Jan, 2007 to June, 2012 which were served from NFDS of NEMA, using Data Mining method. The data was revised through missing data and factor value error modification. After the factors were grouped into fire damage, fire cause and fire occurrence environment. frequency analysis was performed. Among these factors except for weather, time factors and factors which have no relation to fire occurrence, a fire occurrence possibility output model made up of 20 factors has been developed. Using frequency of factor values, each frequency rate was calculated and applied. The model was based on the result of fire occurrence frequency analysis and it was designed to calculate fire occurrence possibility by factor, leading to reflecting a variety of situations. Each fire has its aspect and weather and time have an effect on fire occurrence rate. Accordingly, after the data was grouped into area, weather and time, the fire occurrence possibility was analyzed.
목 차국문요약ⅰ목 차ⅱ표 목 차ⅲ그림목차ⅳI. 서론11. 연구의 배경 및 필요성 12. 연구의 목적 2Ⅱ. 연구 방법 41. 연구동향 42. 연구 방법 및 데이터 처리 61) 연구방법 62) 화재조사데이터의 처리 및 수정 7Ⅲ. 결과 및 고찰 151. 화재발생빈도 기반의 화재발생 예측모델 개발 152. 지역을 고려한 모델의 사례 161) 시도별 화재발생 가능성 162) 시군구별 화재발생 가능성 183. 시간변수를 고려한 모델의 사례 281) 월별 화재발생 가능성 282) 요일별 화재발생 가능성 333) 시간대별 화재발생 가능성 354. 기상변수를 고려한 모델의 사례 371) 온도별 화재발생 가능성 372) 습도별 화재발생 가능성 395. 가중치를 고려한 모델의 사례 411) 시도별 화재발생 가능성 412) 월별 화재발생 가능성 433) 온도별 화재발생 가능성 45Ⅳ. 결 론 47참고문헌 50Abstract 51