본 연구는 한국프로야구 포스트시즌 동안에 치러지는 준PO, PO, KS경기에서의 승, 패에 따른 서로 다른 형태의 경기력을 분석한 연구이다. 각 시리즈별 경기력의 차이점은 무엇인지를 제시하는 것이 1차 목적이며, 각 단기전별 최적의 예측모형을 제시하는 것이 2차 목적이다. 따라서 이러한 연구목적을 달성하기위해 1982년부터 2012년까지 실행된 준PO(준 플레이오프,1989-2012), PO(플레이오프, 1986-2012), KS(한국시리즈, 1982-2012)자료를 이용하여 각 단기전의 승리 팀 vs 패배 팀 간의 경기력변인에 따른 평균비교(t-test)를 하였으며, 예측변인으로 사용될 기술영역변인을 산출하기위해 동등화 과정을 거쳐 가중치(상관계수)를 사용 새로운 영역별(투수력, 타력, 수비력, 기동력, 득점 및 집중력, 선구능력)변인을 생성하여 이 들 변인을 이용 3가지 예측모형(판별모형, 이항로지스틱회귀모형, 인공신경망모형)에 투입하여 예측모형의 정확도를 제시하였다. 준PO와 KS에서는 실책이 유의한 변인으로 나타났으며 PO에서는 삼루타가 준PO와 KS에서는 이루타가 유의미한 변인으로 새롭게 나타났다. 또한 승/패에 큰 영향을 주는 기술영역변인은 준PO에서는 투수력, PO에서는 타력, KS에서는 투수력으로 나타났다. 준PO에서의 최종예측모형은 예측변인이 제일 적게 투입되면서 적중률이 가장 높은 인공신경망모형(통계적 기준: 4개)이 최종선택 되었고, PO에서는 전문가 기준에 의해 만든 기술영역변인을 예측변인으로 적용한 인공신경망 모형(전문가 기준:5개)이 다른 두 모형보다는 예측 적중률이 더 좋았다. KS에서의 특징은 모든 변수가 적용되어 예측변인을 만든 인공신경망모형(모든 변수: 6개)이 최종모형으로 선정 되었다. 또한 준PO, PO, KS의 종합적인 적중률을 살펴보면 판별모형 보다는 이항로지스틱회귀모형이, 이항로지스틱회귀모형 보다는 인공신경망모형이 더 우세한 분류정확성을 보이고 있었다.
This study has been conducted to develop methods and techniques for the analysis of data related to baseball performance using the winning and losing games. The purposes of the study were to examine differences of athlete performance for semi playoff, playoff, and Korean professional baseball series and to develop optimal forecasting model for the short term series. Data used in the study were taken from Korean professional baseball association. Three data sets including semi play off from 1982 to 2012, play off from 1989 to 2012, and Korean series from 1982 to 2012 were used. To compare athlete performance by winning and losing games for short-term series t-test was applied. This study created new parameters by weighted value through the equalization process to calculate skill related variables as a predicted variable. Three predicted models such as discriminant, binary logistic regression and artificial neural network models were developed to clarify the suggested models. The results showed that the number of significant parameters increased as the series continued. In particular, a variable related to error was added as a significant variable at the Korean Series. A third base hit in the play-off and a second base hit were also added as significant parameters in the play-off and the Korean series, respectively. In addition, W/L a major variables affecting a given technology area, the pitching PO, PO, the inertia, KS, the pitching, respectively. An artificial neural network model was finally selected with the highest accuracy and lowest input of estimated parameters in the semi play-off. In the play-off, artificial neural network model that applied technical area parameters by specialist criteria had better accuracy rate than two others. In the Korean series, artificial neural network model that created estimation parameters by applying all parameters was chosen as the final model. When the overall accuracy level of semi-play off, play off and Korean series was figured out, binary logistic regression model had higher accuracy of classification than discriminant model, but artificial neural network model had the higher accuracy of classification than binary logistic regression model.