자동 버그 정정 관리를 위한 프레임워크 : OSS 프로젝트를 중심으로 :

양근석

추천

검색

자료유형: 학위논문

저자정보: 양근석 (서울시립대학교, 서울시립대학교 일반대학원)

지도교수: 이병정

발행연도: 2020

저작권: 서울시립대학교 논문은 저작권에 의해 보호받습니다.

이용수7

이 논문의 연구 히스토리 (2)

2020

버그 리포트와 소스코드의 특징 추출과 Seq-GAN을 활용한 자동 버그 정정 기법

양근석 , 최현호 , 이철훈 외 1명 한국정보과학회 학술발표논문집 2020.07 학술대회자료

자동 버그 정정 관리를 위한 프레임워크 : OSS 프로젝트를 중심으로

양근석 컴퓨터과학과 2020.01 학위논문

이 논문의 후속연구가 궁금하신가요?
연관 학술논문 또는 학술발표를 통해 보다 발전된 연구결과를 확인하실 수 있습니다.
이 논문의 연구 히스토리 확인하기

초록· 키워드

오류제보하기

최근 소프트웨어 산업의 발전으로 소프트웨어의 복잡성이 매우 증가하였다. 이에 따라, 개발자들의 크고/작은 실수들이 발생하게 되었으며 아직까지도 많은 개발자들이 디버깅에 많은 시간을 할애하고 있다. Eclipse 오픈 소스 프로젝트에서는 하루 평균 약 300건의 버그 리포트가 제출되고 있으며, 크고/작은 버그들에 대해서 자동적으로 버그를 정정한다면 소프트웨어 품질을 좋아질 것이다.
본 논문은 이러한 문제를 해결하기 위해 버그 정정 관리를 위한 프레임워크를 제안한다. 버그 정정 관리 프레임워크에는 버그 심각도 예측, 버그 정정 개발자 추천, 버그 로컬라이제이션, 프로그램 버그 정정으로 구성한다.
먼저 버그 심각도 예측에는 버그 리포트에 전처리 과정을 진행하고, 토픽 모델을 구축한다. 워드 임베딩 과정을 통해 합성곱 신경망과 장단기 메모리를 사용하여 각 토픽들에 학습을 적용한다.
버그 정정 개발자 추천에서는 버그 리포트에 대해 전처리 과정과 토픽 모델을 구축한다. 제안한 유사 버그 리포트 검색 기법을 진행하여 유사 버그 리포트를 추출한다. 워드 임베딩 과정을 통해 합성곱 신경망과 장단기 메모리를 사용하여 학습을 진행한다.
버그 로컬라이제이션에서는 버그 리포트, 소스코드 파일, 스택 트레이스를 추출하여 텍스트 특징 추출 과정을 진행한다. 추출된 텍스트 특징들을 결합하여, 오토인코더에 넣어 학습을 진행하고 출력을 합성곱 신경망과 장단기 메모리 알고리즘에 넣어 최종적으로 버기 소스코드 파일을 예측한다.
프로그램 버그 정정에서는 버그 리포트, 소스코드 파일, 키워드 검색을 통한 Github 관련 소스코드 및 설명을 파싱한다. 프로그램 변환 과정을 거쳐 Seq-GAN 알고리즘으로 학습을 진행한다. 새로운 버기 프로그램이 제출되면, Seq-GAN 모델에 넣어 프로그램 패치를 생성한다. 생성된 프로그램 패치가 적절하게 생성되었는지 판단하기 위해 적합도 함수를 이용한다. 주어진 모든 테스트 케이스를 통과하면 프로그램 버그 정정이 적절하게 되었다고 판단한다.
본 프레임워크의 모델에 대한 성능을 평가하기 위해 오픈 소스 프로젝트로 베이스라인과 비교하였으며 제안한 모델이 더 좋은 성능을 보였다. 향후 매개변수 최적화 및 다양한 알고리즘 결합으로 프레임워크의 성능을 더욱 향상할 예정이다.

With the recent development of the software industry, the complexity of software has increased greatly. As a result, big / small mistakes of developers have occurred, and many developers still spend a lot of time debugging. On average, about 300 bug reports are submitted in the Eclipse open source project per day, and software quality will be improved if bugs are automatically corrected for large / small bugs.
In this paper, we propose a framework for managing bug fixes to solve these problems. The bug correction management framework consists of predicting the severity of a bug, recommending a developer to fix a bug, localizing a bug, and fixing a program bug. First of all, to predict the severity of a bug, we preprocess the bug report and build a topic model. Through the word embedding process, learning is applied to each topic using a convolutional neural network and long- and short-term memory.
The bug correction developer recommendation builds a pre-processing and topic model for bug reports. We proceed with the proposed similar bug report search technique to extract the similar bug report. Through the word embedding process, learning is performed using a convolutional neural network and long and short-term memory.
In bug localization, text features are extracted by extracting bug reports, source code files, and stack traces. Combining the extracted text features, put them into an auto-encoder to learn, and put the output into a convolutional neural network and a long- and short-term memory algorithm to finally predict the buggy source code file.
In the program bug correction, the Github related source code and description are parsed through a bug report, source code file, and keyword search. After the program conversion process, learning is performed using the Seq-GAN algorithm. When a new buggy program is submitted, it is added to the Seq-GAN model to generate a program patch. The fitness function is used to determine whether the generated program patch has been properly generated. After passing all the given test cases, it is judged that the program bug correction is appropriate.
To evaluate the performance of the proposed framework''s model, it was compared with the baseline as an open source project, and the proposed model performed better. In the future, we plan to further improve the performance of the framework by optimizing parameters and combining various algorithms.

#버그 심각도 #버그 개발자 추천 #버그 로컬라이제이션 #프로그램 버그 정정

1. 서론 1
2. 배경 지식 7
2.1. 버그 리포트 7
2.2. 버그 생명주기 10
2.3. 버그 추적관리 시스템 11
2.4. 버그 심각도 예측 14
2.5. 버그 정정을 위한 개발자 배정 16
2.6. 버그 로컬라이제이션 16
2.7. 버그 정정 17
3. 소프트웨어 버그 정정 프레임워크 21
3.1 전반적인 버그 정정 프레임워크 21
3.2 버그 심각도 속성 예측 25
3.3 버그 정정을 위한 개발자 추천 36
3.4 버그 로컬라이제이션 40
3.5 프로그램 버그 정정 44
4. 실험 51
4.1 데이터셋 51
4.2 평가 척도 52
4.3 베이스라인 54
4.4 연구 질문 56
4.5 연구 결과 58
5. 토의 70
5.1 실험 결과 70
5.2 위협 요소 71
6. 관련 연구 73
6.1 버그 심각도 예측 73
6.2 버그 배정자 추천 75
6.3 버그 로컬라이제이션 80
6.4 프로그램 버그 정정 83
7. 결론 86
참고 문헌 88
Abstract 100

최근 본 자료

전체보기

구분	그룹	데이터 항목
AI 학습용 데이터	원문	원문 PDF 파일
AI 학습용 데이터	원문 + 메타 (기본/상세)	원문 PDF 파일 및 서지정보 CSV
대량 구매용 데이터	B2B 구독 방식	특정 자료 한정으로 원문 접근 권한 부여
대량 구매용 데이터	URL 전달 방식	바로 PDF 뷰어를 열람할 수 있는 URL 제공

구분	그룹	데이터 항목
AI 학습용 데이터	기본 메타	발행기관명, 간행물명, 권호명, 권(vol), 호(issue), 통권, 발행연도, 발행월, 논문명, 저자명, 시작페이지, 종료페이지, 전체페이지, 상세페이지URL
상세 메타 데이터	발행기관 메타	발행기관 이명, 영문명, 창립연도, 홈페이지URL, 발행기관 소개
	간행물 메타	부제목, 간행물 유형, ISSN, ISBN, 최초발행연도, 폐간연도, 간행빈도, 발행주기, 등재사항, 이용수, 피인용수, 권호수, 논문수, 표지이미지
	논문 메타	작성 언어, 부제목, 대등제목, 목차, 키워드, 초록, 이미지, 참고문헌, 이용수, 피인용수, 논문활용도, DBpia통합주제분류, KDC분류, DDC분류, 한국연구재단분류, UCI, DOI
	저자 메타	소속기관, 소속부서, 직급, 연구분야, 연구키워드, 이용수, 피인용수, 저자 논문활용도

구분	그룹	데이터 항목
※ 결합형/맞춤형 메타 데이터는 신청 내용에 따라 다양하게 제공 가능
이용순위 정보	주제분야별 많이 이용된 논문	“인문학”에서 많이 이용된 논문 TOP100
	이용기관별 많이 이용된 논문	“중고등학교”에서 많이 이용된 논문 TOP100
	세부기관별 많이 이용된 논문	“서울대학교”에서 많이 이용된 논문 TOP100
	키워드별 많이 이용된 논문	“Chat GPT”에서 많이 이용된 논문 TOP100
키워드 정보	많이 이용된 키워드	특정기간/분야/저널 내 많이 이용된 키워드
	많이 발행된 키워드	특정기간/분야/저널 내 많이 발행된 키워드
	많이 검색된 키워드	특정기간/분야/저널 내 많이 검색된 키워드
	연구 트렌드 키워드	특정 키워드 연관 연구동향 분석 데이터 키워드

논문 기본 정보

이 논문의 연구 히스토리 (2)

초록· 키워드

목차

최근 본 자료

댓글(0)