본 연구의 목적은 코메트릭스를 이용하여 중·고등학교 영어 교과서와 대학수학능력시험의 읽기 지문 난이도가 어떠한지를 분석하는데 있다. 코메트릭스란 코퍼스 분석 도구 중 하나로서, 텍스트의 응집성을 포함한 다양한 분석 항목을 측정할 수 있는 텍스트 평가 도구이다. 본 연구에서는 이 도구를 이용하여 7 개 출판사의 2009 개정 교육과정 중학교·고등학교 영어 교과서와 2015·2016 학년도 대학수학능력시험 읽기 지문을 분석하였다. 측정 대상이 된 코메트릭스 지표는 ‘문장 수’, ‘단어 수’, ‘문장 내 단어 수’, ‘인접 문장 간 논항 중복’, ‘LSA’, ‘어휘 다양성’, ‘본동사 앞 단어 수’, ‘명사구 밀도’, ‘내용어 빈도수’, ‘FRE’, ‘FKGL’이라는 11 개의 지표이다. 이 지표들을 분석하여 영어 교과서의 학년별 난이도는 어떻게 나타나는지, 그리고 고등학교 영어Ⅰ·영어Ⅱ 교과서 읽기 난이도와 비교했을 때, 2015·2016 학년도 대학수학능력시험 읽기 난이도는 어떠한지를 알아보았다. 연구를 위해 영어 교과서와 수능 읽기 지문의 코퍼스를 구축한 후, 코메트릭스 담당자에게 분석 서비스를 요청하였다. 그 후 제공받은 측정치로 각 읽기 지문의 난이도를 분석하였다. 연구 결과 기술적 지표인 ‘문장 수’, ‘단어 수’, ‘문장 내 단어 수’ 지표와 가독성을 나타내는 ‘FRE’, ‘FKGL’ 지표에서 학년 간 난이도가 증가하는 경향을 보였으나 점진적인 증가는 아니었고, 특히 중학교 3 학년과 고등학교 영어Ⅰ 사이의 난이도는 급등하였다. 응집성을 나타내는 지표 중 ‘인접 문장 간 논항 중복’의 측정치는 학년이 올라갈수록 오히려 증가하였고, ‘LSA’ 지표의 측정치는 학년 간 연계성이 없었다. 통사적 복잡성 지표 중 ‘본동사 앞 단어 수’는 학년이 올라감에 따라 증가하였으나, ‘명사구 밀도’는 중학교 교과서와 고등학교 교과서 사이에 차이가 있을 뿐 학교급 내에서는 뚜렷한 차이를 보이지 않았다. ‘내용어 빈도수’는 학교급 사이의 차이는 있었으나 비슷한 수준이었다. 그리고 ‘내용어 빈도수’를 제외한 대부분의 지표에서 2015·2016 학년도 대학수학능력시험 간의 난이도는 비슷하였으나 시험 출제 범위인 영어Ⅰ·영어Ⅱ의 난이도 보다는 높은 수준의 난이도를 가졌다. 난이도가 점진적으로 증가하지 않는 교과서 읽기 지문 수준과 고등학교 교과서의 난이도보다 높은 수능 읽기 지문의 수준은 학생들의 영어 학습에 대한 부담감을 높이거나 학교 교육과정 외 다른 곳에 의지해야 하는 환경을 조성할 수 있다. 따라서 2015 개정 교육과정 교과서 개발 시에 객관적인 지표와 기준을 가지고 난이도가 점진적으로 증가할 수 있도록 하고, 대학수학능력시험의 난이도도 학교 교육과정 수준의 난이도를 벗어나지 않도록 해야할 것이다. 본 연구의 분석 도구인 코메트릭스는 읽기 자료의 난이도 측정을 다각도로 가능하게 해주었으며, 객관적인 비교가 가능하게 해주었다. 코메트릭스가 이후의 난이도 연구에서뿐만 아니라 교재의 개발이나 시험 문제의 출제 때, 그리고 학생들 수준에 맞는 학습 자료의 선정시에도 도움이 될 것이라 기대한다.
The purpose of this study is to analyze the difficulty of the reading materials in middle and high school English textbooks and the College Scholastic Ability Test(CSAT) using Coh-Metrix. Coh-Metrix, which is one of the corpus analysis tools, is the text analysis tool that can measure various indices including cohesion. In this study, the reading materials in middle and high school English textbooks in the 2009 revised curriculum of seven publishers were analyzed with Coh- Metrix. To analyze the texts, eleven Coh-Metrix indices were chosen for this study. These were: number of sentences; number of words; mean number of words (length) of sentences in; local(adjacent sentences) argument overlap; LSA sentence adjacent; type-token ratio; words before main verb; modifiers per NP; average word frequency for content words; Flesch Reading Ease(FRE); and Flesch- Kincaid Grade Level(FKGL). By analyzing these indices, it was possible to recognize how the difficulty appears in English textbooks and, compared with high school textbooks, how difficult the CSAT is. For the study, the corpus of English textbooks and CSAT text was built, and a text analysis service was offered from the person in charge of Coh-Metrix. The results showed that the difficulty of English textbooks does not gradually increase by units or among school years as far as these measures: number of sentences; number of words; and mean number of words (length) of sentences in the descriptive indices and FRE; and FKGL of the readability indices. Especially significant differences were found in the difficulty between ninth grade English textbooks and high school EnglishⅠ textbooks. Among the cohesion indices, local (adjacent sentences) argument overlap increased rather than decreased for higher textbooks and LSA did not have connectivity among textbooks. There was an increase in the syntactic complexity indices for words before main verb and in modifiers per NP between middle and high school, but these did not show notable differences among grades within each school. The average word frequency for content words represented similar levels among the texts. In most of the indices, except that for average word frequency for content words, the difficulty in 2015 and 2016 CSAT was similar, but the level of difficulty was much higher for EnglishⅠ·EnglishⅡ textbooks that the CSAT should cover. This can impose not only great burdens on students learning English, but it can also cause increased private education in English. Therefore, when the 2015 revised curriculum is developed, the difficulty in textbooks should be considered to progressively increase. Also, the difficulty in CSAT should not be different from that in the textbooks. Coh-Metrix enabled the difficulty analysis objectively in various indices. It can help to develop textbooks, set questions for tests, and choose teaching materials that are appropriate for students’ levels.
목차
목 차 i표 목 차 v그 림 목 차 viⅠ. 서론 11.1 연구의 필요성 및 목적 11.2 용어의 정의 4Ⅱ. 이론적 배경 62.1 영어 교과서 62.2 대학수학능력시험 82.3 코메트릭스 112.3.1 기술적 지표 132.3.2 응집성 132.3.2.1 참조적 응집성 132.3.2.2 의미적 응집성 142.3.3 어휘 다양성 142.3.4 통사적 복잡성 152.3.5 단어 정보 152.3.6 가독성 162.4 선행 연구 172.4.1 학년 내 난이도 분석 연구 172.4.2 학년 간 난이도 연계성 분석 연구 19Ⅲ. 연구 방법 213.1 연구 대상 213.2 분석 절차 233.2.1 영어 교과서 및 수능 읽기 지문 코퍼스 구축 233.2.2 코메트릭스 분석 과정 243.2.3 분석 지표 선정 243.3 분석 방법 25Ⅳ. 연구 결과 및 논의 264.1 교과서 읽기 난이도 비교 264.1.1 기술적 지표 264.1.1.1 문장 수 264.1.1.2 단어 수 284.1.1.3 문장 내 단어 수 304.1.2 응집성 314.1.2.1 참조적 응집성 324.1.2.2 의미적 응집성 334.1.3 어휘 다양성 344.1.4 통사적 복잡성 364.1.4.1 본동사 앞 단어 수 364.1.4.2 명사구 밀도 374.1.5 단어 정보 394.1.6 가독성 404.1.6.1 FRE 404.1.6.2 FKGL 414.2 대학수학능력시험 읽기 난이도 비교 424.2.1 문장 내 단어 수 424.2.2 응집성 444.2.2.1 참조적 응집성 444.2.2.2 의미적 응집성 464.2.3 어휘 다양성 484.2.4 통사적 복잡성 504.2.4.1 본동사 앞 단어 수 504.2.4.2 명사구 밀도 534.2.5 단어 정보 554.2.6 가독성 564.2.6.1 FRE 564.2.6.2 FKGL 59Ⅴ. 결론 및 교육적 시사점 655.1 결론 655.2 교육적 시사점 675.3 연구의 한계점 및 향후 연구 방향 68참 고 문 헌 70부 록 75<부록 1> 중학교 영어①②③ 인정도서 (2009 개정 교육과정) 75<부록 2> 고등학교 영어ⅠⅡ 인정도서 (2009 개정 교육과정) 76<부록 3> 영어 영역 수능-EBS 연계 대상 교재 목록 77<부록 4> 영어 교과서 출판사별 문장 수 지표 분석 78<부록 5> 영어 교과서 출판사별 단어 수 지표 분석 79<부록 6> 영어 교과서 출판사별 문장 내 단어 수 지표 분석 80<부록 7> 영어 교과서 출판사별 인접 문장 간 논항 중복 지표 분석 81<부록 8> 영어 교과서 출판사별 LSA 지표 분석 82<부록 9> 영어 교과서 출판사별 어휘 다양성 지표 분석 83<부록 10> 영어 교과서 출판사별 본동사 앞 단어 수 지표 분석 84<부록 11> 영어 교과서 출판사별 명사구 밀도 지표 분석 85<부록 12> 영어 교과서 출판사별 내용어 빈도수 지표 분석 86<부록 13> 영어 교과서 출판사별 FRE 지표 분석 87<부록 14> 영어 교과서 출판사별 FKGL 지표 분석 88<부록 15> 대학수학능력시험 문항별 지표 분석 89 91