본 연구는 도표(Graphs)를 설명하는 도표기술문의 언어적 특성을 어휘적, 통사적, 담화적 특성으로 나뉘어 살펴보고 교육적 함의를 알아보고자 하였다. 다양한 장르에서 50개의 도표기술문 텍스트를 발췌․선정하여 코퍼스 자료를 구축하고, WordSmith Tools 6.0과 Coh-Metrix 3.0 분석도구를 통해 여러 언어적 특성을 세부 분석항목으로 나누어 분석하였다. 연구결과는 다음과 같다. 첫째, 도표기술문의 평균 문장 수는 10개이고, 평균 단어 수는 172개이며, 한 문장은 평균 17개의 단어로 구성된 것으로 나타났다. 둘째, 출현어휘 빈도의 경우 상위 100위까지의 어휘 대부분은 관사, 전치사 등의 기능어가 차지하며, 약간의 도표 기술과 관련된 내용어로 구성되어 있는 것으로 나타났다. 어휘의 다양성 면에서는 다양한 어휘가 사용되었다고 할 수 있으며, 어휘의 품사 정보에서는 명사, 형용사, 동사, 부사 순으로 많이 사용되었으며, 대명사는 내용어에 비해 아주 적게 사용된 것으로 나타났다. 셋째, 통사적 복잡성에서는 명사구 내 수식어구보다는 본동사 앞의 단어가 상당히 더 많이 사용된 것으로 나타났으며, 통사구조 밀도에서는 명사구, 전치사구, 동사구, 부사구 밀도 순으로 나타났다. 그리고 동명사 밀도가 수동태, 부정어, 부정사 밀도보다 훨씬 높은 것으로 나타났다. 넷째, 내용어의 중복을 의미하는 지시적 응집성에서는 명사, 논항 그리고 어간 중복이 상당히 나타났으며, 어간 중복, 논항 중복 그리고 명사 중복순으로 많이 나타났다. 문장 쌍들이 의미적 연결 정도를 의미하는 의미적 응집성에서는 문장 간 의미적 유사성은 낮은 편이며, 신-구 정보에서는 구정보보다 신정보가 더 많이 사용된 것으로 나타났다. 문장이나 절을 연결시키는 접속사에서는 추가 접속사, 인과 접속사, 시간 접속사, 대조 접속사 순으로 많이 사용된 것으로 나타났다. 본 연구결과는 도표를 기술하는데 사용되는 텍스트의 어휘적, 통사적, 담화적 특성을 밝히는 중요한 자료로 이용 될 수 있으며, 도표를 기술하는 교육자료를 개발하고, 텍스트 분석법을 활용한 다양한 글쓰기 방안을 제안하는데 귀중한 자료가 될 것이다. 특히 EFL 상황에서 외국어 학습자들이 도표기술문의 언어적 특징을 파악하여 성공적으로 도표를 사용하고 기술할 수 있는 글쓰기 학습 자료로 활용될 수 있을 것이다.
The purpose of this paper was to examine and analyze the linguistic features of descriptions of graphs in terms of lexical, syntactic and discoursal aspects and to find out pedagogical implications for EFL writers. A total of 50 graph descriptions of different genres were collected and used to analyze the linguistic features. The analysis was conducted using WordSmith Tools 6.0 and Coh-Metrix 3.0, two computational tools that assess the texts of the graph descriptions to find out various linguistic characteristics. The findings are as follows. First, the average number of sentences used in the graph texts was 10, the average number of words used was 172, and the average length of sentences was 17 words. Second, for lexical features, the statistics showed that most of the frequently used words were function words such as articles and prepositions. The value of TTR, an indicator of how diverse the words in the corpus was high(0.72), which means the words used were diverse in the texts. It also showed that the words utilized were in the order of nouns, adjectives, verbs, adverbs and pronouns. Third, for syntactic complexity, the statistics showed a higher density with the number of words before main verb and a lower density with the modifiers in the noun phrases. For syntactic density, the statistics showed the order of noun phrase, prepositional phrase, verb phrase, adverb phrase and gerund. Lastly, for discourse features, the statistics showed a higher ratio of stem overlap for the referential cohesion, a low degree of LSA for adjacent sentences for the semantic cohesion, a high ratio of sentences with new information in the paragraphs and a high ratio of additive connectives. It is expected that the results gained from the analysis of graph texts will be utilized as a useful information and source for developing EFL teaching and writing material.