코퍼스 DDL 수업방안

2016. 5. 28. 18:39Education/English

반응형


( 위 배너는 구글 애드센스 입니다. )


코퍼스 DDL 수업방안

 

참고문헌

서민원. 영한 병렬 코퍼스를 활용한 DDL 교수 및 학습 모형 개발 및 적용. 한국교원대학교 박사논문.


    코퍼스란 특정 언어의 모습과 특성을 파악하기 위하여 자연 언어의 텍스트를 선별하여 모은 것, 또는 일반적인 언어학적 분석이 가능한 텍스트의 모음으로 정의하며, 우리말로는 말뭉치 혹은 말모둠이라 한다. 최근에는 컴퓨터 기술의 발전에 힘입어 대규모 코퍼스의 구축이 가능해졌고, 이러한 대규모의 코퍼스를 이용하여 언어 현상에 대한 더욱 객관적이고 정량적인 관찰을 수행하고 있다. 코퍼스에 기반한 언어 연구는 코퍼스 기반 문법 연구, 코퍼스 기반 어휘 연구, 코퍼스 기반 언어 변이 연구, 코퍼스 기반 역사 언어학 연구, 학습자 발화 자료 연구 등이 있으며 이러한 연구의 결과를 언어 교육, 특히 영어 교육에 활용하는 시도가 다양하게 이루어지고 있다.

    코퍼스 분석을 통하여 얻을 수 있는 가장 기본적인 정보는 어휘의 발생빈도일 것이며, 따라서 초기의 코퍼스에서 제공 된 언어 정보의 주된 형태도 바로 이 빈도 분석의 결과였다. 빈도 분석을 통하여 얻게 된 첫 번째 중요한 내용은 가장 빈도가 높은 단어들이 전체 언어 사용에서 막대한 비율을 차지하고 있다는 것이었다. 이러한 빈도 분석을 통하여 두영어의 고빈도 어휘는 언어 사용에서 문법적인 역할을 수행하는 기능어(function words)가 많다는 것을 알게 된다. 또한 구어 담화에 사용된 어휘와 문어 담화에 사용된 어휘의 쓰임이 상당히 다르다는 것을 알게 된다. 이렇게 코퍼스를 활용한 어휘의 빈도 분석을 통하여 영어의 구어와 문어에서 가장 많이 발생하는 어휘를 알게 된 것은 영어 학습자들이 어휘의 빈도에 대한 더욱 정확하고 구체적인 정보를 획득할 수 있게 되었음을 의미한다. 이는 외국어 학습자들이 저빈도 어휘를 상대적으로 자주 사용하거나 고빈도 어휘를 적게 사용함으로써 나타나는 언어 사용의 오류를 줄여줄 수 있을 것으로 기대할 수 있다.

    코퍼스 분석을 통하여 얻을 수 있는 두 번째 정보는 연어 정도이다. 연어(collocation)는 두 개 이상의 단어가 담화에서 함께 등장하는 현상을 의미한다. 연어 분석에서는 두 가지의 중요한 요인이 작용한다. 단어들이 함께 사용된다는 점과 연어 관계에서 다른 어휘가 사용될 수 없는 폐쇄성(exclusivity)의 정도가 다양하게 나타난다는 점이다.

    코퍼스 분석을 통하여 얻을 수 있는 세 번째 정보는 여러 조건에 따른 언어의 다양성을 비교하는 연구다. 언어의 다양성이란 언어가 사용되는 문맥, 상황, 환경에 따라 언어가 다양하게 나타남을 의미한다. 언어의 사용은 지역, 매체, 시대, , 연령, 사회적 위치 등에 따라 달라진다. 언어의 다양성 연구에 이용되는 코퍼스는 시대와 공간을 균형있게 포괄하여 각계각층의 다양한 언어 사용자로부터 수집된다.

언어를 습득하는 과정에 있는 사람들이 사용한 언어는 언어 발달 과정 연구에 중요한 정보를 제공하기 때문에 많은 연구자들이 학습자 코퍼스를 구축하기 위해 노력하고 있다. 원어민 학습자의 언어 습득 단계에 따른 코퍼스나 외국어 학습자의 언어 수준별 코퍼스를 언어 교육 내용 설정의 중요한 기준으로 활용할 수 있기 때문이다.

    코퍼스는 언어 교육 연구에서 세가지 방법으로 활용된다. 첫째, 학습자 코퍼스에서 분석한 정보를 이용하여 학습자의 언어 능력을 진단하고 언어 발달 단계에 적합한 수업 전략이나 교수 및 학습 자료를 개발할 수 있다. 둘째, 언어 학습교재에 대한 코퍼스 기반 분석을 통하여 교재에서 사용된 문장이 원어민들이 사용하는 언어와 비교하여 자연스럽고 적절하게 사용되었는지 점검할 수 있고, 교재에 사용된 언어 교수 및 학습 자료의 수준과 구성을 점검할 수 있다. 셋째, 컨코던싱 프로그램의 여러 가지 기능을 이용하여 목표 어휘가 가지고 있는 문법적, 의미적 자질에 대한 정보를 교수 및 학습에 활용할 수 있다.

    언어 자료 기반 학습은 Data-Driven Learning(이하 DDL)이라는 이름으로 소개되었고, 우리말로는 데이터 추론 학습, 언어 자료 기반 학습 등으로 번역된다. DDL은 코퍼스의 데이터를 이용하여 학습자가 자기 주도적으로 언어에 대한 발견 학습을 하는 방법으로 주목을 받았으며, 처음 소개된 이후 20여년간 이 방법으로 학습을 하도록 하는 연구가 꾸준히 있었다. DDL을 통한 학습효과는 다음과 같다. 첫째, 콘코던싱 프로그램의 사용이 학습자의 측면에서 언어 현상에 대한 탐구와 그 결과에 대하여 생각하도록 자극하고, 목표 언어에 있는 일정한 패턴을 찾고 그에 대한 일반화를 할 수 있는 능력을 발달시키는 데 도움이 된다는 점에서 언어 학습과정에 상당한 영향을 줄 수 있다. 둘째, 교사는 학생이 주도적으로 수행하는 언어 탐구의 관리자 및 조정자의 역할을 취할 수 있어야 한다. 이는 DDL 방식의 학습에는 적합한 방향이지만 기존의 교실 수업에서 이 변화를 어느정도, 어떤 방법으로 수용하고 적용할지에 대한 많은 고민이 필요하다. 셋째, 언어 교수 및 학습에서 문법이 가지는 위치가 재평가되는 것이다. 이전의 문법 중심적 교수 및 학습 방법에서는 학습자에게 일정한 규칙이나 패턴을 제시하고 이것을 담화의 구성에 적용하는 방식이었다. 하지만 DDL 방식은 실제적 언어 사용의 자료를 통하여 학습자가 스스로 문법적 발견을 하는 것을 언어 학습의 중심에 놓고 있기 때문에 문법적 의싱 상향을 가능하게 만든다.

    DDL 방식의 가장 핵심적인 방법은 콘코던스를 활용하는 것이다. 컴퓨터의 콘코던스 프로그램을 활용하여 학습자는 실제적 언어 자료가 축적되어 있는 코퍼스 데이터에서 언어 자료를 검색하여 일정한 언어의 패턴이나 연어를 귀납적으로 학습할 수 있다. 그런데 교실 수업의 여러 가지 환경에 따라서 학습자가 직접 컴퓨터를 사용한는 것이 효과적인 겨우도 있고, 학습자의 컴퓨터 사용이 제한적인 경우도 있다. 따라서 교사가 미리 교수 요목에 따라 학습자를 위하여 콘코던스 검색 결과를 정리하여 종이 학습지 형태로 제시하는 방법이 있다. 이를 약한 버전의 DDL(soft version DDL) 혹은 종이 기반 DDL(paper based DDL)이라고 부르기도 한다. 어휘의 빈도 정보는 교사가 학습자들에게 가르칠 어휘를 선정하는 중요한 기준이 된다. 일반적인 고빈도 어휘는 주제 영역과 상관없이 등장하며 어휘가 사용된 맥락에 따라서 의미가 다르게 사용되는 경우도 있으므로, 고빈도 어휘를 확인하여 학습자들이 이 어휘들을 배우고 실제로 사용할 수 있게 해주는 것이 중요하다. 반면에 저빈도 어휘는 보통 특정한 주제 영역에서 등장하므로 해당 주제 영역을 학습할 때 익히면 되기 때문에, 저빈도 어휘를 확인하여 이 어휘들에 대한 학습 노력을 조절할 수 있다. 또한 어위 자체의 빈도 정보뿐 아니라 어휘가 가지고 있는 다양한 의미들의 빈도 정보도 교수 및 학습의 내용 선정에 중요한 기중이 될 수 있다. 또한 대용량 언어 데이터를 분석하여 어휘 항목이 발생하는 상황적 환경, 즉 맥락(context)을 찾을 수 있으며, 몬법에 대한 정보를 수업에 활용 가능하다. 외국어 학습 상황에서 학습자는 특정 어휘의 대표적인 의미를 학습하고나면 그 어휘의 다른 의미나 다른 쓰임에 대하여 학습할 필요성을 덜 느끼는 경향이 있다. 따라서 코퍼스를 통한 어휘 분석을 통하여 어휘 분석의 필요성을 느끼고 빈도 정보, 어휘 항목의 맥락, 문법, 연어와 어법, 화용론 등 어휘의 다양한 의미와 쓰임에 대하여 주의를 기울이게 된다면 더욱 자연스러운 언어 사용이 가능해 질 수 있을 것이다.

 

참고문헌

서민원. 영한 병렬 코퍼스를 활용한 DDL 교수 및 학습 모형 개발 및 적용. 한국교원대학교 박사논문.


( 아래 배너는 구글 애드센스 입니다. )


반응형