Corpora in applied linguistic (2) by Susan Hunston 요약

2015. 1. 15. 22:27Education/English

반응형

2. 설계와 목적

 

코퍼스는 더 크고 다양해지고 있으며 언어에 대해 더 많이 명확한 설명들을 만드는데 사용할 수 록 어떻게 주제를 설계하는지가 더 중요하게 되었다. 컴퓨터 하드웨어와 소프트웨어가 발달하면서 언어들을 저장할 수 있는 크기는 1960년대 이후부터 기술이 발전하면서 계속해서 증가하고 있다. 작은 코퍼스는 연구자 입장에서는 안정적이지만, 기술 발달로 소프트웨어의 작업 속도 역시 빠르다. 작은 코퍼스는 결과 값이 큰 코퍼스에 비해 상대적으로 덜 방대하다. 따라서 연구자 입장에서는 용어 색인을 볼 때 보기가 편하다. 하지만 소프트웨어가 큰 코퍼스를 분석할 때 적절히 전체 인용색인에서 임의의 비율로 값을 선택하거나 결과 값에서 더 두드러지는 연음이나 특징들을 할당 선택하면 된다. 코퍼스 양의 문제에서 어떤 목적과 설계에 따라 추출 값이 많이 필요한지 그렇지 않은지, 추출 값이 많이 필요한지 안한지, 소프트웨어 회사에서 지원하는 양을 고려해야하며, 연구자가 코퍼스를 수동으로 추가해야하는 부분에 따른 난이도를 염두에 두어야 한다.

코퍼스를 결정할시 무엇을 구할지 그리고 사용하려하는 지를 기초로 하여 특정 목적에 코퍼스가 좋고 적합함을 참작해야한다. 또한 해당 코퍼스를 사용하기 위해서 연구자가 임의로 학습자들의 자료를 활용할 경우, 그 활용할 수 있는 자료에 대한 사용 여부 역시 고려해야한다. 특히 이전 장에서의 코퍼스 타입과 연구 목적 사이에 어울림, 그리고 현재 가지고 있는 코퍼스의 장점과 한계를 생각해야한다. 이는 적절한 코퍼스 자료 수집에 있어 연구자들이 대표성과 균형성 고려로 이어지게 된다. 연구자가 정한 주제를 비교 분석하는 과정에서 연구 대상과 관련된 영역을 선정 했을 시, 그 선정에 대한 영역에서의 하위 범주 전체를 수집해야한다. 그런데 그 하위 범주 자체가 기록 시간, 시기, 주기, 작성 대상, 기록 제출 대상, 장소, 코퍼스 수집 위치, 조사 대상, 성별 및 장소에 따라서 기록의 양과 질은 현저히 다르다. 따라서 다각도로 연구자가 언어 자료 수집에 신경 써 코퍼스 프로그램 사용 시 대상들에 대한 균형성을 맞춰야 하는 어려움이 있다. 연구자는 수집 시 부-코포라를 이용하여 다른 하위 영역에서의 자료를 코포라와 비교하여 좀 더 정확한 분석을 기하는 방법이 있다.

언어는 통시성을 지니기 때문에 코퍼스 역시 이 통시성을 간과해서는 안 된다. 구어와 문어들 중 현재 쓰이지 않는 대표성을 잃은 언어가 불규칙적으로 갑자기 변할 수 있다. 감시 코퍼스를 통해 이를 신속하고 빠르게 이러한 점을 추가 또는 대응 할 수 있다. 그러나 거기에 따른 비용과 시간을 뒷받침해야한다. 감시 코퍼스의 목적에서 나오는 것처럼 어떤 것은 유동적이고 순간적인 반면, 다른 한 코퍼스는 고정되고 확실한 대표성을 지닌 영속 인공물로서의 코퍼스가 있다. 이러한 영속성은 상징적 가치를 가질 때 두드러진다.

 

요약 문헌 : Hunston, Susan. Corpora in applied linguistics. Ernst Klett Sprachen, 2002. 25-37

 

반응형