Introduction to Testing

2016. 10. 4. 01:30Education/English

반응형

Introduction to Testing

박형락

 

1. 학습과 평가

수업시간에 학생의 학습 이후 평가하기는 긍정적인 면과 부정적인 면, 둘 다 가지고 있다. 이는 언어 학습에서 평가 부분이 학생에게 부정적인 영향을 끼친다는 점을 교사가 고려해야할 부분이기도 하다. 언어 학습에서 시행하는 목적과 활동과는 다른 방향으로 평가를 시행하는 것이 부정적인 영향에서 하나의 사례일 것이다. 왜냐하면 학생이 학습이후 평가 준비를 위해 학습과는 다른 학습 요령을 터득해야 한다. 반대로 학습 목표에 부합하여 적절한 평가하기가 학생에게 이루어질 경우, 학생은 학습 목표에 부합된 평가로부터 좋은 효과를 위해 이에 적합한 교수요목, 교과서, 수업을 제공 받을 것이다. 이는 긍정적인 평가 결과를 학생은 성취할 수 있도록 시간과 노력이 효율적으로 이룰 수 있을 것이다. 평가는 학습활동에 있어서 한 일부분이다. 하지만 평가하기는 학습에서 필수는 아니다. 평가는 학습활동이 학생에게 효과적인 결과를 주기 위한 수단이며 다른 학습활동 구성에도 영향을 끼친다.

언어 학습에 대한 평가하기는 인간의 언어를 가지고 시행된다. 따라서 자연 과학처럼 정확하게 수치화하기는 힘들다. 이는 대표적으로 쓰기 평가에서 잘 드러난다. 쓰기 평가를 하려면 쓰기 학습을 하고 쓰기 평가를 내려야 한다. 그렇지만 평가자의 노력, 능력과 평가에 따른 경제, 효율적인 부분에서 현실적으로 정확한 평가가 불가능 하다. 이는 학습 규모가 크면 클수록 이러한 한계에 부딪친다. 따라서 효율적인 평가를 위해 정확성을 포기해야 한다. 이를 교사가 만회하려고 한다면 또 시간과 노력이 사용된다. 이러한 내용과 방법뿐 아니라 신뢰도 부족으로 평가에 있어 문제가 발생한다. 기계가 아닌 사람을 평가하는 것이기 때문에 사람은 여러 가지 환경에 따른 변수로 인하여 동일한 능력을 지녀도 평가 결과는 달라지기 마련이다. 게다가 교사가 만든 문제에서 분명하지 않는 내용, 애매한 질문, 힌트가 되는 내용이 있으면 정확한 평가를 내리기 어렵고 신뢰도 역시 떨어진다. 이는 평가의 결과가 일관성을 유지하기 어렵게 만드는 요인이라고 할 수 있다. 또한 평가 결과를 확인하는 과정에서 교사의 주관성이 개입되면 그 역시 신뢰도가 떨어질 것이다.

이러한 문제가 지니고 있음에도 불구하고 평가 즉 시험은 언어 분야에서 중요한 위치를 차지한다. 대학교에서 외국인 학생을 선발할 때나 통역과 번역가를 고용하는 기관처럼 언어 능력을 믿을 수 있는 점수가 필요하기 때문이다. 또한 가르치는 사람도 교습이후 학생들이 얼마만큼 성취를 했는지 정보를 제공 받으려면 시험이 필요하다. 이러한 정보는 합리적 교육 결정을 판단하게 한다. 평가의 결과는 의미 있는 비교 척도가 되기 때문이다.

시험에는 형성평가와 총괄평가가 있다. 형성평가는 시험이후 교사에게 교습을 수정을, 학생들에게는 피드백을 제공한다. 형성평가에는 수업 이후 비공식적인 시험이나 퀴즈가 있으며 관찰과 포트폴리오도 이에 해당한다. 또한 학생 스스로 자기 평가를 통해 학습 진행 점검 및 목표 수정을 형성평가를 통해 시도한다. 총괄평가는 학습 이후 성취한 것을 측정하는 시험이다. 이는 공식적인 시험에서 필요로 하다. 다양한 평가로 인해 결과로 이어져 정보를 교사가 얻을 수 있어야한다.

시험이라는 평가는 학생에게 언제나 두려움을 준다. 그리고 그 기준은 언제나 불명확 하다. 학생의 손에 쥐어진 성적표는 어떤 평가 기준에서 채점되어 졌느냐에 따라 수긍도가 달라진다. 따라서 평가는 신뢰도와 타당도를 따져 볼 수밖에 없다. 공신력 있는 언어 시험은 학자들 사이에서는 도움이 되지 않는 다고 하나 실제 그 시험을 가지고 사람의 가치를 매기는 사회 현장에서는 낯선 것에 대한 습관과 요령과 실력을 겸비한 문제 풀이 능력에 초점을 맞추고 요구한다. 결국 평가는 순수한 평가자의 학습 능력 향상뿐 아니라 최종 결과를 요구하는 장이다. 그것이 순수 언어 능력이 아니더라도 말이다. 결국 평가에 대한 연구는 학자, 교사, 학생만이 아니라 그 외부의 타자들에 대한 기대와 요구 역시 수용되어야 한다. 그러기 위해서는 언어 평가를 할 때 사후 결과에 대해 누구나 신뢰 할 수 있는 평가가 만들어져야 한다. 그런 빅데이터를 소규모 학교에서 평가가 과연 가능한가는 의문이자 고민이다. 시대의 이데올로기에 걸맞게 평가에 대한 연구에 큰 자본이 투입 될 수 있고 요구에 민감한 상업 이익에 맞춰질 필요가 있다고 생각한다. 특히 공교육에서 언어 평가는 학생의 의지와 노력과 자본에 따라 소규모 데이터에도 순수 언어 능력 외 요령으로 일정 부분 극복 할 수 있다. 이는 성인 영어 평가에서도 마찬가지다. 따라서 언어 평가를 최대한 직접적으로 학생의 언어능력을 평가할 수 있으면서도 효율적이고 객관적인 방식의 평가 설계가 만들어져야 할 것이다.

 

2. 문제 해결로서 평가

시험은 수업의 목표, 시험의 목적 그리고 유효한 자원에 따라 달라진다. 수업의 목표에 맞게 시험이 치러져야하고 일정한 정보를 교사와 학생에게 제공해야 한다. 그리고 시험에서 시간과 비용의 측면을 고려해야한다. 평가자로서 교사는 학생들에게 언어 능숙도, 교습의 목적 성취, 개개인의 장단점과 수준에 대한 정보를 발견하고 그것에 맞는 학습을 제공하도록 해야 한다. 이러한 시험은 최대한 주어진 상황과 환경을 극복할 수 있도록 일관되어야 하고 학습 요구와 목표에 맞는 측정과 긍정적인 효과를 제공하도록 구성되어야 한다. 또한 실용성이 가미되어야 한다.

 

 

3. 시험과 평가의 종류

언어 평가에는 직간접 평가, 분리와 통합 평가, 규준과 준거 지향 평가, 객관식 및 주관식 평가 그리고 컴퓨터 적응 평가와 의사소통 중심 평가가 있다. 언어 시험에는 능숙도 시험, 성취도 시험, 진단 시험, 배치 시험으로 나뉜다.

능숙도 시험은 교습 유무와 상관없이 수험자의 능력을 측정하도록 고안된다. 이러한 시험은 언어를 사용하여 수험자가 특정 목적을 이뤄낼 수 있는지를 판별한다. 이와 달리 능숙도 시험은 언어 사용의 보편적인 목적을 위해 개발될 때가 있다. 언어를 구사하는 데 있어서 여러 방향을 수험자로부터 진단하고 측정하여 그 정보 해석을 통해 언어 수준을 평가한다.

능숙도 시험과는 달리 성취도 시험에서는 강의와 직접적으로 연관이 있고 개개인의 학생이나 집단 또는 강의 목표 달성 성공을 알아본다. 이러한 성취도 시험은 최종 성취도 시험과 진보적 성취도 시험 두 개로 나뉜다. 최종 성취도 시험은 강의 마지막에 시행된다. 최종 성취도 시험은 강의 교수요목, 교재 그리고 다른 자료를 근거로 해야 한다. 그렇기 때문에 이를 교수요목 내용 접근법이라고 한다. 학생이 수업에서 배운 내용을 근거로 시험이 개발되어야 한다. , 강의 교수요목, 교재, 기타 자료가 학습의 최종 목표와 무관하게 된다면 시험과 학생의 성취도 역시 목표와 무관한 결과로 이어진다. 진보적 성취도 시험은 학생이 학습을 하면서 진보되는 능력을 측정한다. 학습 목표를 중심으로 학생의 능력을 측정하며 교사는 단기적인 목표를 세워 학생을 최종 목표를 도달하기 위할 때 이러한 시험이 사용된다. 진보적 성취도 시험이 학습 과정에 있다면 시험마다 사후 평가가 있을 것이며 이를 통해 추후 시험과 교수요목에서 변화를 가져오게 한다.

또 다른 시험으로는 진단 시험과 배치 시험이 있다. 진단 시험은 학생들이 어떤 학습을 받아야 하는지 확인해 주는 시험이다. 그리하여 학생들의 강점과 약점을 확인하는데 이 시험은 사용된다. 진단 시험은 현실적으로는 이상적인 목표를 추구하는데 어려움이 있다. 학생의 언어 능력을 정확히 진단하려면 수많은 요소를 검사해야 하지만 그 수많은 요소를 개개인이 진단하고 정확하게 판단하기에는 불가능하기 때문이다. 배치 시험은 학생들의 능력을 확인한 후 그 능력에 적합한 부분에 배치하는데 사용된다.

시험을 만들고자 할 때 학생을 직접적으로 그리고 간접적으로 이렇게 두 가지로 구분 할 수 있다. 직접적으로 평가를 하면 진정성이 있다. 왜냐하면 평가하고자 하는 것을 요구하는 그대로 평가하기 때문이다. 이러한 방식은 시험지를 치루는 학생은 과업 중 시험 보고 있다고 인지하지 않는다. 따라서 직접적으로 평가하기는 학생으로부터 능력을 정확하게 판단할 수 있고 평가와 해석이 간단하며 목표에 대해 직접적으로 연습하기 때문에 긍정적인 효과가 나타난다. 간접적 평가하기는 직접적 평가하기와 반대되는 방식으로 다른 수행을 통해 얻게 되는 간접적인 효과를 측정하는 방식이다. 따라서 이러한 평가하기 방식은 점수로는 타당성과 신뢰성이 갖추어 있더라도 목표 능력의 점수를 정확하게 알 수 없다. 분리 평가하기는 여러 항목들은 한 가지씩 평가하는 방법이다. 이런 시험은 간접적이다. 통합 평가하기는 하나의 과업을 수행하면서 여러 가지 언어 요소를 포함하여 평가하며 직접적이지만 간접적이기도 하다.

규준 참조 평가하기는 하나가 아닌 다른 여러 학생의 정보를 연관 시킨다. 그래서 학생은 자신의 평가 정보에 대해 무엇인지 알 수 없다. 이와 달리 절대기준 평가 혹은 준거 참조 평가에서는 다른 학생의 평가 정보를 비교하지 않는다. 오직 절대적인 기준에 의해서 그 기준에 학생이 통과했는지 그렇지 않은 지 결정된다. 이는 학생이 다른 학생과 경쟁상대가 아니라 모두가 시험에서 합격할 수 있다는 동기가 발생한다.

이외에도 객관식과 주관식으로 평가하기가 있으며 컴퓨터 적용한 평가하기가 있다. 시험을 치는 학생들이 어떤 문항에 늦게 풀고 어떤 문항에 빨리 푸는 것을 분석하고 개개인의 다른 문항에 대한 분석에 따른 맞춤식 정보들을 컴퓨터를 통해 평가를 시행하고 분석할 수 있다. 그리고 의사소통 언어 평가하기가 있다.

언어 평가는 사람의 언어 능력을 평가하는 것이고 이는 기계와 다르게 수많은 변수와 개성 요인이 펼쳐져 있어서 쉽게 정보를 획득하여 수치화 할 수 없다. 인간을 대상으로 하는 연구 역시 절대 진리에 도달할 수 없을 것이다. 연구에 있어 단순히 사람만 그런 것이 아니라 시대의 문명과 사상 안에서 평가는 세분화되고 변하기 때문이다. 좀 더 최적의 평가를 만들고 제공하기 위해서는 하나의 문항에서 많은 요소의 평가와 분석이 이루어져야 하고 그것을 쉽게 분석할 수 있는 보조 도구와 개개인의 언어 학습 요구에 적합한 전반적인 학습 방법과 교재와 평가가 되어야 한다. 그것은 평가와 주어진 환경과 요구를 감안한 평가 연구가 되어야 할 것이다.

 

요약문헌

Hughes, A. (2003). Testing for language teachers. Cambridge: Cambridge University Press. 1-25.


반응형