节点文献

计算机辅助语言测试:效度分析

COMPUTER-ASSISTED LANGUAGE TESTING: VALIDITY ANANLYSIS

【作者】 满朝辉

【导师】 王炳炎;

【作者基本信息】 解放军外国语学院 , 英语语言文学, 2001, 硕士

【摘要】 计算机已经广泛用于了教育的各个领域,包括教,学以及测试。在语言测试方面,计算机的应用日趋广泛,并有逐步代替传统笔试的趋势。随着计算机技术的日新月异的发展,可以用计算机进行测试的种类从最初的客观题已经发展到听,说,读,写各个语言技巧方面的测试(见第一章)。 所谓计算机辅助测试(CAT)指的是在过程的任何环节运用了计算机技术的测试。就象任何新产生的事物一样,人们对计算机辅助测试的信度(Reliability),效度(Validity)等方面依然存在着疑问。本文除了对计算机辅助语言测试目前的所取得的进展以及今后的发展方向进行了全面的描述以外,重点探讨了关于测试效度的几个问题。在讨论计算机辅助语言测试的效度问题的时候,本文分两个章节分别对基于试题库的计算机自适应性测试(CALT)和计算机化的现实性测试(AuthenticAssessment)的效度进行了分析。 本文分由序言,第一章,第二章,第三章,第四章,结语六个部分组成。 序言主要介绍了本文的研究方向,目的和文章结构。 第一章主要描述了目前计算机辅助语言测试所取得的进展和使用范围。主要分四个方面进行了论述:试题库的建设;计算机辅助语言测试可适用的测试种类;计算机自适应性语言测试以及计算机在语言测试中运用的效果。 试题库建设包括生成,操作,分析,储存,管理,挑选试题的所有过程。一个大的,科学管理的试题库是生成规范试卷的保证。一个小的试题库可以用传统的方法,比如说文件卡片的方式进行管理。可是一个容量的非常大的试题库就只能用计算机进行建设和分析,并且很多这方面的软件己经问世,这样缸使得试题库处理更加简住和有效;用计算机进行语言测试并不彤响测试的种类,在第一章的第二部分,本文总结了计算机辅助语言测试的种类,并且分析了运用计算机进行测试的优势所在:打破了传统测试集体性和限时性,达到了个别化测试和不限时测试,是测试上的一次革命;接着第一章介绍了计算机辅助测试的一个很独特并且得到最广泛运用的分支:计算机自适应性语言测试.和其他的语言测试相比,它有以下几个特点:试题根据波测试者的不同而自行调节:一旦棱测试者的实际水平被测出,测试自行停止;一般在曰目数虽上要少于别的测试。计算机自适应性语言测试是基于项目反应理论memResOO’lseTheoryorIRT)的一种测试,已经被美国研究生人学考试N桐沏te ReCOrd W or GRE和工商管理类研究生人学考试(Gradua for Manapernent and Ad’llllllsthaon Tdor GMA)以及全美护士国家委员会资格考试(NUrS Co’llllllltee Lcense Test orNNCL)等都已采取了CAT的方式。不难看出CAT代表了今后教育、心理测验发展的方向与重点。第一章的第四部分从测试本身与人为因素两个方面论述了计算机辅助语言测试的优势,接着从物理考虑和测试者表现考虑论述了计算机输助语言测试存在的不足之处。 第二章专门对基于试题库的计算机自适应性语言测试的效度进行了分析。首先给出了“试图库建设\“项目反应理论”和“效度”一些术语的定义。然后对于影响计算机自适应性语言测试的几个主要因素进行了讨论并一些解诀办法。这些因素主要包括:测试模式的变化,测试者对计算机的戮悉程度的不同,计算机测试带来的紧张愚,速度的彤响,题日顺序的变化,试卷长度的不同,测试者对出题方式的事先训练,和试题库维度(碰mensiom山勺)的考虑。 计算机辅助语言测试除了机遇试题库的以外,还包括现实语言运用的测试,主要指写作能力的测试。第三章就是通过一个实验对这种类型测试的效度问题进行了分析。现在很多写作方面的测试仍然要求被测试者用笔答的方式进行,但很多学生己经习惯了计算机上的写作,或者相反的情况下,那么这种测试模式和练习模式的不同是不是会影响测试的效度呢?这个问题争论已久。本文在这一章就以解放军外语学院98级英语本科学员为对象,进行了一个实验。实验的假设是:测试模式的变化对写作能力测试的结果有有意义的影响,而对客观题(这里采用的是阅读理解的多项选择题)的影响却是可以忽略的。测试者以他们的专业四级成绩和对计算机的熟悉程度(通过问卷和打字速度测试)分成实验组和控制组,分别以笔答和上机的方式答同一份试卷,试卷包括二十道基于短篇阅读理解的多项选择题和一道写作题,机上的部分采用了AUTHQRWARE软件编写,在形式上尽量做到跟笔答试卷相同。两组的作文都以文本方式进行打分,以避免打分者的偏见(bias)。最后对结果进行了详细的数据分析,验证了假设。除此之外,还对写作题答案进行了文本分析,发现计算机答题能产生较长的文本和相对多的段落,并且通过性别分析,得出结论:计算机写作测试对女生的影响大于男生。这个实验表明我们在评估学生写作能力的时候要考虑到测试模式与练习模式不同对测试结果的影响,特别是当学生习惯笔试的情况下?

  • 【分类号】G434;H319.3
  • 【下载频次】472
节点文献中: