1. 前言
美国著名语言测试专家L. Bachman(1990,279)指出:“测试的开发和使用不是在毫无实用价值的心理测量的试管中进行试验;测试必定是为满足某些需求而开发的,这些需求可能是教育体系内部的,也可能是整个社会的需求。”以色列语言测试专家B. Spolsky(1995,358)在讨论测试目的的重要性时,十分赞同Bachman的观点。他说:“正如Bachman所强调的,语言测试同所有的测试一样,首要任务就是明确考试的目的。”
语言测试的开发和实施是为了适应社会对人才培养的要求,社会对所需人才的要求决定了我们的教学要求,而教学要求决定了语言测试的内容和形式。因此,语言测试改革的原动力是社会发展对人才培养提出了新的要求。从宏观经济学角度讲,经济是促进社会发展的决定因素,进一步讲经济因素制约着语言测试的几个方面:测试的开发,测试实施的可行性,获得测试结果便捷性,测试手段的可靠性,测试的安全性。文章系统论述了大学英语四级(CET-4)发展中的经济因素。
2. 外语测试发展中的经济因素
语言测试的发展往往随着语言科学和技术科学的发展而发展,语言理论提供测试内容,技术科学提供测试手段。然而我们也发现,一个新的语言理论和技术的突破有时并没有带来测试上的发展,测试实践往往大大滞后于前两者。交际语言观在80年代就被我国广大语言工作者和教师认同,交际语言教学亦得到推广,但直到现在,交际测试模式依然在探索之中。所以机构性、社会性和个人的经济因素的分析更能有力地解释实际语言教学和测试的发展(Spolsky,1996)。
2.1 测试机构测试手段中的经济因素分析
在大型测试中,测试机构要考虑时间、费用、效果、利润等诸多问题,所以测试不是人们认为的想测甚么就能测甚么,测试机构总是趋向于采用简单而经济的测试,避免复杂而花费人力的测试。测试只能在现实中进行,受着经济因素的限制,这种限制对测试的影响不容忽视。
测试要考虑所需的开支。如果试卷需彩印,需要录音录像,又或是需要很多人手来进行测试和阅卷,测试的开支会很大,因此测试前必须做好开支方面的预算。判断一项外语测试成功与否,主要看这个测试能否真正测试出被测试者的水平,即在多大程度上测出了想要测试的东西。我们一般认为测试前期的命题准备是关键所在,但在测试实践过程中我们发现经济因素不但影响了测试命题还影响了施测进而影响整个测试的效果。先拿时下四级考试形式发展的必然方向:计算机自适应语言测试(CALT)来说,目前有好多高校还没有这项经费预算来配置适合测试软件的电脑,同时也不具备保证测试系统和测试过程的手段,也就是说没有足够的财力来支持最先进的测试系统,所以尽管计算机自适应语言测试很符合考试需要但也只能因高校现有的经济状况而暂且搁置或仅作为试点运行。国外的测试发展情况也是如此。大型标准化测试托福的(CALT)计划也因为经费问题拖至今日才解决,中间经历几年的资金准备,因为只有财力充分才能运作全新的、质量高的测试系统。
在我国改革开放日益深化的新世纪之初,大学生用英语通过“听”来获取信息并通过“说”来表达思想以参与国际交流的机会越来越多。也就是说,新的社会需求对大学生的英语能力提出了更高的要求,即不仅能通过阅读来获取信息,还能以英语为工具,参与学术交流活动,如听学术报告、参加学术讨论等。为此,教育部于2003年初成立了大学英语教学改革项目组,制定了新的《教学要求》,提出了新的大学英语课程教学目标,即培养学生英语综合应用能力,特别是听说能力,使他们在今后工作和社会交往中能用英语有效地进行口头和书面的信息交流。
大学英语四、六级考试改革要对考试内容和形式进行改革,目标是更准确地测量我国在校大学生的英语综合应用能力,尤其是英语听说能力,以体现社会改革开放对我国大学生英语能力的要求。但是目前的大学英语四级考试只有标准化的听力测试,一些地方由于听力资料播放条件的困难,不能或者降级了听力考试的公平性;口语测试改革还没有开始。一般来讲口语考生要单独测试,所以考官数量和时间是不得不考虑的问题,要培训更大数量的口语考试人员,要增加更多的时间,要付出更大的经济代价。这些经济因素使得组织考试的机构还不能施行口语考试的改革。目前,口语考试只对英语笔试成绩优秀的学生进行,可是说的能力和其它能力是不同的能力,而且许多人各种能力的发展是不均衡的,有些人说的能力很强但笔试成绩不好,这些人因此失去了得到认可口语能力的机会。
2.2 受试者、测试者和公众的经济水平
大学英语四级考试是当今中国乃至世界上参考人数最多的 英语能力考试。考场多设在考生集中的大学里,考试费用低,目前只有几十元的考务费用,相比于托福,GRE,雅思等其它考试费用是非常低廉的。这使得从经济角度看,四级考试的成本费用是目前几种主流英语考评体系中相对便宜的一类,适用于大多数计划求职应聘者。但这丝毫没有影响该测试要表现的测试者鉴定的权威性,测试结果的科学性、准确性和确定性。
2.3 测试的可操作性
可操作性则指从物力或财力上测试是否得以实施,是否可行。如不可行,就必须对测试做出修改。
可操作性即可行性,可操作性是指制约施考过程的因素。我们知道,制约施考过程的因素有:资源因素、人力因素和时间因素。资源因素指考试场地、考试所需的设备、阅卷设施等。人力因素指考官、监考人员、阅卷人员等。时间因素是实施考试可用时间。因此,我们在设计考试时,必须先考虑到这些因素,否则,一个不实用的考试再完美也只能是纸上谈兵。大学英语四级考试地点方便、监考老师培训费用低、组织考试与英语教学工作较好协调。考试的组织实施,监考和阅卷工作,也大都由大学里的教学管理者和教师担任。
从理论上说,人们追求测试的可行性、效度、信度三者的完美统一,但在实际语言测试中必须在三者之间做出妥协。而这种妥协的结果往往受到语言观、学习观、测试目的以及经济因素的影响。当然,我们不能因为受到上述挑战而停滞不前,应该努力实现在测试上更高的可行性、效度而又同时体现信度的新突破。
3. 计算机自适应语言测试(CALT)
据报道,TOEFL测试机构美国的教育测试服务处总裁Nancy Cole曾于去年访问设在上海交大的大学英语四、六级考试委员会。“为了迎接21世纪的挑战,双方都已经开始了计算机辅助量裁性自适应考试的研究”。
机助测试目前处于第二代,正向第三代发展。除了某些技术上的限制使其本身仍有缺陷外,其优点是相当突出的。其经济方面表现在:因其实行无纸化考试,节省了大量的纸张、印刷、运输等方面的物质消耗,从而更多的时间、经费和物资可以投放到测试开发和分析中去。同时,可大大减轻有关从业人员(如测试专家、命题人员、监考人员、教师等)的工作负担,避免“低层次重复劳动”。总之,机助测试是相当经济的。
大学英语四级考试是一种尺度相关-常模参照考试(Criterion-related Norm-referenced Test),目前所采用的心理测量模型主要为经典测试理论,在经历了将近二十年的实践,积累了丰富的经验,实施CALT的条件已较为成熟;再者,CALT成本较低、可立即记分、效率高,非常适合像CET这样大规模的语言考试。让我们欣喜的是自90年代以来,全国大学英语四、六级考试委员会一直都在致力于基于项目反应理论的CET数学模型的研究和CET的改革,题库已正在建设与完善之中,计算机化调适性CET测试的推行将指日可待。到那时,近几年来屡禁不止的泄题现象就可以得到很好的遏止。
从具有世界影响的大型测试—TOFFL的产生和发展的历史也可以看到外界因素对测试的影响。TOFFL产生于60年代初。针对当时以外国学生为对象的英语测试的不完善,提出开发以英语作为外语的测试的设想。在最初的讨论中,Caroll( 1986)提出,语言测试的目标是在考查各项语言知识的基础上,加试综合项目。在保留分立式测试项目的基础上,辅之以考查与实际生活情景有关的说和写的能力的测试。这种观点原则上被有关人士接受,可是决定实施时,重点却放在客观测试上,因为它更为现实更有可行性,而当时经费是最为严重的问题。这个项目一拖就是二十年,随着时间的推移,这方面的研究继续在做,但它的指导思想并非对语言测试理解的深化,还是防止用户对测试的抱怨。由于用户的要求,口语测试在80年代开始实施,两三年后,越来越多的人要求使用它。这个项目在国外的考点并没有实施,当然也是可行性和经济上的原因。写作测试也是在TOFFL的最初设计之中的,由于费用太高而受阻。自至80年代初,有关专家提出开发直接写作测试的计划,这项计划强调市场反应的重要性而不是以测试理论作为设计的基础。写作测试是在1986年才正式实施的,它的成功是市场推动而不是测试研究的结果。这个事例说明,测试的发展除了其本身的理论发展还须受制于其外在的客观因素,比如说经济因素。
CALT是现代化教育技术改变测试手段的新方向,世界上许多很有影响的国际性英语考试也正在全面推行CALT。1998年以来,GRE普通测试由传统的纸笔测试全面改为CALT;东软在线雅思考试(Computerized Assessment System for English Communication)结合日本顶级教育产品和服务提供商旺文社(OBUNSHA)教育集团的经验开发的CALT系统已经广泛应用于企业、学校和政府,成为评价国际职业英语能力的标准。诚然,作为一个新生事物在经济等因素的催活下,CALT仍有许多地方需要改进与完善,随着语言教学的改革与进步,我们相信我们能够充分发挥计算机技术的优势并辅以经济效益,紧跟世界语言测试的新方向,与时俱进,为中国外语测试开辟一片新天地。
4. 结束语
从CET-4的酝酿、诞生和发展能够看出在影响语言测试发展的方方面面中,往往是政治因素、社会因素和经济因素,而非测试理论,扮演了更为重要的角色。这个结论会极大的拓展语言测试研究者的视野,使我们认识到,必须将语言测试的发展置于特定的历史、社会、政治和经济背景中加以分析。语言测试发展与外部的非理论的经济、社会等因素是什么关系是该文想回答的问题。因为多年与CET-4相伴的经历使我们感到,语言测试理论的进步并不能主宰测试实践的发展。对影响语言测试发展非专业因素的研究最终会有助于推动语言测试向尊重测试规律的方向发展,使语言测试成为真正意义上的公平测试,并为研究人员展望未来可能的发展前景提供有价值的参考资料。
参考文献
[1] 金艳. 改革中的大学英语四、六级考试[J]. 中国外语,2004(1).
[2] 杨惠中. 从四、六级考试看我国大学生当前的英语语言能力现状[J]. 中国外语,2004 (1).
[3] 大学英语教学大纲(修订本)(1999). 上海:上海外语教育出版社;北京:高等教育出版社.
[4] 李兆增. 外语测试题库理论及试题编制策略的研究[J].山东师大外国语学院学报, 2002, (1): 95-98.
[5] 申瑞民, 曾华军. 基于Web的自适应考试系统. http://www.cmr.com.cn/ distance/wangluo/002.htm, 2001.
[6] 朱正才, 杨惠中. 关于机助自适应大学英语四、六级考试[J]. 外语教学与研究, 2000, (2):136 - 139.