欢迎访问“安徽语言文字网”
首 页机构简介工作动态政策法规规范标准语文知识学术交流
当前位置:学术交流论文交流
PSC中“说话”项的题型分析和改进建议
【分类:论文交流‖来源:第二届全国普通话水平测试学术研讨会论文集‖上传:安徽省普通话培训测试中心(管理员)‖时间:2012/4/20‖阅读:5106】
北京师范大学文学院(2004级博士生)  朱丽红

提  要:“说话”测试中存在的背稿、离题、说话时间不足等现象,导致测试成绩与应试人的实际语言运用能力不符,影响了PSC的效度和信度。在分析原因时,对试题本身的考察一直被忽略了。本文认为PSC属于以“交际能力”为理论基础的第三代语言测试体系,“说话”测试的话题没有语境和情景,再加上评分标准偏重语音准确性,是导致测试结果偏离测试目标的主要原因。因此,本文提出改变现行的“说话”测试的题型,同时相应调整评分标准。

关键词:“说话” ; 题型分析  ;改进建议 

一、“说话”在普通话水平测试中的重要地位
新《大纲》指出:“普通话水平测试测查应试人的普通话规范程度、熟练程度,认定其普通话水平等级,属于标准参照性考试。”

“水平测试(Proficiency tests)”是从测试目的的角度对测试的归类。水平测试的目的是要根据测量结果判断应试人是否具备了完成特定的工作所需要的语言水平和语言运用能力,Proficiency tests通常也译为“能力测试”。普通话水平测试是“测查应试人的普通话规范程度、熟练程度”的水平测试,是对应试人在从方言向普通话的转化过程中运用普通话的能力的测试。

“标准参照考试(Criterion-referenced testing)”是按测试结果的参照形式进行的归类。标准参照测试中的“标准,指的是标准行为,也就是真实情境中的真实行为,不是为推断这种行为所采用的任何快捷方式,更不是测验的分数线”(张凯,2002)。任何一个测试都只能得到应试人在测试中的表现,也就是真实行为的抽样,然后根据这些有限抽样的表现来推断应试人在真实情境下的表现。问题是:这种抽样能在多大程度上代表应试人的标准行为,我们据此做出的推断又能在多大程度上代表应试人的真实水平?作为测试的开发人员或实施人员,我们对这种抽样的判断是否能保持一致性,以供测试结果的使用者做出正确的决定?这就是测试的效度和信度问题,关系到测试的质量和信誉。

普通话能力由书面语能力和口语能力构成(于根元,1998),普通话水平测试测的是口语能力,采用口试这种直接测试方式是实现高效度的基础。口语测试要求测试任务能最大限度地诱导应试人做出能代表其真实能力的行为,同时又要能实现效度和信度的平衡。因此,题目的内容和题型设计就成为引发应试人的代表性行为的重要技巧。

普通话水平测试的读单音节字词、读多音节词语、判断测试、朗读等四项,除了“判断测试”需要应试人先选择正确答案以外,都是“读”的项目,测试重点都是语音的标准程度。这四项测试的优势在于评分的量化程度很高,可以保证测试的信度,但是“读”并不能完全反映应试人运用普通话的能力,在效度上有欠缺。只有“说话”项的测试需要应试人自己组织语言材料再表达出来,综合考查应试人普通话语音、词汇、语法以及说话的流畅性等项目。说话行为是应试人普通话能力的最直接的反映(前提是应试人有真实的语言表现),是语言运用能力测试的重点和关键,也是实现普通话水平测试的效度的关键。

“说话”在五项测试内容中分值最重。新《大纲》同意“各省、自治区、直辖市语言文字工作部门可以根据测试对象或本地区的实际情况,决定是否免测‘选择判断’测试项。如免测此项,‘命题说话’测试项的分值由30分调整为40分。”这样,“说话”在整个测试中分量更重,对应试人的成绩影响更大。

语言行为的本质决定了“说话”项不可能精确量化,测试结果会损失一定的信度,但是能达到更高的效度。当信度与效度发生冲突时,有几种选择:保证效度,放弃信度;保证信度,忽视效度;维持现状;谋求平衡。一般认为,如果信度与效度不能同时获得,信度必须服从效度,否则只是精确地测量了本来不想测量或不需要测量的东西。做好“说话”项的测试有利于提高普通话水平测试的效度,也可以力求兼顾信度。

 

二、现有的对“说话”项的分析 
目前的普通话水平测试已经“具有较高的试卷的一致性、较强的地区适应性和较好的成绩可比性”(王渝光等,2002),但是鉴于“说话”项的重要地位,其暴露出的普遍问题也引起很多人的关注,现有的研究成果已经对这些问题主要表现及原因作了归纳,以下只作列举,不再赘述。

主要的表现有:背稿;离题;说话时间不足,有两种情况:一种是说话速度特别慢,在规定的时间内没说出多少内容;另一种是说话的内容很少,达不到时间要求就无话可说了。

对原因的探讨主要集中在以下几点:首先是“说话”测试的话题早已给定,应试人有充分的时间做准备。其次是单向说话的测试形式。“说话”测试强调以单向说话为主,容易导致应试人不顾现实情境,只管自己说自己的。第三是“说话”项的评分标准。在前四项重点测查语音标准程度的基础上,“说话”测试的重点仍然是语音。在评分项目上没有关于离题的判定,对背稿也只是在“自然流畅”一项中有要求,而且扣分非常少。词汇语法和自然流畅程度的扣分和语音标准的扣分相比就像芝麻比西瓜。有些应试人离题是因为抽到的话题对他来说的确无话可说,但是一般不可能出现两个话题都这样。对很多语音失误严重的应试人来说,离题是一种宁可丢掉芝麻也要抱住西瓜的应试策略。背稿和说话时间不足也大抵出于这个考虑。

笔者认为有些教师的应试误导也是原因之一,表现为测试对教学的反拨作用。由于普通话水平等级证书关系到学生能否拿到毕业证、能否申报教师资格等重大问题,普通话培训与测试很受重视。由于“说话”项在整个测试中是重要的调节杠杆,整个测试中语音的分量几乎占到了80%,普通话教学的重点自然就放在了正音上。在测试辅导时,有的教师就明确告诉学生应该“紧扣语音中心,以语音不出错为主要目标”,由于“在一定时间内说的越多出错的机率就越大,……说话时可放慢语速,控制节奏,把注意力放在发音上”。按照这样的应试策略能够得到高分,但是一到实际的运用中,就露馅儿了。普通话水平测试在处理信度与效度的关系时选择以牺牲效度实现高信度的做法带来了很不好的反拨作用。

语言测试的反拨作用还不止表现在语言教学方面。有专家提出,语言测试的反拨作用应该包括对应试人个人的潜在影响、对教学和学习活动的影响、对教育体系以及对社会的价值和目标的影响(J.Charles Alderson, Caroline Clapham and Dianne Wall,2000)。针对语文教育中长期存在的偏重书面语轻视口语的问题,语文教育领域也在进行反思和改革。2002年颁布的《全日制义务教育语文课程标准(实验稿)》把原来的“听话说话”改为“口语交际”,南京师范大学的魏南江先生在回答二者之间有什么区别时指出:这“绝不仅仅是个名词术语的更换,而是课程功能重新定位的产物”,“口语交际重在交际,重在培养学生的交往能力,并把这种能力看作现代公民的必备素养”(魏南江,2002)。有的学者提出,中小学语文教学要根据现代语的要求,处理好文言、白话和普通话、方言四者之间的关系,作为全民族的共通口语的普通话的训练必须得到充分的重视,因为“在一体化、地球村的年代,人际交往愈来愈频繁,在传声技术现代化的年代,口头交际愈来愈重要,一代新人要投入社会,要在公关活动中应付各种复杂的局面,实现自我价值,没有良好的口语交际能力怎么行”(李如龙,2003)?李宇明指出,在现代化和信息时代的大背景下,推广普通话工作不仅是“使越来越多的人能够讲普通话”,还要使人们“在各种语言场合切题合意地使用普通话”。普通话水平测试将目标定位在测量运用普通话的能力和水平是非常准确的,测试也应该能够为推广普通话和改进语文教育提供有力的正面反拨作用。

 

三、“说话”项的题型分析
香港中文大学运用概化理论(Generalizability Theory)对测试项目的多少、测评员人数与测试信度的关系问题进行了研究,结果显示与试题相关的项目方差成分很大,说明试题在测试中具有重要意义(王渝光等,2002)。从试题入手找原因,这个角度在已有的研究中一直被忽略了,这正是本文的出发点。

要分析题型首先要了解当前语言测试体系的要点。从历时的角度来看,随着语言观、语言教学观和语言测试观的不断变化和发展,语言教学与测试体系到目前为止经历了三代(李筱菊,1997)。 20世纪60年代中期以后,第三代语言教学与测试体系开始崛起,并于70年代后期在西欧和北美占据了主流地位。

第三代体系的语言教学观是交际语言教学,语言测试观是交际语言测试,即教的和考的都是交际能力。交际能力理论是第三代语言教学与测试体系的直接理论基础,“交际能力”的概念由美国社会语言学家海姆斯(D.Hymes)1967年正式提出。其时正是转换生成语言学的高峰时期,乔姆斯基关于“语言能力”和“语言运用”的区分非常流行。海姆斯则认为,必须提出一个超越“语言能力”和“语言运用”的概念来修正对“使用语言的能力”的忽视和错误认识,这个概念就是“交际能力”,它包括四个交际参数:

(1)语法性,相当于乔姆斯基的“语言能力”,主要指在语言形式系统上是否或在多大程度上是可能的;
(2)可行性,主要是从心理因素如记忆、感知方面考虑是否或在多大程度上是可行的;
(3)得体性,指与实际的情境特征是否或在多大程度上相切合;
(4)现实性,是指虽然有些东西是可能的、可行的、得体的,但是现实中人们遵循着约定俗成的习惯,并不采用或很少采用。

可见,海姆斯的“交际能力”的范畴大于乔姆斯基的“语言能力”的范畴。根据李筱菊(1997)对种种交际能力模式的总结,交际能力包括三个范畴的能力:“语言能力,指对语言形式结构系统本身的操作能力;语篇能力,指语言形式结构置于语篇中运用的能力;语用能力,指语言形式结构置于情境中运用的能力。” 在教学和测试内容的选择上,第三代体系强调语言的学和教都必须放在具有真实性的交际情境中进行,测试也应该在具有真实性的交际行为中检测,评估的标准应该包括对以上三个范畴的能力的评估,即准确性(对语言形式系统的掌握)、流畅性(语篇的组织)和得体性(对情境的切合)。

测试体系的发展往往滞后于教学体系。目前,在测试领域,第二代体系仍然是主流。尽管如此,第三代测试体系已经逐渐发展成为能够与之相抗衡的潮流,并且代表着语言测试体系未来的发展方向。从性质和目的来看,普通话水平测试属于第三代语言测试体系,是语言运用能力测试,“说话”测试是对这种能力的直接检测。现有的试题内容和题型是不是最能诱导出应试人的真实表现呢?

首先,目前的“说话”测试给出的只是一个个孤立的话题(原《大纲》和新《纲要》在这一点上并没有什么不同),没有语境也没有情景,评分标准也不要求应试人考虑一定的情境。人们说话的目的是为了实现有效的交际,有效交际的三个评估标准即准确性、流畅性和得体性,在“说话”项评分标准中没有得到全面贯彻,准确性比例最大,由于试题本身不包括情境,得体性在现行的评分标准中就失去了存在的理由。在这样的情况下,应试人的语言表现是抽象的言语行为,对这种剥离了真实语境和情景的抽象言语行为进行测量时能够精确量化,实现很高的信度,但是效度就大打折扣。

其次,话题是早已给定的,做准备也是符合测试要求的,应试人根据对评分标准的分析,把背稿、离题、说话速度慢或时间不足作为避开自己的难点音而减少扣分的手段也不足为怪。测试员根据现行的评分标准打分也是遵章行事,最后必然出现测试成绩与实际能力不相符合的后果。

很多关于“说话”测试的研究文章都提出应该把单向说话的形式改变为测试员和应试人的双向对话,理由是有了交流的对象就不会出现背稿、离题之类的问题。刘润清在《语言测试和它的方法》一书中介绍了一套剑桥英语水平考试的高质量的口试试题,我们可以借鉴一下:

Situations:

1) You have your car repaired at a garage. The next day when you are out driving, the same trouble occurred. What do you say when you return to the garage?

2) You are watching a very exciting football match. At the most thrilling moment a very large man moved in front of you. What do you say to him?

3) You have been ill at home and a friend has been looking after you. You are very grateful. What would you say?

4) You promised to take your children out for a picnic. When the day arrives you find it impossible to go. Apologize to the children and explain why you can’t go.

5) You buy a small puppy because it looks sad in the shop window. You know your husband/wife doesn’t like dogs. What do you say when you get home?

试题中包括五种情境,应试人可以选择三种。不管应试人选择哪一种,都处在不同的交际情境下,场景、身份、人物关系、交际目的各不相同,需要应试人采用不同的交际策略。

从这个例子我们可以得到这样的启示:即使是在最能代表口语能力的“说话”测试中,单向说话的形式并不是不能用。试题中规定了说话的情境,这些情境是对现实的交际行为的一定程度的取样和模仿,应试人在说话时比较容易找到对象感和交流感,如果测试员能适当配合,就能缓解应试人的紧张情绪,测试项目的真实性就增加,应试人的测试行为就可以反应出真实行为(也就是标准行为)的水平和能力。不同行业有不同要求,我们在开发测试的过程中,如果能充分吸收社会语言学对语言变体的研究成果,通过对不同行业、不同人群的交际能力的需求分析,设计出大量有针对性的试题,从准确性、流畅性和得体性角度全面进行评估,测试结果就更有参考价值。
 

四、“说话”测试的改进建议
根据以上分析和讨论,针对现有的“说话”测试的不足,我们提出以下改进建议:

首先,说话测试不必先给出话题,改为现场抽题或主试人给题的方式,应试人的准备时间包括在测试现场准备时间之内。这样,考前的写稿、背稿就没有必要也没有可能,这是一种釜底抽薪的办法。 

其次,给话题提供一些语境和情景,增加话题的真实性,使应试人的测试行为尽量表现为交际行为,产生真实的语言表现,从而推断出实际的交际能力。举例如下: 

话  题:我的学习生活
情景一:假如你是高一年级的班主任,在新学期的第一次主题班会上向全体学生讲述你的学习生活,你打算说些什么?   
情景二:假如你是一位学生,请你在班级的学习经验交流会上向同学们讲述你的学习生活。
情景三:有一位刚入学的小学一年级学生想知道你的学习生活怎样的,请你向她讲讲你的学习生活。
情景四:多年不见的老同学相聚,大家在一起回顾学习生活,你也要发言,你会怎么说? 

分析:这是原《大纲》中的一个话题,《纲要》里也保留了。这里设计为应试人现场抽到的话题,同时加入了几种情景,允许应试人根据自己的实际情况选择自己最有话可说的一种或两种。这样,原来抽象的言语行为因为有了情景的规定,变成了具体的言语行为,背稿、离题等现象被严格限制,应试人必须考虑到说话的时间、场合、对象、内容、方式以及目的等因素,测试内容涵盖了交际能力的三项内容,有效交际的三个评估标准也得到全面贯彻。

由于题型的改变,评分标准也必须随之做出调整,需要测量的项目应该在评分标准中显示出来。以下是一个关于“说话”项的评分标准设计: 

“说话”项评分细则(总分:40分)
一、语音面貌(20分)
1、离题(5分): 
(1)切题,不扣分;
(2)离题,扣5分。
2、语音(10分): 
(1)语音标准,无方言色彩,不扣分;
(2)语音错误在10次以下,方音不明显,扣0.5-1.5分;
(3)语音错误在10-15次之间,方音比较明显,扣1.6-2.5分;
(4)语音错误在16-20次之间,方音比较明显,扣2.6-3.5分;
(5)语音错误多,声韵调有系统性错误,方音明显,扣3.6-4.5分;
(6)语音错误很多,方音浓重,尚能听出是普通话,扣4.6-5分。

3、词汇、语法(5分):
(1)词汇、语法规范、正确,不扣分;
(2)方言词汇和语法或明显的词汇、语法错误出现1-2次,扣1-2分;
(3)方言词汇和语法或明显的词汇、语法错误出现3次及3次以上,扣3-4分。
二、自然流畅(10分)
1、口语化(5分):
(1)口语化强,表达自然,不扣分;
(2)口语化较弱,有背稿痕迹,扣1-2分;
(3)口语化弱,背稿痕迹明显,扣3-4分。

2、流畅性(5分): 
(1)语速适当,说话流畅,不扣分;
(2)口头禅多或说话断断续续,扣1-2分;
(3)停顿较多,说话时间不足2分钟,扣3-4分;
(4)基本无话可说,说话时间不足1分钟,扣5分。

三、得体性(10分): 
1、能紧扣语境和情景要求,表达效果好,不扣分;
2、总体符合语境和情景要求,表达效果较好,扣1-3分;
3、基本符合语境和情景要求,表达效果一般,扣4-6分;
4、不符合语境和情景要求,扣5-7分。

这个评分标准降低了语音的比重,增加了对离题、非方言性词汇语法错误和得体性的扣分标准,细化了对自然流畅的评分,这样做的目的是为了提高评分的信度。另外,根据王渝光等的介绍:“一般情况而言,选择50个词语2人评判可能是普通话水平测试的最低信度要求” (王渝光,2002)。现在的PSC要求由三个测试员评分,应该是可以保证信度的。 

 
五、 结    论 
根据以上分析讨论,“说话”测试问题的根本原因并不在于单向说话形式,最有效的改进办法的是改变“说话”测试的题型:放弃考前给题,改为临场抽题;取消抽象话题,规定不同情境;减少准确性分值,增加对得体性的要求。这样做的目的是尽量为应试人提供具有真实性的测试环境(由于测试员的行为也会影响测试的效度和信度,这需要测试员的大力配合),让应试人尽量发挥出最高的真实水平和能力。本文提供的只是设想,还需要在实验和实践中做出调整,加以检验,但是应该不失为一条思路和方向。 
 

参考文献:
Arther Hughes著.Testing for Language Teachers[M]. Cambridge:Cambridge University Press,1989
Lyle F.Bachman and Adrian S.Palmer 著.Language Testing in Practice[M]. 上海:上海外语教育出版社,1999 
国家语言文字工作委员会普通话培训测试中心编制 《普通话水平测试实施纲要》,商务印书馆,2004。
张凯《标准参照测验理论研究》,北京语言文化大学出版社,2002。
刘润清、韩宝成编著《语言测试和它的方法(修订版)》,外语教学与研究出版社,2000。
李筱菊《语言测试科学与艺术》,湖南教育出版社,1997。
刘照雄主编《普通话水平测试大纲》,吉林人民出版社,1994。
王晖《1994年以来普通话水平测试研究概述》,《语言文字应用》,2003年第2期。
李如龙《文言 白话 普通话 方言》,《语言文字应用》,2003年第4期。
李宇明《信息时代的中国语言问题》,《语言文字应用》,2003年第1期。
王渝光、姚一斌、张雷、杨志明《现行普通话水平测试的质量评析与改进——兼答〈方言区普通话测评中的负面因素〉一文》,《语言文字应用》,2002年第4期。
屠国平《普通话水平测试说话项评分的几个具体问题》,《绍兴文理学院学报(哲社版)》,2002年第3期。
钱华《普通话测评“说话”项负面因素探析》,《龙岩师专学报》,2002年第4期。
钱华《普通话水平测试“说话”项若干问题的分析》,《湖州师范学院学报》,2002年第2期。
苏向红、施晓红《“说话”及其非字音失误成因与对策》,《湖州师范学院学报》,2002年第2期。
魏南江《关于口语交际教学的对话》,《语文建设》,2002年第11期。
杨云《方言区普通话测评中的负面因素》,《语言文字应用》,2001年第3期。
刘春宁《普通话水平测试“说话”考核探讨》,《哈尔滨师专学报》,2000年第6期。
赵则玲《普通话水平测试中的“说话”问题》,《广西师范大学学报:哲社版》2000年第4期。
韩宝成《语言测试:理论、实践与发展》,《外语教学与研究》,2000年第1期。
张军民《普通话水平测试暴露的问题及对策》,《甘肃高师学报》,2000年第4期。
王玲玲《试析普通话水平测试中“说话”的评分误差》,《南京社会科学》,1999年第6期。
康健《普通话“说话”测试应试分析》,《贵州师范大学学报:社科版》,1999年第3期。
张宝钧《对语言测试反作用于教学的再认识》,《语言教学与研究》,1998年第2期。
周大军、高兰生《交际性语言测试理论述评》,《外语教学与研究》,1998年第2期。
于根元《关于普通话能力》,《语文建设》,1998年第9期。
张德馨《谈语言能力及能力测试》,《语言文字应用》,1997年第4期。
宋欣桥《普通话水平测试评分中的几个问题》,《语言文字应用》,1997年第3期。
陈旻《普通话水平测试及应试要点》,《淮阴师专学报》,1997年第1期。
中国语言文字网  http://www.china-language.gov.cn 

                                

* 本文节选自作者的硕士论文《对PSC中“说话”题的理论思考和改进建议》,指导老师为傅爱兰教授。




测试安排、报名时间请咨询测试站,点击这里查看联系方式。咨询/投诉:ahpsc@qq.com,0551-62677300、62655300。

地址:合肥市庐阳区六安路7号华信大厦3楼