单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,语言测试,第一节 概说:发展、作用、学科特点,第二节 语言测试基本类型,第三节 语言测验开发过程,第四节 题目编写和分析方法,第五节 质量评估:信度和效度,语言测试第一节 概说:发展、作用、学科特点,1,第一节 概说,1.,语言测试主要发展阶段:,(,1,)传统时期或前科学时期(,20,世纪初,-50,年代初),语言观:语言是包括语法知识、词法知识、语音知识的知识体系。,特点:测试结果主要根据教师的主观判断,评分的公正性和准确性都不理想,主观性极强,可信度不高。,题型:短文写作、翻译、语法分析。,教学法:语法,-,翻译法。,第一节 概说,2,(2)心理测量-结构主义时期,或称科学时期(,50,年代末,60,年代初,-70,年代):,语言观:以结构主义语言学、行为主义心理学、心理测量学为基础,以,Robert Lado,语言测试,外语测验的开发与使用,(1961),为标志。学习第二语言就是要获得及操作这套符号系统的技能、对刺激做出正确反应的一套语言习惯。,特点:分立式测试,discrete-point test,每题只考查一个考点。,题型:选择填空,词汇填空,语法填空,完成句子,改错。,教学法:听说法。,(2)心理测量-结构主义时期或称科学时期(50年代末60年代,3,(,3,)心理语言学社会语言学时期或后现代时期,(,70,年代,-,今):注意功能性社会性和语言应用。以,ACTFL,和欧洲,功能意念大纲,、,交际大纲,为基础。,Bachman,提出“语言交际能力模型”。,(3)心理语言学社会语言学时期或后现代时期(70年代-今):,4,语言观:,Chomsky,区分语言能力和语言行为;,Hymes,提出了交际能力的概念,认为使用语言不但要能够按照语法规则产出形式合格的句子,而且还应具有在不同的语境中合理使用这些句子的能力,即语言使用涉及社会文化因素。,Canale,和,Swain,的“四能力”说:语言能力、社会语言能力、交际策略能力、语篇能力。,特点:综合式测试,(the integrative approach,)被试须综合运用各种语言知识或技能。,题型:完形填空,综合改错,听写,口试,作文,。,语言观:Chomsky区分语言能力和语言行为;Hymes提出,5,2.,中国的语言测试,(,1,)中国是最早使用考试(西周)的国家。,(,2,)科举是一个标准化程度很高的测试体系。,(,3,),70,年代末受,TOEFL,等影响开始第二语言测试,出现“英语水平考试(,EPT,)”“大学英语考试(,CET,)”。,(,4,)对外汉语教学界“汉语水平考试(,HSK,)”影响广泛。,2.中国的语言测试(1)中国是最早使用考试(西周)的国家。,6,唐代科举,考试范围除了经书之外还广及道家典籍、数学、法律等等。考试的方式大约有下列五种:,帖经:类如今日的填充题:以所习经,掩其两端,中间开,唯一行,凡帖三字,随时增损,可否不一。,墨义:类如今日的问答题。例如有云:作者七人矣。请以七人之名对。则对云:七人,某某也,谨对。,口义:以上两种一般合称为帖经。若帖经题以口试为之,则称为口译。,诗赋题:唐时进士一科,例必试诗赋,或称为杂文。,策:一般称为时务策。策的原义是谋略。,唐代科举 考试范围除了经书之外还广及道家典籍、数,7,3,.,语言测试的作用,(1),一般作用:,评价学习者的学业成就和语言水平。评估教学的实际效果。为选拔人才提供依据。为改进教学中的问题提供反馈。,(2)对于各种有关人的语言能力的假说,需要实证性数据的证实,语言测试在这方面可以为语言研究(语言教学研究)提供信息,发挥重要作用。,(3)语言测试研究能够为第二语言习得研究提供更为可靠而有效的方法和手段。,3.语言测试的作用(1)一般作用:评价学习者的学业成就和语言,8,4.,语言测试的学科特点,(,1,)理论与实践结合非常紧密。,(,2,)综合性很强:应用语言学(语言学、语言教学)、认知科学、心理测量学、教育统计学、信息科学。,4.语言测试的学科特点,9,第二节 语言测试基本类型,一、从用途的角度分:,1.,成绩测验,achievement test,特点:,教什么测什么,学什么测什么,怎么教怎么测。测试内容必须以教学大纲、教材、教学内容为依据。,典型的成绩测验:,期中、期末测验,分类:,最后成绩测验;进步测验,第二节 语言测试基本类型一、从用途的角度分:,10,2.,水平测验,proficiency test,特点:,不以特定的教学大纲、教学课程或 教学方法为依据,只看被试的语言水平如何。,目的:,测试对目的语运用的熟练程度,选拔人才。,难点:,必须弄准什么叫“语言水平”、要求能够预测未来完成特定任务情况。,2.水平测验 proficiency test,11,3.,能力倾向测验,aptitude test,目的:,预测被试学习目的语的能力。,难点:,必须弄准什么是“能力倾向”,,Carrol,等人认为包括:语音能力、语法能力、综合归纳能力、语言记忆能力、语言表达能力等。,3.能力倾向测验 aptitude test,12,4.,诊断性测验,diagnostic test,特点:学什么考什么,教什么考什么,与成绩测验相反。,目的:,了解学习者对教学内容掌握情况,以便调整教学。不一定需要打分,非正式的测验。,4.诊断性测验 diagnostic test,13,5,.,安置性测验,placement test,目的:,妥善地将学习者按程度分班或编组。,特点:,最好以本单位教学大纲或可能开设的课程内容为依据。,各种用途测验又互相联系:水平测验也可以安置学习者,成绩测验可以诊断教学问题。但各种测验用途有区别,基本特性也有区别。,5.安置性测验 placement test,14,依据,所测能力,信息指向,标准化程度,规模,水平测验,语言理论,一般语言水平,将来?,最高,最大,成绩测验,教学内容,不一定,过去,可以较高,可以很大,倾向测验,认知理论,学习潜能,将来,可以较高,可以很大,安置测验,教学内容,现有水平,将来,不高,不大,诊断测验,教学内容,现有水平,过去,-,将来,低,小,各类测验的特点,依据所测能力信息指向标准化程度规模水平测验语言理论一般语言水,15,二、从评分方法的不同分类:,1.,主观性测验,划分标准:,根据评分时是否需要凭主观判断。,形式:,作文、口试、问答、简述、完成句子、完成会话、造句、翻译,优点:,考查有深度和层次;命题容易;很难猜测,缺点:,评分不易做到完全一致;评分费时费力,二、从评分方法的不同分类:,16,2.,客观性测试,划分标准:,根据评分时是否需要凭主观判断。,形式:,选择题、是非判断题、配伍题(如连线),听写、填空是不是客观题,优点:,题量大,内容覆盖面广;评分简单、客观;容易满足统计学的要求。,缺点:,不适合测试产出性语言技能和被试综合运用语言能力;可以猜题;编题费时费力。,2.客观性测试,17,三、分立式测验和综合式测验,1.,分立式测验,特点:,把语言分解成语音、语法、词汇等不同的语言点来测。,形式:,多项选择、是非判断等题型。,优点:,评分客观、准确;试题针对性强。,2.,综合性测验,目的:,了解被试综合运用语言知识的能力。,形式:,写作、口试、完形填空、听写、多项选择的阅读听力理解。,优点:,有效测量被试整体语言水平。,三、分立式测验和综合式测验1.分立式测验,18,四、标准化测验非标准化测验,1.Standardized Tests,特点:,一,是具有统一的标准,,二,是对整个测试过程可能出现的误差都可严格监控(试题编制、测验实施、阅卷评分、分数转化解释四个标准化),缺点:,忽视不同个体习得第二语言特点,客观性多项选择题能否测量真实语言水平受到怀疑,对语言教学产生误导。,2.,Non-standardized Tests,四、标准化测验非标准化测验1.Standardized T,19,第三节 语言测验开发过程,一、设计阶段,(,1,)明确测验目的:语言教育;选拔人才;改进教学,(,2,)明确测验对象:,背景:,个人特征;知识结构;语言水平;对测验的熟悉程度,需求:,求学;求职,(,3,)确定测验内容:教学内容;非教学内容,第三节 语言测验开发过程一、设计阶段,20,(,4,)确定测验方式和卷面构成:题型;题量,汉语水平考试(,HSK,)的题量和时间分布,考试内容,试题数量,试题比重,答题时间,听力理解,50,29.4%,约,35,分钟,语法结构,30,17.7%,20,分钟,阅读理解,50,29.4%,60,分钟,综合填空,40,23.5%,30,分钟,总计,170,约,145,分钟,(4)确定测验方式和卷面构成:题型;题量考试内容试题数量试题,21,(,5,)确定评分方式和分数体系:,主观题的评分标准和分值(模拟),分数,整体评分标准,分项评分标准,词汇,语法,主题,结构,4,词汇丰富,语法正确,主题鲜明,结构完整,词汇丰富,没有错别字,无语法错误,主题鲜明,结构完整,衔接自然,3,词汇较丰富,语法基本正确,主题鲜明,结构较完整,词汇较丰富,偶有错别字,偶有语法错误,主题鲜明,结构较完整,有不连贯的地方,2,词汇不丰富,语法错误较多,主题不鲜明,结构不完整,词汇不丰富,错别字较多,语法错误较多,主题不鲜明,结构不完整,(5)确定评分方式和分数体系:分数整体评分标准分项评分标准词,22,二、操作化阶段,(,1,)编写测验说明和题目细则,(,2,)训练命题员,(,3,)聘请专家就有关问题向其咨询,二、操作化阶段,23,三、施测阶段,(,1,),预测:在测验正式进行之前,让一组有代表性的被试试做,题目分析(难易度、区分度等),筛选正式题目,(,2,),实测:把符合标准题目合成正式试卷,进行测试,,,报告分数,统计研究施测结果(信度、效度的定量定性分析),三、施测阶段,24,第四节 题目编写和分析方法,一、题目编写,(,1,)多项选择题,优点:,A.,可以测试各个层面的语言知识和技能;,B.,具有良好的诊断作用。多选可以将要测试的内容分解为若干项目进行,老师可以通过分析考生在各个项目中出现的错误及时发现问题,予以纠正;,C.,答案固定,评分客观,可以机器阅卷,省时省力;,D.,试题覆盖面广,适用于大规模测试,测试信度高。,缺点:,A.,题目很难设计,费时费力;,B.,不能测量考生的表达能力和推理、论证能力;,C.,对教学和学习的反拨作用不明显。,第四节 题目编写和分析方法 一、题目编写,25,编写多项选择题的基本原则:,1.,只有一个正确答案,(,1,),目前,还没有发现这类问题。,A.,现在,B.,最近,C.,看来,D.,在眼睛前面,(,2,)我们两家,住斜对门,,关系很好。,A.,隔壁,B.,邻居,C.,门有些斜,D.,门靠门,26,2.,只测一个语言要素,他们都认为,这是个好,主意,。,A.,意思,B.,办法,C.,态度,D.,建设,A.,东西,B.,办法,C.,消息,D.,现象,3.,每一个选项在语法上都应该是可替换的,不要再买点心了,再买妈妈又该,说,我们了。,A.,解释,B.,劝告,C.,责备,D.,表扬,4.,文本不能太难,5.,越简洁、越清楚越好,2.只测一个语言要素,27,(2)是非题、判断题,优点:,A.,命题容易,可以在短时间内编制大量的题;,B.,作答迅速,节省时间;,C.,适合于随堂测试使用,老师可以随时利用学生易犯的错误编写试题;,D.,评分客观。,缺点:,猜测机率大。猜中的机率高达,50%,。因此,在重要的考试中一般不使用这种题型。,(2)是非题、判断题优点:,28,(3)配对题,可以看作是一种改良的多项选择题。,优点:,A.,能在小篇幅内测量大量内容,经济实惠;,B.,题目编制容易,很适用于随堂测试;,C.,能够有效地测量知识上的相关性,有利于培养学生观察、辨别、比较分析等方面的能力。,缺点:,A