单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第七章 测验的实施和计分、解释,第一节 测验的实施,一、测验实施前的准备工作,向被试预告测验:测验的时间、地点、内容,让被试做好心理准备。,熟悉测验程序:测验内容、施测步骤、记分方法、分数解释。,准备测验材料。,准备测验环境:通风、采光、噪声、桌椅高度、桌面大小、挂牌以防止以外干扰等。,熟悉测验的指导语:告诉被试如何选择反应形式(划勾还是涂黑),说明时间限制,例题演示,有时告知被试测验目的。,二、测验的具体实施,按测验手册要求实施测验。,控制测验焦虑,不讲威吓被试的话。,与被试建立良好的协调关系(,rapport,)。,及时和清楚地记录被试的反应。,对特殊问题有所准备(如作弊、被试不配合等)。,第二节 测验的计分和分数的合成,一、计分的一般程序,(一)计分的基本步骤,1、及时和清楚地记录被试的反应,2、制作标准答案,也称计分键,3、将反应和计分键相比较,给反应归类或赋予分数值,(二)论文题计分,盲审,多个主试评分,细分计分标准,(三)客观题计分,人工计分和机器计分,猜测校正公式,S=R,-,W/,(,K,-,1,),S,校正后的分数;,R,被试答对的题目数;,W,被试答错的题目数;,K,选择项目数,是否需要对猜测进行校正?,赞成的理由:,反对的理由:,(二)测验分数的合成,1 分数合成的种类,(1)项目的组合,把各个题目得分相加,得到量表分或分测验分。,分等量加权和不等量加权。,(2)分测验或量表的组合,把各个分测验得分相加,得到量表总分。,(3)测验或预测源的组合,同时运用多个测验得分进行预测,2 分数合成的方法,(1)临床诊断直觉合成,从整体上进行的定性分析,灵活性强,有针对性。,(2)加权求和合成,单位加权:各原始分相加,X,c,=X,1,+X,2,+X,3,+,X,n,等量加权:如果各个分数重要性相等,用标准分相加即可;,Z,c,=Z,1,+Z,2,+Z,3,+Z,n,如果各个分数的重要性不一样,就要根据重要性不同,赋予不同的权重,即加权系数。,Z,c,=W,1,Z,1,+W,2,Z,2,+W,3,Z,3,+,W,n,Z,n,(3)多重回归,用多种预测源分数(测验分数)来预测未来结果。,=a+b,1,x,1,+b,2,x,2,+b,3,x,3,+,+b,n,x,n,(4)多重分段,高中毕业,合格,政审,合格,体检,合格,高考,合格,录取,不合格 不合格 不合格 不合格,淘汰 淘汰 淘汰 淘汰,(5)轮廓分析(剖面图分析),在MMPI中,如果在量表2和量表7上分数高,即27/72,说明抑郁、焦虑不安,有神经症。,第三节,参照常模的分数解释,原始分数与导出分数,原始分数(,raw score,):,将被试的反应与标准答案相比较而获得的测验分数。原始分数本身没有多大意义。,导出分数(,derived score,):,按照一定的规则,针对原始分进行统计处理后获得的分数。导出分数具有一定参照点和单位,可以相互比较。,根据解释分数时的参照标准不同,可以将导出分数分为两大类:,常模参照分数,标准参照分数:,包括,内容参照分数,结果参照分数,。,参照常模解释分数,通常是将被试的分数直接或间接地以在某个团体中的相对等级或相对位置来表示。这个用来比较的参照团体,称为,常模团体,(norm group)。常模团体的分数分布,就是,常模,(norm)。,一、常模团体的组成,(一)常模团体的性质,由具有共同特征的人所组成的一组群体,或是该群体的一个样本。,任何一个测验,都有许多可能的常模团体。,在制定常模时,首先要确定常模团体。,在对常模参照分数做解释时,也必须首先考虑常模团体的组成。,(二)确定常模团体的注意事项,1 群体构成的界限必须明确,对每个常模团体的性质和特征的简短且明确的描述。,2 常模团体必须是所测群体的代表性样本,克服取样偏差,采用正确的取样方法:随机取样,系统抽样,分层取样。,3 取样的过程必须明确且有详尽的描述,在测验手册中,有关取样的大小、取样方法、取样时间等的说明和描述,越明确、越详尽越好。,4 样本大小要适当,从统计学原理上说,样本是越大越好,但考虑到经济、实用,样本数量也不能无限扩大。样本大小可以根据以下几方面来确定:,常模总体的数目,。总体数目小,则样本数目也小;总体数目大,样本数目也应大。一般来说,样本最好应有,30100,人;如果是全国性常模,一般应有,20003000,人为宜。,总体性质,。总体性质越复杂,样本容量就越大。,测验结果的精确度,。精确度要求越高,样本量就越大。,5,常模团体必须是近时的。,6,注意一般常模与特殊常模的结合,二、常模参照分数(norm referenced score),主要有:发展量表、商数、百分位、标准分数四大类。,(一)发展量表,1心理年龄(,mental age,)(智力年龄),指被试智力发展水平的年龄。单位是年(或岁)和,12,个等距的月。,年龄量表最基本的假设是,随年龄的增长,所测量的特质有系统的改变。因此,不适用于成人。,年龄量表的基本要素:,(,1,)题目:可区分不同年龄组;,(,2,)常模团体:由各个年龄被试组成的有代表性样本;,(,3,)常模表,2年级当量(,grade equivalents,),即年级常模,用年级代替年龄,指把学生的测验成绩与各年级学生的平均成绩比较,看他相当于几年级的水平。,年级常模的单位通常为,10,个月间隔。如,5,年级的分布为,5-0,到,5-9,。,年级当量只适用于一般课程,不适合只学,12,年的课程。,年级当量只适用于解释本学年的水平,不适用于跨学年的。如一个五年级学生的年级当量为,8,,并不能说他已经掌握了,8,年级的课程。,3.发展顺序量表(,ordinal scales,),格塞尔发展顺序量表,格塞尔认为,婴幼儿的行为系统的建立是一个有次序的过程,反映了神经系统的不断成长和功能的分化,因而可以把每个成熟阶段的行为模式作为智能诊断的依据。,4周,16周,28周,40周,52周,不能控制头部,仰卧姿势左右不对称,颈可竖直,头微摇动,仰卧姿势左右对称,扶起独坐,身体前倾,可独坐,爬行,扶着物件站立,搀一手行走,摇摆,皮亚杰量表,用特定的任务来揭示儿童发展处于哪个阶段。,(二)商数(,quotient,),1比率智商,IQ=100(MA/CA),缺点:,实龄是等距的,而智龄不等距(智力发展不是直线的),计算成人智商时,以多大实龄作为除数?智力生长何时达到顶点?,不同年龄组,比率智商分数具有不同的标准差,因而相同的比率智商对于不同年龄具有不同的意义。,2.教育商数,EQ=100(EA/CA),儿童所受的教育相当于某个年龄儿童所受教育的平均水平,则他的教育年龄就是几岁。,3成就商数,AQ=100(EQ/IQ),用于说明智力发展与教育发展是否同步。,(三)百分位,1,百分等级,(percentile rank),概念,某个分数的百分等级就是得分低于这个分数的人数的百分比。百分等级指示个体在常模团体中的相对位置。百分等级越低,个体所处的地位越低。,计算,(,1,)未分组分数资料,100R,-,50,P,R,=100,-,N,(2)分组分数资料,100 (X,-,L)f,P,R,=,+F,b,N i,2,百分点,相对于某一百分等级的分数点叫百分点或百分位数。,3,十分位,百分点将分数分布分成100个等份。,十分位是将分数分成10个等份。十分位提供一个10级的等级量表,每一级包括10%的分数。,百分位的评价,优点:容易计算,容易解释。对于各种被试和各种测验普遍适用。,缺点:缺少相等单位,属于顺序量表,不能做加减乘除运算。,(四)标准分数(standard score),1,Z,分数。,X,-,X,Z=,S,不仅具有可比性,还具有可加性。,Z=0 S,Z,=1,-3,+3,约占总体的99.73%。,除了Z分数外,还可以把Z分数转换成T分数、标准九、离差智商等。,转换方法:,线性转换:从正态到正态,非线性转换:从偏态到正态(通过百分等级),2,T,分数,纪念,Terman,和,Thorndike,。,T=10,Z+50,平均数为,50,,标准差为,10,3,标准九(stanine),标准化九级分制,标准九=5+2Z,即平均数为5,标准差为2,标准九分,本段面积(%),累加面积(%),段中值与平均数的距离(,),9,4,100,2.0,8,7,96,1.5,7,12,89,1.0,6,17,77,0.5,5,20,60,0,4,17,40,0.5,3,12,23,1.0,2,7,11,1.5,1,4,4,2.0,4,离差智商(deviation IQ),IQ=100+15Z,5,CEEB分数(College Entrance Examination Board),美国大学入学考试委员会分数,CEEB分数=500+100Z,6,EPT分数,EPT分数=90+20Z,标准分数变式的评价,优点:,转换成等距量表,使进一步统计分析成为可能。,都可以转换成百分等级,使得不同分数之间可以进行比较。,缺点:,外行难以理解;,如果非正态分布,不同变式的分数之间无法比较与求和。,、几种导出分数间的相互关系,三、呈现常模资料的方法,(一)转化表,转化表的3个基本要素:原始分、导出分、常模团体的特征描述。,1简单转化表,2复杂转化表,(二)剖析图,(三)常态百分位图表,分数以百分等级来表示,而分数轴的距离以标准分数为单位。把百分等级与标准分结合起来使用,具有双重优点。,语文推理,27,70,*,数字能力,23,70,*,语文+数字,50,70,*,抽象推理,40,85,*,文书速度与正确,29,15,*,机械推理,45,45,*,*,空间关系,30,65,*,*,拼写,62,60,*,*,语言应用,26,55,*,*,原始 百分 百分位,分数 位 1 5 10 20 25 30 40 50 60 70 75 80 90 95 99,1 5 10 20 25 30 40 50 60 70 75 80 90 95 99,百分位,常态百分位图表示例,第四节 参照标准的分数解释,一、内容参照分数(,content referenced socre,),内容参照又叫范围参照,是看被试对指定范围中的内容和技能掌握得如何。,1 掌握分数,(mastery score),要想知道被试对一些基本的知识和技能是否掌握,需要制定一个最低的掌握标准,这个标准就是掌握分数。如果一个人达到了这个分数,就说明他已经掌握了这种知识和技能。,一般以80%90%的正确回答作为最低标准。,掌握测验只分掌握(通过)和未掌握(未通过),没有具体的得分。,2 正确百分数,如果需要了解被试对知识和技能的掌握程度,就需要报告被试在测验中的正确百分数。,正确百分数=100,(答对题目数/总题目数),3 等级评定量表,有些知识和技能是无法通过回答问题来确定其水平,需要主试对被试的知识或技能进行等级评定。如书法、绘画、体育等。,二、结果参照分数,(outcome,referenced score,),也叫效标参照分数,即用效标行为的水准来表示的分数,用来对被试未来行为的预测。,1 期望结果的概率,通过原始分或标准分来推测将来成功或失败的概率。,期望表,期望图,原始分数,效标行为等级,H,G,F,E,D,C,B,A,7579,100,100,67,7074,100,100,82,36,6569,100,94,50,33,11,6064,100,85,48,22,4,5559,100,88,63,31,4,5054,100,94,83,45,12,5,4549,100,87,61,24,5,4044,100,96,72,40,20,4,3539,100,85,46,15,3034,100,期望表,0 10 20 30 40 50 60 70 80 90 100,用测验选拔飞行员的淘汰率(期望图),标准九 人数 失败百分比,