*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第五章 相关系数,第一节 相关、相关系数与散点图,什么是相关,相关系数,散点图,一、什么是相关,事物之间的相关关系,因果相关,共变相关,相关关系,相关的类别,正相关,负相关,零相关,二、相关系数,两列变量间相关程度的数字表示形式,或者说是用来表示相关关系强度的指标。,取值情况:,-1.00r 1.00,三、散点图,通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够对原始数据间的关系作出直观而有效的预测和解释。,线性相关,曲线相关,第二节 积差相关,概念,适用条件,公式,例题,一、概念,积差相关,又叫积矩相关,是英国统计学家皮尔逊在20世纪初提出的一种计算相关的方法,故而也被称为皮尔逊相关法,是求直线相关的最根本的方法。,二、适用条件,两列变量均是由测量得到的连续变量,两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布,变量必须是成对的数据,两变量间为线性关系,三、计算公式,计算公式1,计算公式2,计算公式3,四、例题,例5-1,第三节 等级相关,斯皮尔曼等级相关,肯德尔等级相关,一、斯皮尔曼等级相关,概念,适用条件,公式,例题,1、概念,两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,计算这样两变量的相关,称为等级相关,又叫斯皮尔曼相关。,2、适用条件,两变量的资料为等级测量数据,且具有线性关系,连续变量的测量数据,按其大小排成等级,亦可用等级相关法计算,不要求总体呈正态分布,3、公式,N为等级个数,D指二列成对变量的等级差数,与 为两列变量各自排列的等级顺序,4、例题,例5-3,出现相同等级时:,用它们所占等级位置的平均数作为它们的等级,二、肯德尔和谐系数,概念,适用条件,公式,例题,1、概念,肯德尔和谐系数又称肯德尔W系数。当多个变量值以等级顺序表示时,这几个变量之间的一致性程度,称为肯德尔和谐系数。,2、适用条件,适用于两列以上等级变量。,如了解几个评定者对同一组学生学习成绩等级评定的一致性程度。,3、计算公式,为R的离差平方和,K为等级变量的列数或评价者数目;n为被评价对象的数目,4、例题,例5-6,练习:,书后习题10、11,第四节 质与量相关,一列为等比或等距的测量数据,另一列是按性质划分的类别,欲求这样两列变量的直线相关,称之为质量相关。,点二列相关,二列相关,一、点二列相关,概念,适用条件,计算公式,例题,1、概念,两列变量中,一列是正态连续性变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关。,二分变量的种类,真正的二分变量,人为的二分变量,2、适用条件,一列变量为正态连续变量,而另一列为真正的二分变量,3、计算公式,为二分称名变量的一个值对应的连续变量的平均数,为二分称名变量的一个值对应的连续变量的平均数,p与q是二分称名变量两个值各自所占的比率,p+q=1,St是连续变量的标准差,4、例题5-9、5-10,149页,二、二分变量,概念,适用条件,计算公式,例题,1、概念,两列变量中,一列是正态连续性变量,另一列是人为的二分变量,描述这两个变量之间的相关,称为二列相关。,2、适用条件,两列数据均属于正态分布,其中一列变量为等距或等比的测距数据,另一列变量为人为划分的二分变量。,3、计算公式,为二分称名变量的一个值对应的连续变量的平均数,为二分称名变量的一个值对应的连续变量的平均数,p与q是二分称名变量两个值各自所占的比率,p+q=1,St是连续变量的标准差,4、例题5-11,152页,第五节 品质相关,品质相关用于表示RC行列表的两个变量的相关程度。,这种相关处理的数据类型一般都是计数数据,而非测量性数据,分类:四分相关、相关、列联表相关,相关,概念,适用条件,计算公式,例题,1、概念,当两变量均为真正的二分变量时,描述这两个变量之间的相关,称为 相关。,A因素,A,非A,B因素,B,a,b,a+b,非B,c,d,c+d,a+c,b+d,2、适用条件,两变量为真正的二分变量,两个分布都只有两个点值或表示某些质的属性,3、计算公式,A因素,A,非A,B因素,B,a,b,a+b,非B,c,d,c+d,a+c,b+d,4、例题5-14,复习:,