资源预览内容
第1页 / 共38页
第2页 / 共38页
第3页 / 共38页
第4页 / 共38页
第5页 / 共38页
第6页 / 共38页
第7页 / 共38页
第8页 / 共38页
第9页 / 共38页
第10页 / 共38页
第11页 / 共38页
第12页 / 共38页
第13页 / 共38页
第14页 / 共38页
第15页 / 共38页
第16页 / 共38页
第17页 / 共38页
第18页 / 共38页
第19页 / 共38页
第20页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第十章 典型相关分析,10.1,引言,10.2,总体典型相关,10.3,样本典型相关,10.4,典型相关系数的显著性检验,第十章 典型相关分析10.1 引言,10.1,引言,典型相关分析(,canonical correlation analysis,)是研究两组变量之间相关关系的一种统计分析方法,它能够有效地揭示两组变量之间的相互线性依赖关系。,典型相关分析是由霍特林(,Hotelling,1935,1936,)首先提出的。,10.1 引言典型相关分析(canonical corr,10.2,总体典型相关,一、典型相关的定义及导出,二、典型相关变量的性质,三、从相关矩阵出发计算典型相关,10.2 总体典型相关一、典型相关的定义及导出,一、典型相关的定义及导出,设,x,=(,x,1,x,2,x,p,),和,y,=(,y,1,y,2,y,q,),是两组随机变量,且,V,(,x,)=,11,(0),,,V,(,y,)=,22,(0),,,Cov(,x,y,)=,12,,即有,其中,21,=,12,。,我们,研究,u,=,a,x,与,v,=,b,y,之间的相关关系,其中,a,=(,a,1,a,2,a,p,),,,b,=(,b,1,b,2,b,q,),现来计算一下,u,与,v,的相关系数。,Cov(,u,v,)=Cov(,a,x,b,y,)=,a,Cov(,x,y,),b,=,a,12,b,V,(,u,)=,V,(,a,x,)=,a,V,(,x,),a,=,a,11,a,V,(,v,)=,V,(,b,y,)=,b,V,(,y,),b,=,b,22,b,一、典型相关的定义及导出设x=(x1,x2,xp)和y,所以,,u,与,v,的相关系数,由于对任意非零常数,k,1,和,k,2,,有,(,k,1,u,k,2,v,)=,(,u,v,),因此,为避免不必要的结果重复,我们常常限定,u,与,v,均为标准化的变量,即附加约束条件,V,(,u,)=1,,,V,(,v,)=1,即,a,11,a,=1,,,b,22,b,=1,在此,约束条件下,求,a,R,p,和,b,R,q,,使得,(,u,v,)=,a,12,b,达到最大。,所以,u与v的相关系数,容易证明,,有着相同的非零特征值,且皆为正,其个数为,m,=rank(,12,),。将这些正特征值分别记为,。设,a,1,a,2,a,m,为,的相应于,的特征向量,且满足标准化条件,a,i,11,a,i,=1,,,i,=1,2,m,令,,则有,从而,b,1,b,2,b,m,为,的相应于,的特征向量,并且满足,容易证明,有着相同的非零特征值,且皆为正,其,可以证明,当取,a,=,a,1,b,=,b,1,时,,,(,u,v,)=,a,12,b,达到最大值,1,(,显然,1,1),。我们称,u,1,=,a,1,x,,,v,1,=,b,1,y,为,第一对典型相关变量,,称,1,为,第一个典型相关系数,第一对典型相关变量,u,1,v,1,提取了原始变量,x,与,y,之间相关的主要部分,如果这一部分还显得不够,可以在剩余相关中再求出,第二对典型相关变量,u,2,=,a,x,v,2,=,b,y,,也就是,a,b,应满足标准化条件且应使得第二对典型相关变量不包括第一对典型相关,十章节典型相关分析课件,变量所含的信息,即,(,u,2,u,1,)=,(,a,x,a,1,x,)=Cov(,a,x,a,1,x,)=,a,11,a,1,=0,(,v,2,v,1,)=,(,b,y,b,1,y,)=Cov(,b,y,b,1,y,)=,b,22,b,1,=0,在这些约束条件下使得,(,u,2,v,2,)=,(,a,x,b,y,)=,a,12,b,达到最大。,一般地,,第,i,(1,,表明第一个典型相关系数大于两组原始变量之间的相关系数。,相应于特征值 的特征向量为,10.3,样本典型相关,设数据矩阵为,则样本协方差矩阵为,S,可用来作为,的估计。当,n,p,+,q,时,,可分别作为 的估计;它们的非零特征值 可用来估计 ;,10.3 样本典型相关设数据矩阵为,相应的特征向量,作为,a,1,a,2,a,m,的估计,,作为,b,1,b,2,b,m,的估计。,的正平方根,r,j,称为,第,j,个样本典型相关系,数,,称为,第,j,对样本典型相关变量,,,j,=1,2,m,。将样本,(,x,i,y,i,),,,i,=1,2,n,经中心化后代入,m,对典型变量,即令,则称,u,ij,为第,i,个样品,x,i,的第,j,个样本典型变量得分,,称,v,ij,为第,i,个样品,y,i,的第,j,个样本典型变量得分,。由约束条件,可得,同理可得,对每个,j,,可画出,(,u,ij,v,ij,),,,i,=1,2,n,的散点图,该图也可用来检查是否有异常值出现。,相应的特征向量 作为a1,a2,am的估计,,例,10.3.1,某康复俱乐部对,20,名中年人测量了三个生理指标:体重,(,x,1,),、腰围,(,x,2,),、脉搏,(,x,3,),和三个训练指标:引体向上,(,y,1,),、起坐次数,(,y,2,),、跳跃次数,(,y,3,),。其数据列于表,10.3.1,。,表,10.3.1,某康复俱乐部的生理指标和训练指标数据,编,号,x,1,x,2,x,3,y,1,y,2,y,3,1,191,36,50,5,162,60,2,189,37,52,2,110,60,3,193,38,58,12,101,101,4,162,35,62,12,105,37,5,189,35,46,13,155,58,6,182,36,56,4,101,42,7,211,38,56,8,101,38,例10.3.1 某康复俱乐部对20名中年人测量了三个生理,8,167,34,60,6,125,40,9,176,31,74,15,200,40,10,154,33,56,17,251,250,11,169,34,50,17,120,38,12,166,33,52,13,210,115,13,154,34,64,14,215,105,14,247,46,50,1,50,50,15,193,36,46,6,70,31,16,202,37,62,12,210,120,17,176,37,54,4,60,25,18,157,32,52,11,230,80,19,156,33,54,15,225,73,20,138,33,68,2,110,43,816734606125409176317415200401,的特征值分别为0.6630、0.0402和0.0053,于是,r,1,=0.797,,,r,2,=0.201,,,r,3,=0.073,相应的样本典型变量系数为,因此,第一对样本典型变量为,如果需要,第二对样本典型变量为,十章节典型相关分析课件,例,10.3.2,在研究组织结构对,“,职业满意度,”,的影响时,作为其中一部分,邓讷姆,(Dunham),调查了职业满意度与职业特性相关的程度。对从一大型零售公司各分公司挑出的,n,=784,个行政人员,测量了,p,=5,个职业特性变量:用户反馈,(,x,1,),、任务重要性,(,x,2,),、任务多样性,(,x,3,),、任务特性,(,x,4,),及自主权,(,x,5,),和,q,=7,个职业满意度量:主管满意度,(,y,1,),、事业前景满意度,(,y,2,),、财政满意度,(,y,3,),、工作强度满意度,(,y,4,),、公司地位满意度,(,y,5,),、工种满意度,(,y,6,),及总体满意度,(,y,7,),。对,784,个被测者的样本相关矩阵为,例10.3.2 在研究组织结构对“职业满意度”的影响时,,样本典型相关系数和样本典型变量系数列于表,10.3.2,中。,十章节典型相关分析课件,表,10.3.2,典型相关系数和典型变量系数,标准化变量,x,1,*,0.42,0.34,0.86,0.79,0.03,x,2,*,0.20,0.67,0.44,0.27,0.98,x,3,*,0.17,0.85,0.26,0.47,0.91,x,4,*,0.02,0.36,0.42,1.04,0.52,x,5,*,0.46,0.73,0.98,0.17,0.44,r,j,0.55,0.24,0.12,0.07,0.06,标准化变量,y,1,*,0.43,0.09,0.49,0.13,0.48,y,2,*,0.21,0.44,0.78,0.34,0.75,y,3,*,0.04,0.09,0.48,0.61,0.35,y,4,*,0.02,0.93,0.01,0.40,0.31,y,5,*,0.29,0.10,0.28,0.45,0.70,y,6,*,0.52,0.55,0.41,0.69,0.18,y,7,*,0.11,0.03,0.93,0.27,0.01,表10.3.2 典型相关系数和典型变量系数标准化变,第一对样本典型变量为,根据典型系数,,主要代表了用户反馈和自主权这两个变量,三个任务变量显得并不重要;而,主要代表了主管满意度和工种满意度变量,其次代表了事业前景满意度和公司地位满意度变量。我们也可从相关系数的角度来解释典型变量,原始变量与第一对典型变量间的样本相关系数列于表,10.3.3,中。,第一对样本典型变量为,所有五个职业特性变量与第一典型变量,u,1,*,有大致相同的相关系数,故,u,1,*,可以解释为职业特性变量,这与基于典型系数的解释不同。,v,1,*,主要代表了主管满意度、事业前景满意度、公司地位满意度和工种满意度,,v,1,*,可以解释为职业满意度,公司地位变量,这与基于典型系数的解释基本相一致。第一对典型变量,u,1,*,与,v,1,*,的样本相关系数,r,1,=0.55,,可见,职业特性与职业满意度之间有一定程度的相关性。,表,10.3.3,原始变量与典型变量的样本相关系数,原始变量,样本典型变量,原始变量,样本典型变量,x,u,1,*,v,1,*,y,u,1,*,v,1,*,x,1,:用户反馈,0.83,0.46,y,1,:主管满意度,0.42,0.76,x,2,:任务重要性,0.73,0.40,y,2,:事业前景满意度,0.36,0.64,x,3,:任务多样性,0.75,0.42,y,3,:财政满意度,0.21,0.39,x,4,:任务特性,0.62,0.34,y,4,:工作强度满意度,0.21,0.38,x,5,:自主权,0.86,0.48,y,5,:公司地位满意度,0.36,0.65,y,6,:工种满意度,0.45,0.80,y,7,:总体满意度,0.28,0.50,表10.3.3 原始变量与典型变量的样本相关系数原始变,10.4,典型相关系数的显著性检验,一、全部总体典型相关系数均为零的检验,二、部分总体典型相关系数为零的检验,10.4 典型相关系数的显著性检验一、全部总体典型相关系,一、全部总体典型相关系数均为零的检验,设,(,x,y,),N,p,+,q,(,),0,。又设,S,为样本协方差矩阵,且,n,p,+,q,。,考虑假设检验问题:,H,0,:,1,=,2,=,m,=0,H,1,:,1,2,m,至少有一个不为零,其中,m,=min,p,q,。若检验接受,H,0,,则认为讨论两组变量之间的相关性没有意义;若检验拒绝,H,0,,则认为第一对典型变量是显著的。,(10.4.1),式实际上等价于假设检验问题,H,0,:,12,=,0,,,H,1,:,12,0,H,0,成立表明,x,与,y,互不相关。,一、全部总体典型相关系数均为零的检验设(x,y)Np,检验统计量为,对于充分大的,n,,当,H,0,成立时,统计量,在给定的,下,若,,则拒绝,H,0,,认为典型变量,u,1,与,v,1,之间的相关性是显著的;否则,,就,认为
点击显示更多内容>>

最新DOC

最新PPT

最新RAR

收藏 下载该资源
网站客服QQ:3392350380
装配图网版权所有
苏ICP备12009002号-6