单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,主成分分析法,主成分分析法,1,一、主成分分析法概述,二、主成分分析法的基本原理,三、主成分分析法的应用,四、主成分分析法的步骤和方法,五、主成分分析法的操作流程,六、,主成分分析法,的结果分析,七、应用主成分分析法的注意事项,八、与因子分析法的区别,一、主成分分析法概述,2,一、主成分分析法概述,每个人都会遇到有,很多变量,的数据。,这些数据的共同特点是变量很多,在如此多的变量之中,有很多是相关的。人们希望能够找出它们的,少数“代表”,来对它们进行描述。,介绍两种把变量维数降低以便于描述、理解和分析的方法:主成分分析(principal component analysis)和因子分析(factor analysis)。,实际上主成分分析可以说是因子分析的一个特例,。,一、主成分分析法概述每个人都会遇到有很多变量的数据。,3,定义,:,主成分分析(Principal Components Analysis,PCA)也称为主分量分析,是一种通过,降维,来简化数据结构的方法,即如何把多个变量(变量)转化为少数几个综合变量(综合变量),而这几个综合变量可以反映原来多个变量的大部分信息。主成分:把,相关的变量,变为,无关的主成分,。,注意:,进行主成分的,变量之间必须要有相关性,,经过分析后,变量之间独立,。,定义:主成分分析(Principal Components,4,二、主成分分析法基本原理,主成分分析就是设法将原来众多具有一定相关性的变量,(,如,p,个变量,),,重新组合成一组新的相互无关的综合变量来代替原来变量。,怎么处理?,通常数学上的处理就是将原来,p,个变量作线性组合作为新的综合变量。,如何选择?,如果将选取的第一个线性组合即第一个综合变量记为,F1,,自然希望,F1,尽可能多的反映原来变量的信息。,怎样反映,?,二、主成分分析法基本原理主成分分析就是设法将原来众多具有一定,5,最经典的方法就是用方差来表达,,即,var(F1),越大,表示,F1,包含的信息越多,。因此在所有的线性组合中所选取的,F1,应该是方差最大的,,故称之为第一主成分(,principal component I,)。,如果第一主成分不足以代表原来,p,个变量的信息,再考虑选取,F2,即第二个线性组合。,F2,称为第二主成分(,principal component II,)。,F1,和,F2,的关系?,最经典的方法就是用方差来表达,即var(F1)越大,表示F1,6,1、,基于类型的古村落旅游竞争力分析,本文以社区参与型古村落为主要研究对象,采用主成分分析法、层次熵法等确定主要的旅游评价指标并获得其贡献指数,。,三、主成分分析法的应用,1、基于类型的古村落旅游竞争力分析本文以社区参与型古村落为,7,2、,基于主成分分析的新疆与全国旅游产业竞争力评价,本文采用主成分分析(PCA)方法,对新疆旅游业的竞争能力与全国其他省、区、直辖市进行比较。对全国31个省、区、直辖市的310个原始数据,根据PCA方法的原理和步骤进行计算机处理,可以得到主成分因子的,特征值,、,贡献率,与,累积贡献率,及因子提取结果。,前3个主成分因子的累积贡献率达87,.,154%,根据累积贡献率大于85%的主成分因子选取原则,选择前,3个主成分因子,而且选择的3个主成分因子,相互之间不存在相关性。,2、基于主成分分析的新疆与全国旅游产业竞争力评价,8,四、主成分分析法的步骤,1,)数据归一化处理:数据标准化(,Z,),2,)计算相关系数矩阵,R,:,3,)计算,特征值,;,特征值越大说明重要程度越大。,4,)计算主成分,贡献率,及,方差的累计贡献率,;,5,)计算,主成分载荷,与,特征向量,:,主成分的负荷值大小反映了主成分因子对可测变量的影响程度;载荷值越大说明此变量对主成分的解释越多,及贡献越大。,6,)写出主成分模型,四、主成分分析法的步骤1)数据归一化处理:数据标准化(Z),9,主成分选取的条件:,(,1,),特征值,(,特征值,1,);,(,2,),方差的累计贡献率,。,(,前,K,个主成分的方差累计贡献率达到了,80%,或,85%,,,也可以说,累计贡献率,80%,或,85%,),(较多),。,两个条件满足其一就可以了,,,究竟以哪个为主依个人情况而定或根据实际情况两个结合使用。,如果前,K,个主成分的累计贡献率达到了,85%,,则表明取前,K,个主成分基本包含了全部测量指标所具有的信息,从而达到了变量降维的目的。,主成分选取的条件:如果前K个主成分的累计贡献率达到了85%,,10,五、主成分分析法的操作流程,五、主成分分析法的操作流程,主成分分析法课件,主成分分析法课件,13,主成分分析法课件,14,主成分分析法课件,15,主成分分析法课件,16,主成分分析法课件,17,KMO,检验,是在主成份分析前对数据的分析,:,KMO越接近于1越好,等于相关系数,0.5就可,以,。,1,、相关系数,R:KMO,检验,六、主成分分析法的结果分析,KMO检验是在主成份分析前对数据的分析:1、相关系数R:KM,18,主成分分析法课件,19,2,、确定主成分,本操作是选择以,特征根大于1,为标准提取主成分,提取了,4,个主成分,。,按照,累积方差的观点,,应该,提取,80%或,85%的值,,本例题提取,5,个主成分,其累积方差贡献率为,85.644,,应该提取前,五,个主成分。,2、确定主成分本操作是选择以特征根大于1为标准提取主成分,提,20,两个条件都满足,两个条件都满足,21,3,、,写出主成分模型,3、写出主成分模型,22,2,、,写出主成分模型,主成分因子载荷矩阵:,载荷值越大,,说明此变量,对主成分的解释越多,,及,贡献越大,;越大越好。,2、写出主成分模型 主成分因子载荷矩阵:,23,前面的表,给出的是因子载荷矩阵,,主成分系数应该为特征向量,其换算方法为:用,主成分载荷矩阵中的数据,除以,主成分,相对应的,特征值开平方根,便得到两个主成分中每个指标所对应的系数。,(,1,)主成分系数(特征向量)计算,前面的表给出的是因子载荷矩阵,主成分系数应该为特征向量,24,主成分分析法课件,25,主成分分析法课件,26,主成分分析法课件,27,主成分分析法课件,28,主成分分析法课件,29,主成分分析法课件,30,(,2,),写,各,主成分模型,F1=,0.,50,X1+,0.,40,X2,-0.02,X3+0.,07,X4+,0.,36,X5+0.,1,4X6,F1主要表示X1、X2、X,5,的信息,F,2,=,1.28,X1,-0.18,X2,-0.07,X3+,0.,38,X4,-0.08,X5+,0.,50,X6,F,2,主要表示X1、X,4,、X,6,F,3,=,2.27,X1+0.,14,X2,-0.54,X3,-0.47,X4,-0.12,X5+0.,07,X6,F,3,主要表示X1,F,4,=,3.69,X1,-0.01,X2,+,0.38,X3,-0.13,X4+,0.,52,X5,-0.03,X6,F,4,主要表示X1、X3、X,5,(2)写各主成分模型F1=0.50X1+0.40X2-0.0,31,主成分的综合模型:,两个公式之意:,F,中,X1,的,综合系数,w1,=(F1,的,x1,的系数,x1,在,F1,中的,方差贡献率,+F2,的,x1,的系数,x1,在,F2,中的,方差贡献率,Fn)/,方差累计贡献率,注意,:,X1,、,X2,在,F1,、,F2,中各自所对应的,方差贡献率,。,方差贡献率与方差累计贡献率的区别,主成分的综合模型:两个公式之意:F中X1的综合系数w1=(F,32,主成分赋权法,其中,,aij,描述了因子,i,在第,j,个主成分中的,因子得分系数,,即第,i,个因子对第,j,个主成分的贡献,它与该主成分对应方差的贡献率,Ej,的组合,便是需要确定的,第,i,个环境因子的权重值。,主成分赋权法其中,aij描述了因子 i 在第 j 个主成分中,33,主成分赋权法:计算权重集,进行归一化处理,由此即得到权重集:和为,1.,主成分赋权法:计算权重集进行归一化处理由此即得到权重集:和为,4,、旋转:,从下表,的因子荷载,看,第三个主成分因子在10,个指标上的载荷值,都不明显,因此很难对第三个主成分因子进行有效定义,。,旋转的条件,:,当某个主成分因子的各,载荷值大小,都不明显,很难对,此,主成分因子进行有效定义,时,采用旋转进一步分析。,4、旋转:从下表的因子荷载看,第三个主成分因子在1,旋转,后的主成分因子载荷矩阵,旋转后的主成分因子载荷矩阵,景区满意度旋转前后,成分矩阵图对比,景区满意度旋转前后成分矩阵图对比,选取主成分的个数,,急转处,是确定主成分的个数处。,5,、碎石图分析,景区满意度碎石图,选取主成分的个数,急转处是确定主成分的个数处。5、碎石图分析,八、与因子分析法的区别,八、与因子分析法的区别,1,、基本概念,主成分分析,就是,将多项指标转化为少数几项综合,指标,用综合指标来解释多变量的方差,-,协方差结构。,综合指标即为主成分,。所得出的少数几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关。,因子分析,是研究如何以最少的信息丢失,,将众多原始变量浓缩成少数几个因子变量,,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。,1、基本概念主成分分析就是将多项指标转化为少数几项综合指标,因子分析实例:,因子分析实例:,主成分分析法课件,主成分分析法课件,2,、基本思想的异同,共同点,主成分分析法和因子分析法都是,用少数的几个变量,(,因子,),来综合反映原始变量,(,因子,),的主要信息,,变量虽然较原始变量少,但,所包含的信息量却占原始信息的,85%,以上,,所以即使用少数的几个新变量,可信度也很高,也可以有效地解释问题。并且,新的变量彼此间互不相关,,消除了多重共线性。这两种分析法得出的新变量,并不是原始变量筛选后剩余的变量。,主成分分析和因子分析都产生了新变量。,2、基本思想的异同共同点,不同之处,主成分分析,中,,最终确定的新变量是原始变量的线性组合,,每个主成分都是由原有,p,个变量线性组合得到。在诸多主成分,Zi,中,,Zi,在方差中占的比重最大,说明它综合原有变量的能力最强,越往后主成分在方差中的比重也小,综合原信息的能力越弱。,因子分析,是要利,用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,,它不是对原始变量的重新组合,而,是对原始变量进行分解,分解为公共因子与特殊因子两部分。,公共因子是由所有变量共同具有的少数几个因子;特殊因子是每个原始变量独自具有的因子。,主成分分析法课件,主成分分析,是研究如何通过少数几个主成分来解释多变量的方差一协方差结构的分析方法,,也就是求出少数几个主成分,(,变量,),,,使它们尽可能多地保留原始变量的信息,,且彼此不相关,。,因子分析,是,寻找潜在的起支配作用的因子模型,的方法。因子分析是根据相关性大小把变量分组,,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低,,每组变量代表一个基本结构,这个基本结构称为公共因子。通过因子分析得来的新变量是对每个原始变量进行内部剖析。,主成分分析法课件,3,、应用中的优缺点比较,主成分分析,优点:首先它利用降维技术用少数几个综合变量来代替原始多个变量,这些综合变量集中了原始变量的大部分信息。其次它通过计算综合主成分函数得分,对客观经济现象进行科学评价。再次它在应用上侧重于信息贡献影响力综合评价。,缺点:当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确。命名清晰性低。,3、应用中的优缺点比较主成分分析,因子分析,优点:第一它不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化