Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,因子分析步骤(bzhu),第一页,共26页。,一、前言(qin yn),变量的相关性,公共因子?,将多个实测变量转换成少数几个不相关的综合(zngh)指数,第二页,共26页。,二、因子分析模型(mxng),一般地,设X=(x1,x2,xp)为可观测的随机变量(su j bin lin),且有,f=(f1,f2,fm)为公共(共性)因子(common factor),简称因子(factor),第三页,共26页。,e=(e1,e2,ep)为特殊因子(specific factor),f和e均为不可直接观测的随机变量,=(1,2,p)为总体x的均值,A=(aij)p*m为因子负荷(fh)(载荷)(factor loading)矩阵,第四页,共26页。,主因子法(principal factor),将多个实测变量转换成少数几个不相关的综合(zngh)指数,各因子间不再相互独立,而彼此相关。,f=(f1,f2,fm)为公共(共性)因子(common factor),简称因子(factor),第二十五页,共26页。,求样本相关系数矩阵R=(rij)p*p;,()fi与ei相互独立,各因子间不再相互独立,而彼此相关。,主因子法(principal factor),则共同度的初始值为(hi)2=1-i=1-1/rii。,求样本相关系数矩阵R=(rij)p*p;,(1)方差最大正交旋转(varimax orthogonal rotation),七、因子分析应用(yngyng)实例,设原变量的相关矩阵为R=(rij),其逆矩阵为R-1=(rij)。,回归法得分是由Bayes思想导出的,得到的因子(ynz)得分是有偏的,但计算结果误差较小。,极大似然法(maximum likelihood factor),通常(tngchng)先对x作标准化处理,使其均值为零,方差为这样就有,假定()fi的均数为,方差为;,()ei的均数为,方差为i;,()fi与ei相互独立,则称x为具有m个公共因子的因子模型,第五页,共26页。,如果再满足()fi与fj相互独立(ij),则称该因子(ynz)模型为正交因子(ynz)模型。,正交因子(ynz)模型具有如下特性:,x的方差可表示为,设,第六页,共26页。,()hi2是m个公共因子对第i个变量的贡献,称为第i个共同度(communality)或共性方差,公因子方差(common variance),()i称为特殊(tsh)方差(specific variance),是不能由公共因子解释的部分,第七页,共26页。,因子载荷(zi h)(负荷)aij是随机变量xi与公共因子fj的相关系数。,设,称gj2为公共因子fj对x的“贡献”,是衡量公共因子fj重要性的一个指标。,第八页,共26页。,三、因子分析的步骤(bzhu),输入原始数据xn*p,计算样本均值和方差,进行标准化计算(处理);,求样本相关系数矩阵R=(rij)p*p;,求相关系数矩阵的特征根i(1,2,p0)和相应(xingyng)的标准正交的特征向量li;,第九页,共26页。,确定公共因子数;,计算公共因子的共性方差hi2;,对载荷矩阵进行旋转(xunzhun),以求能更好地解释公共因子;,对公共因子作出专业性的解释。,第十页,共26页。,四、因子(ynz)分析提取因子(ynz)的方法,主成分(chng fn)法(principal component factor),第十一页,共26页。,每一个公共因子的载荷(zi h)系数之平方和等于对应的特征根,即该公共因子的方差。,第十二页,共26页。,极大似然法(maximum likelihood factor),假定原变量服从正态分布,公共因子和特殊因子也服从正态分布,构造(guzo)因子负荷和特殊方差的似然函数,求其极大,得到唯一解。,第十三页,共26页。,主因子法(principal factor),设原变量的相关矩阵为R=(rij),其逆矩阵为R-1=(rij)。各变量特征方差的初始值取为逆相关矩阵对角线元素(yun s)的倒数,i=1/rii。则共同度的初始值为(hi)2=1-i=1-1/rii。,第十四页,共26页。,以(hi)2代替相关矩阵中的对角线上的元素(yun s),得到约化相关矩阵。,(h1)2 r12 r1p,r21 (h2)2 r2p,R=.,.,rp1 rp2 (hp)2,R的前m个特征根及其对应的单位化特征向量就是主因子解。,第十五页,共26页。,迭代主因子法(iterated principal factor),主因子的解很不稳定。因此,常以估计的共同(gngtng)度为初始值,构造新的约化矩阵,再计算其特征根及其特征向量,并由此再估计因子负荷及其各变量的共同(gngtng)度和特殊方差,再由此新估计的共同(gngtng)度为初始值继续迭代,直到解稳定为止。,第十六页,共26页。,Heywood现象(xinxing),残差矩阵,第十七页,共26页。,五、因子(ynz)旋转,目的:使因子(ynz)负荷两极分化,要么接近于0,要么接近于1。,常用的旋转方法:,第十八页,共26页。,(1)方差最大正交旋转(varimax orthogonal rotation),基本思想:使公共因子的相对负荷(lij/hi2)的方差之和最大,且保持原公共因子的正交性和公共方差总和不变。,可使每个因子上的具有(jyu)最大载荷的变量数最小,因此可以简化对因子的解释。,第十九页,共26页。,(2)斜交(xi jio)旋转,(oblique rotation),因子斜交(xi jio)旋转后,各因子负荷发生了较大变化,出现了两极分化。各因子间不再相互独立,而彼此相关。各因子对各变量的贡献的总和也发生了改变。,适用于大数据集的因子分析。,第二十页,共26页。,六、因子(ynz)得分,Thomson法,即回归法,回归法得分是由Bayes思想导出的,得到的因子(ynz)得分是有偏的,但计算结果误差较小。,第二十一页,共26页。,Bartlett法,Bartlett因子得分是极大(j d)似然估计,也是加权最小二乘回归,得到的因子得分是无偏的,但计算结果误差较大。,因子得分可用于模型诊断,也可用作进一步分析的原始资料。,第二十二页,共26页。,七、因子分析应用(yngyng)实例,第二十三页,共26页。,八、因子分析应用(yngyng)的注意事项,应用条件,(1)变量是计量的,能用线性相关系数(Pearson积叉相关系数)表示(biosh)。,(2)总体的同质性,第二十四页,共26页。,样本量,没有估计公式。至少要保证样本相关系数稳定可靠。,因子数目,一般认为(rnwi),累积贡献要达到80%以上。但要注意Heywood现象。,第二十五页,共26页。,谢谢(xi xie)!,第二十六页,共26页。,