Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料来源,3,线性回归模型,的,的拟合优度检,验,验,说 明,回归分析是要通过样本,所,所估计的参数,来,来代替总体的,真,真实参数,或,者,者说是用样本,回,回归线代替总,体,体回归线。,尽管从统计性质上已知,如果,有,有足够多的重,复,复 抽样,参,数,数的估计值的,期,期望(均值),就,就等于其总体,的,的参数真值,,但,但在一次抽样,中,中,估计值不,一,一定就等于该,真,真值。那么,,在,在一次抽样中,,,,参数的估计,值,值与真值的差,异,异有多大,是,否,否显著,这就,需,需要进一步进,行,行,统计检验,。主要包括,拟合优度检验、,变量的,显著性检验,及参数的,区间估计。,一、拟合优度,检,检验,目的:建立度,量,量被解释变量,的,的变动在多大,程,程度上能够被,所,所估计的回归,方,方程所解释的,指,指标,直观的,想,想法是比较估,计,计值与实际值,。,。即使用,Y,围绕其均值的,变,变异的平方和,,,,作为需要通,过,过回归来解释,其,其变动的度量,。,1,、总离差平方,和,和的分解,已知由一组样,本,本观测值(,X,i,Y,i,),,i,=1,2,n,得到如下样本,回,回归直线,如果,Y,i,=,i,即实际观测值,落,落在样本回归,“,“线”上,则,拟合最好,。,可认为,,“离差”全部来自回归,线,线,而与“残,差,差”无关。,对于所有样本,点,点,则需考虑,这,这些点与样本,均,均值离差的平,方,方和,可以证明:,TSS=ESS+RSS,记,总体平方和,(,TotalSum ofSquares,),回归平方和(,Explained Sum of Squares,),残差平方和(,Residual Sumof Squares,),Y,的观测值围绕,其,其均值的总离,差,差,(totalvariation),可分解为两部,分,分:一部分来,自,自回归线,(ESS),,另一部分则,来,来自随机势力,(RSS),。,在给定样本中,,,,,TSS,不变,如果实,际,际观测点离样,本,本回归线越近,,,,则,ESS,在,TSS,中占的比重越,大,大,因此定义,拟合优度:回,归,归平方和,ESS,与,Y,的总离差,TSS,的比值。,拟合优度检验:,对样本回归直,线,线与样本观测,值,值之间拟合程,度,度的检验。度,量,量拟合优度的,指,指标:,判定系数,(,可决系数,),R,2,问题一,:采用普通最小,二,二乘估计方法,,,,已经保证了,模,模型最好地拟,合,合了样本观测,值,值,为什么还,要,要检验拟合程,度,度?,2,、可决系数,R,2,统计量,称,R,2,为,(样本)可决系数,/,判定系数(,coefficientof determination),。,可决系数,的,取值范围,:,0,,,1,R,2,越接近,1,,说明实际观,测,测点离样本线,越,越近,拟合优,度,度越高,。,在例,2.1.1,的,收入消费支,出,出,例中,,注:可决系数,是一个非负的,统,统计量。它也,是,是随着抽样的,不,不同而不同。,为,为此,对可决,系,系数的统计可,靠,靠性也应进行,检,检验,这将在,第,第,3,章中进行。,判断系数的含,义,义:度量了,Y,围绕其均值的,变,变异中能够被,回,回归方程所解,释,释的比例,第一,等于,1,;,第二,等于,0,;,第三,介于,0,到,1,之间。,使用判定系数,时,时必须注意的,问,问题:,第一,盲目的,崇,崇拜论文中展,示,示或计算机计,算,算出估计结果,;,;,第二,过度依,赖,赖方程总体拟,合,合度在评价回,归,归模型不同设,定,定之间优劣时,的,的作用;,第三,判断系,数,数的大小依赖,于,于解释变量的,个,个数,从而造,成,成其在评价方,程,程总体拟合度,时,时出现偏误。,相应的处理方,法,法:,第一,在承认,回,回归结果以前,,,,要从模型所,隐,隐含的理论到,数,数据的质量,,认,认真考察和评,估,估所估计方程,的,的每一个方面,;,;,第二,综合运,用,用各种统计检,验,验和计量检验,;,;,第二,尽量使,用,用调整判断系,数,数。,问题:为什么,调,调整判断系数,指,指标比判断系,数,数指标要好?,