Click to edit Master title,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,9-,*,三峡大学理学院,于 林,数理统计,Click to edit Master title,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,9-,*,三峡大学理学院,于 林,数理统计,Click to edit Master title,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,数学建模多元回归分析,数学建模多元回归分析,多元线性回归模型,(概念要点),一个因变量与两个及两个以上自变量之间的回归,描述因变量,y,如何依赖于自变量,x,1,,,x,2,,,,,x,p,和误差项,的方程称为,多元线性回归模型,涉及,p,个自变量的多元线性回归模型可表示为,b,0,,,b,1,,,b,2,,,,,b,p,是参数,是被称为误差项的随机变量,y,是,x,1,,,x,2,,,,,x,p,的线性函数加上误差项,说明了包含在,y,里面但不能被,p,个自变量的线性关系所解释的变异性,多元线性回归模型(概念要点)一个因变量与两个及两个以上自,多元线性回归模型,(概念要点),对于,n,组实际观察数据,(,y,i,;,x,i,1,,,x,i,2,,,,,x,i,p,),,,(,i,=1,2,n,),,多元线性回归模型可表示为,y,1,=,b,0,+,b,1,x,11,+,b,2,x,12,+,+,b,p,x,1p,+,e,1,y,2,=,b,0,+,b,1,x,21,+,b,2,x,22,+,+,b,p,x,2p,+,e,2,y,n,=,b,0,+,b,1,x,n1,+,b,2,x,n2,+,+,b,p,x,np,+,e,n,多元线性回归模型(概念要点)对于 n 组实际观察数据,多元线性回归模型,(基本假定),自变量,x,1,,,x,2,,,,,x,p,是确定性变量,不是随机变量,随机误差项,的期望值为,0,,且方差,2,都相同,误差项,是一个服从正态分布的随机变量,即,N,(0,2,),,,且相互独立,多元线性回归模型(基本假定)自变量 x1,x2,xp是,多元线性回归方程,(概念要点),描述,y,的平均值或期望值如何依赖于,x,1,,,x,1,,,,,x,p,的方程称为,多元线性回归方程,多元线性回归方程的形式为,E,(,y,)=,0,+,1,x,1,+,2,x,2,+,+,p,x,p,b,1,,,b,2,,,,,b,p,称为偏回归系数,b,i,表示假定其他变量不变,当,x,i,每变动一个单位时,,y,的平均平均变动值,多元线性回归方程(概念要点)描述 y 的平均值或期望值如,多元线性回归模型、回归方程与估计的回归方程,回归方程的显著性检验(线性关系的检验),非线性模型及其线性化方法,令:y=lny,则有y=ln+x,y1=b0+b1 x11+b2 x12+bpx1p+e1,回归方程与回归系数的显著性检验,3548t=0.,回归系数的显著性检验(要点),回归系数的显著性检验,用样本统计量 代替回归方程中的 未知参数 即得到估计的回归方程,H1:bi 0 (自变量 xi 与 因变量 y有线性关系),bi 表示假定其他变量不变,当 xi 每变动一个单位时,y 的平均平均变动值,多元线性回归方方程的直观解释,二元线性回归模型,(,观察到的,y,),回归面,0,i,x,1,y,x,2,(,x,1,x,2,),多元线性回归模型、回归方程与估计的回归方程多元线性回归方方程,多元线性回归的估计,(,经验,),方程,总体回归参数 是未知的,利用样本数据去估计,用样本统计量 代替回归方程中的 未知参数,即得到估计的回归方程,是 估计值,是,y,的估计值,多元线性回归的估计(经验)方程总体回归参数,参数的最小二乘估计,参数的最小二乘估计,参数的最小二乘法,(要点),根据最小二乘法的要求,可得求解,各回归参数 的标准方程如下,使因变量的观察值与估计值之间的离差平方和达到最小来求得,。即,参数的最小二乘法(要点)根据最小二乘法的要求,可得求解各,回归方程的显著性检验,回归方程的显著性检验,多重样本决定系数,(多重判定系数,R,2,),回归平方和占总离差平方和的比例,反映回归直线的拟合程度,取值范围在,0,1,之间,R,2,1,,说明回归方程拟合的越好;,R,2,0,,说明回归方程拟合的越差,等于多重相关系数的平方,即,R,2,=(,R,),2,多重样本决定系数(多重判定系数 R2)回归平方和占总离,修正的多重样本决定系数,(修正的多重判定系数,R,2,),由于增加自变量将影响到因变量中被估计的回归方程所解释的变异性的数量,为避免高估这一影响,需要用自变量的数目去修正,R,2,的值,用,n,表示观察值的数目,,p,表示自变量的数目,修正的多元判定系数的计算公式可表示为,修正的多重样本决定系数(修正的多重判定系数 R2)由于,回归方程的显著性检验,(,线性关系的检验,),检验因变量与所有的自变量和之间的是否存在一个显著的线性关系,也被称为,总体的显著性,检验,检验方法是将回归离差平方和,(,SSR,),同剩余离差平方和,(,SSE,),加以比较,,应用,F,检验,来分析二者之间的差别是否显著,如果是显著的,因变量与自变量之间存在线性关系,如果不显著,因变量与自变量之间不存在线性关系,回归方程的显著性检验(线性关系的检验)检验因变量与所有,回归方程的显著性检验,(步骤),提出假设,H,0,:,1,2,p,=0,线性关系不显著,H,1,:,1,,,2,,,p,至少有一个不等于,0,2.,计算检验统计量,F,3.,确定显著性水平,和分子自由度,p,、分母自由度,n-p,-1,找出临界值,F,4.,作出决策:若,F,F,,拒绝,H,0,;,若,F,F,,接受,H,0,回归方程的显著性检验(步骤)提出假设2.计算检验统,回归系数的显著性检验,(要点),如果,F,检验已经表明了回归模型总体上是显著的,那么回归系数的检验就是用来确定每一个单个的自变量,x,i,对因变量,y,的影响是否显著,对每一个自变量都要单独进行检验,应用,t,检验,在多元线性回归中,回归方程的显著性检验,不再等价于,回归系数的显著性检验,回归系数的显著性检验(要点)如果F检验已经表明了回归模型总,回归系数的显著性检验,(步骤),提出假设,H,0,:,b,i,=0 (,自变量,x,i,与,因变量,y,没有线性关系,),H,1,:,b,i,0 (,自变量,x,i,与,因变量,y,有线性关系,),计算检验的统计量,t,确定显著性水平,,并进行决策,t,t,,拒绝,H,0,;,t,F,0.05,(2,7)=4.74,,回归方程显著,回归系数的显著性检验,t,=9.3548,t,=0.3646,,;,t,2,=4.7962,t,=2.3646,;两个回归系数均显著,一个含有四个变量的回归,一个二元线性回归的例子(计算机输出结果解释)销售额与人口数,第三节 可化为线性回归的 曲线回归,基本概念,非线性模型及其线性化方法,第三节 可化为线性回归的,非线性回归,1.,因变量,y,与,x,之间不是线性关系,2.,可通过变量代换转换成线性关系,用最小二乘法求出参数的估计值,并非所有的非线性模型都可以化为线性模型,非线性回归1.因变量 y 与 x 之间不是线性关系,几种常见的非线性模型,指数函数,线性化方法,两端取对数得:,ln,y,=ln,+,x,令:,y,=ln,y,,则有,y,=,ln,+,x,基本形式:,图像,几种常见的非线性模型 指数函数线性化方法基本形式:图像,几种常见的非线性模型,幂函数,线性化方法,两端取对数得:,lg,y,=lg,+,lg,x,令:,y,=lg,y,,,x,=lg,x,,,则,y,=,lg,+,x,基本形式:,图像,0,1,1,=1,-1,0,-1,=-1,几种常见的非线性模型 幂函数线性化方法基本形式:图像0,几种常见的非线性模型,双曲线函数,线性化方法,令:,y,=1/,y,,,x,=1/,x,则有,y,=,+,x,基本形式:,图像,0,几种常见的非线性模型 双曲线函数线性化方法基本形式:图像,几种常见的非线性模型,对数函数,线性化方法,x,=lg,x,则有,y,=,+,x,基本形式:,图像,0,0,几种常见的非线性模型 对数函数线性化方法基本形式:图像,几种常见的非线性模型,S,型曲线,线性化方法,令:,y,=1/,y,,,x,=e,-,x,则有,y,=,+,x,基本形式:,图像,几种常见的非线性模型 S 型曲线线性化方法基本形式:图像,非线性回归,(实例),【,例,】,为研究生产率与废品率之间的关系,记录数据如下表。试拟合适当的模型。,废品率与生产率的关系,生产率(周,/,单位,),x,1000,2000,3000,3500,4000,4500,5000,废品率(,%,),y,5.2,6.5,6.8,8.1,10.2,10.3,13.0,非线性回归(实例)【例】为研究生产率与废品率之间的,非线性回归,(实例),生产率与废品率的散点图,非线性回归(实例)生产率与废品率的散点图,非线性回归,(实例),用线性模型:,y,=,0,1,x,+,,有,y,=,2.671+0.0018,x,用指数模型:,y,=,x,,有,y,=4.05,(1.0002),x,比较,直线的残差平方和,5.3371,指数模型的残差平方和,6.11,。直线模型略好于指数模型,非线性回归(实例)用线性模型:y=01x+,,本章小结,相关系数与相关分析,一元线性回归模型、回归方程与估计的回归方程,多元线性回归模型、回归方程与估计的回归方程,回归方程与回归系数的显著性检验,非线性回归的线性化,5.,用,Excel,进行回归分析,本章小结相关系数与相关分析,结 束,结 束,身体健康,学习进步!,身体健康,学习进步!,