1,.,了解随机误差、残差、残差图的概念,.,2,.,会用残差分析判断线性回归模型的拟合效果,.,3,.,掌握建立回归模型的步骤,.,4,.,通过对典型案例的探究,了解回归分析的基本思想方法和初步应用,.,1,.,回归分析,(1),函数关系是一种,确定性,关系,而相关关系是一种,非确定性,关系,即自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做,相关关系,.,(2),回归分析,是对具有相关关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是画出两个变量的,散点图,求回归直线方程,并用回归直线方程进行预报,.,【做一做,1,-,1,】,在回归分析过程中,散点图的作用是,(,),A.,查找个体个数,B.,比较个体数据的大小关系,C.,探究个体分类,D.,粗略判断变量是否线性相关,解析,:,散点图能直观形象地反映两个变量间的关系,可以粗略地判断两个变量间是否存在线性关系,.,故选,D,.,答案,:,D,【做一做,1,-,2,】,在下列各组量中,:,正方体的体积,V,与棱长,a,;,一块农田的水稻产量与施肥量,;,人的身高与年龄,;,家庭的支出与收入,;,某户家庭的用电量与电价,.,其中量与量之间的关系是相关关系的是,(,),A.,B.,C.,D.,解析,:,是函数关系,V=a,3,;,电价是统一规定的,与用电量的关系是确定的关系,.,中的两个量之间的关系都是相关关系,因为水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不确定,;,人的身高一开始随着年龄的增大而增加,之后则不变化或降低,在身高增加时,也不是均匀增加的,;,家庭的支出与收入有一定的关系,这种关系是相关关系,不是确定关系,.,答案,:,D,2,.,线性回归模型,(,2),线性回归模型,y=bx+a+e,其中,e,称为,随机误差,自变量,x,称为,解释,变量,因变量,y,称为,预报,变量,.,(3),随机误差产生的原因,3,.,刻画回归效果的方式,【做一做,3,】,下列四个命题中正确的是,(,),在线性回归模型中,e,是,bx+a,预报真实值,y,的随机误差,它是一个可观测的量,;,残差平方和越小的模型,拟合的效果越好,;,用,R,2,来刻画回归方程,R,2,越小,拟合的效果越好,;,在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,.,带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高,.,A.,B.,C.,D.,解析,:,e,是一个不可观测的量,故,不正确,;,R,2,越小,残差平方和越大,即模型的拟合效果越差,故,不正确,;,是正确的,.,故选,B,.,答案,:,B,1,.,相关关系与函数关系的区别与联系是什么,?,剖析,:(1),两者之间的区别,.,相关关系是一种非确定性关系,.,如人的身高与年龄、商品的销售额与广告费等都是相关关系,.,而函数关系中的两个变量是一种确定性关系,.,如正方形的面积,S,与边长,x,之间的关系,S=x,2,就是函数关系,即对于边长,x,的每一个确定的值,面积,S,都有唯一确定的值与之对应,.,函数关系是一种因果关系,而相关关系不一定是因果关系,.,(2),两者之间的联系,.,相关关系与函数关系有着密切的联系,在一定条件下可以相互转化,.,例如正方形的面积,S,与其边长,x,之间虽然是一种确定性关系,但在每次测量时,由于测量误差等原因,其数值大小又表现出一种随机性,而对于具有相关关系的两个变量来说,当求得其回归直线方程后,我们又可以用一种确定的关系对这两个变量间的关系进行估计,.,2,.,怎样理解散点图和,R,2,的关系,?,剖析,:,散点图可以说明变量间有无线性相关关系,但不能精确地说明两个变量之间关系的密切程度,因此需要计算,R,2,来描述两个变量之间,关系,的密切程度,.,知识拓展,两种特殊非线性回归模型的转化,.,(1),将幂型函数,y=ax,m,(,a,为正的常数,x,y,取正值,),化为线性函数,.,若将,y=ax,m,两边同取以,10,为底的对数,则有,lg,y=m,lg,x+,lg,a.,令,u=,lg,y,v=,lg,x,lg,a=b,代入上式,得,u=mv+b,其中,m,b,是常数,.,这是,u,v,的线性函数,.,若以,u,为纵坐标,v,为横坐标,则,u=mv+b,的图象就是一条直线,.,(2),将指数型函数,y=ca,x,(,a,0,且,a,1,c,0,且为常数,),化为线性函数,.,将,y=ca,x,两边同取以,10,为底的对数,有,lg,y=x,lg,a+,lg,c,令,lg,y=u,lg,a=k,lg,c=b,得,u=kx+b,其中,k,和,b,是常数,与幂型函数不同的是,x,依然保持原来的,只是用,u,代替了,y,的对数,lg,y.,3,.,线性回归分析需要注意哪些方面,?,剖析,:,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,.,(1),用散点图分析线性相关关系,.,用散点图能较粗略地分析和判断两个具有相关关系的变量是否线性相关,.,如果是线性相关的,可以求其线性回归方程,;,如果不是线性相关的,通过运用某种变换把不呈线性相关关系的两个量变为线性相关关系,.,题型一,题型二,题型三,题型四,概念的理解和判断,【例,1,】,有下列说法,:,线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法,;,利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示,;,通过回归,其中正确命题的个数是,(,),A.1B.2,C.3D.4,题型一,题型二,题型三,题型四,解析,:,解答本题时,可先逐一核对相关概念及性质,然后再逐一作出判断,最后得出结论,.,反映的正是最小二乘法思想,故正确,;,反映的是散点图的作用,故正确,;,是不正确的,在求回归方程之前必须进行相关性检验,以体现两个变量的关系,.,答案,:,C,题型一,题型二,题型三,题型四,反思,回归分析的过程,:,(1),随机抽取样本,确定数据,形成样本点,;,(2),由样本点形成散点图,判断变量是否具有线性相关关系,;,(3),由最小二乘法确定线性回归方程,;,(4),由回归方程观察变量的取值及变化趋势,.,题型一,题型二,题型三,题型四,题型一,题型二,题型三,题型四,线性回归分析,【例,2,】,为研究质量,x,(,单位,:g),对弹簧长度,y,(,单位,:cm),的影响,对不同质量的,6,个物体进行测量,数据如下表所示,:,(1),作出散点图,并求线性回归方程,;,(2),求出,R,2,;,(3),进行残差分析,.,分析,:,题型一,题型二,题型三,题型四,解,:,(1),散点图如图所示,.,题型一,题型二,题型三,题型四,(,2),列表如下,:,题型一,题型二,题型三,题型四,题型一,题型二,题型三,题型四,【变式训练,2,】,已知某种商品的价格,x,(,单位,:,元,),与需求量,y,(,单位,:,件,),之间的关系有如下,5,组数据,:,求,y,对,x,的回归直线方程,并说明回归模型拟合效果的好坏,.,题型一,题型二,题型三,题型四,题型一,题型二,题型三,题型四,题型一,题型二,题型三,题型四,非线性回归分析,【例,3,】,下表为收集到的,7,组数据,:,(1),作出,x,与,y,的散点图,并猜测,x,与,y,之间的关系,;,(2),建立,x,与,y,的关系,;,(3),利用所得模型,预报当,x=,40,时,y,的值,.,题型一,题型二,题型三,题型四,题型一,题型二,题型三,题型四,(2),对两边取对数把指数关系变为线性关系,令,z=,ln,y,则变换后的样本点应分布在直线,z=bx+a,(,a=,ln,c,1,b=c,2,),的周围,这样就可以利用线性回归模型来建立,y,与,x,之间的非线性回归方程了,数据可以转化为,(3),当,x=,40,时,y=,e,0,.,272,x-,3,.,849,1 131,.,题型一,题型二,题型三,题型四,反思,解决非线性回归问题的方法及步骤,:,(1),确定变量,:,确定解释变量为,x,预报变量为,y,;,(2),画散点图,:,通过观察散点图,并与学过的函数,(,幂函数、指数函数、对数函数、二次函数,),作比较,选取拟合效果好的函数模型,;,(3),变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程,;,(4),根据相应的变换,写出非线性回归方程,.,题型一,题型二,题型三,题型四,【变式训练,3,】,为了研究某种细菌随时间,x,(,单位,:,天,),变化时,繁殖个数,y,(,单位,:,个,),的变化,收集数据如下,:,解,:,(1),作出的散点图如图所示,.,(1),用天数,x,作解释变量,繁殖个数,y,作预报变量,作出这些数据的散点图,;,(2),描述解释变量,x,与预报变量,y,之间的关系,.,题型一,题型二,题型三,题型四,题型一,题型二,题型三,题型四,易错辨析,易错点,:,把非线性回归问题当作线性回归问题致错,【例,4,】,在一次抽样调查中测得样本的,5,个样本点,数值如下表,:,试建立,y,与,x,之间的回归方程,.,题型一,题型二,题型三,题型四,错,解,:,由已知条件制成下表,:,题型一,题型二,题型三,题型四,错因分析,本题直接取已知数据求回归直线方程,没有画出散点图进行线性相关性的检验,而本题的样本点恰好不是线性相关的,.,根,题型一,题型二,题型三,题型四,正,解,:,根据散点图,(,如图,),可知,y,与,x,近似地呈反比例函数关系,题型一,题型二,题型三,题型四,由散点图,(,略,),可以看出,y,与,t,呈近似的线性相关关系,列表如下,:,题型一,题型二,题型三,题型四,题型一,题型二,题型三,题型四,反思,求回归直线方程,应先对样本点是否线性相关进行判断,因为对于任何一组样本点,都可以根据最小二乘法求得一个回归直线方程,但这条回归直线不一定较好地反映了样本点的分布,.,可以通过散点图首先作出是否线性相关的判断,然后再选择恰当的回归模型进行模拟,.,