Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第10讲,回归分析(fnx)与独立性检验,第一页,共46页。,考纲要求,考点分布,考情风向标,1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.,2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.,3.了解下列一些常见的统计方法、并能应用这些方法解决一些实际问题.,(1)了解独立性检验(只要求2,2列联表)的基本思想、方法及其简单应用.,(2)了解回归分析的基本思想及其简单应用,2012年新课标卷考查样本的相关系数;,2014年新课标卷,考查非线性拟合、线性回归方程求法、利用回归方程进行预报预测;,2015年新课标卷,考查非线性拟合、线性回归方程求法、利用回归方程进行预报预测,由于该部分内容的特殊性,高考对该部分的考查一直非常慎重.高考在该部分的主要命题点就是回归分析和独立性检验的基础知识和简单应用.因此,复习时要掌握好回归分析和独立性检验的基本思想、方法和基本公式.此部分内容也可能结合概率统计的其他内容命制综合解答题.另外,复习时要把独立性检验作为重点,第二页,共46页。,1.变量(binling)间的关系,(1)常见(chn jin)的两变量之间的关系有两类:一类是函数关系,另,一类是相关关系;与函数关系不同,相关关系是一种非确定性,关系.,(2)将样本中 n 个数据点(xi,yi)(i1,2,n)描在平面直,角坐标系中,表示两个变量关系的一组数据的图形(txng)叫做散点图.,第三页,共46页。,(3)正相关(xinggun)、负相关(xinggun).,在散点图中,点散布(snb)在从左下角到右上角的区域,对于两,个变量的这种相关关系(gun x)称为正相关.,在散点图中,点散布在从左上角到右下角的区域,两个变,量的这种相关关系称为负相关.,第四页,共46页。,2.回归(hugu)分析,(1)定义:对具有相关关系的两个(lin)变量进行统计分析的一种,常用(chn yn)方法.,(2)线性相关关系:,观察散点图的特征,如果散点图中点的分布从整体上看大,致在一条直线附近,我们就称这两个变量之间具有线性相关关,系,这条直线叫做回归直线.,第五页,共46页。,(3)回归(hugu)直线的求法:,对于(duy)一组具有线性相关关系的数据(x1,y1),(x2,y2),,的方法,即求回归直线,使得样本(yngbn)数据的点到它的距离的平方,和最小,这一方法叫做最小二乘法,则回归直线方程,的,系数为:,第六页,共46页。,样本(yngbn)点的中心,第七页,共46页。,(4)线性相关强度(qingd)的检验:,第八页,共46页。,当 r0 时,表明两个变量正相关;,当 r3.841.,7522521090,因此有 95%的把握认为“该校学生的每周平均体育运动时,间与性别(xngbi)有关”.,第二十七页,共46页。,【规律方法】解决独立性检验问题的一般步骤(bzhu):,制作列联表;,利用(lyng)公式 K2,n,(,ad,bc,),2,(,a,b,)(,c,d,)(,a,c,)(,b,d,),计算(j sun),近似计算(j sun),要精确到小数点后三位;,查表得出结论,要选择满足条件,P,(,K,2,k,0,),的,k,0,作为拒,绝域的临界值.,第二十八页,共46页。,项目,不及格,及格,总计,男,6,14,20,女,10,22,32,总计,16,36,52,【互动探究(tnji)】,2.(2014 年江西)某人研究中学生的性别与成绩、视力、智,商、阅读量这 4 个变量之间的关系,随机抽查 52 名中学生,得,到统计数据如表 1 至表 4,则与性别有关联的可能性最大的变,量是(,),表 1,成绩(chngj),第二十九页,共46页。,项目,不及格,及格,总计,男,4,16,20,女,12,20,32,总计,16,36,52,项目,不及格,及格,总计,男,8,12,20,女,8,24,32,总计,16,36,52,表 2,表 3,视力(shl),智商,第三十页,共46页。,项目,不及格,及格,总计,男,14,6,20,女,2,30,32,总计,16,36,52,表 4,A.成绩(chngj),C.智商,阅读(yud)量,B.视力,D.阅读(yud)量,第三十一页,共46页。,解 析:由公式(gngsh)K2,n,(,ad,bc,),2,(,a,b,)(,c,d,)(,a,c,)(,b,d,),计算(j sun)得,A.,528,2,16362032,,,B.,52112,2,16362032,,,C.,5296,2,16362032,,,D.,52408,2,16362032,.显然 D 的值最大,说明阅读(yud)量与性别有关联,的可能性最大,.,答案:,D,第三十二页,共46页。,考点 3 回归(hugu)分析的综合运用,例 3:(2015 年新课标)某公司为确定下一年度投入某种,产品(chnpn)的宣传费,需了解年宣传费 x(单位:千元)对年销售量 y(单,位:t)和年利润 z(单位:千元)的影响,对近 8 年的宣传费 xi 和,年销售量 yi(i1,2,8)数据作了初步处理,得到(d do)下面的散,点图(如图 9-10-2)及一些统计量的值.,图 9-10-2,第三十三页,共46页。,(1)根据散点图判断,yabx 与 ycd ,哪一个适宜,作为年销售量 y 关于(guny)年宣传费 x 的回归方程类型(给出判断即,可,不必说明理由);,(2)根据(1)的判断(pndun)结果及表中数据,建立 y 关于 x 的回归方,程;,(3)已知这种产品(chnpn)的年利润 z 与 x,y 的关系为 z0.2yx ,,根据(2)的结,果回答下列问题:,46.6,563,6.8,289.8,1.6,1469,108.8,第三十四页,共46页。,当年宣传费 x49 时,年销售量及年利润的预报值是多,少?,当年宣传费 x 为何值时,年利润的预报值最大?,附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回,归直线u 的斜率和截距的最小二乘估计(gj)分别为,第三十五页,共46页。,第三十六页,共46页。,第三十七页,共46页。,年份,2007,2008,2009,2010,2011,2012,2013,年份代号,t,1,2,3,4,5,6,7,人均纯收入,y,2.9,3.3,3.6,4.4,4.8,5.2,5.9,【互动(h dn)探究】,3.(2014 年新课标)某地区(dq)2007 年至 2013 年农村居民家,庭纯收入 y(单位:千元)的数据(shj)如下表:,(1)求,y,关于,t,的线性回归方程;,(2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农,村居民家庭人均纯收入的变化情况,并预测该地区 2015 年农村,居民家庭人均纯收入.,第三十八页,共46页。,附:回归直线的斜率和截距的最小二乘法估计(gj)公式分别为:,第三十九页,共46页。,第四十页,共46页。,(2)由(1)知,0.50,故 2007 年至 2013 年该地区(dq)农村居,民家庭人均纯收入逐年(zhnin)增加,平均每年增加 0.5 千元.,将 2015 年的年份代号 t9 带入(1)中的回归方程,,得 0.592.36.8.,故预测(yc)该地区2015 年农村居民家庭人均纯收入为6.8 千元.,第四十一页,共46页。,日期,1 月 11 日,1 月 12 日,1 月 13 日,1 月 14 日,1 月 15 日,平均气温/,9,10,12,11,8,销量/杯,23,25,30,26,21,易错、易混、易漏,对回归分析(fnx)的理解,例题:(2015 年广东广州调研)某位同学进行寒假社会实践,活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的,关系进行分析(fnx)研究,他分别记录了 1 月 11 日至 1 月 15 日的白,天平均气温(单位:)与该奶茶店的这种饮料销量(单位:杯),,所得数据如下表:,第四十二页,共46页。,(1)若从这 5 组数据(shj)中随机抽出 2 组,求抽出的 2 组数据(shj)恰,好是相邻 2 天数据(shj)的概率;,第四十三页,共46页。,正解:(1)设“选取的 2 组数据恰好是相邻 2 天数据”为事,件 A.,所有基本(jbn)事件(m,n)(其中m,n 为1月份的日期数)有(11,12),,(11,13),(11,14),(11,15),(12,13),(12,14),(12,15),(13,14),,(13,15),(14,15),共 10 种.,事件A 包括的基本(jbn)事件有(11,12),(12,13),(13,14),(14,15),,共 4 种.,第四十四页,共46页。,第四十五页,共46页。,1.求回归方程,关键在于正确求出系数 a,b,由于 a,b 的,计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生,错误(cuw).(注意回归直线方程中一次项系数为 b,常数项为 a,这与,一次函数的习惯表示不同),2.回归分析是处理变量相关关系的一种数学方法(sh xu fn f).主要解,决:确定特定量之间是否有相关关系,如果有,就找出它们,之间的数学表达式;根据一组观察值,预测变量的取值及判,断变量取值的变化趋势;求出回归直线方程.,3.独立性检验中统计量 K2 的观测值 k 的计算公式很复杂,,在解题中易混淆一些数据的意义,代入公式时出错(ch cu),而导致整,个计算结果出错(ch cu).,第四十六页,共46页。,