,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,1,2.2,独立性检验,2.3,独立性检验的基本思想,2.4,独立性检验的应用,12.2 独立性检验,人们都认可“吸烟具有危害性”,那么,人们认可这个观点,有什么根据么?吸烟是否对患肺癌有影响呢?下面我们用数学知识来分析一下,这个观点是否具有科学根据,人们都认可“吸烟具有危害性”,那么,人们认可这个,1.,掌握利用,22,列联表进行独立性检验,会用,22,列联表解决实际问题,.,(重点),2.,了解独立性检验的基本思想及实施步骤,.,(重点),3.,掌握独立性检验的简单应用,(难点),1.掌握利用22列联表进行独立性检验,会用22列联表解决,探究点,1,独立性检验,为了调查吸烟与患肺癌是否有联系,某机构随机调,查了,6 578,人,得到表中的数据(单位:人),患肺癌,不患肺癌,吸烟,56,1 932,不吸烟,23,4 567,22,列联表,这一问题称为,22,列联表的独立性检验,.,患肺癌情况,吸烟情况,探究点1 独立性检验为了调查吸烟与患肺癌是否有联系,某机构,思考:,如何根据表格中的数据来判断吸烟与患肺癌是否有联系?,为了讨论的方便,我们引入以下记号:,变量,A,:,A,1,=,吸烟,,变量,B,:,B,1,=,患肺癌,,计算得如下表格:,思考:如何根据表格中的数据来判断吸烟与患肺癌是否有联系?为,患肺癌,B,1,未患肺癌,B,2,总计,吸烟,A,1,56,1 932,1 988,不吸烟,A,2,23,4 567,4 590,总计,79,6 499,6 578,我们假设吸烟与患肺癌是独立的,即吸烟不影响患肺癌,.,根据直观的经验,我们把吸烟人群中患肺癌的人所占百分比,与不吸烟人群中患肺癌的人所占百分比作比较,.,如果吸烟不影响患肺癌,就意味着,无论吸烟与否,患肺癌的人所占的百分比应该是基本一样的,就此题而言:,患肺癌情况,吸烟情况,患肺癌B1未患肺癌B2总计吸烟A1561 9321 988不,通过表格中的数据计算可得,吸烟人群中患肺癌的人所占百分比是:,不吸烟人群中患肺癌的人所占百分比是:,结论:,吸烟人群中患肺癌的人所占的百分比,与不吸烟人群中患肺癌的人所占百分比不等,且相差较大,.,由此我们可以推断,开始的假设是不成立的,.,也就是说,患肺癌与吸烟是有关系的,.,由吸烟人群中患肺癌的人所占的百分比较多,我们认为吸烟会对肺癌的发病率造成一定的影响,.,通过表格中的数据计算可得,另一方面,如果吸烟与患肺癌是独立的,那么有,都成立,由上表数据可得:,患肺癌情况,吸烟情况,另一方面,如果吸烟与患肺癌是独立的,那么有都成立,由上表数据,既吸烟又患肺癌的人频率为:,吸烟的人频率为:,患肺癌的人频率为:,显然,两边相差很大,可以估计,结论:,患肺癌与吸烟有关,.,既吸烟又患肺癌的人频率为:吸烟的人频率为:患肺癌的人频率为:,设,A,B,为两个变量,每个变量都可取两个值,,变量,A,:,变量,B,:,,,=,;,,,=,.,【,概括总结,】,B,A,B,1,B,2,总计,A,1,a,b,_,A,2,c,d,c+d,总计,a+c,_,n=_,a+b,a+b+c+d,b+d,设 A,B为两个变量,每个变量都可取两个值,变量A:变量B:,设,,用 估计 ,,估计 ,估计,.,若有式子,,,则可认为 与 独立,.,同理,若 则可认为,A,1,与,B,2,独立;若,则可认为,A,2,与,B,1,独立;若,则可认为,A,2,与,B,2,独立,.,设 ,用,在 中,,由于 ,表,示的是频率,不同于概率,即使变量之间独立,式子两,边也不一定恰好相等,但是当两边相差很大时,变量,之间就不独立,.,在 中,由于 ,,考察棉花种子经过处理跟棉花生病之间的关系,,得到数据如下:,则判断种子处理与得病之间的独立性,.,【,练一练,】,种子处理情况,得病情况,考察棉花种子经过处理跟棉花生病之间的关系,则判,解:,由题意可知,a=32,,,b=101,,,c=61,,,d=213,,从而,可得 ,所以,种子处理与得病,之间是独立的,.,解:由题意可知a=32,b=101,c=61,d=213,从,在上面吸烟是否对患肺癌有影响的问题中,探究点,2,独立性检验的基本思想,当上面的值较大时,变量,A,B,不独立,.,思考,:,当这些量多大时才能说明变量间不独立呢?我们能不能选择一个量,用它的大小来检验变量之间是否独立呢?,在上面吸烟是否对患肺癌有影响的问题中探究点2 独立性检验的,统计学家选取以下统计量,用它的大小来检验变量之间是否独立:,当,2,较大时,说明变量之间不独立,.,统计学家选取以下统计量,用它的大小来检验变量之间是否独立:当,当数据量较大时,在统计中,用以下结果对变量的独立性进行判断,.,1.,如果 ,2.706,没有充分的证据判定变量,A,B,有关联,可以认为变量,A,,,B,是没有关联的;,3.,如果,3.841,,有,95%,的把握判定变量,A,B,有关联,;,2.,如果,2.706,,有,90%,的把握判定变量,A,B,有关联,;,4.,如果,6.635,,有,99%,的把握判定变量,A,B,有关联,.,当数据量较大时,在统计中,用以下结果对变量的独立性进行判断.,患肺癌,B,1,未患肺癌,B,2,总计,吸烟,A,1,56,1932,1988,不吸烟,A,2,23,4567,4590,总计,79,6499,6578,对于吸烟和患肺癌的问题,所以有,99%,以上的把握认为吸烟与患肺癌是有关的,.,患肺癌情况,吸烟情况,患肺癌B1未患肺癌B2总计吸烟A15619321988不吸烟,思考:,在进行,2,运算,判断变量相关时,,若,2,=56.632,,,P,(,2,6.635)0.01,和,P,(,2,3.841)0.05,,哪种说法是正确的?,提示:,两种说法均正确,.P,(,2,6.635)0.01,的含义是有,99%,以上的把握认为两变量相关;而,P,(,2,3.841)0.05,的含义是有,95%,以上的把握认为两变量相关,.,思考:在进行2运算,判断变量相关时,,参加体育锻炼情况,性别,喜欢参加,体育锻炼,不喜欢参加体育锻炼,男,197,48,女,135,120,为了了解高中生是否喜欢参加体育锻炼与性别之间,的关系,调查者随机调查了,500,名高中生的情况,,调查结果如下,(单位:人):,试问:,高中生是否喜欢参加体育锻炼与性别之间有关系吗,?,【,变式练习,】,参加体育锻炼情况喜欢参加不喜欢参加体育锻炼男19748女13,解:,根据表中的数据得,a=197,b=48,c=135,d=120,所以有,99%,以上的把握认为,高中生是否喜欢参加体育锻炼与性别之间是,有关的,.,解:根据表中的数据得a=197,b=48,c=135,d=1,例,1.,某组织对男女青年是否喜爱古典音乐进行了一个调查,调查者随机调查了,146,名青年,下表中给出了调查的结果(单位:人):,喜爱,不喜爱,男青年,46,30,女青年,20,50,试问:男女青年喜爱古典音乐的程度是否有差异?,探究点,3,独立性检验的应用,喜欢古典音乐情况,青年,例1.某组织对男女青年是否喜爱古典音乐进行了一个调查,调查者,解:,根据表中的数据计算得下表,(单位:人):,喜爱,不喜爱,总计,男青年,46,30,76,女青年,20,50,70,总计,66,80,146,所以有,99%,以上的把握认为是否喜爱古典音乐与青年的性别有关,.,喜欢古典音乐情况,青年,解:根据表中的数据计算得下表(单位:人):喜爱不喜爱总计男青,例,2.,容易生气的人更有可能患心脏病吗?某机构随机,调查了,2 796,人,下表给出了调查的结果(单位:人):,患心脏病,未患心脏病,易怒,27,606,不易怒,53,2 110,试问:容易生气的人是否更有可能患心脏病?,患心脏病情况,是否易怒,例2.容易生气的人更有可能患心脏病吗?某机构随机患心脏病未患,解:,根据表中的数据计算得下表,(单位:人):,患心脏病,未患心脏病,总计,易怒,27,606,633,不易怒,53,2 110,2 163,总计,80,2 716,2 796,所以有,95%,以上的把握认为患心脏病与易怒有关,.,患心脏病情况,是否易怒,解:根据表中的数据计算得下表(单位:人):患心脏病未患心脏病,眼睛虹膜颜色,头发颜色,蓝色,棕色,红金黄色,156,12,黑色,20,24,例,3.,生物学上对于人类头发的颜色与眼睛虹膜的颜色是否有关进行了调研,以下是一次调查结果,调查人数共,212,人,调查记录如表,(单位:人):,试问:头发的颜色与眼睛虹膜的颜色有关吗?,眼睛虹膜颜色蓝色棕色红金黄色15612黑色2024例3.生,解:,根据表中的数据计算得下表,(单位:人):,眼睛虹膜颜色,头发颜色,蓝色,棕色,总计,红金黄色,156,12,168,黑色,20,24,44,总计,176,36,n=212,因为,55.5766.635,所以有,99%,以上的把握认为,头发的颜色与眼睛虹膜的颜色有关,.,解:根据表中的数据计算得下表(单位:人):眼睛虹膜颜色蓝色棕,要推断“,和,是否有关系”,可按下面的步骤进行:,(,1,),根据,22,列联表得出合计总表,;,(,2,)用公式计算 的值;,(,3,)查对临界值,作出判断,.,由于抽样的随机性,由样本得到的推断有可能正,确,也有可能错误,.,利用 进行独立性检验,可以,对推断的正确性作出估计,样本量,n,越大,估计越准确,.,【,总结,】,要推断“和是否有关系”,可按下面的步骤进行:(1)根据2,有甲乙两个班级进行一门课程的考试,按照学生考试,成绩优秀和不优秀统计成绩后,得到如下列联表:,优秀,不优秀,甲班,10,35,乙班,7,38,试问:学生的学习成绩与所在的班级有关吗?,【,变式练习,】,成绩,班级,有甲乙两个班级进行一门课程的考试,按照学生考试优秀不优秀甲,优秀,不优秀,总计,甲班,10,35,45,乙班,7,38,45,总计,17,73,90,解:,根据表中的数据计算得下表,因为,0.6533.841.,所以有,95%,的把握判定两个变量有关联,.,95%,3.若由一个22列联表中的数据计算得 4.013,那,4.,根据下表计算 ,_.,解,:,由 的计算公式,得,1.78,发病情况,手术情况,4.根据下表计算 _.解:由 的计算公式,,5.,下表是某地区的一种传染病与饮用水的调查表:,试问:这种传染病与饮用水的卫生程度有关吗?,得病情况,饮用水卫生程度,5.下表是某地区的一种传染病与饮用水的调查表:试问:这种传染,解:,根据表中的数据计算得下表,所以有,99%,以上的把握认为,这种传染病与饮用水的卫生程度有关,.,得病情况,饮用水卫生程度,解:根据表中的数据计算得下表所以有99%以上的把握认为这种传,B,A,B,1,B,2,总计,A,1,a,b,a+b,A,2,c,d,c+d,总计,a+c,b+d,n=a+b+c+d,根据,2,2,列联表中的数据,来判断两个变量,A,B,是否独立的问题,1.22,列联表的定义,变量,A,:,A,1,;,变量,B:B,1,用如下数据,:,BB1B2总计A1aba+bA2cdc+d总计a+cb+dn,2.,统计量,2,的计算公式,3.,独立性检验判断方法,2,=,2,=,2.统计量2的计算公式2=2=,人生难免遇风雨,天空难免有阴云,别因雨水湿透衣衫而难过,别为坎坷阻力而叹息,用乐观心态面对人生遭遇,用积极的拼搏迎接雨后的彩虹,相信自己,.,人生难免遇风雨,天空难免有阴云,别因雨水湿透衣衫而难,