单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2017/6/29,#,高中,数学人教,A,版,选修,2,3,第,3,章 统计案例,四川省成都市新都一中,肖 宏,No.,1,middle school,,,my love,!,高中数学人教A版选修23第3章 统计案例四川省成都市,1,经常上网会影响学习吗,?,下表为教育部对,1000,名中学生进行调查的结果,.,经常上网影响学习吗,?,如何判断,?,No.,1,middle school,,,my love,!,第,3,课时,独立性检验的基本思想及其初步应用,经常上网会影响学习吗?下表为教育部对1000名中学生进行调查,2,问题,1:(1),通过表中的数据,可知经常上网的人成绩及格的比例为,60%,,不经常上网的人成绩及格的比例为,85%,,这个数据可以初步判断经常上网对学习成绩是有影响的,但这种说法犯错误的概率有多大,还需要进行独立性检验才知道,.,No.,1,middle school,,,my love,!,问题1:(1)通过表中的数据,可知经常上网的人成绩及格的比例,3,(2),两个分类变量,A,和,B,的,22,列联表,一般,地,假设有两个分类变量,A,和,B,,它们的可能取值分别为,A,1,,,A,2,和,B,1,,,B,2,,其样本频数列联表,(,称为,22,列联表,),为,:,No.,1,middle school,,,my love,!,(2)两个分类变量A和B的22列联表No.1 middl,4,No.,1,middle school,,,my love,!,No.1 middle school,my love,5,No.,1,middle school,,,my love,!,问题,3:,独立性检验的基本思想,独立性检验的基本思想类似于反证法,要确认,“,两个分类变量有关系,”,这一结论成立的可信度,.,首先假设该结论不成立,即假设结论,“,两个分类变量没有关系,”,成立,在该假设下构造的随机变量,K,2,应该很小,如果观测数据计算得到的,K,2,的观测值,k,很大,则在一定程度上说明假设不合理,根据随机变量,K,2,的含义,与有关的临界值相比较,可确定可信程度,.,No.1 middle school,my love,6,No.,1,middle school,,,my love,!,问题,4:,独立性检验的方法,(1),根据实际问题的需要确定推断,“,两个分类变量有关系,”,犯错误概率的上界,a,,然后通过下表确定临界值,k,0,.,(2),附临界值表,:,No.1 middle school,my love,7,No.,1,middle school,,,my love,!,No.1 middle school,my love,8,No.,1,middle school,,,my love,!,反证法原理与独立性检验原理的比较,反证法原理,:,在假设,H,0,下,如果推出一个矛盾,就证明了,H,0,不成立,;,独立性检验原理,:,在假设,H,0,下,如果出现一个与,H,0,相矛盾的小概率事件,就推断,H,0,不成立,该推断犯错误的概率不超过这个小概率,.,No.1 middle school,my love,9,No.,1,middle school,,,my love,!,一、,22,列联表,某学校对高三学生进行了一项调查后发现,:,在平时的模拟考试中,性格内向的,426,名学生中有,332,名学生在考前心情紧张,性格外向的,594,名学生中有,213,名学生在考前心情紧张,.,请作出考前心情紧张与性格的列联表,.,【方法指导】在,22,列联表中,共有两类变量,每一类变量都有两个不同的取值,然后找出相应的数据,列表即可,.,No.1 middle school,my love,10,No.,1,middle school,,,my love,!,【解析】,作列联表如下,:,【小结】分清类别是作列联表的关键,表中排成两行两列的数据是调查得来的结果,.,No.1 middle school,my love,11,No.,1,middle school,,,my love,!,二、,独立性检验及其应用,某聋哑研究机构对聋哑关系进行抽样调查,在耳聋的,657,人中有,416,人哑,而另外不聋的,680,人中有,249,人哑,你能运用这组数据得出相应的结论吗,?,【方法指导】本题属于独立性检验问题,因此,首先要列出,22,列联表,再计算,K,2,的值,通过比较与临界值的大小关系作出判断,.,No.1 middle school,my love,12,No.,1,middle school,,,my love,!,No.1 middle school,my love,13,No.,1,middle school,,,my love,!,No.1 middle school,my love,14,No.,1,middle school,,,my love,!,三、,独立性检验,与统计的综合应用,某校为了探索一种新的教学模式,进行了一项课题实验,乙班为实验班,甲班为对比班,甲、乙两班均有,50,人,一年后对两班进行测试,成绩如下表,(,总分,:150,分,):,甲,班,乙班,No.1 middle school,my love,15,No.,1,middle school,,,my love,!,(1),现从甲班成绩位于,90,,,120),内的试卷中抽取,9,份进行试卷分析,请问用什么抽样方法更合理,并写出最后的抽样结果,;,(2),根据所给数据可估计在这次测试中,甲班的平均分是,101.8,,请你估计乙班的平均分,并计算两班平均分相差几分,;,(3),完成下面,22,列联表,并判断能否有,95%,以上的把握认为这两个班在这次测试中成绩的差异与实施课题实验有关,.,请说明理由,.,No.1 middle school,my love,16,No.,1,middle school,,,my love,!,【方法指导】,(1),先由三组数据存在差异确定抽样方法并计算抽样比,从而确定各区间抽样份数,.,(2),累加各组的组中值与频率的积,并计算乙班的平均分,从而得到两班平均分的差,.,(3),根据所给的数据得到,22,列联表,由列联表中的数据求出,K,2,,结合临界值表得出结论,.,No.1 middle school,my love,17,No.,1,middle school,,,my love,!,No.1 middle school,my love,18,No.,1,middle school,,,my love,!,(,3),补全列表如下,:,No.1 middle school,my love,19,No.,1,middle school,,,my love,!,No.1 middle school,my love,20,No.,1,middle school,,,my love,!,1.,在一项有关医疗保健的社会调查中,发现调查的男性为,530,人,女性为,670,人,其中男性中喜欢吃甜食的为,117,人,女性中喜欢吃甜食的为,492,人,请作出性别与喜欢吃甜食的列联表,.,No.1 middle school,my love,21,No.,1,middle school,,,my love,!,【解析】,作列联表如下,:,No.1 middle school,my love,22,No.,1,middle school,,,my love,!,2.,调查,339,名,50,岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下,:,判断吸烟习惯与患慢性气管炎是否有关,?,附表,:,No.1 middle school,my love,23,No.,1,middle school,,,my love,!,No.1 middle school,my love,24,No.,1,middle school,,,my love,!,3.,电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了,100,名观众进行调查,其中女性有,55,名,.,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图,:,No.1 middle school,my love,25,No.,1,middle school,,,my love,!,将,日均收看该体育节目时间不低于,40,分钟的观众称为,“,体育迷,”,,已知,“,体育迷,”,中有,10,名女性,根据已知条件列出,22,列联表,并根据此资料判断是否可以认为,“,体育迷,”,与性别有关,.,【解析】由所给的频率分布直方图知,,“,体育迷,”,的人数为,100(100.020,100.005),25.,“,非体育迷,”,的人数为,100,25,75,,,No.1 middle school,my love,26,No.,1,middle school,,,my love,!,22,列联表如下,:,No.1 middle school,my love,27,No.,1,middle school,,,my love,!,No.1 middle school,my love,28,No.,1,middle school,,,my love,!,(2013,年,福建卷,),某工厂有,25,周岁以上,(,含,25,周岁,),工人,300,名,,25,周岁以下工人,200,名,.,为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了,100,名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在,“25,周岁以上,(,含,25,周岁,)”,和,“25,周岁以下,”,分为两组,再将两组工人的日平均生产件数分成,5,组,:50,,,60),,,60,,,70),,,70,,,80),,,80,,,90),,,90,,,100,分别加以统计,得到如图所示的频率分布直方图,.,No.1 middle school,my love,29,No.,1,middle school,,,my love,!,No.1 middle school,my love,30,No.,1,middle school,,,my love,!,(,1),从样本中日平均生产件数不足,60,件的工人中随机抽取,2,人,求至少抽到一名,“25,周岁以下组,”,工人的概率,;,(,2),规定日平均生产件数不少于,80,件者为,“,生产能手,”,,请你根据已知条件完成,22,列联表,并判断能否有,90%,以上的把握认为,“,生产能手与工人所在的年龄组有关,”?,No.1 middle school,my love,31,No.,1,middle school,,,my love,!,【解析】,(1),由已知得,样本中有,25,周岁以上组工人,60,名,,25,周岁以下组工人,40,名,.,所以样本中日平均生产件数不足,60,件的工人中,,25,周岁以上组工人有,600.05,3,名,记为,A,1,,,A,2,,,A,3,;25,周岁以下组工人有,400.05,2,名,,,No.1 middle school,my love,32,No.,1,middle school,,,my love,!,No.1 middle school,my love,33,No.,1,middle school,,,my love,!,(,2),由频率分布直方图可知,在抽取的,100,名工人中,,“25,周岁以上组,”,中的生产能手,600.25,15,名,,“25,周岁以下组,”,中的生产能手,400.375,15,名,据此可得,22,列联表如下,:,No.1 middle school,my love,34,No.,1,middle school,,,my love,!,No.1 middle