单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,复习回顾,1,、什么是简单随机抽样?,什么样的总体适宜简单随机抽样?,2,、什么是系统抽样?,什么样的总体适宜 系统抽样?,3,、,什么是分层抽样?什么样的总体适宜分层抽样?,抽样是统计的第一步,接下来就要对样本进行分析,复习回顾1、什么是简单随机抽样?什么样的总体适宜简单随机抽样,1,2.2,用样本估计总体,2.2用样本估计总体,2,学习目标:,1.,绘画频率分布直方图,频率折线图,茎叶图。,2.,通过实例体会,频率分布直方图,频率折线图,茎叶图各自特征,从而恰当的选择上述方法分析样本的分布,准确地做出总体估计。,学习目标:,3,这种估计一般分成两种:是用样本的频率分布估计总体的分布.是用样本的数字特征(如平均数、标准差 等)估计总体的数字特征.,用样本去估计总体,是研究统计问题的一个基本思想,.,这种估计一般分成两种:,4,频率分布,样本中所有数据(或数据组)的频数和样本容量的比,叫做该数据的,频率,.,频率分布的表示形式有:,样本频率分布表,样本频率分布条形图,样本频率分布直方图,所有数据(或数据组)的频数的分布变化规律叫做,样本的频率分布,.,频率分布 样本中所有数据(或数据组)的频数和样本容量的比,叫,5,2.2.1,用样本的频率分布,估计总体分布,(1),2.2.1用样本的频率分布,6,我国的缺水情况,我国是世界上严重缺水的国家之一。,我国的缺水情况我国是世界上严重缺水的国家之一。,7,我国是世界上严重缺水的国家之一,城市缺水问题较为突出。,2000,年全国主要城市中缺水情况排在前,10,位的城市,我国是世界上严重缺水的国家之一,城市缺水问题较为突出。20,8,探究,:,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准,a,用水量不超过,a,的部分按平价收费,超过,a,的部分按议价收费。,如果希望大部分居民的日常生活不受影响,那么标准,a,定为多少比较合理呢,?,为了较合理地确定这个标准,你认为需要做哪些工作?,探究:某市政府为了节约生活用水,计划在本市试行居民生活用水定,9,根据这些数据你能得出用水量其他信息吗,?,根据这些数据你能得出用水量其他信息吗?,10,1.,求极差,(,即一组数据中最大值与最小值的差,)4.3-0.2=4.1,2.,决定组距与组数,(将数据分组),3.,将数据分组,(8.2,取整,分为,9,组,),画频率分布直方图的步骤,4.,列出频率分布表,.,5.,画出频率分布直方图,组距,:,指每个小组的两个端点的距离,,组数,:,将数据分组,当数据在,100,个以内时,,按数据多少常分,5-12,组,.,1.求极差(即一组数据中最大值与最小值的差),11,1.,求极差,:,步骤:,2.,决定组距与组数,:,组数,=,4.3-0.2=4.1,4.1,0.5,=8.2,组距,极差,=,3.,将数据分组,0,,,0.5),,,0.5,,,1),,,,,4,,,4.5,画频率分布直方图,1.求极差:步骤:2.决定组距与组数:组数=4.3-,12,4.,列频率分布表,100,位居民月均用水量的频率分布表,第几组频率,=,第几组频数,样本容量,4.列频率分布表100位居民月均用水量的频率分布表第几组频率,13,月均用水量,/t,频率组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,小长方形的面积,=?,5.,画频率分布直方图,月均用水量/t频率组距0.100.200.300.400.5,14,月均用水量,/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,小长方形的面积总和,=?,5.,画频率分布直方图,月均用水量/t频率0.100.200.300.400.500,15,月均用水量,/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,月均用水量最多的在那个区间,?,5.,画频率分布直方图,月均用水量/t频率0.100.200.300.400.500,16,月均用水量,/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,请大家阅读第,68,页,直方图有那些优点和缺点,?,5.,画频率分布直方图,月均用水量/t频率0.100.200.300.400.500,17,频率分布直方图的特征:,(,1,)从频率分布直方图可以清楚的,看出数据分布的总体趋势,(,2,)从频率分布直方图得不出原始,的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了,频率分布直方图的特征:,18,探究:,同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同,.,不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,.,分别以,1,和,0.1,为组距重新作图,然后谈谈你对图的印象,.,探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到,19,已知样本,10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为,0.2,范围的是,(),A.5.57.5 B.7.59.5 C.9.511.5 D.11.513.5,分组,频数,频率,5.57.5,2,0.1,7.59.5,6,0.3,9.511.5,8,0.4,11.513.5,4,0.2,合计,20,1.0,D,练习,1,:,已知样本10,8,6,10,8,13,11,10,1,20,练习,2:,有一个容量为,50,的样本数据的分组的频数如下:,12.5,15.5,),3,15.5,18.5,),8,18.5,21.5,),9,21.5,24.5,),11,24.5,27.5,),10,27.5,30.5,),5,30.5,33.5,),4,(1),列出样本的频率分布表,;,(2),画出频率分布直方图,;,(3),根据频率分布直方图估计,数据落在,15.5,24.5,)的百分比是多少,?,练习2:有一个容量为50的样本数据的分组的频数如下:12.,21,解,:,组距为,3,分组 频数 频率,频率,/,组距,12.5,15.5,),3,15.5,18.5,),8,18.5,21.5,),9,21.5,24.5,),11,24.5,27.5,),10,27.5,30.5,),5,30.5,33.5,),4,0.06,0.16,0.18,0.22,0.20,0.10,0.08,0.020,0.053,0.060,0.073,0.067,0.033,0.027,解:组距为3 分组 频数 频率,22,频率分布直方图如下,:,频率,组距,0.010,0.020,0.030,0.040,0.050,12.5,15.5,0.060,0.070,频率分布直方图如下:频率0.0100.0200.0300.0,23,频率分布直方图,应用,步骤,1.,求极差,2.,决定组距与组数,3.,将数据分组,4.,列频率分布表,5.,画频率分布直方图,频率分布直方图应用步骤1.求极差2.决定组距与组数3.将数据,24,1.,求极差,:,2.,决定组距与组数,:,组数,=,364.41-362.51=1.90,1.90,0.19,=10,组距,极差,=,3.,将数据分组,362.51,,,362.70),,,362.70,362.89),,,364.22,364.41,画频率分布直方图,1.求极差:2.决定组距与组数:组数=364.41-36,25,4.,列频率分布表,362.51,362.70)3 0.0375,362.70,362.89)5 0.0625,362.89,363.08)6 0.075,363.08,363.27)11 0.1375,363.27,363.46)8 0.1,363.46,363.65)18 0.225,363.65,363.84)13 0.1625,363.84,364.03)7 0.0875,364.03,364.22)5 0.0625,364.22,364.41 4 0.05,合计,80 1,4.列频率分布表362.51,362.70),26,5.,频率分布直方图如下,:,频率,组距,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,零件尺寸,362.51,364.41,5.频率分布直方图如下:频率0.10.20.30.40.50,27,频率分布直方图如下,:,月均用水量,/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,连接频率分布直方图中各小长方形上端的中点,得到,频率分布折线图,频率分布直方图如下:月均用水量/t频率0.100.200.3,28,利用样本频分布对总体分布进行相应估计,(,3,)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,总体密度曲线,。,(,2,)样本容量越大,这种估计越精确。,(,1,)上例的样本容量为,100,,如果增至,1000,,其频率分布直方图的情况会有什么变化?假如增至,10000,呢?,利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,29,2.2,总体分布的估计,频率,组距,月均用水量,(,mm,),a,b,当样本容量无限增大,分组的组距无限缩小,那么频率分,布直方图就会无限接近一条光滑曲线,总体密度曲线,总体在区间 内取值的概率,S,2.2 总体分布的估计频率月均用水量 ab,30,总体密度曲线,频率,组距,月均用水量,/t,a,b,(图中阴影部分的面积,表示总体在某个区间,(a,b),内取值的百分比)。,总体密度曲线频率月均用水量/tab (图中阴影部分,31,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,,频率分布直方图,就会无限接近,总体密度曲线,,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具,.,总体密度曲线,用样本分布直方图去估计相应的总体分布时,一般样,32,茎叶图,情境:,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,(1),甲运动员得分:,13,51,23,8,26,38,16,33,14,28,39,(2),乙运动员得分,:,49,24,12,31,50,31,44,36,15,37,25,36,39,问题:,如何有条理地列出这些数据,分析该运动员的整体水平及发挥的稳定程度?,茎叶图情境:某赛季甲、乙两名篮球运动员每场比赛得分的原始记录,33,甲,乙,8 0,4 6 3 1 2 5,3 6 8 2 5 4,3 8 9 3 1 6 1 6 7 9,4 4 9,1 5 0,注:,中间,的数字表示得分的,十,位数字。,旁边,的数字分别表示两个人得分的,个位,数。,茎叶图,甲,34,茎叶图的特征:,(,),用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示;,()茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰;,()茎叶图对重,复出现的数据要重复记录,,不能遗漏,茎叶图的特征:()用茎叶图表示数据有两个优点:一是从统计,35,练习,1,:,某中学高一(,2,)班甲,乙两名同学自高中以来每场数学考试成绩情况如下:,甲的得分:,95,,,81,,,75,,,91,,,86,,,89,,,71,,,65,,,76,,,88,,,94,乙的得分:,83,,,86,,,93,,,99,,,88,,,96,,,98,,,98,,,79