单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,用样本的频率分布 估计总体分布,复习旧知识,1,抛掷硬币的大量重复试验的频率分布表,:,0.501 1,0.498 9,样本容量为,72 088,什么叫频率分布,条形图?频数?频率?,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0,1,试验结果,频率,“正面向上”记为,0,“反面向上”记为,1,35 964,36 124,反面向上,正面向上,频率,频数,实验结果,注意点:,各直方长条的宽度要相同,宽窄与频率无关;,相邻长条之间的间隔要适当;,条形图的高度就是频率;,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0,1,试验结果,频率,练 习,1.,在,100,名学生中,每人参加一个运动队,其中参加田径,队的有,13,人,参加体操队的有,10,人,参加足球队的,有,24,人,参加篮球队的有,27,人,参加排球队的有,15,人,参加乒乓球队的有,11,人,.,(1),列出学生参加各运动队的频率分布表,;,(2),画出表示频率分布的条形图,.,试验结果,频 数,频率,参加田径队,(1),13,0.13,参加体操队,(2),10,0.10,参加足球队,(3),24,0.24,参加篮球队,(4),27,0.27,参加排球队,(5),15,0.15,参加乒乓球队,(6),11,0.11,解:频率分布表如下:,频率分布条形图如下,:,1,5,2,3,4,6,频率,结果,例 某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准,a,用水量不超过,a,的部分按平价收费,超过,a,的部分按议价收费。,如果希望大部分居民的日常生活不受影响,那 么标准,a,定为多少比较合理呢,?,为了较合理地确定这个标准,你认为需要做,哪些工作?,思考,:由上表,大家可以得到什么信息?,通过抽样,我们获得了,100,位居民某年的月平均用水量,(,单位:,t),,,如下表:,上面这些数字能告诉我们什么呢?很容易,发现的是一个居民月均用水量的最小值是,0.2t,,最大值是,4.3t,,其他在,0.24.3t,之,间。除此以外,很难发现这,100,位居民的用,水量的其他信息。,1.,求极差(即一组数据中最大值与最小值的差),2.,决定组距与组数,组数,=,4.3,-,0.2=4.1,4.1,0.5,=8.2,组距,极差,=,3.,将数据分组,0,,,0.5,),,,0.5,,,1,),,,,,4,,,4.5,组数:将数据分组,当数据在,100,个以内时,,按数据多少常分,5-12,组。,组距:指每个小组的两个端点的距离,,这时可以将数据分为,9,组,这个组数是较合适,的,于是取组距为,0.5,,组数为,9,4.,列频率分布表,100,位居民月平均用水量的频率分布表,注意:这里出来了条形图中条形的宽度。频率不仅与条形的高度有关,而且与它的宽度有关。,为了使选择不同宽度的总体分布相同,我们用另一种图形表示,即直方图,用面积表示概率。,频率,/,组距,月平均用水量,/t,0.50,0.40,0.30,0.20,0.10,0,0.5 1 1.5 2 2.5 3 3.5 4 4.5,5.,画频率分布直方图,小长方形的面积,组距,频率,=,组距,频率,=,注意:,这里的纵坐标不是频率,而是频率,/,组距;,某个区间上的概率用这个区间的面积表示;,频率分布直方图,思考:所有小长方形的面积之和等于?,从中我们可以看到,月均用水量在区间,【2,2.5】,内的居民最多,在,【1.5,2,)内,的次之,大部分居民的月均用水量都在,【1,3),之间。,直方图能够看到在分布表中看不清楚的数,据模式。例如,从图中可以清楚的看到,,居民月均用水量的分布是“山峰”状的,而,且是的“单峰”的,另外还有一定的对称性。,但是,直方图也丢失了一些信息,例如,原,始数据不能再图中表示出来。,思考:如果当地政府希望使,85%,以上的居,民每月的用水量不超出标准,根据频率分,布表和频率分布直方图,你能对制定月用,水量标准提出建议吗?,想一想:,3t,这个标准一定能够保证,85%,以上的,居民用水不超标吗?如果不一定,那么哪些环,节可能导致结论的差别?,实际上,这个标准还可能出现偏差,.,所以,在实践中,对统计的结论是需要进行评价的,.,探究:,同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以,1,和,0.1,为组距重新作图,然后谈谈你对图的印象。,一,、,求,极差,,,即数据中最大值与最小值的差,二、决定,组距,与组数:组距,=,极差,/,组数,三、分组,通常对组内数值所在区间,,取,左闭右开,区间,最后一组取闭区间,四、登记,频数,计算,频率,列出,频率分布表,画一组数据的频率分布直方图,可以按以下的步骤进行,:,五、画出,频率分布直方图,(纵轴表示,频率组距,),频率,/,组距,月平均用水量,/t,0.50,0.40,0.30,0.20,0.10,0,0.5 1 1.5 2 2.5 3 3.5 4 4.5,频率分布折线图,连接频率直方图中各小长方形上端中点的折线,叫,频率分布折线图,一般的,当总体中的个体数较多时,,抽样时样本容量就不能太小。例如,,如果要抽样调查一个省乃至全国的,居民的月均用水量,那么样本容量,就应比调查一个城市的时候大。,频率,组距,产品,尺寸,(,mm,),当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线,总体在区间 内取值的概率,S,总体密度曲线,a b,说明,:在,(,a,b,),内的概率与在,a,b,)内的概率是一样的,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,,频率分布直方图,就会无限接近,总体密度曲线,,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值概率。,总体密度曲线反映了总体在各个范围内取值的概率,精确地反映了总体的分布规律。是研究总体分布的工具,.,总体密度曲线,(1),离散型,:,当总体中的个体所取的不同数值较少时,,其随机变量是离散型的,.,试验结果,频 数,频 率,频率,试验结果,0,1,条形图,小结:,(2),连续型,:,当总体中的个体所取的数值较多,甚至,无限时,其随机变量是连续型的,.,分 组,频 数,频 率,产品尺寸,25.295,25.355,频率分布直方图,累积频率,频率分布表,3,、频率分布条形图和频率分布直方图,两者是不同的概念,虽然它们的横坐标表示的内容是相同的,但是频率分布条形图的纵轴(矩形的高)表示频率;,频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的面积。,例题,.,一个容量为,100,的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格,.,分组,频数,频率,频率累计,12,15),6,15,18),0.08,18,21),0.30,21,24),21,24,27),0.69,27,30),16,30,33),0.10,33,36,1.00,合计,100,1.00,例,1,、对某电子元件进行寿命追踪调查,情况如下:,寿命,个数,100200,200300,300400,400500,500600,20,30,80,40,30,(,1,)列出频率分布表;,(,2,)画出频率分布直方图;,(,3,)估计电子元件寿命在,100h400h,以内的概率;,(,4,)估计电子元件寿命在,400h,以上的概率;,应用举例:,(,1,)列出频率分布表;,100200,200300,300400,400500,500600,寿命,合计,频率,频数,累积频率,20,30,80,40,30,200,0.10,0.15,0.40,0.20,0.15,1,0.10,0.25,0.65,0.85,1,频率,/,组距,课堂小结,编制频率分布直方图的步骤,:,找最大值与最小值。,决定组距与组数,决定分点,登记频数,计算频率,列表,画直方图,说明,:,(1),确定分点时,使分点比数据多一位小数,并且把第,1,小组的起点稍微再小一点,.,茎叶图,情境:,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,(1),甲运动员得分:,13,51,23,8,26,38,16,33,14,28,39,(2),乙运动员得分,:,49,24,12,31,50,31,44,36,15,37,25,36,39,问题:,如何有条理地列出这些数据,分析该运动员的整体水平及发挥的稳定程度?,茎叶图,甲,乙,0,1,2,3,4,5,2 5,5 4,1 6 1 6 7 9,4 9,0,8,4 6 3,6 8,3 8 9,1,甲,乙,8 0,4 6 3 1 2 5,3 6 8 2 5 4,3 8 9 3 1 6 1 6 7 9,4 4 9,1 5 0,茎叶图不仅能够保留原始数据,而且能够展示数据的,分布情况,.,比如乙运动员的得分基本上是对称的,叶的,分布是,”,单峰,”,的,有,10/13,的叶集中在茎,2,3,4,上,中位,数是,36;,甲运动员的得分除一个特殊得分,(51,分,),外,也,大致对称,叶的分布也是,”,单峰,”,的,有,9/11,的叶主要集,中在茎,1,2,3,上,中位数是,26.,由此可以看出,乙运动员,的成绩更好,.,乙运动员的得分更集中于峰值附近,说明,乙运动员的发挥更稳定,.,一般地:当数据是一位和两位有效数字,时,用中间的数字表示十位数,即第一个有,效数字,两边的数字表示个位数,即第二个,有效数字,它的中间部分像植物的茎,两边,部分像植物茎上长出来的叶子,因此通常把,这样的图叫做茎叶图。茎按从小到大的顺序,从上向下列出,共茎的叶一般按从大到小,(或从小到大)的顺序同行列出。,1,茎叶图的概念:,2,茎叶图的特征:,)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示;()茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数据不太容易操作;而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰;()茎叶图对重复出现的数据要重复记录,不能遗漏,制作茎叶图的方法是,:将所有两位数的十位数字作为,“,茎,”,,个位数字作为,“,叶,”,,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出,.,茎叶图的制作方法,注意,:,在制作茎叶图时,,重复出现的数据要重复记录,不能遗漏,特别是,“,叶,”,部分;,同一数据出现几次,就要在图中体现几次,.,用,茎叶图表示数据有两个突出的优点:,一,.,是所有的信息都可以从这个茎叶图,上得到;,二,.,是茎叶图便于记录和表示,.,用茎叶图表示数据有一个突出的缺点:,茎叶图,的缺点,是其分析只是粗略的,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便,.,