单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,1.,频数:,将样本按照一定的方法分成若干组,,每组内含有这个样本的个体的数目。,2.,频率:,样本中某个组的频数和样本容量的比。,简单随机抽样、系统抽样、分层抽样,2.通过抽样方法收集数据的目的是什么?,从数据中寻找所包含的信息,用样本去估计总体,1.随机抽样的三种常用方法:,复习旧知,温故知新,1.频数:将样本按照一定的方法分成若干组,简单随机抽样、系,1,思考:生活中,我们在哪里可以看到大量的,数据,?,思考:生活中,我们在哪里可以看到大量的数据?,2,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水,定额管理,即确定一个居民月用水量标准a,用水量不超过a的,部分按平价收费,超出a的部分按议价收费。,如果希望大部分居民的日常生活不受影响,那么标准,a定为多少比较合理呢?,采用抽样调查的方式,获得样本数据,分析样本数据来估计,全市居民用水量的分布情况,2000年全国主要城市中,缺水情况排在前10位的城市,问题1:,为了较合理地确定这个,标准,你认为需要做哪些工作?,探索新知,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政,3,初中我们曾经学过,频数分布图,和,频数分布表,,这使我们能够清楚地知道数据分布在各个小组的个数,.,下面将要学习,的,频率分布表,和,频率分布图,,则是从各个小组,数据在样本容量中所占比例大小的角度,来表示数据分布的规律,.,它可以使我们看到整个样本数据的,频率分布,情况,.,用,图,将它们画出来,或者用紧凑的,表格,改变数据的排列方式,.,分析数据的一种基本方法是,作图,可以达到两个目的,:,(1),从数据中提取信息(2)利用图形传递信息。,表格,通过改变数据的构成形式,为我们提供解释数据的新方式。,初中我们曾经学过频数分布图和频数分布表,这使我们能够清,4,3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2,讨论:如何分析数据?根据这些数据你能得出用水量其他信息吗?,通过抽样,获得了,100位居民月平均用水量(单位:t),如下表:,我们要对这些数据进行,整理与分析,收集数据,3.1 2.5 2.0 2.0 1.5 1.0,5,第一步,:,求,极差,(一组数据中的最大值与最小值的差),思考1:,上述100个数据中的,最小,值和最大值分别是什么,?样本数据的变化范围是什么?,0.2 4.3,思考2:,分成多少组合适呢?,第二步,:,决定,组距,与,组数,组距,:指每组两个端点的距离。,组数,:,k=极差组距,,(4.30.2)0.58.2,组数=8.2+1=9,于是组距为0.5,组数为9,如果将上述100个数据取组距,为0.5进行分组,那么这些数据,共分为多少组?,4.3-0.2=4.1,整理数据,若,k为整数,则组数=k,,若k不为整数,则组数=k+1。,当样本容量不超过,100时,,按数据多少,常分成5-12组。,第一步:求极差思考1:上述100个数据中的0.2 4.3,6,第四步:列,频率分布表,第三步:将数据,分组,以组距为,0.5将数据分组时,,可以分成以下9组:,0,0.5),0.5,1),4,4.5.,知识探究(一):频率分布表,思考3:,各组数据的取值范围,可以如何设定?,各组均为,左闭右开区间,,,最后一组是,闭区间,思考4:,如何统计样本,数据在各组中的,频数,?,如何计算样本数据在各组中的,频率,?,你能将这些数据用表格反映出来吗,?,第四步:列频率分布表第三步:将数据分组以组距为0.5将数据分,7,分组,频数累计,频数,频率,0,0.5),0.5,1),1,1.5),1.5,2),2,2.5),2.5,3),3,3.5),3.5,4),4,4.5,合计,4,8,15,22,25,14,6,4,2,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,100,1.00,0.02,频率,/组距,0.08,0.16,0.30,0.44,0.50,0.28,0.12,0.08,0.04,频率分布表,1.分组,2.频数累计(可省),3.频数,4.频率,最后一行是合计,知识探究(一):频率分布表,频数的合计为,样本容量,频率合计为,1,100位居民月平均用水量的频率分布表,5.频率,/组距,分组频数累计频数频率0,0.5)0.5,1)1,1.5,8,小矩形的面积,组距,频率,组距,频率,=,=,分组,频数,频率,频率/组距,0,0.5),4,0.04,0.08,0.5,1),8,0.08,0.16,1,1.5),15,0.15,0.30,1.5,2),22,0.22,0.44,2,2.5),25,0.25,0.50,2.5,3),14,0.14,0.28,3,3.5),6,0.06,0.12,3.5,4),4,0.04,0.08,4,4.5,2,0.02,0.04,合计,100,用水量/t,0.10,0.20,0.30,0.40,0.50,O,频率/组距,0.5,1,1.5,2.5,3.5,4.5,2,3,4,请计算每个小矩形的面积,它代表什么?为什么?,所有小矩形的面积的和是多少?,1,注意,纵坐标是,频率/组距,为了直观反映样本数据在各组中的分布情况,将频率分布表中的信息用图形表示:,知识探究(二):频率分布直方图,小矩形的面积组距频率组距频率=分组频数频率频率/组距0,9,用水量/t,0.10,0.20,0.30,0.40,0.50,O,频率/组距,0.5,1,1.5,2.5,3.5,4.5,2,3,4,1.频率分布直方图,显示了样本数据落在各个小组的比例的大小,图中最高的小矩形说明了什么?,2.大部分居民的月均用水量都集中在什么之间?,月均用水量在2,2.5)内的居民最多.,1,3)之间,.,根据频率分布直方图,居民月均用水量有什么特点?,分析数据,(,1)居民月均用水量的分布是,“,山峰,”,状的,而且是,“,单峰,”,的;,(,2)大部分居民的月均用水量集中在一个中间值附近,,只有少数居民的月均用水量很多或很少;,(,3)居民月均用水量的分布有一定的对称性等.,用水量/t0.100.200.300.400.50O频率/组,10,如果当地政府希望85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量提出建议吗?,分组,频数,频率,频率/组距,0,0.5),4,0.04,0.08,0.5,1),8,0.08,0.16,1,1.5),15,0.15,0.30,1.5,2),22,0.22,0.44,2,2.5),25,0.25,0.50,2.5,3),14,0.14,0.28,3,3.5),6,0.06,0.12,3.5,4),4,0.04,0.08,4,4.5,2,0.02,0.04,合计,100,1,用水量/t,0.10,0.20,0.30,0.40,0.50,O,频率/组距,0.5,1,1.5,2.5,3.5,4.5,2,3,4,若将标准a定为2.5,则,74,%的居民在2.5t以下,若将标准a定为3,则,88%的居民在3t以下,标准可定为3t.,如果当地政府希望85%以上的居民每月的用水量不超出标准,根据,11,同样一组数据,如果,组距不同,横轴、纵轴的单位不同,,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,下面给出以0.1和1为组距重新作出的频率分布直方图。,同样一组数据,如果组距不同,横轴、纵轴的单位不同,得,12,优点:,很容易表示大量数据,非常直观的表明分布形状,,使我们能够看到在分布表中看不清楚的一些数据模式。,缺点:,虽然可以大致估计出总体的分布情况,但是不能保留原来的数据信息,在精确度要求较高的情况下不适用,。,问题:,你认为频率分布直方图的优缺点是什么?,优点:很容易表示大量数据,非常直观的表明分布形状,问题:,13,0,0.1,0.2,0.3,0.4,0.5,0.6,0.5 1 1.5 2 2.5 3 3.5 4 4.5,画出频率分布折线图,频率,/组距,月均用水量,/t,(取组距中点,并连线),连接频率分布直方图中各小长方形上端的中点,得到,频率分布折线图,.,00.10.20.30.40.50.6 0.5 1 1.,14,利用样本频率分布对总体分布进行相应估计,:,(1)上例的样本容量为,100,如果增至1 000,其频率分布直方图的情况会有什么变化?假如增至10 000呢?,(2),样本容量越大,这种估计越精确,.,(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线总体密度曲线,.,利用样本频率分布对总体分布进行相应估计:,15,在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为,总体密度曲线,.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,.,总体密度曲线,:,月均用水量,/t,频率,组距,0,a,b,在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,16,1.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来?,思考,实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。,1.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲,17,2.图中阴影部分的面积表示什么?总体密度曲线与横轴围成的面积是多少?,月均用水量,/t,频率,组距,0,a,b,总体在区间(,a,b,)内取值的百分比,2.图中阴影部分的面积表示什么?总体密度曲线与横轴围成的面积,18,四种图表的区别和联系,名称,区别,频率分布表,从数量上比较准确地反映样本的频率分布规律,频率分布直方图,直观的反映样本的频率分布情况,频率分布折线图,反映了数据的变化趋势,总体密度曲线,虽然客观存在,但是要准确画出难度较大,只能用样本频率分布估计,样本容量越大,估计越准确,小结:,四种图表的区别和联系名称区别频率分布表从数量上比较准确地反映,19,