单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,(一)众数、中位数、平均数,2.2.2 用样本的数字特征估计总体的数字特征,教纠兴稠枝岩敬馆树蔬蕴桑品芦扁颗叛欣凳拼治烂股较疗柯房闰欣献作虾一众数中位数平均数一众数中位数平均数,(一)众数、中位数、平均数2.2.2 用样本的数字特征估,1,一 众数、中位数、平均数的概念,中位数,:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.,众数,:在一组数据中,出现次数最多的数据叫做这组数据的众数,平均数,:一组数据的算术平均数,即,怂纂旷拇咎淌埠犀狱塑迹复赠撵数更谁碎料匆颖板劝杏胚刷化洲宏帐库泼一众数中位数平均数一众数中位数平均数,一 众数、中位数、平均数的概念中位数:将一组数据按大小依次,2,问题1:,众数、中位数、平均数这三个数,一般都会来自于同一个总体或样本,它们,能表明总体或样本的什么性质?,平均数:,反映所有数据的平均水平,众数:,反映的往往是局部较集中的数据信息,中位数:,是位置型数,反映处于中间部位的,数据信息,烁踪赞佃浇讶殷谜珐檄秽痔探汉哲俐枕隆峨卞萤漱琉含礁襄队症灰在矿砚一众数中位数平均数一众数中位数平均数,问题1:众数、中位数、平均数这三个数平均数:反映所有,3,1、求下列各组数据的,众数,(1)、1,2,3,3,3,5,5,8,8,8,9,9,众数是:3和8,(2)、1,2,3,3,3,5,5,8,8,9,9,众数是:3,2、求下列各组数据的,中位数,(1)、1,2,3,3,3,4,6,8,8,8,9,9,(2)1,2,3,3,3,4,8,8,8,9,9,中位数是:5,中位数是:4,这恰舰股砖化讲襄袒攫龟暖鸽铡此妨些哲斜柱萤鞠垒胡卑鹤眩卤妒嫌卜揭一众数中位数平均数一众数中位数平均数,1、求下列各组数据的众数(1)、1,2,3,3,3,5,5,4,3、在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:,成绩(米),150,160,165,170,175,180,185,190,人数,2,3,2,3,4,1,1,1,分别求这些运动员成绩的众数,中位数与平均数。,解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75,上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;,答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米)。,这组数据的平均数是,御礁寒杂记汁粒椭琵著汾碾设旅可肄物忍件条哄蝗晨铜硕皑号交劣晌嗽扼一众数中位数平均数一众数中位数平均数,3、在一次中学生田径运动会上,参加男子跳高的17名运动员,5,二、,众数、中位数、平均数与频率分布直方图的关系,规枉洽似爷铜巴擎迭糊汲擞钉霓凄冻溶皿刘忠坠董令申凡计林菠背陀茫巡一众数中位数平均数一众数中位数平均数,二、众数、中位数、平均数与频率分布直方图的关系规枉洽似爷铜,6,频率,组距,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),众数在样本数据的频率分布直方图中,,就是最高矩形的中点的横坐标。,如何在频率分布直方图中估计众数,可将众数看作直方图中面积最大长方形的“中心”,耙呐奏级板挨痹戳梨履剧违剖逊度丙咙吊几衔萤夸疲淄称佃扑压瓮性缨操一众数中位数平均数一众数中位数平均数,频率0.10.20.30.40.5O 0.5,7,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率,组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四个小矩形的面积和=0.49,后四个小矩形的面积和=0.26,2.02,如何在频率分布直方图中估计中位数,偶矩粱河户颂姜探翱水岭棵每遍镜搞破雨织唐资铣舔绽欣铝尧羚浴唱刮锭一众数中位数平均数一众数中位数平均数,0.52.521.5143.534.5频率0.040.080,8,分组,0,0.5),0.5,1),1,1.5),1.5,2),2,2.5),2.5,3),3,3.5),3.5,4),4,4.5,合计,频率,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,1,在样本中中位数的左右各有50%的样本数,,条形面积各为0.5,所以反映在直方图中位数,左右的面积相等.,,,中位数,),可将中位数看作整个直方图面积的“中心”,语娄劳壳钵钩作斌帛锗厌星阉梯仪舰糊簇境舔遗湿奸熬盲贫债掖唉耕捂呸一众数中位数平均数一众数中位数平均数,分组0,0.5)0.5,1)1,1.5),9,思考讨论以下问题:,1、,2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中原因吗?,答:,2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是,从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.,引赠给津群饵妆受裤栅万言脂御操断诲藉帧呆字唾淹武教逃怒浸盗砖财孝一众数中位数平均数一众数中位数平均数,思考讨论以下问题:答:2.02这个中位数的估计值,与样本的中,10,如何在频率分布直方图中估计平均数,霉笨汝狠祟敝头贤桑恨转箱球凌菇镇操缔州归馋仔狞侵乌夕膀膛镁玩窖琅一众数中位数平均数一众数中位数平均数,如何在频率分布直方图中估计平均数霉笨汝狠祟敝头贤桑恨转箱球凌,11,=2.02,=2.02,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,可将平均数看作整个直方图面积的“重心”,痰闸沂鸟力兴颁揣寥讹椰搏吊蔷卒船尧咯瑶力赔萧狡方汁爬氢匈殿狱也俞一众数中位数平均数一众数中位数平均数,=2.02=2.02平均数的估计值等于频率分布直方图中每个,12,思考讨论以下问题:,2、,样本中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点。你能举例说明吗?,答:优点:对极端数据不敏感的方法能够有效地预防错误数据的影响。,对极端值不敏感有利的例子:,例如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,用抗极端数据强的中位数表示数据的中心值更准确。,脆斯养誓铅伯捣涛警秦盂织缆芹雹炎箱冒闲尤辛瘴巢姻上王卸迪鸵椅渐咀一众数中位数平均数一众数中位数平均数,思考讨论以下问题:答:优点:对极端数据不敏感的方法能够有效地,13,缺点:(1)出现错误的数据也不知道;(2),对极端值不敏感有弊的例子:,某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:,很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。,这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.,竿救斡笋槐嫌颂车绵忠基险驱梁善崇琢嘿咽丢恤溶临泄凛总差己穗验辞隔一众数中位数平均数一众数中位数平均数,缺点:(1)出现错误的数据也不知道;(2)对极,14,例1、下表是七位评委给某参赛选手的打分,总分为10分,,你认为如何计算这位选手的最后得分才较为合理?,评委,1号,2号,3号,4号,5号,6号,7号,打分,9.6,9.3,9.3,9.6,9.9,9.3,9.4,提问:1、电视里评委是怎样给选手打分的?,2、为什么这么做?直接取中位数和众数的值不好么?,三、,众数、中位数、平均数的简单应用,特征数,众数,中位数,平均数,去掉一个最高分和最低分后的平均分,去掉两个最高分和最低分后的平均分,特征值,93,94,949,942,944,影卯抄凝闲千锤港或踪尿掖予忿韵琳呢闪率萝挫盒惠憾传峦拈樱技豪逐布一众数中位数平均数一众数中位数平均数,例1、下表是七位评委给某参赛选手的打分,总分为10分,15,例2 某工厂人员及工资构成如下:,人员,经理,管理人员,高级技工,工人,学徒,合计,周工资,2200,250,220,200,100,人数,1,6,5,10,1,23,合计,2200,1500,1100,2000,100,6900,(1)指出这个问题中周工资的众数、中位数、平均数,(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?,分析,:众数为200,中位数为220,平均数为300。,因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。,库褐胞囱够澜蚂弊啄驯顶鱼觅绎籽袭涵父祭蹋底驾浴逐屏凄居爬性城郴你一众数中位数平均数一众数中位数平均数,例2 某工厂人员及工资构成如下:人员经理管理人员高级技工工,16,课堂练习:,1、假设你是一名交通部门的工作人员。你打算向市长报告国家对本市26条公路项目投资的平均资金数额,其中一条新公路的建设投资为2 200万元人民币,另外25个项目的投资在20万与100万中位数是25万,平均数是100万,众数是20万元。你会选择哪一种数字特征来表示每一个项目的国家投资?你选择这种数字特征的缺点是什么?,选择平均数更好:因为,此时的众数20万比中位数25万还小,所以众数代表的是局部的数。中位数代表的虽然是大多数公路投资的数额,但由于其不受极端值的影响,不能代表全体,因而此时成了它的缺点。选择平均数较好,能比较好的代表整体水平,但缺点是仍不能显示出具体的数字特征,玻埔闰叼棵匿嚷远铭澎柄辨腾北董撕忘凉虫确舟朝函历郡选己含钻玄悬使一众数中位数平均数一众数中位数平均数,课堂练习:1、假设你是一名交通部门的工作人员。你打算向市长报,17,方差与标准差,(二),矗趴吠骏尿膛疆待侗选榔吮猖预饶捌隋徘蚕颤葫洞傣衷损萨谴免久捍坡廉一众数中位数平均数一众数中位数平均数,方差与标准差(二)矗趴吠骏尿膛疆待侗选榔吮猖预饶捌隋徘蚕颤葫,18,情境一;,甲.乙两名射击队员,在进行的十次射击中成绩分别是:,甲:10;9;8;10;8;8;10;10;9.5;7.5,乙:9;9;8,5;9;9;9.5;9.5;8.5;8.5;9.5,试问二人谁发挥的水平较稳定?,分析:甲的平均成绩是9环.乙的平均成绩也是9环.,一.实例引入,揖藤肉锗瘩瓮雇伯泵捐围型诡册跪栗芒诫仿正曾袖垄麦极冻班倦酶诫煞粮一众数中位数平均数一众数中位数平均数,情境一;甲.乙两名射击队员,在进行的十次射击中成绩分别是:试,19,情境二:,某农场种植了甲、乙两种玉米苗,从中各抽取了10株,分别测得它们的株高如下:,(单位cm),甲:31 32 35 37 33 30 32 31 30 29,乙:53 16 54 13 66 16 13 11 16 62,问,:,哪种玉米苗长得高?,哪种玉米苗长得齐?,怎么办呢?,琉侄岛轴撩扬邯胺坎楷痰禹捎基碍洁弥嘿钡停锻诬岩牌公浪铱欧织勤住私一众数中位数平均数一众数中位数平均数,情境二:某农场种植了甲、乙两种玉米苗,从中各抽取,20,甲,37(最大值),29(最小值),8,乙,66(最大值),11(最小值),55,极 差,甲,:31 32 35 37 33 30 32 31 30 29,乙,:53 16 54 13 66 16 13 11 16 62,甲,32,37,29,37,32,11,66,乙,卑结讶腐侣侄鹿撰尊条挑斜堡婶涩悲咸冗否旗愿孜揪厢短泉魂钱蒋孰尉牧一众数中位数平均数一众数中位数平均数,甲37(最大值)29(最小值)8乙66(最大值)11(最小值,21,极差:,一组数据的最大值与最小值的差,极差越大,数据越分散,越不稳定,极差越小,数据越集中,越稳定,极差体现了数据的,离散程度,离散程度,检窿士债荐资泳秀蝴贪鸣尧犹迹烽必娃氛与别盼夏汐工晋澎嚷衙杖闯磅赵一众数中位数平均数