单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,统计学第六章 变异指标,第一节,变异指标的基本理论,第二节 全距、分位差和平均差,第三节 标准差和标准差系数,【学习目标】通过本章的学习和习题演算,掌握变异指标的意义和作用;标准差和标准差系数的计算和应用。了解变异指标的分布特性;极差、平均差和四分位差的概念、计算公式和特点;分布的偏度与峰度。,第四节 偏度和峰度,第五节 变异指标的应用,第一节 变异指标的基本理论第二节 全距、分位差和平均差第,1,课程,学生,语文,数学,英语,总成绩,平均成绩,甲,乙,丙,60,65,55,65,65,65,70,65,75,195,195,195,65,65,65,单位:分,某班三名同学三门课程的成绩如下:,请比较三名同学学习成绩的差异。,课程语文数学英语总成绩平均成绩甲60657019565,2,指总体中各单位标志值背离分布中心的规模或程度,,用,标志变异指标,来反映。,离中趋势,反映统计数据差异程度的综合指标,也称为,标志变动度,变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大,第一节 变异指标的基本理论,一、,离中趋势的涵义,指总体中各单位标志值背离分布中心的规模或程度,用标志变异指标,3,测定离中趋势的意义,用来衡量和比较,平均数,代表性的大小;,用来反映社会经济活动过程的,均衡性,和节奏性;,用来衡量风险程度。,测定离中趋势的意义用来衡量和比较平均数代表性的大小;,4,例如:某车间有两个生产小组,各有7名工人,各人日产量如下:,甲组:20,40,60,70,80,100,120,乙组:67,68,69,70,71,72,73,例如:某车间有两个生产小组,各有7名工人,各人日产量如下:,5,供货计划完成百分比(%),季度总供货计划执行结果,1月,2月,3月,钢,厂,甲厂,100,32,34,34,乙厂,100,20,30,50,供货计划完成百分比(%)季度总供货计划执行结果1月2月3月甲,6,二、,变异指标的种类,以标志值之间相互比较说明变异情况,以平均数为比较标准来说明标志的变异情况,以正态分布为标准说明分配数列偏离情况的指标,平均差,标准差,平均差系数,标准差系数,方差,峰度,偏度,全距,分位差,二、变异指标的种类以标志值之间相互比较说明变异情况 以平均数,7,第二节 全距、分位差和平均差,指所研究的数据中,最大值与最小值之差,又称,极差,。,一、全距,最大变量值或最高组上限或开口组假定上限,最小变量值或最低组下限或开口组假定下限,第二节 全距、分位差和平均差 指所研究的数据中,最大值与最,8,【例A】,某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则,全距系数,【例A】某售货小组5人某天的销售额分别为440元、480元、,9,【例B】,某季度某工业公司18个工业企业产值计划完成情况如下:,计划完成程度,(),组中值,(),企业数,(个),计划产值,(万元),90以下,90100,100110,110以上,85,95,105,115,2,3,10,3,800,2500,17200,4400,合计,18,24900,计算该公司该季度计划完成程度的全距。,【例B】某季度某工业公司18个工业企业产值计划完成情况如下:,10,优点:,计算方法简单、易懂;,缺点:,易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差;,受个别极端值的影响过于显著,不符合稳健性和耐抗性的要求,往往应用于生产过程的质量控制中,全距的特点,优点:计算方法简单、易懂;往往应用于生产过程的质量控制中全距,11,二、分位差,从变量数列中,剔除了一部分极端值后计算的类似于极差的指标,。,四分位差,十六分位差,十分位差,八分位差,三十二分位差,百分位差,上四分位数,下四分位数,二、分位差从变量数列中,剔除了一部分极端值后计算的类似于极差,12,简单平均差,适用于未分组资料,是各个数据与其算术平均数的离差绝对值的算术平均数,用 表示,三、平均差,计算公式:,总体算术平均数,总体单位总数,第 个单位的变量值,简单平均差适用于未分组资料是各个数据与其算术平均数的,13,【例A】,某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。,解:,即该售货小组5个人销售额的平均差为93.6元。,【例A】某售货小组5个人,某天的销售额分别为440元、480,14,加权平均差,适用于分组资料,总体算术平均数,第 组变量值出现的次数,第 组的变量值或组中值,平均差系数,加权平均差适用于分组资料总体算术平均数第 组变,15,【例B】,计算下表中某公司职工月工资的平均差。,月工资(元),组中值(元),职工人数(人),300以下,300400,400500,500600,600700,700800,800900,900以上,250,350,450,550,650,750,850,950,208,314,382,456,305,237,78,20,合计,2000,【例B】计算下表中某公司职工月工资的平均差。月工资(元)组中,16,解:,即该公司职工月工资的平均差为138.95元。,解:即该公司职工月工资的平均差为138.95元。,17,优点:,不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;,缺点:,用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。,平均差的特点,一般情况下都是通过计算另一种标志,变异指标标准差,来反映总体内,部各单位标志值的差异状况,优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差,18,平均差系数,平均差系数,19,简单标准差,适用于未分组资料,是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用 来表示;标准差的平方又叫作方差,用 来表示。,计算公式:,总体单位总数,第 个单位的变量值,总体算术平均数,一、标准差,第三节 标准差和标准差系数,简单标准差适用于未分组资料是各个数据与其算术平均数的,20,【例A】,某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。,解:,(比较:其销售额的平均差为93.6元),即该售货小组销售额的标准差为109.62元。,【例A】某售货小组5个人,某天的销售额分别为440元、480,21,加权标准差,适用于分组资料,总体算术平均数,第 组变量值出现的次数,第 组的变量值或组中值,加权标准差适用于分组资料总体算术平均数第 组变,22,【例B】,计算下表中某公司职工月工资的标准差。,月工资(元),组中值(元),职工人数(人),300以下,300400,400500,500600,600700,700800,800900,900以上,250,350,450,550,650,750,850,950,208,314,382,456,305,237,78,20,合计,2000,【例B】计算下表中某公司职工月工资的标准差。月工资(元)组中,23,解:,(比较:其工资的平均差为138.95元),即该公司职工月工资的标准差为167.9元。,解:(比较:其工资的平均差为138.95元)即该公司职工月工,24,标准差的特点,不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;,用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.,由同一资料计算的标准差的结果一般要略大于平均差。,证明:当a,b,c0时,有,标准差的特点不易受极端数值的影响,能综合反映全部单位标志值的,25,简单标准差,加权标准差,标准差的简捷计算,避免离差平方和计算过程的出现,目的:,变量值平方的平均数,变量值平均数的平方,简单标准差加权标准差标准差的简捷计算避免离差平方和计算过程的,26,可比,变异系数指标,可比变异系数指标,27,身高的差异水平:cm,体重的差异水平:kg,用,变异系数,可以相互比较,可比,身高的差异水平:cm体重的差异水平:kg用变异系数可以相互比,28,二、标准差系数,用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小:,标准差系数小的总体,其平均数的代表性大;反之,亦然。,应用:,二、标准差系数用来对比不同水平的同类现象,特别是不同类现象总,29,【例】,某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。,解:,一班成绩的标准差系数为:,二班成绩的标准差系数为:,因为 ,所以一班平均成绩的代表性比二班大。,【例】某年级一、二两班某门课的平均成绩分别为82分和76分,,30,例:,已知甲乙两个班组工人日产资料如下,:,甲 班 乙 班,日产量 工人数 日产量 工人数,(件)(人)(件)(人),5 6 8 11,7 10 12 14,9 12 14 7,10 8 15 6,13 4 16 2,合计 40 合计 40,要求:比较一下哪个班组工人的平均日,产量的代表性高?,例:已知甲乙两个班组工人日产资料如下:甲,31,解题过程如下:,工人,数,日产,量,工人,数,日产,量,40,合 计,40,合 计,2,16,4,13,6,15,8,10,7,14,12,9,14,12,10,7,11,8,6,5,乙 班,甲 班,30,70,108,80,52,340,88,168,98,90,32,476,150,490,972,800,676,3088,704,2016,1372,1350,512,5954,解题过程如下:工人日产工人日产 40 合 计40合,32,甲班,:,=8.5(件),乙班:,=11.9(件),甲班:=2.22(件),乙班:=2.69(件),2、计算日产量的标准差,:,3、计算变异系数,:,甲班:,乙班:,乙班变异系数小于甲班,乙班工人的平均日产量代表性高。,第四章 综合指标,1、计算工人平均日产量,:,甲班:=8.5(件)乙班:=11.9(件)甲班:=,33,是非标志总体,分组,单位数,变量值,具有某一属性,不具有某一属性,1,0,合计,为研究是非标志总体的数量特征,令,指总体中全部单位只具有,“是”,或,“否”,、,“有”,或,“无”,两种表现形式的标志,又叫,交替标志,是非标志,是非标志总体分组单位数变量值具有某一属性1合计为研究是非标,34,具有某种标志表现的,单位数所占的成数,不具有某种标志表现,的单位数所占的成数,指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重,成数,具有某种标志表现的不具有某种标志表现指是非标志总体中具有某种,35,是非标志总体的指标,均,值,标,准,差,是非标志总体的指标均标,36,是非标志总体的指标,方差,标准差系数,是非标志总体的指标方差标准差系数,37,【例】,某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。,是非标志总体的指标,解:,【例】某厂某月份生产了400件产品,其中合格品380件,不合,38,常用的几种标志变异指标,概 念 计 算 特 点,数列中最大值,与最小值之差,1极差,(R),R=最大值-最小值,优点:容易理解,计算方便,缺点:不能反映全部数据分布状况,2平均差,(A.D),各标志值与,均值离差绝,对值的算术,平均,简单:,加权:,优点:反映全部数据分布状况,缺点:取绝对值,数字上 不尽合理,常用的几种标志变异指标概 念 计 算,39,概 念 计 算 特 点,各标志值与均值离差平方的平均。,方差的平方根(取正根),3方差(2)和,标准差(),优点:反映全部数据分布状况,数字上合理。,缺点:受计量单位和平均水平影响,不便于比较,4标准差系 数,(V),标准差与均值,之商,是无量,纲的系数,简单:,加权:,优点:适宜不同数据集的比