单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,项目三 统计整理,统计数列,11/16/2024,1,分配数列,分配数列是进行统计分组的必然产物,是统计整理结果的一种重要表现形式,也是统计描述和统计分析的重要内容。,它可以表明总体的分布特征和内部结构,并为研究总体中某种标志的平均水平及其变动规律提供依据。,11/16/2024,2,分配数列,分配数列就是按照一定的标志进行分组,用来说明总体单位在各组中分配情况的一系列数字。,是统计分组后获得的反映总体中所有单位在各组间的分布状态和分布特征的数列。,11/16/2024,3,分配数列,各组名称为组别,分配在各组中的总单位数成为次数或频数,各组单位数与总体单位数之比成为比率或频率,P45,表,3-5,分配数列有,品质数列,和,变量数列,两种。,11/16/2024,4,实例,下表是某企业二百名职工按文化程度不同分组形成的分配数列。,11/16/2024,5,品质数列,品质数列又称属性分配数列、品质分配数列,就是按照,品质标志,进行分组所形成的分配数列。,主要用于反映社会经济总体现象属性特征的结构、比率等分布规律。,实例一:,P45,11/16/2024,6,实例二,上表中的分配数列,是按照性别这个品质标志来进行分组的,所以把它叫做品质数列。,11/16/2024,7,课堂思考,下表是什么数列?按照什么标志进行分组?,11/16/2024,8,变量数列,变量数列全称为“变量分配数列”,变量数列就是按照,数量标志,进行分组所形成的分配数列。,主要用于反映社会经济总体现象数量特征的分布规律。,根据分组变量值表现形式不同,可分为,单项数列,和,组距数列,。,11/16/2024,9,实例一,表中的分配数列,是按照年龄这个数量标志来进行分组的,所以把它叫做变量数列。,变量数列也是由两部分所组成,即:,一部分是由变量值所形成的各个组,另一部分是由总体单位在各组中分配的次数所组成。,而各组职工人数所占的比重,就是频率。,11/16/2024,10,实例二,某厂工人按生产某种产品的日产量为分组标志所编制的变量数列,见下表:,11/16/2024,11,单项数列,单项变量数列,是指在变量数列中的每一个组,只用一个变量值来表示所形成的数列。,即以每个变量值为一组并按照一定顺序排列所编制的变量数列,。,一般而言,,当数量标志值变动幅度较小,变量值个数较少,且为离散变量(取值只能取整数的变量)时,,适宜编制单项数列。,实例一:,P45,11/16/2024,12,实例二,11/16/2024,13,组距数列,单项变量数列的应用,受到一定的限制,一般仅适用于数列变异幅度不太大的情况。,如果数列的变异范围很大,就要采用组距数列。,组距数列,是指在变量数列中的每一个组,并不是由一个变量值来表示,而是由表明一定变动范围或表示一定距离的两个变量值所形成的数列。,11/16/2024,14,组距数列,一般而言,当整个数列中数量标志值的变动幅度较大,变量个数较多,且为连续型变量(可以在一定区间内任意取值的变量)时,,宜把整个数列按照变量值顺序划分为几个区间,一个区间内所有变量值归为一组,形成组距数列。,以便于描述被研究总体单位的规律性。,实例一:,P46,11/16/2024,15,组距数列的相关概念,上限和下限,组距,组中值,开口组和闭口组,等距数列和异距数列,P46,11/16/2024,16,实例二 等距数列,11/16/2024,17,组距数列,上表中的变量数列,是一个组距数列。,我们把各组的最大值称为上限,最小值称为下限。,而把上限与下限之差称为组距,在这个数列中,每一个组的组距是,10,,所以又把它叫做等距数列。,组距数列,可以是等距的,也可以是不等距的。我们把不等距的数列,叫做异距数列。,11/16/2024,18,异距数列,下表中的组距数列,各个组的组距都不相等,是一个比较特殊的异距数列,它是根据各个不同年龄组的特点来编制的。,11/16/2024,19,统计数列的编制方法,将原始资料按数值大小依次排列,确定组数(,k,)和组距(,h,),确定组距。,P46-47,11/16/2024,20,各种变量数量的编制,对于品质数列来讲,如果分组标志选择得好,分组标准定得恰当,则事物性质的差异表现得就比较明确,总体中各组也容易划分。,在编制品质数列时,只要按规定的分组标准将总体单位按组归类整理即可。,品质数列一般来说比较稳定,通常能准确反映总体的分布特征。,11/16/2024,21,单项式数列的编制,在编制单项式数列时,一般首先将调查所得资料按照数值由小到大顺序排列;,然后确定各组的变量值和组数,一般有多少个变量值就有多少组;,最后汇总出各变量值出现的次数,编制单项式数列。,由于单项式数列每组只有一个变量值,各组之间界限划分也非常明确,因此编制出的数列也很稳定。,11/16/2024,22,组距式数列的编制,与品质数列和单项式数列相比,组距式数列编制方法的难度稍大一些。,编制过程中,一般首先把变量值按由小到大的顺序排列,并确定全距;,其次,确定组数和组距;在此基础上确定组限;,最后,汇总出各组的次数及比重,编制组距式数列。,由以上编制方法可知,组距式数列编制重点是要解决,组数、组距、组限及组中值,的几个要素的确定问题。,11/16/2024,23,组数与组距,正确确定组数和组距是组距式数列编制过程中的一个关键问题。,在组距数列中我们用变量值变动的一定范围代表一个组,每个组的最大值为组的上限,最小值为组的下限,每个组上限和下限之间的距离称为组距。,对一个总体来讲,分组的组数和组距必须恰当,不能太多也不能太少,不能太小也不能太大。,组数太多,组距太小,分配数列显得很繁琐,不能反映总体分布特征;组数太少,组距太大,分配数列显得过于笼统,同样很难反映总体分布特征。,组距(组中值),=,(下限,+,上限),/2,11/16/2024,24,案例思考,对某县城居民家庭人均月消费性支出情况进行抽样调查,得到,40,户家庭人均月消费性支出(单位:元)资料如下:,这里共有()个变量值,最小值是()元,最大值是()元,标志变动的范围为(),()元,全距为()元。,如果将其分为两个组距相等的组,则各组组距为(),实际取组距为,150,元,尝试编制出组距式变量数列。,11/16/2024,25,答案要点,这里共有,40,个变量值,最小值是,304,元,最大值是,593,元,标志变动的范围为,304593,元,全距为,289,元,如果将其分为两个组距相等的组,则各组组距为,144.5,,实际取组距为,150,元,则可以编制出下表的组距式变量数列。,11/16/2024,26,答案要点,如果将其分成,15,个相等的组,则组距为(),实际取组距为,20,元,尝试编制组距式变量数列。,11/16/2024,27,答案要点,如果将其分成,15,个相等的组,则组距为,19.27,,实际取组距为,20,元,则可以编制出表中的组距式变量数列。,将其分成,6,个组距相等的组,则组距为(),实际取组距为,50,元,尝试编制出表组距式分配数列。,11/16/2024,28,答案要点,将其分成,6,个组距相等的组,则组距为,48.2,,实际取组距为,50,元,则可以编制出下表的分配数列。,11/16/2024,29,知识拓展,以上我们对同一种资料进行了三种不同分组,第一个组距太大,分组过粗,第二个则分组过细,组距太小,都不利于显示总体内部各组的分布特征,而第三个能较好地反映某县城居民家庭人均月消费性支出的分布状态。,由此可见,编制组距式数列时,不仅要考虑各组的划分是否能区分总体内各组成部分的性质差异,还要适当地确定组距和组数,才能准确而清晰地反映总体的分布特征。,11/16/2024,30,知识拓展,实际工作中确定组数时,可以根据对事物的定性分析加以确定。,这种方法需要对研究总体进行认真的分析,才能做出准确地判断。,例如,根据某个班级学生学习成绩的数据资料编制组距数列,在编制数列前,首先确定不及格、及格、中等、良好、优秀五个不同性质的组,然后把组距数列分为,60,以下、,60,70,、,70,80,、,80,90,、,90,100,五个组。,11/16/2024,31,