单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,社会统计学,教材:中央广播电视大学出版社,陈卫,第三章 数据的组织与展示,学习目标:,1、了解数据的筛选与排序,掌握使用SPSS进行数据的筛选与排序2、了解常用统计图和统计表,明确不同统计图和统计表适用的数据类型。3、能使用SPSS绘制统计图表。,统计数据的整理:,是对统计数据的加工处理过程,以使统计数据系统化、条理化、符合统计分析的需要,它是收集数据与数据分析之间的必要环节。,收集数据,数据分析,数据整理,第一节 数据的整理,一、数据整理,数据整理是使用数据之前对数据进行必要的处理,包括数据的审核、筛选和排序等。这样可以保证数据的质量,并且选择符合研究要求的数据,为数据的使用与分析打下坚实的基础。,(一)数据审核,数据审核是指,从数据的完整性、准确性、适用性及时效性等方面对数据进行检查,保障数据质量,为之后进一步的分析打下基础。,数据审核,数据筛选,数据排序,1 2 3,数据审核:,完整、准确、适用、时效,完整性:数据是否完整、调查单位是否全面覆盖、调查项目问题是否全部回答。总体不漏人,个体不漏项,准确性:数据是否真实、准确,数据是否真实反映实际情况,数据是否有误,。,适用性:审核数据的来源、口径、背景等是否符合研究需要,若不符合研究需要则不应该生搬硬套,。,时效性:审核数据是否滞后、是否具有研究意义。,对于原始数据,只需要从完整性和准确性两方面进行审核。对于二手数据,不仅需要。还需要进行适用性和时效性审核。(二)数据筛选 数据筛选是指将不符合要求的数据或者有明显错误的数据剔除掉,或者将某些不符合研究需要的数据剔除掉,只留下符合需要的数据。数据经过筛选后使其结果符合研究需要,为以后研究打下良好基础。,(三)数据排序,数据排序是指按照一定顺序对数据进行排列,为数据分组、分析数据提供方便。不同数据的排序标准不同。对于分类数据,排序方式多种多样,可以按照字母顺序进行排序,如按姓氏首字母对姓名进行排序,也可以按照姓氏笔画进行排序;而对于数值型数据,则只有递增和递减两种排序方式,如按照收入从高到低对某类人进行排序,也可以从低到高排序。,二、数据分组,针对数值型数据 数据分组就是根据研究需要,按照某种标准将原始数据分为不同的组,分组后的数据叫做分组数据。包括单变量分组和组距分组,其中组距分组又包括等距分组和不等距分组两类。(一)单变量分组 在分组时将每一个变量作为一组。只适合离散变量。例如,将妇女生育数0,1,2,3,4,5,6,7,8.分别分组。,(二)组距分组(重点)组距分组是指将全部变量值按照次序划分为多个区间,每一区间里的值作为一组。组距分组适合连续变量且数据较多的情况。上限值:每一组最大的值下限值:每一组最小的值组距:上限值-下限值操作步骤:1、对数据进行排序 2、确定分组数。K=1+lgn/lg2,(其中n为数据总个数),3、确定组距。,组距=(最大值-最小值)/组数,(二,),)组,距,距分,组,组原,则,则,不重,不,不漏,:,:一,个,个数,据,据必,须,须属,于,于且,仅,仅属,于,于一,组,组,,不,不能,重,重复,出,出现,,,,也,不,不能,遗,遗漏,。,。,上,上,限,限值,不,不在,组,组内,:,:当,相,相邻,两,两组,的,的上,限,限值,与,与下,限,限值,重,重叠,时,时,,恰,恰好,等,等于,某,某一,组,组上,限,限值,的,的变,量,量值,不,不放,在,在该,组,组内,,,,而,放,放在,下,下一,组,组。,当,当存,在,在极,端,端值,,,,使,得,得最,大,大值,和,和最,小,小值,相,相差,悬,悬殊,时,时,,我,我们,可,可以,将,将第,一,一组,改,改为,“,“XX以,下,下”,,,,或,将,将最,后,后一,组,组改,为,为“XX,以,以上,”,”,,避,避免,遗,遗漏,。,。,(三,),)等,距,距分,组,组和,不,不等,距,距分,组,组,在分,组,组时,,,,如,果,果各,组,组组,距,距相,等,等,,则,则称,为,为等,距,距分,组,组;,如,如,果,果各,组,组组,距,距不,相,相等,,,,则,称,称为,不,不等,距,距分,组,组。,不,不等,距,距分,组,组eg:,婴,婴幼,儿,儿组,(,(06,岁,岁),少,少,年,年儿,童,童组,(,(717岁,),),中,中青,年,年组,(,(1859,岁,岁),老,老,年,年人,组,组(60,岁,岁及,以,以上,),),三、,应,应用SPSS,对,对数,据,据进,行,行整,理,理与,分,分组1、,排,排序,点,点击Date,SortCases,指,指,定,定需,要,要进,行,行排,序,序的,变,变量,到,到Sortby,框,框,中,中,,同,同时,在,在SortOrder中,选,选择,是,是升,序,序排,列,列还,是,是降,序,序排,列,列。升序,:,:Ascending,降,降序,:,:Descending,三、,应,应用SPSS,对,对数,据,据进,行,行整,理,理与,分,分组,2、,筛,筛选,点,点击Date,Select,Cases,然,然,后,后选,择,择何,种,种方,式,式筛,选,选个,案,案。,ifconditionissatisfied,是根,据,据某,特,特定,条,条件,选,选择,个,个案,randomsampleofcase,是随,机,机选,取,取个,案,案,然,然,后,后指,定,定未,选,选中,个,个案,的,的处,理,理方,式,式。,filteroutunselectedcases,表示,在,在那,些,些未,选,选中,的,的个,案,案号,码,码上,做,做一,个,个/,标,标记,;,;,deleteunselectedcases,表示,删,删除,未,未选,中,中的,个,个案,;,;,copyselectedtoanewdetaset,表示,将,将选,中,中的,个,个案,复,复制,为,为一,个,个新,文,文件,。,。,三、,应,应用SPSS,对,对数,据,据进,行,行整,理,理与,分,分组,3、,分,分组,相,相当,于,于变,量,量的,重,重新,编,编码,。,。,首先,选,选中,要,要赋,值,值的,变,变量,,,,点,击,击箭,头,头进,入,入它,右,右边,的,的空,白,白框,中,中。,在OutputVariable,下,下,面,面的NameandLabel,框,框中,填,填写,要,要新,生,生成,的,的变,量,量的,名,名称,和,和标,签,签,,点,点击change,按,按,钮,钮,,则,则对,中,中间,的,的新,旧,旧变,量,量名,配,配对,,,,然,后,后点,击,击OldandNewValue,进,进行,变,变量,的,的重,新,新赋,值,值,,赋,赋值,完,完毕,之,之后,点,点击OK,即,即可,。,。,操作,示,示范,第二,节,节,频,频数,分,分布,表,表,(,一),相,相关,概,概念,1、,频,频数,频数,就,就是,某,某个,类,类别,或,或某,个,个小,组,组中,的,的数,据,据个,数,数,,也,也称,次,次数,。,。例,如,如根,据,据测,试,试成,绩,绩,,将,将学,生,生分,为,为优,、,、良,、,、及,格,格、,不,不及,格,格四,个,个组,,,,如,果,果18个,同,同学,为,为优,,,,那,么,么这,组,组的,频,频数,就,就是18,。,。,2、,频,频率,或,或比,例,例,频率,就,就是,一,一个,总,总体,(,(或,者,者样,本,本中,),),,某,某一,类,类别,或,或某,一,一小,组,组中,数,数据,个,个数,(,(即,频,频数,),)占,总,总数,据,据个,数,数的,比,比重,,,,也,称,称为,比,比例,。,。例,如,如根,据,据测,试,试成,绩,绩,,将,将100,个,个学,生,生分,为,为优,、,、良,、,、及,格,格、,不,不及,格,格四,个,个组,,,,如,果,果四,个,个组,人,人数,分,分别,为,为18、52,、,、21、9,,那,那么,四,四个,组,组的,频,频率,分,分别,为,为0.18、0.52,、,、0.21、0.09,。,。比,例,例通,常,常用,于,于反,应,应总,体,体的,构,构成,情,情况,,,,一,个,个数,据,据中,各,各部,分,分比,例,例之,和,和为1。,第二,节,节,频,频数,分,分布,表,表,(,一),相,相关,概,概念,3、,百,百分,比,比,百分,比,比就,是,是一,个,个总,体,体中,某,某一,类,类别,或,或某,一,一小,组,组中,数,数据,个,个数,(,(频,数,数),占,占总,体,体数,据,据的,比,比重,乘,乘以100,,各,各个,小,小组,百,百分,比,比之,和,和为100,,即,即频,率,率乘,以,以100,。,。它,是,是将,对,对比,的,的基,数,数抽,象,象为100而,计,计算,出,出来,的,的,,用,用%,号,号表,示,示,,数,数值,表,表示,每,每100,个,个分,母,母中,包,包含,多,多少,个,个分,子,子。,上,上面,例,例子,中,中,,优,优、,良,良、,及,及格,、,、不,及,及格,四,四个,组,组的,百,百分,比,比分,别,别为18%、52%、21%、9%,。,。,4、,比,比率,比率,就,就是,各,各个,不,不同,类,类别,或,或小,组,组的,数,数值,之,之间,的,的比,值,值。,例,例如,,,,上,面,面例,子,子中,,,,优,与,与良,的,的比,率,率为18/520.35,。,。,频数,分,分布,表,表,频数,分,分布,表,表是,各,各类,别,别及,其,其对,应,应的,频,频数,形,形成,的,的分,布,布。,表,某,某专,业,业一,年,年级,学,学生,平,平均,上,上网,时,时间,的,的频,数,数分,布,布,二、,累,累积,频,频数,和,和累,积,积频,率,率,(,一),相,相关,概,概念,1、,累,累积,频,频数,累积,频,频数,就,就是,将,将各,类,类别,或,或组,的,的频,数,数逐,级,级累,加,加起,来,来,,这,这样,可,可以,很,很清,楚,楚的,看,看出,某,某一,类,类别,或,或组,以,以上,或,或以,下,下的,频,频数,之,之和,。,。,2、,累,累积,频,频率,或,或累,积,积百,分,分比,累积,频,频率,就,就是,将,将各,类,类别,或,或组,的,的频,率,率逐,级,级累,加,加起,来,来,,这,这样,可,可以,很,很清,楚,楚的,看,看出,某,某一,类,类别,或,或组,以,以上,或,或以,下,下的,频,频率,之,之和,。,。,二、累积,频,频数和累,积,积频率,(二,)累积方,法,法,1、向上,累,累积,从开始一,方,方向最后,一,一方逐级,累,累加,从,最,最小值开,始,始向最大,值,值方向逐,级,级累加,2、累积,频,频率或累,积,积百分比,从最后一,方,方向开始,一,一方逐级,累,累加,从,最,最大值开,始,始向最小,值,值方向逐,级,级累加,小,大,举例说明,三、利用SPSS,制,制作频数,分,分布表,具体步骤,:,:Analyze,DescriptiveStatisticsFrequencies,Frequency tables,就,就可输出,频,频数分布,表,表。,第三节,统,统计图,一、条形,图,图(bar chart),用宽度相,同,同的条形,的,的高度或,者,者长度来,表,表示数据,多,多少的图,形,形。,适合定类,数,数据、定,序,序数据或,者,者数值型,数,数据ouke,第三节,统,统计图,二、饼图,(piechart),用圆形以,及,及圆内扇,形,形的角度,来,来表示数,值,值大小。,主要反映,总,总体的构,成,成问题,第三节,统,统计图,三、环形,图,图,(annualchart),空心圆,它,它用环上,的,的一段来,表,表示总体,或,或者样本,中,中的各部,分