单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,第 九 章,资料的统计分析,(,一,),单变量分析,要点提示:,社会统计是现代社会调查方法的重要环节。均值、中位数和众数是常见的对集中趋势的度量,极差和四分位差、标准差、方差是常见的对离散趋势的度量。假设检验是根据已有的知识对总体的某一数量特征提出假设并用样本的实际数据进行相关检验的过程。,关键词:,社会统计 集中趋势 离散趋势 假设检验,社会调查方法(第三版),目录,社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,第一节 单变量描述统计,第二节 单变量推论统计,第三节,SPSS,基本应用,目录社会调查方法(第三版),01,社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,第一节 单变量描述统计,一、一个例子,二、,频数表和直方图,三、集中趋势的度量,四、离散趋势的度量,01社会调查方法(第三版),社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,二、社会调查的作用,从总体而言,社会调查的目的有三个方面,:,描述事实、解释现象和探索本质、科学预测和对策研究。因此,社会调查的作用也主要体现在三个方面,:,描述状况,有利于正确认识社会现实,;,解释原因,有助于探索事实或现象背后的本质,;,预测趋势,有助于应对未来。,1.,描述状况,虽然有人认为描述状况是缺乏含金量的研究,但对某种社会现象进行描述,是人们深入研究该现象的基础。,社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,一、一个例子,我们首先引入一个实际生活中的例子。表,9-1,呈现的是南京某高校某选修课成绩的一个随机抽样结果。相信成绩单对于大家来说都不陌生。我们的问题是,面对这样已经收集起来的数据,应该如何来组织和初步呈现出结果。,社会调查方法(第三版),社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,二、社会调查的作用,从总体而言,社会调查的目的有三个方面,:,描述事实、解释现象和探索本质、科学预测和对策研究。因此,社会调查的作用也主要体现在三个方面,:,描述状况,有利于正确认识社会现实,;,解释原因,有助于探索事实或现象背后的本质,;,预测趋势,有助于应对未来。,1.,描述状况,虽然有人认为描述状况是缺乏含金量的研究,但对某种社会现象进行描述,是人们深入研究该现象的基础。,社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,二、频数表和直方图,1.,频数表,对收集数据的最初处理往往是希望获得该数据的分布,而对于社会研究者而言,频数分布是最常见的。“所谓频数分布,就是指一组数据中取不同值的个案的次数分布情况,它一般以频数分布表的形式表达。”频数分布表显示了各个分数段的学生数量,但很多时候,我们更习惯于以百分比的形式来呈现各种分数段的学生数量相对于总的学生数量的相对比率,这就是频率分布表。,频数表和频率表的作用是显而易见的。通过对数据进行这样的处理,原有的数据被简化,异常庞杂的数据都能被整合进简洁的表格来呈现,;,同时,从频数,/,频率表中,我们不仅能够看到整个数据的分布范围,更能直观地看到各个类别的数据的分布,方便对各个类别进行比较。相对于频数表而言,频率表将整个数据都限定在,100%,实际上是一种标准化的过程。这样,不同的变量,(,数据,),之间的初步比较也成为可能。从变量的测量层次的角度,不难看出,频数,/,频率表对于定类变量和定序变量是更为合适的。,在对定距,/,定比数据进行分组的过程中,有两个方面是值得重视的。首先是对“组”的确定,就如在问卷中设置答案时要注意可选答案的“互斥”和“穷尽”一样,分组的原则同样要求非重叠性和涵盖性,(,在一定程度上,问卷设置问题选项就是一个分组的过程,),。其次,分组的过程是对数据进行约简的过程,同时也是数据信息丢失的过程。分组,实际上是将定距,/,定比层次的变量下降到定序层次的变量来看待,其中必然有数据信息的减少。,2.,直方图,尽管统计图与统计表是完全等价的,但是统计图往往比统计表讨巧很多。很多人看到数字也许会觉得枯燥,而图形则是更为直接、便捷的呈现,因而也更具吸引力。在社会研究中最常使用的图示法包括直,社会调查方法(第三版),社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,二、社会调查的作用,从总体而言,社会调查的目的有三个方面,:,描述事实、解释现象和探索本质、科学预测和对策研究。因此,社会调查的作用也主要体现在三个方面,:,描述状况,有利于正确认识社会现实,;,解释原因,有助于探索事实或现象背后的本质,;,预测趋势,有助于应对未来。,1.,描述状况,虽然有人认为描述状况是缺乏含金量的研究,但对某种社会现象进行描述,是人们深入研究该现象的基础。,社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,二、频数表和直方图,方图、折线图、曲线图等。直方图,(histogram),是一种用图形的方法表现频数表的统计图。,直方图用矩形的面积来表示各个组的频数状况,而矩形的宽度,则表示各个组的组距,各个矩形之间往往相互连接、不留空隙。因此,如果我们假设矩形的总面积为,1,的话,各个矩形的面积表示的就是频率。,直方图是用面积,(,矩形的面积,),来呈现频数,/,频率分布的,了解这一点很重要。我们总是想当然地以为直方图就是看矩形的高度,这种错误在等距分组中显得微不足道,当等距分组限定了矩形的宽度后,显然矩形的面积和矩形的高度就成正比,而通常情况下等距分组使用得比较广泛,但是在不等距分组中这个问题就更突出了。因此,应当记住,矩形的面积代表的是频数或频率,而矩形的高度代表的是频数密度或频率密度。,社会调查方法(第三版),社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,二、社会调查的作用,从总体而言,社会调查的目的有三个方面,:,描述事实、解释现象和探索本质、科学预测和对策研究。因此,社会调查的作用也主要体现在三个方面,:,描述状况,有利于正确认识社会现实,;,解释原因,有助于探索事实或现象背后的本质,;,预测趋势,有助于应对未来。,1.,描述状况,虽然有人认为描述状况是缺乏含金量的研究,但对某种社会现象进行描述,是人们深入研究该现象的基础。,社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,三、集中趋势的度量,集中趋势从最简单的意义理解就是计算和了解平均数,(average),而平均数是能够最好地代表一组数据的数值。“集中趋势”在字面上所指代的是,用一个有代表性的指标来反映整组数据向这个指标值的集中情况。最常见的集中趋势的度量有三种,:,均值、中位数以及众数。,1.,均值,均值是社会调查研究中使用得最为普遍的集中趋势度量,也称为算术平均数,是将所有的数据累加起来再除以累加数的个数。根据不同的资料类型,我们一般分两种方式计算均值,:,简单算术平均数和加权算术平均数。,2.,中位数,如果说均值是数据的值的中间点的话,那么中位数可以看成数据的位置的中间点。中位数,(media),将所有的数据由低至高排列起来,然后一分为二,其中的一半的值大于中位数,另一半小于中位数,因此中位数是数据序列中处于正中间的那个值。计算中位数有如下几种情况,:,(1),对原始数据求中位数。,(2),对单项分组数据求中位数。,(3),对组距分组数据求中位数。,3.,众数,众数也是对集中趋势的一种重要度量,但也是最笼统、最不精确的一种。众数,(mode),就是在数据中出现次数最多,(,频数最高,),的那个数值。从众数的定义来看,众数是不需要计算的,只需要将所有的数据集中在一起,看出现次数最多的数值是哪一个即可。,社会调查方法(第三版),社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,二、社会调查的作用,从总体而言,社会调查的目的有三个方面,:,描述事实、解释现象和探索本质、科学预测和对策研究。因此,社会调查的作用也主要体现在三个方面,:,描述状况,有利于正确认识社会现实,;,解释原因,有助于探索事实或现象背后的本质,;,预测趋势,有助于应对未来。,1.,描述状况,虽然有人认为描述状况是缺乏含金量的研究,但对某种社会现象进行描述,是人们深入研究该现象的基础。,社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,三、集中趋势的度量,4.,三种集中趋势度量的比较,同样是对集中趋势的度量,在具体的研究情境下,究竟应该采用均值、中位数还是众数呢,?,莱文和福克斯认为,我们至少要考虑以下三个维度,:,测量的层次、数据的分布以及研究的目的。由于根据“研究目的”选择合适的度量这样的说法往往流于空泛,因此,仅按前两个维度对三种集中趋势度量进行比较。,(1),测量的层次。根据上文的介绍可以看到,均值只能用于定距,(,或者定比,),层次的数据,一般而言,对定类和定序层次的数据计算均值是没有意义的。而中位数则能用于定距,(,或者定比,),以及定序层次的数据,只要数据能够被从小到大进行排列,我们就可以确定位置的中间点。由于众数只需要计算出现的次数,(,频数,),因而众数对测量层次的适用范围最广,定类、定序或者定距,(,或者定比,),的数据都可以用来计算众数。,而从适用性的角度看,均值更适用于定距及以上层次的变量,中位数更适用于定序层次的变量,众数更适用于定类层次的变量。,(2),数据的分布。在一个对称的正态分布中,均值、中位数、众数是一致的。可以想象在一个对称的正态分布中,频数最大的点,(,众数,),应该就是最居中的点,(,中位数,),同时也是“重心”,(,均值,),。因此,对于一个对称的正态分布,实际上选择哪个指标来测量集中趋势都是一样的。但是当数据是一个有偏的分布时,均值、中位数、众数就不再重合,选择哪个指标来进行集中趋势度量就变得很重要。,社会调查方法(第三版),社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,二、社会调查的作用,从总体而言,社会调查的目的有三个方面,:,描述事实、解释现象和探索本质、科学预测和对策研究。因此,社会调查的作用也主要体现在三个方面,:,描述状况,有利于正确认识社会现实,;,解释原因,有助于探索事实或现象背后的本质,;,预测趋势,有助于应对未来。,1.,描述状况,虽然有人认为描述状况是缺乏含金量的研究,但对某种社会现象进行描述,是人们深入研究该现象的基础。,社会调查方法(第三版)新编,21,世纪思想政治教育专业系列教材,四、离散趋势的度量,集中趋势计算的是一组数据的代表性数值,但是,仅仅用这样的指标是不够的,往往还需要对数据的离差状况,(,离散趋势,),做出有效的描述。实际上,集中趋势的测量和离散趋势的测量是相互补充的。离散趋势