,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,实 用 统 计 学,实 用 统 计 学,第七章,抽 样 调 查,第七章 抽 样 调 查,抽样调查是一种实用价值很大的非全面调查方法。通过本章的学习,可以使读者认识到抽样推断的科学性。本章重点阐述抽样调查的优点,抽样推断的几个基本概念;抽样调查的目的是为了推断总体的数量特征,即做出抽样估计;抽样估计有两种:点估计和区间估计。在区间估计中,有抽样误差、抽样平均误差、极限误差、概率度等概念。,抽样调查是一种实用价值很大的非全面调查方法。通过本章的学习,,第一节,抽样推断综述,一、抽样推断的理论基础及其优点,抽样推断是在抽样调查的基础上,利用样本实际资料计算的样本的指标值,推断总体相应指标数量特征的方法。它以概率论大数定律作为理论基础,以随机原则科学抽取样本,科学估计总体特征。,抽样推断具有五大优点:,1,)当某些现象不可能采用全面调查时,可以利用抽样做出推断。,2,)当某些现象没有必要采用全面调查时,可利用抽样做出推断。,第一节 抽样推断综述一、抽样推断的理论基础及其优点,第一节,抽样推断综述,3,)抽样调查和全面调查相结合,可以相互补充,也可以对全面资料起到检验核对的作用。,4,)对于某些总体的假设需要依靠抽样法进行假设检验。,5,)它可用于现代化工业大批量生产过程中的产品质量控制。,第一节 抽样推断综述3)抽样调查和全面调查相结合,可以相,第一节,抽样推断综述,二、抽样推断中常用的基本概念及指标,(一)总体,总体是指调查对象的全部单位。例如,,人口普查中的全部人口,就是调查的总体。,(二)样本,它是指从全部单位中按照随机原则抽取一部分作为调查对象的单位所构成的集合体用,N,表示,组成样本的具体单位称样本单位。,一般来说,样本单位数达到或超过,30,个(,n30,)称为大样本,而在,30,个以下称为小样本。,第一节 抽样推断综述二、抽样推断中常用的基本概念及指标,第一节,抽样推断综述,(三)抽样推断中用到的几个指标,1.,总体平均数,代表总体单位数量标志一般水平的指标称为总体平均数或全及总体平均数。它表明变量变动的集中趋势,通常用,表示。,2,总体成数,当总体的一个现象有两种表现时,其中具有某种表现的单位数占总体单位数目的比重叫总体成数,用,P,或,Q,表示。,第一节 抽样推断综述(三)抽样推断中用到的几个指标,第一节,抽样推断综述,3,总体标准差和总体方差,表示单位之间标志值的变异程度指标叫做总体标准差。总体标准差的平方称为总体方差。,4,抽样平均数,代表样本单位数量标志一般水平的指标称为抽样平均数或样本平均数。它表明变量变动的集中趋势,其计算公式为,第一节 抽样推断综述3总体标准差和总体方差,第一节,抽样推断综述,5,抽样成数,当抽样总体的一个现象有两种表现时,其中具有某种表现的单位数占抽样总体单位数目的比重,叫抽样成数,也称样本成数,用,p,或,q,表示,其计算公式为,第一节 抽样推断综述5抽样成数,第一节,抽样推断综述,6,抽样总体标准差和抽样总体方差,表示抽样总体之间标志值的变异程度指标,叫做抽样总体标准差,用,S,表示。总体标准差的平方称为总体方差,用,S,2,表示,其计算公式为,第一节 抽样推断综述6抽样总体标准差和抽样总体方差,第一节,抽样推断综述,(四)抽样误差的概念,调查所得资料与客观实际之间存在,的,离差称为统计误差。统计误差主要有两类。一类是调查误差,即在调查过程中由于观察、测量、登记、计算上的失误所引起的误差,在抽样调查中将这种误差称为登记性误差。另一类是代表性误差,即用样本资料估计总体资料所不可避免的误差。这种由系统性原因引起的样本指标不足以代表总体指标的误差称为系统性误差。,由抽样的随机原则引起的难以避免的代表性误差则是抽样误差。因此,抽样误差就是指样本指标与被它估计的总体指标之间数量上的差数。,第一节 抽样推断综述(四)抽样误差的概念,第一节,抽样推断综述,(五)抽样平均误差,抽样平均误差是抽样实际误差的一般水平,是所有可能样本指标与总体指标的平均离差,即所有可能样本指标的标准差。若以 代表可能样本平均数的平均误差,以 代表样本可能成数的平均误差,以,M,代表所有可能样本数目,则从理论上讲有,第一节 抽样推断综述(五)抽样平均误差,第一节,抽样推断综述,第一节 抽样推断综述,第一节,抽样推断综述,第一节 抽样推断综述,第一节,抽样推断综述,从抽样误差理论可知,抽样误差大小受四个主要因素的影响:,1)总体标志变异程度的大小,。,在其他条件不变的情况下,总体变异程度越大,抽样误差也越大;反之,则越小。,2)样本容量,即,n,的大小,若其他条件不变,样本容量越大,抽样误差则越小;反之,则越大。,3)抽样方法,在同等条件下,重复抽样的抽样误差总是大于不重复抽样的抽样误差。,4)抽样组织方式,在同等条件下,简单随机抽样的抽样误差较大,而类型抽样的抽样误差较小。,第一节 抽样推断综述从抽样误差理论可知,抽样误差大小受四,第一节,抽样推断综述,(六)抽样极限误差,抽样极限误差也称抽样允许误差,是指样本指标与总体指标之间抽样误差的可能范围。,我们将这种以绝对值形式表示的抽样误差的可能范围称为抽样极限误差,记作,,平均数的极限误差记作,,成数的极限误差记作,,则,第一节 抽样推断综述(六)抽样极限误差,第一节,抽样推断综述,(七)概率度,把抽样极限误差,除以相应的抽样平均误差,,得出相对数,t,,它表示误差范围为抽样平均误差的若干倍,,t,称为概率度,用公式表示为,第一节 抽样推断综述(七)概率度,第二节 抽样的方法与抽样的组织形式,一、抽样的方法,重复抽样与不重复抽样是两种具体抽取样本单位的方法,应用中应根据调查对象的特点和研究目的而选择应用。抽样实践中,不重复抽样的应用较多。,第二节 抽样的方法与抽样的组织形式一、抽样的方法,第二节 抽样的方法与抽样的组织形式,(一)重复抽样,重复抽样又叫重置抽样,是指每次从总体中随机抽取一个样本单位,经观察登记其有关标志后再放回总体中,使其与其他单位具有同等的机会参加下一次抽取,如此进行,n,次,就可以得到容量为,n,的样本总体。这样,在每次抽选过程中,总体单位数目,N,始终不变,但同一个单位有可能被多次重复抽选。,重复抽样有两个特点:第一,每个总体单位都有被重复抽中的可能;第二,每次都是从全部总体单位中抽取一个样本单位。因此,各个单位被抽中的可能性前后相等。,第二节 抽样的方法与抽样的组织形式(一)重复抽样,第二节 抽样的方法与抽样的组织形式,(二)不重复抽样,不重复抽样也叫不重置抽样,它是指每次从总体中随机抽取一个样本单位进行登记后,不再放回原总体,而是从剩余单位中进行下一个样本单位的抽取,直至抽足预定的样本单位数为止。,不重复抽样有以下特点:,每个总体单位一旦被抽中,就不会再有被抽中的可能性,即不可能重复中选。,一次抽足预定的样本单位数。,总体单位数在抽选过程中逐渐减少,这样,总体单位被抽中的可能性越来越大。,第二节 抽样的方法与抽样的组织形式(二)不重复抽样,第二节 抽样的方法与抽样的组织形式,二、抽样调查的组织形式,(一)简单随机抽样,简单随机抽样又称纯随机抽样。这种抽样方式是不对总体作任何处理,直接按随机原则抽取调查单位。常用的方法有抽签法、随机数字表法等。这种方式最能体现抽样的随机原则,所以抽样误差的计算方法是以此种方式为基础的。,第二节 抽样的方法与抽样的组织形式二、抽样调查的组织形式,第二节 抽样的方法与抽样的组织形式,(二)类型抽样,类型抽样又叫分层抽样和分类抽样。它是将总体中的所有单位先按某一主要标志分成若干类(或组),使组内各单位标志值比较接近,然后从各类中随机抽取一部分调查单位,共同组成样本。由于它是按照与调查目的有关的主要标志对总体进行分组处理,使影响抽样误差的组内标志变动减小,所以其抽样误差要小于纯随机抽样的误差。,类型抽样的特点是把分组法与贯彻随机原则结合起来。在总体单位标志值差异较大时,采用类型抽样较为适宜。,第二节 抽样的方法与抽样的组织形式(二)类型抽样,第二节 抽样的方法与抽样的组织形式,(三)机械抽样,机械抽样又叫等距抽样。它是先将总体各单位按某一标志进行排队,根据既定的抽样比例确定抽样间距,然后按一定的顺序等间隔地抽取调查单位。这种抽样方式的随机性主要体现在第一个样本单位的抽选上,所以一定要保证第一个样本单位抽取的随,机性。,机械抽样,的,两种方法:,1,)按无关标志排队法等距抽样,2,)有关标志排队法等距抽样,第二节 抽样的方法与抽样的组织形式(三)机械抽样,第二节 抽样的方法与抽样的组织形式,(四)整群抽样,整群抽样是先将总体划分为若干个群(组),每一群内包含若干个单位,然后随机抽取一部分群作为样本群,对样本群的所有总体单位进行全面调查的调查方式。这种方式不同于前面三种的一个一个地抽取调查单位,而是成群地抽取。由于其影响抽样误差的群间标志变动度通常较大,所以其抽样误差往往较大,大于纯随机抽样。如果要保证推断的准确性和可靠性,就需要多抽取调查单位(群)。,第二节 抽样的方法与抽样的组织形式(四)整群抽样,第二节 抽样的方法与抽样的组织形式,(五)多阶段抽样,多阶段抽样是把抽取样本单位的过程分为两个或更多个阶段进行。先从统计总体中抽取若干大的样本单位,叫第一阶段单位,再从第一阶段单位中抽取较小的样本单位,叫第二阶段单位,照此类推,直到最后阶段抽出最终的样本单位,即需要登记其特征的单位。若第二阶段单位是最终样本单位,就是两阶段抽样;若第三阶段单位是最终样本单位,就是三阶段抽样。在调查范围很大、总体单位太多的情况下,可采用多阶段抽样进行抽样调查。,第二节 抽样的方法与抽样的组织形式(五)多阶段抽样,第三节 抽 样 估 计,一、总体指标的点值估计,点值估计就是直接以抽样调查所取得的样本指标作为总体指标的估计值。点值估计一般欠考虑抽样平均误差和可靠程度,它适用于准确程度、可靠程度要求不十分高的情况。若用,和,分别代表总体平均数与总体成数的估计值,用,和,p,分别表示调查所得的样本平均数和样本成数,则有,第三节 抽 样 估 计一、总体指标的点值估计,第三节 抽 样 估 计,二、区间估计,这里讲的区间估计,就是根据样本平均数、抽样平均误差、概率保证度去推断总体数值的可能范围。,样本抽样平均数的区间范围为,第三节 抽 样 估 计二、区间估计,第三节 抽 样 估 计,区间为,第三节 抽 样 估 计区间为,第三节 抽 样 估 计,三、总体指标的区间估计,区间估计在一定概率保证下,结合抽样平均误差、极限误差,给出总体指标的区间范围,并明确其上限与下限的数值。上限和下限两个数值所构成的可能范围叫区间,也称置信区间。,第三节 抽 样 估 计三、总体指标的区间估计,第三节 抽 样 估 计,数理统计中,在研究概率分布时,若已知总体指标则抽样指标离开总体指标一定距离的概率可以计算出来,其公式为,统计抽样运用演绎推理方法指出,在给定一定概率保证程度,,也叫置信概率,并计算出抽样平均误差情况下,总体指标的区间范围为,第三节 抽 样 估 计 数理统计中,在研究概率分布,第三节 抽 样 估 计,四、区间估计的步骤,根据方案给定的概率保证程度推算极限误差范围,以进行总体指标的区间估计,步骤如下:,1)根据方案抽取样本,计算抽样平均数或抽样成数以作为总