资源预览内容
第1页 / 共45页
第2页 / 共45页
第3页 / 共45页
第4页 / 共45页
第5页 / 共45页
第6页 / 共45页
第7页 / 共45页
第8页 / 共45页
第9页 / 共45页
第10页 / 共45页
第11页 / 共45页
第12页 / 共45页
第13页 / 共45页
第14页 / 共45页
第15页 / 共45页
第16页 / 共45页
第17页 / 共45页
第18页 / 共45页
第19页 / 共45页
第20页 / 共45页
亲,该文档总共45页,到这儿已超出免费预览范围,如果喜欢就下载吧!
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,第三章 抽样误差与t分布,第三章 抽样误差与t分布,1,如:总体均数,总体标准差,如:样本均数,样本标准差,S,总体,样本,抽取部分观察单位,统计量,参 数,统计推断,统计推断,如:总体均数如:样本均数总体样本抽取部分观察单位 统计量,2,在医疗卫生实践和医学研究中,往往难以对所要研究的总体进行全部观察,通常从总体中随机抽取样本进行观察,然后由样本的信息去推断总体特征,这种研究方法叫做,抽样研究方法,。,用样本的信息去推断总体特征,这种分析方法称为,统计推断,。,基本手段,直接推断(参数估计),间接推断(假设检验),在医疗卫生实践和医学研究中,往往难以对所要研究的总体进行全部,3,总体参数的估计,均数的抽样误差,t,分布,总体均数的估计,总体参数的估计均数的抽样误差,4,抽样误差的定义,假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了三次。,119.41cm,=4.38cm,抽样误差的定义假如事先知道某地七岁男童的平均身高为119.4,5,三次抽样得到了不同的结果!,原因何在?,三次抽样得到了不同的结果!,6,如果没有个体变异,No Variation!,No Sampling Error!,如果没有个体变异No Variation!,7,No Random sampling!,No Sampling Error!,如果没有抽样研究,No Random sampling!如果没有抽样研究,8,三次抽样得到了不同的结果,原因何在?,个体变异,随机抽样,不同男童的身高不同,每次抽到的人几乎不同,抽样误差,三次抽样得到了不同的结果,原因何在?个体变异随机抽样不同男童,9,【定义】,由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为,抽样误差(sampling error)。,各种参数估计都有抽样误差,这里我们以,均数,为研究对象,【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体,10,抽样误差产生的条件,抽样研究,个体变异,抽样误差产生的条件抽样研究,11,抽样误差的表现,样本均数和总体均数间的差别,样本均数和样本均数间的差别,抽样误差是不可避免的,可以通过保证总体的同质性及增大样本含量来缩小抽样误差。,抽样误差的表现样本均数和总体均数间的差别样本均数和样本均数间,12,从,正态分布总体,N,(5.00,0.50,2,),中,每次随机抽取样本含量,n,5,,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。,按上述方法再做样本含量,n,10,、样本含量,n,30,的抽样实验;比较计算结果。,抽样误差的规律性,正态分布抽样,从正态分布总体N(5.00,0.502)中,每次随机,13,抽样试验(,n,=5),抽样试验(n=5),14,抽样试验(,n,=10),抽样试验(n=10),15,抽样试验(,n,=30),抽样试验(n=30),16,1000份样本抽样计算结果,总体的均数,总体标准差,s,均数的均数,均数标准差,n,=5,5.00,0.50,4.99,0.2212,0.2236,n,=10,5.00,0.50,5.00,0.1580,0.1581,n,=30,5.00,0.50,5.00,0.0920,0.0913,1000份样本抽样计算结果总体的均数总体标准差s均数的均数均,17,3个抽样实验结果图示,3个抽样实验结果图示,18,非正态分布抽样,分别从各总体中抽取10000个样本含量为,n,的样本,计算每个样本的均数,并绘制频数分布图。,n,分别取2、4、10、25。,非正态分布抽样分别从各总体中抽取10000个样本含量为n的样,19,偏三角分布抽样,偏三角分布抽样 ,20,均匀分布,均匀分布,21,指数分布,指数分布,22,双峰分布,双峰分布,23,从正态总体中随机抽样,其样本均数服从正态分布;,从任意总体中随机抽样,当样本含量足够大时,其样本均数的分布逐渐逼近正态分布;,样本均数之均数的位置始终在总体均数的附近;,随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。,从正态总体中随机抽样,其样本均数服从正态分布;,24,中心极限定理,从正态总体中随机抽取例数为n的样本,样本均数x也服从正态分布,即使从偏态总体中抽样,只要样本例数足够大,如n50,样本均数x也近似正态分布。,从均数为,,标准差为,的正态总体中随机抽取例数为n的样本,样本均数的总体均数为,,标准差为,x,中心极限定理从正态总体中随机抽取例数为n的样本,样本均数x也,25,中心极限定理,中心极限定理,26,标准误的定义,样本统计量(如均数)也服从一定的分布。,与描述观测值离散趋势的指标类似,样本统计量的标准差就反映了从某个总体中随机抽样所得样本之均数分布的离散程度。,用,样本统计量的标准差,来反映抽样误差的大小。又称,标准误,(standard error)。,标准误的定义样本统计量(如均数)也服从一定的分布。与描述观测,27,x,标准误,x,=,/n,s,x,=,s/n,x标准误x=/nsx=s/n,28,标准误的意义,反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。,标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。,标准误的大小与标准差有关,在例数,n,一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。,标准误的意义反映了样本统计量(样本均数,样本率)分布的离散程,29,用途:,(1)衡量样本均值的可靠性,(2)估计总体均值的可信区间,(3)用于均数的假设检验,用途:(1)衡量样本均值的可靠性(2)估计总体均值的可信区间,30,t,分布,随机变量,X,N,(,m,,,s,2,),标准正态分布,N,(,0,,,1,2,),u,变换,标准正态分布,N,(,0,,,1,2,),均数,Student,t,分布,自由度,=n,-1,t,变换,t分布随机变量X标准正态分布u变换标准正态分布均数Stude,31,由,W.S.Gosset,提出,由W.S.Gosset提出,32,t,=,x-,s/,n,对于不同的n,有不同的t分布曲线。,(n-1),称为,t分布的自由度,t=x-s/n对于不同的n,有不同的t分布曲,33,f,(,t,),=(,标准正态曲线,),=5,=1,0.1,0.2,-4,-3,-2,-1,0,1,2,3,4,0.3,自由度分别为1、5、,时的,t,分布,f(t)=(标准正态曲线)=5=10.10.,34,t,分布的特征:,t分布为一簇单峰分布曲线。,t分布以0为中心,左右对称。,t分布与自由度有关,自由度越小,t分布的峰越低,而两尾越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。,t分布的特征:t分布为一簇单峰分布曲线。t分布以0为中心,35,t,分布曲线下面积规律,t,分布曲线下总面积仍为1或100%,t,分布曲线下面积以0为中心左右对称,由于,t,分布是一簇曲线,故,t,分布曲线下面积固定面积(如95%或99%)的界值不是一个常量,而是随自由度的大小而变化,t分布曲线下面积规律t分布曲线下总面积仍为1或100%,36,其通式为,单侧:,P(t-t,)=,或,P(tt,)=,双侧:,P(t-t,/2,)+P(tt,/2,)=,图中非阴影部分面积的概率为,,P(-t,/2,tt,/2,)=,1,-,其通式为,37,t,分布的界值,t,检验水准,(尾端概率),自由度,在t 检验中很重要,t分布的界值t,检验水准自由度 在t 检验中很,38,t 界值表,横标目:自由度,,纵标目:尾端概率,p,即曲线下阴影部分的面积;,表中的数字:相应的|,t|界值。,t 界值表,39,附表,2,t,分布表的特点,附表2的横标目为自由度,,纵标目为概率,P,,表中数值为其相应的,t,界值,记作,t,。,附表2只列出正值,若计算的,t,值为负值时,可用其绝对值查表。,附表2右上附图的阴影部分表示,t,以外尾部面积的概率。,附表2,t分布表的特点附表2的横标目为自由度,纵标目为概率,40,单侧t,0.05,30,=1.697,,,表示=30时,t1.697的概率或t-1.697的概率为0.05,记作P(t-1.697)=0.05或P(t 1.697)=0.05;,双侧t,0.05,30,=2.042,,,表示=30时,t2.042的概率和t-2.042的概率之和为0.05,记作P(t-2.042)+P(t 2.042)=0.05,单侧t0.05,30=1.697,表示=30时,t1.6,41,图中非阴影部分面积的概率为:,P(-,/2,t t,/2,)=1-,从附表2中还可以看出,双侧概率P为单侧概率的两倍,如双侧t,0.10/2,30,=单侧t,0.05,30,=1.697,图中非阴影部分面积的概率为:,42,标准误与标准差的关系,区别,标准差,s,标准误,s,x,意义 个体变异 统计量的抽样误差,用途 正常值范围 总体均数的可信区间,(,x,1.96,s,)(,x,t,s,x,),与n,关系 n,s,趋于稳定,n,s,x,趋于 0,标准误与标准差的关系区别 标准差 s,43,联系,1.两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。,2.当样本含量不变时,标准差大,标准误亦大,均数的标准差与标准误成正比。,联系 1.两者都是变异指标,说明个体之间的变异用标准差,说,44,消除隐患,确保安全,保障稳定,促进发展。,11月-24,11月-24,Tuesday,November 19,2024,人民消防人民办,办好消防为人民。,04:49:39,04:49:39,04:49,11/19/2024 4:49:39 AM,做好安全工作,树立企业形象。,11月-24,04:49:39,04:49,Nov-24,19-Nov-24,绊人的桩不在高,违章的事不在小。,04:49:39,04:49:39,04:49,Tuesday,November 19,2024,人人保安全,家家笑开颜。,11月-24,11月-24,04:49:39,04:49:39,November 19,2024,每项振作求质量,产品质量有保障。,2024年11月19日,4:49 上午,11月-24,11月-24,人人有专职,工人有程序,检查有标准,做好留证据。,19 十一月 2024,4:49:39 上午,04:49:39,11月-24,由前至后一条拉,从上到下一条心。,十一月 24,4:49 上午,11月-24,04:49,November 19,2024,创名牌、夺优质,全厂员工齐努力。,2024/11/19 4:49:39,04:49:39,19 November 2024,质量放松,劳而无功,.,安全发展,国泰民安。,4:49:39 上午,4:49 上午,04:49:39,11月-24,读安全书,做安全人。体系有效运行,销售蒸蒸日上。,11月-24,11月-24,04:49,04:49:39,04:49:39,Nov-24,同心协力,提高品质。,2024/11/19 4:49:39,Tuesday,November 19,2024,质量是制造出来的,而不是检验出来的。,11月-24,2024/11/19 4:49:39,11月-24,谢谢大家!,消除隐患,确保安全,保障稳定,促进发展。9月-239月-23,45,
点击显示更多内容>>

最新DOC

最新PPT

最新RAR

收藏 下载该资源
网站客服QQ:3392350380
装配图网版权所有
苏ICP备12009002号-6