园艺植物科学研究导论7试验资料的统计推断-

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第七章试验资料的统计推断,统计学的目的不只是为了研究样本，而是要通过样本的结果来推断其所属总体的特征，即统计推断问题。统计推断就是根据抽样分布律和概率理论，由样本结果统计数对总体特征参数进行推论。试验所获得的资料通常是样本资料，而我们的目的是希望知道样本所属总体的情况。因此，统计推断是科研工作中的一个十分重要的工具。,统计推断的根本内容有两个方面：,1统计假设测验；2参数估计。,第一节概率的根本知识,假定在同一组条件下重复进行同一类试验或调查，随机事件A的频率a/n 在试验或调查的次数n逐渐增大时，将稳定地在某一数值P附近摆动，而且当n愈增大时这种摆动的幅度愈变愈小频率的稳定性，那么定义随机事件A的概率为P，并记为：,PA=P,在通常情况下，由于P是一个理论值，实际中P不可能准确获得的，所以人们常用n充分大时事件A的频率作为该事件概率P的近似值，即,PA=P(a/n),而且：0 P(A)1,随机事件的概率表现了事件的客观统计规律，反映事件在一次试验中发生的可能性大小。P(A)愈大，事件A就愈容易发生。如P(A)=1，那么，事件A是必然事件；,相反，P(A)愈小，事件A就愈不容易发生，当P(A)=0时，表示事件A根本不可能发生，成为不可能事件。假设事件A发生的概率很小，表示事件A在一次试验中出现的可能性很小，以至实际上不可能出现，这称为“小概率事件实际不可能性原理。概率论的这一原理是统计假设性测验的根本原理。在生物统计上，常把事件发生的概率小于5%叫做小概率事件。,概率计算法那么：,1.假设事件A与事件B是互斥事件，其概率分别为P(A)和P(B)，那么事件A与B的和事件的概率等于事件A的概率与事件B的概率之和，即：P(A+B)=P(A)+P(B),假设事件A的概率为P(A)，那么其对立事件B的概率为：,P(B)=1-P(A),假设事件A1、A2、A3、An构成试验的完全事件系，那么：,PA1+A2+A3+An=1,2.假设事件A和事件B相互独立，那么事件A和事件B同时发生或相继发生的事件概率等于两个独立事件概率的乘积，即：,PAB=PAPB,概率的乘法定理可扩及到多个独立事件的运算。,第二节理论概率分布,一、二项分布 binomial distribution,一二项总体,在试验中，有些总体的每个个体的某种性状，只能发生非此即彼的两种结果用0，1表示，这种由非此即彼事件构成的总体称为二项总体，又称为0、1总体。,统计上习惯将二项总体中变量“1 的概率用p表示；变量“0 的概率用q表示。显然，P+q=1。,二项总体的参数：=p 2=pq,(二)二项分布,1.二项分布：是一种最重要的非连续性随机变数的概率分布。假设从二项总体中独立抽取n个个体，把这n个个体作为一个样本，那么可以抽得n+1个样本，将每一样本的n个观察值加起来得到样本总和数，那么这n+1个样本的总和数就构成了样本总和数总体，样本总和数总体的概率分布就叫二项概率分布，简称二项分布。,二项分布中任何一项概率的通式为:,P(x=K)=Cnk pk qn-k,显然有：Cnk pk qn-k=p+q)n=1,2.二项分布的形状与参数,二项分布的参数为：,=np 2=npq,二项分布的图形形状取决于n和p。假设变数x服从二项分布，可记为：xBn，p,二项分布的形状：,当p=q时，无论n大小。图形左右对称。,2.当pq、n一定时，图形偏斜，且p、q相差越大越偏斜。,3.当p与q为一定值，尽管二者相差较大，但随着n的增大而偏斜度相应减小，且逐渐接近于左右对称；当n 适当大n30,且np和nq都不小于5时，二项分布趋近于正态分布；当n、p不过小时，二项分布即成为正态分布。,二、正态分布normal distribution,正态分布特性,f(x)=,1是连续性分布，以x=为对称轴左右对称分布。在平均数的左方或右方，只要距离相等，其f(x)就相等。,2正态分布曲线有一个顶峰，曲线以x轴为渐近线，随机变数x的取值范围为-，+。,3正态曲线是一个曲线系统，由和两个参数来确定的，其中确定曲线在x轴上的位置，确定它的变异程度，故记作：N(,2)。,4正态分布与x轴之间的面积表示所研究总体的全部变量出现的概率密度总和，等于1。,常用的理论面积或概率如下：,区间,1,面积或概率=0.6826,2,=0.9545,3,=0.9973,1.96,=0.9500,2.58,=0.9900,2.正态分布概率计算,将一般正态分布转换成标准正态分布的过程就是将x变数转换成u变数：,u=,标准正态离差：u=,从一般正态分布N(，2)到标准正态分布,N0，1，可简化处理步骤，而不改变正态分布的根本性质。因此在求一般正态分布的概率时，只要将其转换成u值，然后查表即可。,三、普松分布poisson distribution),当n、p0时，二项分布可导出普松分布。计算其任一变量的概率为：,Px=K=,普松分布仅具参数=np，可记作：,P ，且有：=2=的特征。,普松分布通常是极偏斜状分布，此分布主要用于描述小概率事件，并且事件应是独立的。,一般当二项分布在p,0.1和 np,0 或 0，测验的否认区域位于正态分布右尾。,2.0：0，对 A：0，其否认区域位于正态分布的左尾。,以上将否认区仅选在一尾的测验，叫一尾或单尾测验。,一般而言，如果凭借一定的知识和经验，推测,应当或可能是,0,的，为测验,是否显著,0,，我们的假设应是：,0,：,0,，对,A,：,0,的，我们的假设应是：,0,：,0,，对,A,：,0,第五节平均数的假设测验,一、单个平均数的假设测验,指测验某个样本平均数的总体平均数与某一总体平均数0 之间的差异是否显著。,：=0 A：0,总体的标准差一般为未知的，可由样本方差去估计总体方差，如果样本为大样本n30 可以直接进行u测验；如果样本为小样本n30，那么要进行t测验。,u或t=,进行t检验时，依据自由度为df=n-1查临界t值t。,二、两个样本平均数的统计假设测验,指测验两个样本所属总体的平均数 1和间有无显著性差异。,H0:1=2 A：12,测验的方法随试验设计的不同而有差异，可分为成组数据和成对数据的比较两大类。,一成组数据,两个处理间的各供试单位彼此独立，其观察值之间无一一对应关系，即为成组数据。其测验又依两样本所属总体的方差和是否和样本容量的大小不同，测验方法也不同。,1.在两个样本所属正态总体的方差和时，用 u 测验。,总体的方差往往是未知的，如果两个样本均为大样本n130，n230，可以用两个样本均方估计其总体的方差：,两个样本所属总体方差未知，且又为小样本时，可以假定两个样本所属总体方差相等，即 =，为了增加误差估计的精确度，将两个样本均方乘以各自的自由度之和，再除以两个样本自由度之和，得到两个样本均方的加权平均数作为总体方差,2,的估计值。,成组数据可以n1=n2,也可以n1n2,假设为一定，那么在时，为最小，所以在设计时，最好使各平均数的n相等，以减小误差。,二成对数据,两个处理间的各供试单位彼此存在一一对应关系，即为成对数据，显然成对数据必然有：n1=n2。,=,t=,依据自由度为df=n-1查临界t值t,。,第六节参数的区间估计,参数估计是指由样本结果对总体参数作出估计点估计和区间估计。点估计是以统计数估计相应参数，因未考虑误差，所以对总体估计是有一定偏误的，故可用区间估计进行参数估计。,区间估计是指：根据统计数的概率分布，给出一个区间，使总体参数在此区间的概率为1-，即：,一、总体平均数的区间估计,区间估计和显著性测验的结果有着必然的联系。假设参数的1-置信区间内包括H0，那么必在水平上接受H0；如置信区间内不包括H0，那么必在水平上否认H0。,二、总体平均数差数的区间估计,对于按u分布的资料，置信限：,对于按t分布的资料，置信限：,对于成对资料，置信限：,本章结束,

最新DOC

最新PPT

最新RAR