单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第八章 常用统计分布,11/19/2024,1,第一节 超几何分布,适用:小群体的两分变量。假定总体为,K个成功类、N-K个为失败类,1.超几何分布为离散型随机变量的概率,分布,它的数学形式是,11/19/2024,2,2.超几何分布的数学期望值和方差,如果用 ,那么有,11/19/2024,3,例 以随机方式自5男3女的小群体中选出5人组成一个委员会,求该委员会中女性委员人数的概率分布、期望值与变异数。,解 由题意可知:N8K3,NK5n5,代入(81)式,故概率分布如下:,由 ,代入(84)式、(85)式得,1,2,X,0 1 2 3,合计,P=(X=,x,),1/56 15/56 30/56 10/56,56/56,11/19/2024,4,3.关于超几何分布的近似,设某校有l000名大学生,其中有外国留学生10、名,现从该校学生中任抽2人,求抽到外国留学生的概率分布。解 抽到外国留学生人数,X,服从,N,1000、,K,10、,n,2的超几何分布,根据(81)式得,11/19/2024,5,由于 000201,用二项分布近似 计算有 ,由(86)式得,两种方法计算结果比较一下,仅在小数点后第5位上才出现误差。当然在01时,如此计算误差会比较大。另外,二项分布的计算量仍不算小,有时还可以将二项分布近似为泊松分布,这一点我们将在下一节讨论。,11/19/2024,6,第二节泊松分布,适用:稀有事件的研究。一个事件的平均发生次数,是大量实验的结果,在这些试验中,此事件可能发生,但,是发生的概率非常小。,泊松分布亦为离散型随机变量的概率分布,随机变量,X为样本内成功事件的次数。假设为成功次数的期望值,,假定它为。而且在某一时空中成功的次数很少,超过,5次的成功概率可忽不计,那么X的某一具体取值x即稀,有事件出现的次数的概率分布为,11/19/2024,7,泊松分布的性质:,x的取值为零和一切正整数;图,形是非对称的,但随着的增加,图形变得对称;泊松,分布的数学期望和方差均为。,11/19/2024,8,例 某城市50天交通事故的频数分布如 表所示,试求泊松,理论分布。,X,0,1,2,3,4,合计,P,0.4493,0.3595,0.1438,0.0383,0.0091,1.0000,理论频(50,P,i,),22.4,18.0,7.2,1.9,0.5,50.0,一天交通事故数,0,1,2,3,合计,天数f,23,17,7,3,50,解 由资料知,查泊松分布表,得理论分布,将实测频数与理论频数比较,可知题中所述稀有事件是,满足泊松分布的。,11/19/2024,9,第三节 卡方分布,卡方分布是一种连续型随机变量的概率分布,主要用于列联表,检验。,1.数学形式,设随机变量X1,X2,Xk,相互独立,且都服从同一的正态,分布N(,2)。那么,我们可以先把它们变为标准正态变量,Z1,Z2,Zk,k个独立标准正态变量的平方和被定义为卡方分布,分布的随机变量 读作卡方,且,我们把随机变量 的概率分布称为 分布,其概率密度记,作 。其中,k,为卡方分布的自由度,它表示定义式中独立变量的个数。,11/19/2024,10,注意 写法的含义:它,表示自由度为,k,的卡方分布,当,其分布函数,时,其随机变量 的临界值(参见图)。具体来说,在假设检验中,它表示在显著性水平,上卡方分布随机变量 的临界值。,关于卡方分布的分布函数,附表7对不同的自由度,k,及不同的临,界概率,(0,1),给出了满足下面概率式的 的值(参见,图)。,11/19/2024,11,例 k5,15,求临界概率。,解 查卡方分布表,在表中自由度为5的横行中找到,与15最接近的数值是15086,得到的近似值为001。,由此可知 001,解 查卡方分布表(附表7)得,例 试求以下各值:,11/19/2024,12,式中:,2,代表总体方差,自由度为,n,l。,2.卡方分布的性质,(1)恒为正值,。,(2)卡方分布的期望值 是自由度,k,,方差 为2,k,。,卡方分布取决于自由度,k,,每一个可能的自由度对应一个具体,的卡方分布。卡方分布只与自由度有关,这就给卡方分布的实际应,用带来很大方便。分布由正态分布导出,但它之所以与正态分布的,参数,和,无关,是因为标准正态变量,Z,与原来的参数无关。,(3)卡方分布具有可加性,(4)利用卡方分布可以推出样本方差,S,2,的分布,11/19/2024,13,所以,样本方差,S,2,落在33和87之间的概率约为90。,3.样本方差的抽样分布,例 由一正态总体抽出容量为25的一随机样本,26,求,样本方差S 2在3.3到8.7之间的概率。,解 n25,26,由 得,11/19/2024,14,第四节,F,分布,F 分布是连续性随机变量的另一种重要的小样本分布,可用来检验两个总体的方差是否相等,多个总体的均值是否相等。还是方差分析和正交设计的理论根底。,1.数学形式,设 和 相互独立,那么随机变量,服从自由度为(,k,1,,,k,2,)的,F,分布。其中,分子上的自由,度,k,1,叫做第一自由度,分母上的自由度,k,2,叫做第二自由度。,11/19/2024,15,注意 写法的含义:它表示自由度为,(,k,1,,,k,2,),的,F,分布,当其分布函数,时,其,随机变量,F,的临界值(参,见图)。具体来说,在假设检验中,它表示在显著性水平,上,F,分布,随机变量,F,的临界值。,我们把随机变量F的概率分,布称为F分布,其概率密度记,作 。本书附,表8,对不同自由度(k1,k2)及,不同的临界概率(01),,给出满足以下概率式的F(k1,,k2)的值(参见图)。,11/19/2024,16,如果 和,是两个独立随,机样本的方差,样本来源于具有相同,方差,2,的两个正态总体,样本容量,分别为n,1,和n,2,,那么根据(822)式,,随机变量,F,服从于自由度为(n,1,1和,n,2,1)的,F,分布。,例 试求以下各值:,解,查,F,分布表(附表,8,)得,11/19/2024,17,2.,F分布性质,(1)随机变量,F,恒为正值,,F,分布也是一个连续的非对,称分布。,(2)分布具有一定程度的,反对称性。,(3),F,分布的期望值与变异数(方差),11/19/2024,18,