单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,二 项 分 布(binomial distribution),1,随机变量,(random variable):,指取值不能事先确定的观察结果,通常简称为变量,离散型变量,:在一定区间内变量取值为有限个,或数值可以一一列举出来。,如:,出生人数、死亡人数、有效人数,连续型变量,:在一定区间内变量取值为无限个,或数值无法一一列举。,如:,身高、体重、血清转氨酶测定结果,2,随机变量 概率分布,连续型 连续型分布(u、t、F、,2,分布),离散型 离散型分布(二项分布、poisson分布),3,例:一个口袋中有10个外形相同的乒乓球,其中6个白球、4个黄球,现进行摸球游戏,每次摸出一个球后又重新放回袋中,先后摸10次,问摸到白球的次数为1、2、3、0的概率分别是多少?,概率的乘法法则,:几个独立事件同时发生的概率,等于各独立事件的概率之积。,一、二项分布的概念,4,(1)摸到白球的次数为1的概率:,0.60.4,9,10=0.6,1,(1-0.6),9,=0.00157,(2)摸到白球的次数为2的概率:,0.6,2,0.4,8,45=0.6,2,(1-0.6),8,=0.,01062,(3)摸到白球的次数为3的概率:,0.6,3,0.4,7,120=0.6,3,(1-0.6),7,=0.04247,(4)摸到白球的次数为0的概率:,0.4,10,=0.6,0,(1-0.6),10,=0.00010,5,(5)摸到白球的次数分别为4、5、6、7、8、9、10的概率:,P(4)=0.11148 P(5)=0.20066 P(6)=0.25082 P(7)=0.21499 P(8)=0.12093 P(9)=0.04031 P(10)=0.00605,6,二项分布,:指在只会产生,两种可能结果,如“阳性”或“阴性”之一的n次,独立重复,试验(,Bernoulli 试验,)中,当每次试验的,“阳性”概率保持不变,时,出现阳性的次数X0,1,2,n的一种概率分布。,XB(n,),7,当“阳性”结果的概率固定为(“阴性”结果的概率为1-)时,n次Bernoulli试验中出现X次“阳性”的概率:,X0,1,2,n,8,例3.4:三只小白鼠试验,见P,35,9,二、二项分布的应用条件,1、各观察单位只能具有相互对立的一种结果,2、n次试验在相同条件下进行,且相互独立,3、发生某一结果的概率为,其对立结果的概率为(1-),10,三、二项分布的性质,1、二项分布的均数和标准差,=n,11,二项分布的均数和标准差用相对数表示:,12,2、二项分布的累计概率,最多,有k例阳性的概率:,P(X k)=P(0)+P(1)+P(k),最少,有k例阳性的概率:,P(X k)=P(k)+P(k+1)+P(n),X=0,1,2,k,n,13,例(补充):据报道,输卵管结扎的育龄妇女经壶腹部壶腹部吻合术后,其受孕率为0.55,问对10名输卵管结扎的育龄妇女实施该吻合术后最多有2人不受孕的概率,n10 p0.55,P(X 8)P(8)+P(9)+P(10),或,n10 p10.550.45,P(X 2)=P(0)+P(1)+P(2),14,3、二项分布的图形,已知:XB(n,),以X为横坐标、以P(X)为纵坐标绘出二项分布的图形,见P,37,15,二项分布的图形形状(n,):,(1)当0.5时,分布对称;当 0.5时分布是偏态的,(2)固定时,随着n的增大,分布趋于对称,(3)当n、不太靠近0或1时,二项分布接近正态分布,16,四、二项分布的应用,1、总体率的估计,点估计:,区间估计:,(1)查表法:(n50),95%CI、99%CI,例3.6 P,38,17,例(补充):对13名输卵管结扎的育龄妇女经壶腹部壶腹部吻合术后,观察其受孕情况,发现有8人受孕,请估计该吻合术妇女受孕率的95可信区间。,受孕率的95CI:,(,32%,86%),注意,:Xn/2时应以n-X查表,18,(2)正态近似法,当n较大、p和(1-p)均不太小如np和n(1-p)均大于5时:,B(n,)N(n,n(1-),样本率 N(,(1-)/n),N(p,p(1-p)/n),总体率的CI:pu,/2,S,p,19,例3.7 P,38,P,31,20,2、样本率与总体率的比较,(1)直接计算法,例:据报道,输卵管结扎的育龄妇女经壶腹部-壶腹部吻合术后,其受孕率为0.55,今对10名输卵管结扎的育龄妇女实施峡部-峡部吻合术,结果有9人受孕,问其受孕率是否高于壶腹部-壶腹部吻合术?,(,假设检验:,P(X 9)0.023257,),21,(2)正态近似法:,(n50、np和n(1-p)均大于5),例:某疾病采用常规治疗,其治愈率为45。现随机抽取180名该疾病的患者,并改用新的治疗方法对其治疗,治愈117人。问新治疗方法是否比常规疗法的效果好,u5.394,单测u,0.05,1.64,22,3、两样本率的比较,(n,1,、n,2,均较大,p,1,和,1,p,1,、p,2,和,1,p,2,均不太小),23,例:为研究某职业人群颈椎病发病的性别差异,随机抽取了该职业人群男性120人和女性110人,发现男性中有36人患有颈椎病,女性中有22人患有颈椎病,试作统计推断,u1.745,2,3.0433,24,4、研究非遗传性疾病的家族集聚性,非遗传性疾病的家族集聚性,:指该疾病的发生在家族成员间是否有传染性。如果无传染性,即该种疾病无家族集聚性,家庭成员患病应是独立的。此时以家族为样本,在n个成员中,出现x个成员患病的概率分布呈二项分布;否则便不服从二项分布。,25,例:某研究者为研究某种非遗传性疾病的家族集聚性,对一社区82户3口人的家庭进行了该种疾病患病情况的调查,所得数据资料见下表。试分析其家族集聚性。,26,某病的患病资料,X,实际户数,(1),(2),0,26,1,10,2,28,3,18,合计,82,n=3,p=(026+110+228+318)/(823)=0.4878,如果该社区的此种疾病存在家族集聚性,则以每户3口人的家庭为样本,在3个家庭成员中出现X(=0,1,2,3)个成员患病的概率分布即不服从二项分布。,27,表 数据资料与二项分布拟和优度,2,检验,X,实际户数,概率P(X),理论户数,T-A,(T-A),2,(1),(2),(3),(4),(5),(6),0,26,0.13265,10.8774,-15.1226,228.6936,1,10,0.38235,31.3525,21.3525,455.9273,2,28,0.36735,30.1229,2.1229,4.5069,3,18,0.11765,9.6472,-8.3528,69.7690,合计,82,82.0000,(T-A),2,/T42.9483,组数2422,P(1)=C,3,1,0.4878,1,(1-0.4878),2,0.38235,28,练习:,已知某种常规药物治疗某种非传染性疾病的有效率为0.70。今改用一种新药治疗该疾病患者10人,发现9人有效。问新药的疗效是否优于常规药物?,P(9)+p(10)=0.149,29,