,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,概率数理统计,概率数理统计概率数理统计抽样分布统计推断从样本中推断总体,主要目标:归纳和预测,统计量的概率分布称为抽样分布,总体大小,样本容量,选择样本的方法,例:依据 的抽样分布对参数 做出推断,通过阅读报刊,我们能增长见识,扩大自己的知识面。,抽样分布,统计推断从样本中推断总体,主要目标:归纳和预测,统计量的概率分布称为抽样分布,总体大小,样本容量,选择样本的方法,例:依据 的抽样分布对参数 做出推断,重要统计量,统计量:由随机变量组成的一随机样本的函数,不含任何未知参数,样本均值,描述样本中心趋势,样本方差,描述样本的波动性,n,阶原点矩,均值的抽样分布,样本容量为,n,的 的抽样分布,实验不断重复(样本容量为,n,),产生多次的值时的一个分布,描述样本在总体均值,附近的平均变化,n,个随机样本来自,N,(,2,),总体,N,(,2,/,n,),S,2,的抽样分布,S,2,统计量,引入:,分布,定义:,X,1,X,2,X,n,i.i.d,N,(0,1),随机变量,所服从的分布为自由度为,n,的卡方分布,也就是,(n/2,)分布,其密度函数为:,n=1,n=4,n=10,n=15,卡方分布特性,自由度为,n,的卡方分布:,=,n,2,=2,n,卡方分布的可加性,推论:,X,1,X,2,X,n,i.i.d,N,(,2,),随机变量,服从自由度为,n,的卡方分布。,Fisher(费歇尔)定理,如果,S,2,是,x,i,N,(,2,)的样本方差统计量,且 与,S,2,相互独立,则随机变量,样本 ,N,(,2,/n,),实际中没有已知的,值,只能通过,S,进行估计,考察统计量:,引入,t,分布,t,分布(学生氏分布),定义:,X,N,(0,1),Y,2,(,n,),且,X,与,Y,相互独立,称随机变量,所服从的分布为自由度为,n,的,t,分布,,t,t,(n),密度函数为:,t,分布特性,n,=1时,,E,(,t,)不存在,n,2时,,E,(,t,)=0,n,时(,n,45),,t,分布趋向于标准正态分布,n=1,n=5,n=60,n=10,结论:,X,1,X,2,X,n,i.i.d,N,(,2,),随机变量,为符合自由度为,n,-1的,t,分布。,t,分布被大量用于总体均值的推断、样本比较等问题上,F,分布(方差比分布),定义:,X,2,(,n,),,Y,2,(,m,),且,X,与,Y,相互独立,称随机变量,所服从的分布为自由度为(,n,m,)的,F,分布,,F,F,(,n,m,),F,分布的密度函数,(1,10),(5,10),(10,10),(60,10),用于比较多种类型的样本方差问题,如:比较样本是否来源于不同总体,分布的分位数,在统计推断时,需要知道给定概率下,对应随机变量的取值。,定义:,设,X,是随机变量,0,1,若实数,Z,满足,则称Z,为,X,的,分位点。,p,分位点可以由分布表查得,第二章 样本估计,抽样估计,点估计,极大似然估计,最小二乘法,区间估计,统计推断,主要方法,经典方法和贝叶斯方法,估计,例1:通过随机抽样的100名投票者的意见来估计支持某位候选人的投票者的比例,例2:通过随机抽样,估计整批产品的次品率,假设检验,例:假设A的支持率比B高,通过适当的检验后,验证推翻这个假设,点估计方法,要求,估计的,“,误差,”,应较小,当,n,较大时,估计的,“,精度,”,应较高,常用的点估计:,矩估计法,极大似然估计法,最小二乘估计法,极大似然估计,基本思想:,一个随机试验有很多可能结果,如果在一次试验中,某结果发生了,则认为该结果,(,事件,),发生的可能性最大。,Fisher,极大似然估计,例:,一老战士与一新同学一同进行射击训练,每人打了一枪,结果有一枪中靶,.,试问这一枪是谁打中的?,分析:,按照,Fisher,的极大似然思想,应该认为是老战士打中的较合理。,定义:,设 是总体 的样本,令,若存在统计量 使得:,称 为,似然函数,则称 为 的,极大似然估计,简记为,MLE,Maximum Likelihood Estimation,估计量的评选标准,均值估计:选择,样本均值,还是,中位数,?,选择标准:,无偏性标准、有效性标准,定义:若估计量,的数学期望,存在,且 有,则称 为,的,无偏估计,,否则称为,有偏估计,。,称:,为估计量 的偏差,样本,x,i,N,(,2,),样本均值 ,样本方差,极大似然估计,ML,=,可以证明:,,,S,2,是无偏估计,ML,、,2,ML,本身符合高斯分布,无偏估计,有偏估计,,N ,,渐进无偏,偏差可以忽略,有效估计,定义:,某种参数,所有可能的无偏估计量,其中最小方差的估计量是,的最有效估计量,的三个估计量中,,1,和,2,是无偏的,,1,的方差小于,2,的方差,因此更有效。,作业,1.证明:自由度为,n,的卡方分布,(n/2,)分布,2.证明统计量样本均值、样本方差分别是,,,2,的无偏估计,3.根据所给的资料,学习掌握常用分布(正态分布、卡方分布、,t,分布和,F,分布)的绘制方法,回归(Regression)问题,Fit the data using a polynomial function,y,(,x,w,),is a nonlinear function of,x,It is a linear function of the coefficients,w,可以转化为多元线性回归问题求解,确定参数,最小二乘法:,计算值与观测值之间的误差的平方最小,误差函数,The error function corresponds to(one half of)the sum of the squares of the displacements(shown by the vertical green bars)of each data point from the function,y(x,w).,.,残差图,一元线性函数,t,=,w,0,+,w,1,x,min,Gaussian,(1777-1855),数学王子,数学成就比肩牛顿、阿基米德,德国著名数学家、物理学家、天文学家、大地测量学家,高斯的成就遍及数学的各个领域,在数论、非欧几何、微分几何、超几何级数、复变函数论以及椭圆函数论等方面均有开创性贡献。他十分注重数学的应用,并且在对天文学、大地测量学和磁学的研究中也偏重于用数学方法进行研究。,最重要贡献:,算术研究,精品课件,!,精品课件,!,费歇尔,Fisher,Ronald Aylmer(1890.2.171962.7.29),英国统计与遗传学家,现代统计科学的奠基人之一。,在遗传学的研究中,不断发展其变异数分析理论,他在,1925,所著,研究工作者的统计方法,影响力超过半世纪,遍及全世界。,巨著,天择的遗传理论,说明孟德尔的遗传定律与达尔文的理论相辅相成,认为演化的驱力主要来自选择的因素远重於突变的因素。这本著作将统计分析的方法带入演化论的研究,为解释现代生物学的核心理论打下坚实的基础。,谢谢大家!,谢谢大家!,