单击此处编辑母版标题样式,概率论、数理统计的区别,概率论:,研究随机现象统计规律的理论基础。,假定分布已知,或可以求出,,在此基础上研究随机变量,的性质、特点、数字特征、任意随机事件发生的概率。,数理统计:,随机现象统计规律的统计推断和应用。,一般分布未知,或分布形式已知,但含有未知参数,,在此前,提下根据样本信息对,X,的统计规律做出合理的统计推断。,概率论、数理统计的区别 概率论:研究随机现象统计规律的理论基,数理统计及其主要内容,主要内容:,1,、收集、整理数据资料,(,抽样调查,),2,、统计推断:,根据样本数据对,X,的统计规律做出推断,数理统计:,以概率论为理论基础,,根据试验或观察的数据,对,随机现象的客观规律性,做出种种合理的估计或推断,(,1,),(,非)参数估计:,点估计、区间估计,(,2,)假设检验:,均值、方差、单总体、两总体,(,3,)方差分析、回归分析,3,、实际应用:预测、,VaR,风险管理、质量检验控制,讲授,数理统计及其主要内容 主要内容:1、收集、整理数据资料(抽样,第六章 样本及抽样分布(约,4,学时),1,、(,13,节)随机样本,直方图,统计量,.1,学时,2,、三大抽样分布,.1,学时,4,、抽样分布,.2,学时,重点:三大抽样分布定义、查找分位数,正态总体样本均值、样本方差的主要性质,难点:总体、样本、统计量,第六章 样本及抽样分布(约4学时)1、(13节)随,主要内容(,1,学时),一、总体与个体。,二、随机样本(难点)。,三、(频率)直方图。,四、统计量(重点)。,第,1-3,节 随机样本,直方图,统计量,主要内容(1学时)一、总体与个体。第1-3节 随机样本直,1,、举例说明:,一、总体与个体,例,1,企业为了解生产的灯泡,平均使用寿命,.,使用寿命是一个随机变量,X,.,为求,E,(,X,),从产品中抽取部分进行寿命测试,根据测试数据对灯泡平均使用寿命作出推断,.,例,2,要了解某城市居民的日常生活消费水平,.,消费水平是一个随机变量,设为,Y,从居民中抽取一部分,进行消费水平调查,再根据调查数据对所有居民的,平均消费水平,E,(,Y,),消费水平与均值的偏离程度,D,(,Y,),作出推断,.,例,1,的,使用寿命,、例,2,的,消费水平,即为总体。,通过样本推断,1、举例说明:一、总体与个体 例 1企业,2,、总体与个体的,概念,说明:,总体:随机现象的某一数量指标的全体可能观测值,。,个体:总体中的每一种可能观测值。,(1),总体是由许多具有共同性质的元素组成:,数量指标、可相同,(2),总体对应一随机变量,X,每一个体是,X,的一个可能取值,.,总体用字母,X,Y,Z,表示,.,总体的分布即,X,的分布,,不区分,(3),总体分类:,有限总体、,无限总体,(,容量无限,或容量很大,),(4),一个随机现象可能对应多个总体。,2、总体与个体的概念 说明:总体:随机现象的某一数量指标的全,3,、具体,例子,(2),某大学同学的健康状况(用身高、体重、血型评价)。,血型:总体,Z(A=1,B=2,AB=3,O=4),(3),上市公司经营绩效。,每股收益:,总体,X,净资产收益率,:总体,Y,EPS,增长率:,总体,Z,(1),某工厂生产的,灯泡寿命,:,总体,X,身高:总体,X,体重:,Y,3、具体例子(2)某大学同学的健康状况(用身高、体重、血型,1,、样本及其容量,现实中,总体的分布一般未知,或者分布已知,但含有未知参数。从总体中抽取,样本,,根据,样本信息,推断总体的分布,样本:从总体,X,中抽取的部分个体。,二、随机样本(难点),样本容量:样本中包含的个体个数。,1、样本及其容量现实中,总体的分布一般未知,或者分布已知,但,2,、简单随机样本、样本观察值,说明:,样本,如何抽取样本?无限总体:,不放回抽样,。,有限总体:,放回抽样,,nN,时不放回,。,2、简单随机样本、样本观察值说明:样本如何抽取样本?,例如:研究某工厂生产的灯泡寿命(总体,X,)分布。,例如:研究某工厂生产的灯泡寿命(总体X)分布。,3,、样本的分布函数,统计推断的任务,:,对,从总体抽取的简单随机样本进行适当整理,由样本的分布规律近似地推断总体的分布规律,.,3、样本的分布函数统计推断的任务:,随机样本直方图统计量课件,随机样本直方图统计量课件,三、(频率)直方图,为分析样本数据的统计规律,将样本数据整理,,频率直方图,基本方法:样本分组、确定组距、确定组限、统计频率、直方图,过程:,(,1,)确定样本分组数,k,通常组数,5-10,组,组数主要取决于样本容量。,样本容量,n50,,组数增加。,本例,k=5,三、(频率)直方图为分析样本数据的统计规律,将样本数据整理,,(,2,)确定各组组距,d,各组区间长度:组距。一般各组组距相同(也可不同),方便起见,取,d=10,(,3,)确定每组组限,分组区间:,(147,157,(157,167,(167,177,(177,187,(187,197,(2)确定各组组距d各组区间长度:组距。一般各组组距相同(也,(,4,)统计频数频率,统计样本数据落入各区间的个数,(,频数,),,计算相应区间的频率,组序,分组区间,组中值,频数,频率,累计频率,(%),1,2,3,4,5,(147,157,(157,167,(167,177,(177,187,(187,197,152,162,172,182,192,4,8,5,2,1,0.2,0.4,0.25,0.1,0.05,20,60,85,95,100,合计,20,1,组中值,=(,组上限,+,组下限,)/2,:,近似代表该组的变量取值,(4)统计频数频率统计样本数据落入各区间的个数(频数),计算,作法:横坐标代表,X,取值区间、纵坐标表示频率,(,或频数),频数频率直方图演示,(,5,)频率直方图,作法:横坐标代表X取值区间、纵坐标表示频率(或频数)频数频率,1,、统计量,样本是统计推断的基础。但在应用时,一般不直接用样本本身推断总体的分布,而是,利用样本构造适当的函数,(,统计量,),,通过统计量对总体的分布进行统计推断,。,四、统计量(重点),1、统计量样本是统计推断的基础。但在应用时,一般不直接用样本,2,、常用统计量,(,1,)样本均值,:,2、常用统计量(1)样本均值:,(,2,)样本方差及标准差,:,(2)样本方差及标准差:,(,3,)样本,k,阶矩、,k,阶中心矩,:,(3)样本k阶矩、k阶中心矩:,随机样本直方图统计量课件,本节重点总结,一、随机样本。,二、常用统计量。,本节重点总结一、随机样本。,第二节,三大抽样分布,1,、分布,2,、,t,分布,3,、,F,分布,第二节 三大抽样分布1、分布,说明:,统计量是样本的函数,是,随机变量,,有其概率分布,统计量的分布称为,抽样分布,.,要求,:了解,分布,、,t,分布、,F,分布的定义,及来自正态总体,X,的样本均值的分布等常见统计量的分布。,会,查,分布,、,t,分布、,F,分布的上,分位数,。,说明:统计量是样本的函数,是随机变量,有,一、卡方分布(),分布,1,、定义(重点),说明,:,一、卡方分布()分布1、定义,2,、概率密度及其图形,5 10 15 20,分布图形:,2、概率密度及其图形5 10,3,、主要特征:,3、主要特征:,4,、上侧分位数(重点),说明:,4、上侧分位数(重点)说明:,随机样本直方图统计量课件,随机样本直方图统计量课件,二、,t,分布(,student,分布),1,、定义(重点),即,n,充分大时,,t,分布以标准正态分布为极限分布,.,二、t分布(student分布)1、定义(重点)即n充分大时,(,1,)图形特征,2,、主要特征:,(,2,)数字特征,(1)图形特征2、主要特征:(2)数字特征,3,、上侧分位点(重点),说明:,3、上侧分位点(重点)说明:,随机样本直方图统计量课件,三、,F,分布,1,、定义(重点),三、F分布1、定义(重点),2,、主要性质,2、主要性质,3,、上侧分位点(重点),说明:,3、上侧分位点(重点)说明:,随机样本直方图统计量课件,