资源预览内容
第1页 / 共31页
第2页 / 共31页
第3页 / 共31页
第4页 / 共31页
第5页 / 共31页
第6页 / 共31页
第7页 / 共31页
第8页 / 共31页
第9页 / 共31页
第10页 / 共31页
第11页 / 共31页
第12页 / 共31页
第13页 / 共31页
第14页 / 共31页
第15页 / 共31页
第16页 / 共31页
第17页 / 共31页
第18页 / 共31页
第19页 / 共31页
第20页 / 共31页
亲,该文档总共31页,到这儿已超出免费预览范围,如果喜欢就下载吧!
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,数理统计的基本概念,1,从本章起,我们转入课程的第二部分,数理统计学,。数理统计学与概率论是两个有密切联系的姐妹学科。大体上可以说,概率论是数理统计学的基础,而数理统计学是概率论的重要应用.,数理统计学是一门关于数据资料的收集、整理、分析和推断的科学。但人们常常将统计这一概念误解为大量数据的收集以及对这些数据作一些简单的运算(如求和、求平均值、求百分比等),或用图表、表格等形式把它们表示出来。其实这些工作仅仅是统计学工作的非主要部分,统计学还包括怎样设计试验、采集数据以及怎样对获得的数据进行分析、推断等其它许多工作。,2,数理统计的方法及考虑的问题不同于一般的资料条件,它更侧重于应用随机现象本身的规律性来考虑资料的收集、整理和分析,从而找出相应的随机变量的分布律或数字特征。从理论上讲,只要对随机现象进行足够多次的观察,被研究的随机现象的规律性一定能清楚地呈现出来,但实际上所允许的观察永远只能是有限次的,有时甚至是少量的,因此我们关心的问题是怎样有效地利用有限的资料,尽可能作出精确而可靠的结论。,根据问题的不同要求以及对观察值所采取的不同处理方法,就产生了数理统计的各个分支:,参数估计、假设检验、方差分析、回归分析,等。,3,第一节 随机样本,一、总体与个体,二、随机样本的定义,三、统计学的主要内容,四、小结,4,一、总体与个体,1.,总体,试验的全部可能的观察值称为总体,.,在研究2000名学生的年龄时,这些学生的年龄的全体就构成一个总体,每个学生的年龄就是个体.,2.,个体,总体中的每个可能观察值称为个体,.,实例,1,5,某工厂10月份生产的灯泡寿命所组成的总体中,个体的总数就是10月份生产的灯泡数,这是一个有限总体;而该工厂生产的所有灯泡寿命所组成的总体是一个无限总体,它包括以往生产和今后生产的灯泡寿命.,3.,有限总体和无限总体,实例,2,当有限总体包含的个体的总数很大时,可近似地将它看成是无限总体.,6,4.,总体分布,在2000名大学一年级学生的年龄中,年龄指标值为“15”,“16”,“17”,“18”,“19”,“20”的依次有9,21,132,1207,588,43 名,它们在总体中所占比率依次为,实例,3,即学生年龄的取值有一定的分布.,7,一般地,我们所研究的总体,即研究对象的某项数量指标,X,其取值在客观上有一定的分布,X,是一个随机变量.,总体分布的定义,我们把数量指标取不同数值的比率叫做总体分布,.,如,实例,3,中,总体就是数集 15,16,17,18,19,20.,总体分布为,8,二、随机样本的定义,1.,样本的定义,9,2.,简单随机抽样的定义,获得简单随机样本的抽样方法称为简单随机抽样,.,根据定义得:,10,解,例,4,11,解,例,5,12,13,三、统计学的主要内容,1.抽样理论:介绍如何收集数据。主要抽样方法,,样本容量的确定,抽样误差,敏感问题等,2.参数估计:如何根据数据得到总体参数的信息,,点估计、区间估计等,3.假设检验:如何对关于总体的一些假设做出决策,,正态总体参数的检验,分布拟合检验,,统计决策等理论,14,4.方差分析与回归分析:变量之间的效应关系。,方差分析 分类变量与数值变量的效应关系,回归分析 研究数值变量之间的效应关系,5.多元分析:研究若干个变量之间的关系,聚类分析、判别分析、主成分分析、,因子分析、典型相关分析等等,15,问题一:希望了解某个城市的家庭月支出情况。,解决方法:从这个城市里,随机地,调查,有代表性的,一些,家庭,根据收集到的数据去得出这个城市家庭每个,月支出费用的有关信息。,1.如何得到样本?,各个阶层的比例应该各占多少?样本容量,n,应该取多少才合适?被调查者拒绝调查怎么办?,抽样调查,内容介绍,16,2.如何确定总体的分布?,这里的总体是这个城市的家庭月支出费用,,我们不妨认为,家庭月支出费用,是一个服从正态,分布的随机变量。,根据经验或者是所讨论的问题的实际背景,,总体的分布类型一般可以事先确定下来。,(不同的城市对应的期望、方差也就不相同),即,总体随机变量,X,N,(,2,),,而这个,城市相应的两个参数,与,2,是未知的。,17,注意:当不知道或者不好确定总体的分布类型时,,在统计学中常常采用下面两种办法来近似得到,总体分布的有关信息。,(1).直方图的方法,只适用于连续总体,得到的是总体密度函数的近似。,把收集到的,n,个数据,x,1,,,x,2,,,,,x,n,从小到大排列:,x,(1),x,(2),x,(,n,),;,其次取区间(,a,,,b,),,包含全部数据,a,x,(1),,,x,(,n,),b,;,18,把 (,a,,,b,),等分成,若干小区间,计算,每个小区间中包含,的数据的频率。,x,(1),x,(,n,),根据这些频率做出相应的小区间上的矩形,则,当,n,充分大时,这些小区间上矩形的面积将近似于,总体的概率密度函数下曲边梯形的面积。,19,(2).经验分布函数的方法,构造一个分布函数,得到的是总体分布,函数,F,(,x,),的近似。,E,n,(,x,)=,0,,x,x,(1),,,x,(,k,),x,x,(,k,+1),1,,x,x,(,n,),这是一个非降、右连续的函数,实际上是观察值,x,1,,,,,x,n,中不大于,x,的频率,即,E,n,(,x,),=,x,1,,,,,x,n,中不大于,x,的个数/,n,k,n,20,O,x,y,x,(1),x,(2),x,(3),1/,n,2/,n,可以证明,经验分布函数,E,n,(,x,),将依概率,收敛到,F,(,x,)。,21,3.如何从样本得出总体的信息?,样本是一组与总体独立、同分布的随机变量,,我们得到的数据是样本观察值,而不是样本。,调查一个家庭得到了一个数据,相当于对总体,分布做了一次随机试验而观察到了这个随机变量的,具体取值。,一共有,n,个数据,相当于对总体分布做了,n,次,独立重复试验,而得到了这个总体随机变量在这些,试验中的具体取值。,22,利用样本观察值去估计出总体的未知参数,直观上,可以利用调查到的,n,个家庭的月支出,x,1,x,2,x,n,的算术平均:,去估计这个城市的平均家庭月支出费用,。,为什么可以这么做?它的合理性在哪?,还有没有其它的办法?,这些不同的方法各有什么样的优缺点?,数理统计学最重要的内容之一,参数估计,23,事先提出一个假设,利用样本观察值去检验,这个假设是否可以被接受,假设检验,比如说,当地政府要制定有关的一些政策,如,税收、社会保障措施等;或者是外地的企业与公司,要进入这个城市的市场,面临的产品定位等等。,共同关心的一些问题,比如说:,0,?,这里,0,是一个已知的常数。,数理统计学最重要的内容之一,24,应该如何去做这个检验?,一种想法是,既然已经通过,参数估计,得到了这个,城市的月平均支出,(,也就是总体的参数,)的估计值,,自然就可以用它代替假设里的,去做检验:,当估计值比,0,大,就接受这个假设,否则就拒绝,但是这样做的风险很大:样本总是随机得到的,因,此估计值与真实值之间不可避免地存在着随机误差。,一般的做法是,给出一个区域(拒绝域),如果估计,值落在这个区域内,就拒绝原来的假设,否则就接受。,25,除了对总体参数的检验外,还有一些重要的,假设检验问题,例如:,关于总体分布的检验,检验得到的样本数据是不是来自于某个事先给出的总体,独立性的检验,检验一些分类变量之间是否是独立的,例如:,抽烟与肺癌,睡觉打鼾与心脏病,分布拟合检验,26,关于数据差异的检验,主要希望了解两组或多组数据之间的差异究竟,是来自于随机性,还是总体间的确存在差异?,例如:,小儿麻痹症疫苗的研制,,越战期间美国的征兵计划,,27,讨论数值变量之间的效应关系问题,比如说,想了解月支出与月收入之间的关系。,在每个被调查的家庭中同时获得这两个变量的,观察值,分析它们是否有某种(函数)关系,,一元线性回归,多元线性回归,例如,月支出与:月收入、年龄、人口、,住房面积,等等是否有关?关系如何?,数理统计学的重要应用之一,回归与相关分析,28,讨论分类变量与数值变量之间的关系,比如说,想了解月支出与居住地点之间的关系。,是否居住地附近有大型超市的市民平均月消费偏高?,如果偏高,这种差异是否是纯属偶然原因,,单因素方差分析,数理统计学的重要应用之一,方差分析,双因素方差分析,希望了解居住地点和职业这两个因素联合对于支出,的关系。各自单独是否有影响?交互效应如何?,29,简单的说,从概率论的角度出发,,可以把上述数理统计学的过程理解成:,有一个含有未知信息的概率分布,F,针对,F,做了,n,次独立重复的试验与观察,,得到,n,个独立同分布于,F,的随机变量的取值,根据样本的具体观察值,去推断出总体,F,所包含的未知信息,或作出进一步的决策等,30,四、小结,个体 总体,有限总体,无限总体,基本概念:,说明,1,一个总体对应一个随机变量,X,我们将不区分总体和相应的随机变量,统称为总体,X,.,说明,2,在实际中遇到的总体往往是有限总体,它对应一个离散型随机变量;当总体中包含的个体的个数很大时,在理论上可认为它是一个无限总体.,随机样本,31,
点击显示更多内容>>

最新DOC

最新PPT

最新RAR

收藏 下载该资源
网站客服QQ:3392350380
装配图网版权所有
苏ICP备12009002号-6