,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2019/2/3,#,单击此处编辑母版标题样式,2019/2/3,#,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,实例,2:,中国妇女生育水平的决定因素是什么,?,妇女生育水平除了受计划生育政策影响以外,还可能,与社会、经济、文化等多种因素有关。,1.,影响中国妇女生育率变动的因素有哪些?,2.,各种因素对生育率的作用方向和作用程度如何?,3.,哪些因素是影响妇女生育率主要的决定性因素?,4.,如何评价计划生育政策在生育水平变动中的作用?,5.,计划生育政策与经济因素比较,什么是影响生育率的,决定因素?,6.,如果某些地区的计划生育政策及社会、经济、文化,等因素发生重大变化,预期对这些地区的妇女生育,水平会产生怎样的影响?,第一节 相关分析的意义和任务,一、相关关系的概念,(,注意相关关系与函数关系的区别,),(,一,),函数关系,它,反映着现象之间存在着,严格,的依存关系,也就是具有,确定性,的对应关系,这种关系,可用一个数学表达式,反映出来。,例,如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的依存关系。,(,二,),相关关系,它,反映着现象之间的数量上,不严格,的依存关系,也就是说两者之间,不具有确定性,的对应关系,这种关系有二个明显特点:,1.,现,象之间,确实存在数量上的依存关系,,即某一社会经济现象变化要引起另一社会经济现象的变化;,2.,现,象之间的这种依存关系是,不严格,的,,即无法用数学公式,表示。,商品价格和商品销售量之间,存在着一定的依存关系,即商品价格发生变动,商品的销售量也会随之发生变动。,例,在,具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用,X,表示;发生对应变化的变量称因变量,一般用,y,表示。,1.,按,相关关系涉及的因素多少来分,可分为:单相关和复相关。,在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为,偏相关,。,二因素之间的相关关系称,单相关,,即只涉及一个自变量和一个因变量。,三个或三个以上因素的相关关系称,复相关,,或多元相关,即涉及二个或二个以上的自变量和因变量。,二、相关关系的种类,2.,按,相关关系的性质来分,可分为,:,正相关和负相关,正相关,是指两相关现象变化的方向是一致的。,负相关,是指两相关现象变化的方向是相反的。,3.,按,相关关系的形式来分,可分为:直线相关和曲线相关,直线相关,是指两个相关现象之间,当自变量,X,的数值发生变动时,因变量,y,随之发生近似于固定比例的变动,在相关图上的,散点近似地表现为直线形式,,因此称其为直线相关关系。,曲线相关,是指两个相关现象之间,当自变量,X,的数值发生变动时,因变量,y,也随之发生变动,但这种变动在数值上不成固定比例,在,相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,,因此称其为曲线相关关系。,4.,按,相关程度分,可分为:完全相关、不完全相关和不相关,完全相关,就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。,不相关,是指两现象之间在数量上的变化上各自独立,互不影响。,不完全相关,就是介于完全相关和不相关之间的一种相关关系。,相关分析的对象主要是不完全相关关系。,三、相关分析的任务和内容,相关分析的主要任务,概括起来是两个方面:,一方面,,研究现象之间关系的密切程度,即相关分析;,另一方面,,研究自变量与因变量之间的变动关系,用数学方程式表达,即回归分析。,相关分析的主要内容包括以下五个方面:,1.,判,断社会经济现象之间是否存在相互依存的关系,是直线相关,还是曲线相关,这是相关分析的出发点;,2.,确,定相关关系的密切程度;,3.,测,定两个变量之间的一般关系值;,4.,测,定因变量估计值和实际值之间的差异,用以反映因变量估计值的可靠程度;,5.,相,关系数的显著性检验。,第二节 简单线性相关分析,一、相关表和相关图,相关图,也称散布图,(,或散点图,),。,单变量分组表:指根据一个变量进行分组,另一个变量不进行分组,只计算次数和平均数。,(,实际应用最多,P331),双变量分组表:一般情况下很少使用,某市,1996,年,2003,年的工资收入与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。,从表可看出,随着工资收入的增加,城镇储蓄存款余额有明显的增长趋势。所以,资料表明,(,如图,),有明显的直线相关趋势。,序号,年份,工资收入,(,万元,)x,城镇储蓄存款余额,(,万元,)y,1,1996,500,120,2,1997,540,140,3,1998,620,150,4,1999,730,200,5,2000,900,280,6,2001,970,350,7,2002,1050,450,8,2003,1170,510,例,1,企业按销售额分组,(,万元,),流通费用率,(%),4,以下,9.65,4,8,7.68,8,12,7.25,12,16,7.00,16,20,6.86,20,24,6.73,24,28,6.64,28,32,6.60,32,36,6.58,例,2,二、相关系数,相,关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。一般用符号,r,表示。,r,的测定方法:,仍以上例,1,资料计算:,序,号,年,份,x,(,万元,),y,(,万元,),1,1996,500,120,-310,-155,96100,24025,48050,2,1997,540,140,-270,-135,72900,18225,36450,3,1998,620,150,-190,-125,36100,15625,23750,4,1999,730,200,-80,-75,6400,5625,6000,5,2000,900,280,90,5,8100,25,450,6,2001,970,350,160,75,25600,5625,12000,7,2002,1050,450,240,175,57600,30625,42000,8,2003,1170,510,360,235,129600,55225,84600,合计,6480,2200,-,-,432400,155000,253300,经过计算,表明该市工资性收入与城镇储蓄存款余额之间存在着高度正相关。,对,r,的解释如下:,(,即,r,的特点,),(1),r,取正值或负值决定于分子协方差;,(2),r,的绝对值,在,0,与,1,之间;,(3),r,的绝对值大小,可说明现象之间相关关系的紧密程度。,积差法公式进一步化简如下:,2.,简捷法,资料计算如下:,序号,年份,X,(,万元,),Y,(,万元,),x,2,y,2,xy,1,1996,500,120,250000,14400,60000,2,1997,540,140,291600,19600,75000,3,1998,620,150,384400,22500,93000,4,1999,730,200,532900,40000,146000,5,2000,900,280,810000,78400,252000,6,2001,970,350,940900,122500,339500,7,2002,1050,450,1102500,202500,472500,8,2003,1170,510,1368900,260100,596700,合计,6480,2200,5681200,760000,2035300,3.,从单变量分组表计算相关系数,(选学,),三、简单线性相关分析的特点,通过对,r,的计算方法的讨论,可看出二个明显特点:,2.,相,关关系中只能计算出一个相关系数,r,。,1.,相,关关系中,两个变量不必定出哪个是自变量,哪个是因变量,因此,相关的两个变量都是随机变量;,第三节 回归分析,在,回归分析中,两个变量之间的回归称为简单回归,两个以上变量之间的回归称为复回归。无论是简单回归还是复回归,数学模型均有线性,(,直线,),回归和非线性,(,曲线,),回归之分。,回归的,古典意义,高尔顿遗传学的回归概念,父母身高与子女身高的关系,:,无论高个子或低个子的子女,都有向人的平均身高回归的,趋势,回归的现代意义,一个因变量对若干解释变量依存关系的研究,回归的,目的,(实质),:,由固定的自变量去估计因变量的平均值,样本,总体,自变量固定值,估计因变量平均值,相关分析与回归分析的联系,共同的研究对象:都是对变量间相关关系的分析,只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义,相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析,相关分析中相关系数的确定建立在回归分析的基础上,一、直线回归,(,一,),简单直线回归分析,简,单直线回归方程的一般形式为:,y,c,=a+bx,y,c,因变量的估计值;,x,自变量;,a,回归直线在,y,轴上的截距;,b,回归直线的斜率,称回归系数,表明,x,每增加,一个单位,因变量,y,c,的,平均变化值,b0,,,x,与,y,为正相关,b0,,,x,与,y,为负相关,a,、,b,的确定:,在,简单直线回归方程中,,a,、,b,为待定系数,常用最小平方法来确定,即,(y-y,c,),2,=,最小值。,简单直线回归方程建立的步骤为:,确,定自变量,x,和因变量,y,;,计,算,x,、,y,、,x,2,、,xy,;,代,入公式,先求,b,,再求,a,。,仍用上例,1,资料得到:,y,c,=-199.5+0.5858x,表明该市工资收入每增加,1,万元,储蓄存款余额就增加,0.5858,万元。,举例说明,b(,回归系数,),在经济管理中的作用:,某企业的某种产品月产量与单位成本的关系呈直线关系,用直线回归方程表示是:,y,c,=77.36-1.818x,,其中,,x,表示月产量,(,千件,),y,表示单位成本,(,元,);,a=77.36(,元,),,表示生产这种产品在单位成本方面的条件(特征);,b=-1.818,,表示月产品每增加,1000,件,单位成本平均降低,1.818,元。,从单变量分组表配合回归直线,(选学,),简单直线回归分析的主要特点:,1.,直,线回归分析时,要根据研究目的,在两个变量之间确定哪个是自变量,哪个是因变量。,2.,在,两个现象互为根据的情况下,可以有两个回归方程:,y,c,=a+bx,称,y,倚,x,回归直线,x,c,=c+dy,称,x,倚,y,回归直线,(,二,),多元线性回归分析,多,元线性回归分析可以看作是一元线性回归分析的扩展。现以二元线性回归模型进行回归分析,其方程式为:,以我国,1973,1983,年,11,年手表销售量和手表价格的实际资料为例,拟合一元线性回归方程为:,y,c,=9643-65,x,此时,回归系数,b,表明,手表平均价格每降低,1,元,/,只,销售量约平均增长,65,万只。,一元线性回归模型只列入了手表平均价格对销售量的影响,而忽略了居民收入这一很重要的因素,因此,现对此资料补入同期居民人均货币收入资料,将原来的一元线性回归模型扩展为二元线性回归模型进行回归分析。,例,列成计算表如下:,年份,(n=11),手表销售量,y(,万只,),人均货币收入,x,1,(,元,),手表平均价格,x,2,(,元,/,只,),x,1,y,x,2,y,x,1,x,2,1973,650.4,102.1,134,66405.84,87153.6,13681.4,1974,758.4,105.3,134,79859.52,101625.6,14110.2,1975,819.9,110.1,129,90270.99,105767.1,14202.9,1976,1051.7,113.9,131,119788.63,137772.7,14920.9,