,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,计量经济学讲义,*,2024/11/20,计量经济学讲义,1,第,6,章:双变量线性回归,2024/11/20,计量经济学讲义,2,本章主要内容,双变量线性回归模型:,回归的含义,总体回归函数,随机误差项的性质和设定,参数估计,-,普通最小二乘法,参数最小二乘估计量的统计性质,(小结),2024/11/20,计量经济学讲义,3,复习:,计量经济学“四大过程”,模型设计:,理论假说,理论模型,计量模型,模型估计:,数据,估计方法,模型检验:,经济,统计,计量,模型应用:,预测,制定政策,2024/11/20,计量经济学讲义,4,复习:,计量模型“四个要素”,Y=,1,+,2,X+u,3,、方程式,4,、随机扰动项,2,、参数,1,、变量,2024/11/20,计量经济学讲义,5,(,2,)、回归与相关,相关分析就是用来测度变量之间的线性关联程度的一种分析方法。,回归分析并不对变量之间的关系感兴趣,主要是通过自变量的设定值来估计或预测因变量的平均值,同时对经济理论建立的假设进行检验。,2024/11/20,计量经济学讲义,6,2024/11/20,计量经济学讲义,7,回归的几个基本概念,回归分析,(regression analysis),是研究一个变量关于另一个(些),变量的具体依赖关系的计算方法和理论,。,其用意,:,在于通过后者的已知或设定值,去估计和(或)预,测前者的(总体)均值,。,这里:前一个变量被称为,被解释变量,(,Explained Variable,),或,因变量,(,Dependent Variable,),,后一个(些)变量被称为,解,释变量,(,Explanatory Variable,),或,自变量,(,Independent Variable,)。,2024/11/20,计量经济学讲义,8,2,、总体回归函数,总体回归函数(,PRF:Population Regression Function,),E(Y|X,i,)=f(X,i,),例如,Y,i,=b,0,+b,1,X,i,+u,回归直线上的点可表示为:,E(YXi)=b,0,+b,1,X,i,2024/11/20,计量经济学讲义,9,总体回归曲线,2024/11/20,计量经济学讲义,10,总体回归函数释义,E(YX,i,),意为:在给定,X,值的条件下,Y,值分布的均值,即回归。,这就是,Y,的条件期望(,conditional expectation,)或条件均值(,conditional expected value),。,意味着,Y,依赖于,X,,一般称之为,Y,对,X,的函数。一般称为,Y,对,X,的回归。,换句话说,总体回归直线经过,Y,的条件期望值。,2024/11/20,计量经济学讲义,11,回归系数,b,0,,,b,1,为参数,parameters,也称回归系数(,regression coefficients),b,1,为截距,(intercept);b,0,为斜率(,slope),u,i,是随机误差项(,stochastic,random error term),或随机干扰项。其值不能先验地知道。通常用概率分布来描述。,2024/11/20,计量经济学讲义,12,条件分布,条件分布:以,X,取定值为条件的,Y,的条件分布,注:给定收入,X,,支出,Y,并不确定,而是取不同的值。,问:给定收入,X,,支出,Y,取什么值?,例:给定,X=80,,,Y,取,5,个不同的值:,55,、,60,、,65,、,70,、,75,2024/11/20,计量经济学讲义,13,条件概率,条件概率:给定,X,的,Y,的概率,记为,P(Y|X),。,已知给定,X=80,,,Y,取,5,个不同的值:,55,、,60,、,65,、,70,、,75,。问:,Y,取每个值的概率有多大?,古典概率模型:取每个值的概率相等。因此有:,P(Y=55|X=80)=1/5,;,P(Y=60|X=80)=1/5,;,P(Y=65|X=80)=1/5,;,P(Y=70|X=80)=1/5,;,P(Y=75|X=80)=1/5,;,2024/11/20,计量经济学讲义,14,条件期望,问:给定,X,,,Y,可以取不同的值,那么,这些值平均起来是多少?,条件期望(,conditional Expectation,):给定,X,的,Y,的期望值,记为,E(Y|X,i,),。,例如,,E(Y|X=80)=551/5,601/5,651/5,701/5,751/5,65,注:条件均值条件期望,称条件期望是为了表示它是总体的平均值。习惯上,看到“期望”一般指的是总体的平均值;看到“均值”一般指的是样本的平均值。应该注意区分二者的含义。,2024/11/20,计量经济学讲义,15,总体回归曲线,思考:给定一个,X,,就对应一个(唯一的),E(Y|X),。因此,(,X,,,E(Y|X),)可以表示成平面上的一个点。,总体回归曲线(,Popular Regression Curve,):,Y,的条件均值的轨迹。即,Y,对,X,的回归。,总体回归曲线的几何意义:当解释变量给定值时因变量的条件期望值的轨迹。,2024/11/20,计量经济学讲义,16,条件均值,条件均值,80 140 220 X,E(Y|X,i,),Y,149,101,65,2024/11/20,计量经济学讲义,17,总体回归函数(,PRF,),因为每个,X,i,对应唯一的一个,E(Y|X,i,),,所以,E(Y|X,i,),是,X,i,的函数。将此函数称为:,总体回归函数(,PRF:Population Regression Function,),E(Y|X,i,)=f(X,i,)(1),当,PRF,的函数形式为线性函数,则有,,E(Y|X,i,)=,1,+,2,X,i,(2),其中,1,和,2,为未知而固定的参数,称为回归系数。,1,和,2,也分别称为截距和斜率系数。,上述方程也称为线性总体回归函数。,2024/11/20,计量经济学讲义,18,6.4,随机误差项的性质及其来源,1,、变量的省略。由于人们认识的局限不能穷尽所有的影响因素或由于受时间、费用、数据质量等制约而没有引入模型之中的对被解释变量有一定影响的自变量。,2,、统计误差。数据搜集中由于计量、计算、记录等导致的登记误差;或由样本信息推断总体信息时产生的代表性误差。,3,、模型的设定误差。如在模型构造时,非线性关系用线性模型描述了;复,wwaz,杂关系用简单模型描述了;此非线性关系用彼非线性模型描述了等等。,4,、随机误差。被解释变量还受一些,不可控制的众多的、细小的偶然因素的影响,2024/11/20,计量经济学讲义,19,4,、总体与样本,总体是我们研究的目的,但是不能知道总体的全部数据,用总体中的一部分(样本)来推断总体的性质。,总体,样本,样本,样本,2024/11/20,计量经济学讲义,20,4,、样本回归函数(,SRF,),两个随机样本,对应给定的每个,X,i,只有一个,Y,值,问:能从样本数据中估计出,PRF,吗?,样本数据一 样本数据二,X,Y,1,49,2,65,3,44,10,29,X,Y,1,51,2,47,3,46,10,30,2024/11/20,计量经济学讲义,21,样本回归线与总体回归线,比较两条样本回归线,SRF1,和,SRF2,(假定,PRF,是直线),问哪条样本线代表“真实”的总体回归线?,SRF1,PRF,SRF2,Y,X,2024/11/20,计量经济学讲义,22,2024/11/20,计量经济学讲义,23,2024/11/20,计量经济学讲义,24,样本回归函数,估计量(,Estimator,):一个估计量又称统计量,是指一个规则、公式或方法,是用已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值称为估计值。,2024/11/20,计量经济学讲义,25,比较,PRF,和,SRF,2024/11/20,计量经济学讲义,26,样本回归线的几何意义,X,i,X,i,u,i,Y,E(Y|X,i,),E(Y|X,i,),i,Y,i,2024/11/20,计量经济学讲义,27,样本回归线的几何意义,2024/11/20,计量经济学讲义,28,“,线性”的含义,“,线性,”,可作为两种解释:对变量的线性和对参数的线性。本课,“,线性,”,回归一词总是指对参数,为线性的一种回归(即参数只以它的,1,次方出现)。,模型对参数为线性?,模型对变量为线性?,是,不是,是,LRM,LRM,不是,NLRM,NLRM,LRM=,线性回归模型;,NLRM,=,非线性回归模型,2024/11/20,计量经济学讲义,29,线性回归的特殊含义,:,2024/11/20,计量经济学讲义,30,6.6:“,线性”特殊含义:,一解释变量的线性,:,是被解释变量,y,与解释变量,x,之间为线性关系,即解释变量,x,仅以一次方的形式出现在模型之中。用数学语言表示为:,二是被解释变量,x,与参数 之间为线性关系,即参数,仅以一次方的形式出现在模型之中。用数学语言表示为:,在经济计量学中,我们更关心被解释变量,y,与参数 之,间的线性关系。因为只要被解释变量,y,与参数 之间,2024/11/20,计量经济学讲义,31,为线性关系,即使被解释变量,y,与解释变量,x,之间不为,线性关系,我们也可以通过变量替换方便地将其化为,线性。例如,模型就属于被解释变量,y,与解释变量,x,之间不为线性关系的情形,如果我们令,,此时非线性模型 就变成线性,模型 了。,三、一元线性回归模型中随机项的假定,在给定样本观测值(样本值),,1,2,3,n,后,为,了估计(,2.1.5,)式的参数 和 ,必须对随机项做出,某些合理的假定。这些假定通常称为古典假设。,2024/11/20,计量经济学讲义,32,“,线性”的含义,Y=,1,+,2,X+u,是线性的!,lnY=,1,+,2,lnX+u,也是线性的!,Y=,1,ln(,2,X+u,)不是线性的!,2024/11/20,计量经济学讲义,33,2024/11/20,计量经济学讲义,34,方程组(,*,)称为,正规方程组,(,normal equations,),。,(2.2.3),(2.2.4),2024/11/20,计量经济学讲义,35,记,上述参数估计量可以写成:,称为,OLS,估计量的,离差形式,(,deviation form,)。,由于参数的估计结果是通过最小二乘法得到的,故称为,普通,最小二乘估计量,(,ordinary least squares estimators,2024/11/20,计量经济学讲义,36,由最小二乘法确定的一元线性回归方程,有以下性质:,1,、它是由所选取的样本唯一决定的。即对于一个给定,的样本,只能估计出一个 ,但对于不同的样本,,估计出的 可能不相等,即它们是服从某种分布的,随机变量。,2,、残差的均值为零,即,3,、残差 的大小无关,进而与 的大小无关,,即,4,、由 知,。说明回归直线 通过样本的平均点()。,2024/11/20,计量经济学讲义,37,2024/11/20,计量经济学讲义,38,