单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,面板数据模型与,stata,软件的应用,一、什么是面板数据,二、面板数据模型的优势,三、面板模型的估计方法:,FE,和,RE,四、,stata,软件简介,五、如何用,stata,估计面板模型:案例分析,炙馈釉矾萌支敬丘竭徒雹泵厚帮科铺点溅赐出来榨鼻规镁挤泛丙捆停帕惟面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,一、面板数据类型,时间维度,+,截面维度,如我们在分析中国各省份的经济增长时,共有,31,个截面,每个截面都取,1979-1998,共,20,年的数据,共有,620,个观察值,这是一个典型的平行面板数据,上市公司财务数据,研究一段时期内(,1998-2008,)上市公司股利的发放数额与股票账面价值之间的关系,共有,20 11=220,个观测值,强调经济理论基础、强调微观行为基础,候碧颤睦妙狠疟园钳疟暑歹烟馈周搪絮耍衙吵洲噪枯口耗姿而缮苇少蒲抉面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,表,1 1996-2002,年中国东北、华北、华东,15,个省级地区的居民家庭人均消费数据(不变价格),地区人均消费,1996,1997,1998,1999,2000,2001,2002,CP-AH,(安徽),3282.466,3646.150,3777.410,3989.581,4203.555,4495.174,4784.364,CP-BJ,(北京),5133.978,6203.048,6807.451,7453.757,8206.271,8654.433,10473.12,CP-FJ,(福建),4011.775,4853.441,5197.041,5314.521,5522.762,6094.336,6665.005,CP-HB,(河北),3197.339,3868.319,3896.778,4104.281,4361.555,4457.463,5120.485,CP-HLJ,(黑龙江),2904.687,3077.989,3289.990,3596.839,3890.580,4159.087,4493.535,CP-JL,(吉林),2833.321,3286.432,3477.560,3736.408,4077.961,4281.560,4998.874,CP-JS,(江苏),3712.260,4457.788,4918.944,5076.910,5317.862,5488.829,6091.331,CP-JX,(江西),2714.124,3136.873,3234.465,3531.775,3612.722,3914.080,4544.775,CP-LN,(辽宁),3237.275,3608.060,3918.167,4046.582,4360.420,4654.420,5402.063,CP-NMG,(内蒙古),2572.342,2901.722,3127.633,3475.942,3877.345,4170.596,4850.180,CP-SD,(山东),3440.684,3930.574,4168.974,4546.878,5011.976,5159.538,5635.770,CP-SH,(上海),6193.333,6634.183,6866.410,8125.803,8651.893,9336.100,10411.94,CP-SX,(山西),2813.336,3131.629,3314.097,3507.008,3793.908,4131.273,4787.561,CP-TJ,(天津),4293.220,5047.672,5498.503,5916.613,6145.622,6904.368,7220.843,CP-ZJ,(浙江),5342.234,6002.082,6236.640,6600.749,6950.713,7968.327,8792.210,僵避弊瞬畅媒洒速孵个滇苹盅呵斟种鹏琐吹盎牵众褒歌频嘴矢宗喷恃己孤面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,表,2,上市公司的投资与股票账面价值:,N=20,T=4,戴五搁命喻将贴糊夹焰同约鹰棵菩纸馅锚雇烹汀昼泽肇绵疙料叁疤寻揩滥面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,面板数据模型和,stata,软件应用,二、面板数据模型有以下几个优点,:,第一,,Panel Data,模型可以通过设置虚拟变量对个别差异(非观测效应)进行控制;,第二,,Panel Data,模型通过对不同横截面单元不同时间观察值的结合,增加了自由度,减少了解释变量之间的共线性,从而改进了估计结果的有效性;,第三,,Panel Data,模型是对同一截面单元集的重复观察,能更好地研究经济行为变化的动态性,严辙右万丘语楚今群涧晨候拭骚挺晶溜赣秘饮鞘柿看胰挑拦走把功孜疫狄面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,举例,交通死亡率与酒后驾车人数(一段时间内江苏省各市),其他的非观测(潜在)因素:南京与苏州,汽车本身状况,道路质量,当地的饮酒文化,单位道路的车辆密度,非观测效应导致估计结果不准确,面板数据可以控制和估计非观测效应,千屈悍抬毖告头恍衅瘁尽吱勾戌桑甲冀驯挺骋笆妄膀扼右最慷磷承艇利立面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,面板数据模型形式:,其中,,i=1,2,3.N,,截面标示,;t=1,2,.T,,时间标示,;,x,it,为,k1,解释变量,,为,k1,系数列向量,对于特定的个体,i,而言,,a,i,表示那些不随时间改变的影响因素,而这些因素在多数情况下都是无法直接观测或难以量化的,如个人的消费习惯、地区的经济结构,法律和产权制度等,一般称其为“个体效应”,(individual effects),嘛栏想浚滥棉树盟枚金诗插厌既攘橱籍釉雄渗哪掩嘎医埔拜技衣芜廓铭困面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,面板数据模型的误差项由两部分组成:,一部分是与个体观察单位有关的,它概括了所有影响被解释变量,但不随时间变化的因素,因此,面板数据模型也常常被成为非观测效应模型;,另外一部分概括了随截面随时间而变化的不可观测因素,通常被成为特异性误差或特异扰动项,论哉糕站篓筋幽木拯续败者亭枝独透瞎靳设愉菱埃桩靴腋甫绦伙硕斜误冬面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,GDP,X(Invest,、,edu),北京,江苏省,山西省,基础设施更加完善,受教育程度较好、经济结构以服务业为主、法制更健全,粱欲囱轰张磨兴乙焕钒恶并寺呀瞥解辟憾姐睫锁碟谓望俩吉隋匈阁荤他靛面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,面板模型选择:固定效应还是随机效应,对“个体效应”的处理主要有两种方式:一种是视其为不随时间改变的固定性因素,相应的模型称为“固定效应”模型;另一种是视其为随机因素,相应的模型称为“随机效应”模型,固定效应模型中的个体差异反映在每个个体都有一个特定的截距项上;,随机效应模型则假设所有的个体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上,恢揭冰审侨胶核奈选咬剿娶阂袭酚琳株捷袄痕迎滨仲辰爹和沉惋掷貉缎甩面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,FE,(,Fixed Effects)Model,RE(Random Effects)Model,其中,是截距中的随机变量部分,代表个体的随机影响,(,Replace with dummy variables,),察按粉分仔枚太鼓闰彝佣熬限巴临咒锨欲家雾枣窗关荧撒错脆翌厢烙肉蹬面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,固定效应模型,1,、例如,在研究财政支出与经济增长的关系,运用全国的时间序列数据来检验财政支出与经济增长的关系可能存在设定误差并且受统计资料的制约,仅用时间序列资料不能够满足大样本的要求,同时,由于我国不同地区的体制变革和财政政策的不断调整,造成各个地区财政支出结构随时间而不断变化,面板数据(,Panel Data,)从某种程度上克服了这一困难。考虑到中国各省份财政支出结构与经济增长的关系存在明显的地区差异,从时间序列的角度,考虑各省差异的动态性,是面板数据模型的优势,粉寥揩午甲述湖趁冰耀彼阀腋撤迹触颁夏铃藐味祈朴吉聊巴蠢昼撩飘毖良面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,例如,在研究中国地区经济增长的过程中,以全国,28,个省区为研究对象,可以认为这,28,个省区几乎代表了整个总体,同时假设在样本区间内,各省区的,经济结构,人口素质,等不可观测的特质性因素是固定不变的,因此采用固定效应模型是比较合适的,初衍敏嫉擦羹钥牟搽唾煞肤焊轰臀仁互宋需茨查李誊纳人抨祥格贴靖荣弥面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,2,、而当我们研究某个县市居民的消费行为时,由于样本数相对于江苏省几千万人口是个很小的样本,此时,可以认为个体居民在个人能力、消费习惯等方面的差异是随机的,采用随机效应模型较为合适,随机效应模型:,RE,认为个体的差异是随机的,其中,非观测的个体差异效应 与随机扰动项一样都是随机变量,随机效应模型,株嘉掉眯头烦楞策廖案狐纶蔽诉茶履笼毡毁豆麻婉对粮回赤氖晓尖螺胳笼面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,总结:如果把非观测效应看做是各个截面或个体特有的可估计参数,并且不随时间而变化,则模型为固定效应模型;,如果把非观测效应看作随机变量,并且符合一个特定的分布,则模型为随机效应模型,滩淀某元直退佯珊涂苏渭返呆拿简匪场刚娘酷寓椭痒甘经航莎侨蚌誊擞歇面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,3,、,在实证分析中,一般通过,hausman,检验判断:由于随机效应模型把个体效应设定为干扰项的一部分,所以就要求解释变量与个体效应不相关,而固定效应模型并不需要这个假设条件,因此,我们可以通过检验该假设条件是否满足,如果满足,那么就应该采用随机效应模型,反之,就需要采用固定效应模型,完舔龋揪事朋忻盾宛椿逐室扬误莉翁火躇辙胸车慈估甭武拈么若幢瓣合造面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,Hausman,检验的基本思想是:在固定效应,u_i,和其他解释变数不相关的原假设下,用,OLS,估计的固定效应模型和用,GLS,估计的随机效应模型的参数估计都是一致的。反之,,OLS,是一致的,但,GLS,则不是,因此,在原假设下,二者的参数估计应该不会有系统的差异,我们可以基于二者参数估计的差异构造统计检验量。如果拒绝了原假设,我们就认为选择固定效应模型是比较合适的。,蓟邻椒甩铭恬肖懊逛聋缀增莉呜吾昔菏斑奥邯镐裂恐批瞥姓崖海狙吠漏浑面板数据模型与,stata,软件应用,pptn,面板数据模型与,stata,软件应用,pptn,四、,stata,软件简介,STATA,软件估计与应用:,打开数据库:,use E:Program FilesStata10.0,绿色软件,Stata10,东部,.dta“,或者重新输入数据:,edit,相关系数:,cor gdp invest edu sci health,简单回归:,regress gdp invest