资源预览内容
第1页 / 共23页
第2页 / 共23页
第3页 / 共23页
第4页 / 共23页
第5页 / 共23页
第6页 / 共23页
第7页 / 共23页
第8页 / 共23页
第9页 / 共23页
第10页 / 共23页
第11页 / 共23页
第12页 / 共23页
第13页 / 共23页
第14页 / 共23页
第15页 / 共23页
第16页 / 共23页
第17页 / 共23页
第18页 / 共23页
第19页 / 共23页
第20页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,直线相关与回归分析,胡良平,单位:军事医学科学院,生物医学统计咨询中心,直线相关与回归分析概述,1、一般直线方程与回归方程的区别,2、“回归的真实含义,3、相关与回归在概念上的区别,4、正确实现相关与回归分析的步骤,直线相关与回归分析概述,5,、相关与回归分析计算原理,6,、回归分析的种类,7,、怎样看待回归分析的结果,8,、正确进行回归分析的步骤,1,、一般直线方程与 回归方程的区别,2、“回归的真实含义,1回来Come back,2返回、回程Return,3回归大自然,Go back to the Nature,2、“回归的真实含义,4复归、回归、倒退,Regression,意思是:回到“总体的平均水平,历史来源:,由生物统计学家F.Galton1887最先创用“回归这个词。,2、“回归的真实含义,历史来源:,F.Galton1887在研究由K.Pearson搜集的上千个家庭中父亲与儿子的身高时惊奇地发现:,父高子也高,但高个子父亲的平均身高高于他们儿子的平均身高;矮个子父亲的平均身高却低于他们儿子的平均身高。,3,、回归分析的作用,如何实现预测;,如何实现控制;,如何实现修匀。,4,、相关与回归 在概念上的区别,相关是研究在专业上有联系的两个定量变量之间的相互关系,要求两个变量均为随机变量;,回归是研究在专业上有联系的两个定量变量之间的依赖关系,要求因变量必须是随机变量,自变量可以是随机变量,也可以是一般变量。,4,、相关与回归 在概念上的区别,从资料所具备的条件来说,作相关分析时要求两变量都是随机变量如:人的身长与体重、血硒与发硒;作回归分析时要求因变量是随机变量,自变量可以是随机的,也可以是一般变量(即可以事先指定变量的取值,如:用药的剂量)。,5,、回归分析的 计算原理,最小平方法,或最小二乘法,5,、图示最小平方法的原理,图中,Q=,观测,y,值,-,用直线回归方程计算的,y,值,5,、,图示,最小平方法,的原理,6,、回归分析的种类,1如果因变量是(非时间的)连续变量即一般定量资料,设自变量的个数为,当时,回归分析的种类有:,直线回归分析;通过直线化实现的简单曲线回归分析以下简称为曲线拟合;非线性曲线拟合;一般多项式曲线拟合;正交多项式曲线拟合。,6,、回归分析的种类,当时,称为多元回归分析。当同时对多个因变量进行回归分析时,称之为多重回归分析。在多元回归分析中,简单而又实用的那么是多元线性回归分析。,6,、回归分析的种类,2如果因变量是与时间有关的连续变量且未被离散化,如:生存时间、复发时间、死亡时间等,而自变量可以是定量的,也可以是定性的。此时需用生存分析中的半参数(或Cox回归或参数回归分析法。,6,、回归分析的种类,3如果因变量是名义或有序变量,无论它取二个离散值如:死与活、复发与未复发等,还是多个离散值自变量可以是定性和定量的时,都可选用logistic回归分析;如果把列联表中每个格内的理论频数的对数当作因变量,把分组变量包含影响因素和观测结果变量类当作自变量,可用对数线性模性分析。,7,、怎样看待回归分析的结果,【例1】设有4组定量指标的数据如下:Xi,Yi(i=1、2、3、4)是第i对在专业上有联系的指标。对各对指标均观测了11对数据,问:可否用直线回归分析研究各对指标之间的变化关系?,拟作回归分析的数据,OBS X1 Y1 X2 Y2 X3 Y3 X4 Y4,1 10 8.04 10 9.14 10 7.46 8 6.58,2 8 6.95 8 8.14 8 6.77,8 5.76,3 13 7.58 13 8.74 13 12.74 8 7.71,4 9 8.81 9 8.77 9 7.11 8 8.84,5 11 8.33 11 9.26 11 7.81 8 8.47,6 14 9.96 14 8.10 14 8.84 8 7.04,7 6 7.24 6 6.13 6 6.08 8 5.25,8 4 4.26 4 3.10 4 5.39 19 12.50,9 12 10.84 12 9.13 12 8.15 8 5.56,10 7 4.82 7 7.26 7 6.42 8 7.91,11 5 5.68 5 4.74 5 5.73 8 6.89,回归分析总模型的假设检验结果,Analysis of Variance,Sum of Mean,Model DF Squares Square F Value ProbF,1 1,27.51000 27.51000 17.990 0.0022,2 1 27.50000 27.50000 17.966 0.0022,3 1 27.47001 27.47001 17.972 0.0022,4 1 27.49000 27.49000 18.003 0.0022,回归分析参数估计的结果,Parameter Estimates,Parameter Standard T for H0:,Variable,DF Estimate Error Parameter=0 Prob|T|,INTERCEP 1 3.000091 1.12474679 2.667 0.0257,X1 1 0.500091 0.11790550 4.241 0.0022,INTERCEP 1 3.000909 1.12530242 2.667 0.0258,X2 1 0.500000 0.11796375 4.239 0.0022,INTERCEP 1 3.002455 1.12448123 2.670 0.0256,X3 1 0.499727 0.11787766 4.239 0.0022,INTERCEP 1 3.001727 1.12392107 2.671 0.0256,X4 1 0.499909 0.11781894 4.243 0.0022,求得的直线回归方程皆为:,Y=3+0.5X,散布图在回归分析中的作用,X1,X2,X3,X4,Y1,Y2,Y3,Y4,8,、正确进行回归分析的步骤,1依据专业知识,2绘制、分析散布图,3对值得分析的资料再求a、b,4对回归参数进行假设检验,5将回归方程应用于实践中去,
点击显示更多内容>>

最新DOC

最新PPT

最新RAR

收藏 下载该资源
网站客服QQ:3392350380
装配图网版权所有
苏ICP备12009002号-6