单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,00,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2014.6.11,体检中心,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,临床科研中,常用统计方法及选择,2014.6 CQMU.PB,临床科研中常用统计方法及选择2014.6 CQMU.PB,统计学方法有什么用?,合理选择统计方法的四个因素,数据资料的描述,数据资料的组间比较,变量间关系研究,主要内容,统计学方法有什么用?主要内容,一张关于统计学的图片,一、统计学方法有什么用?,一张关于统计学的图片一、统计学方法有什么用?,例子,1,:一研究者宣布找到一种治疗某病的新药,试验的结果如下:,药物,例数,有效,有效率,新药,60,42,70%,安慰剂,50,2,5,5,0%,该新药是否值得推广?,几个例子,假设检验及临床优效性检验,例子1:一研究者宣布找到一种治疗某病的新药,试验的结果如下:,例子,2,:英国某年全人口统计资料,矛盾:移民组的发病率在各个年龄组均高于英格兰和威尔士组,为什么它的合计发病率反而低?,分析中混杂因素的控制,例子2:英国某年全人口统计资料矛盾:移民组的发病率在各个年龄,胃癌,228 235 143 187 250,胃炎,100 153 178 143 200 ,非胃病,98 123 170 100 120 ,例子,3,:,为鉴别胃癌、胃炎、非胃病患者,各测定了,50,名对象的铜兰蛋白等指标,其中铜兰蛋白的观察结果如下,:,问:三种人的铜兰蛋白有无不同?,能否根据测定的铜兰蛋白数据对患者进行初步诊断?,假设检验及判别诊断,胃癌 228 235 143,结局指标:心性死亡,预后因素:年龄、性别、高血压病、心梗位置、心梗分级、,传导阻滞、溶栓治疗,,.,,等,例子,4,:,研究心肌梗死患者预后的影响因素,,以,是否发生,心性死亡,作为观察结果指标,,,对116名心梗患者的22个可能影响预后的因素进行观察和记录,哪些预后因素与发生心性死亡有关系?,关系的强度如何?,影响因素筛选,回归分析,结局指标:心性死亡例子4:研究心肌梗死患者预后的影响因素,以,统计学在医学科研中作用,统计学是进行医学科研的,重要工具,满足统计学原则要求是保障医学科研科学性的前提,采用恰当的统计学方法是研究结论可靠、可信的前提,课题申报、论文撰写均有明确的统计学要求,统计学在医学科研中作用统计学是进行医学科研的重要工具,研究设计,分析目的,资料类型,数据特征,二、合理选择统计方法的四个因素,研究设计二、合理选择统计方法的四个因素,完全随机设计(成组设计),-,最常见,最易实施的实验设计方案,-,将研究对象,随机分配,到几个组,然后做实验,配对设计,(,区组设计,),-,将具有相似特征的研究对象配成对子,然后再将每个对子的对象,随机分配,到两个组进行实验,-,常见形式:同源配对(如样品一分为二),异源配对(按性别、体重、年龄配对),自身前后配对(试验前后的对比),(一)研究设计,完全随机设计(成组设计)(一)研究设计,析因设计,-,同时研究,多个实验因素,对结果的影响,-,例如,研究,药物剂量,(3mg,、,6mg),及,给药方式,(,口服、肌注,),对结果的影响,每种组合均需要做试验,(3mg+,口服,,3mg+,肌注,,6mg+,口服,,6mg+,肌注,),,为,22,析因设计,重复测量设计,-,同一对象在,不同时间点,上进行某个指标的观测,以分析该指标在时间上的变化。,-,临床上很常见的一类资料,(一)研究设计,析因设计(一)研究设计,对临床资料进行统计描述,描述性统计分析方法,如,,均数,中位数,标准差,百分比,频数分布等,估计总体参数,95%,可信区间,对几组资料进行差异性检验,假设检验方法,如,,t,检验,卡方检验,方差分析,秩和检验等,探讨变量之间的关系,或者,自变量(影响因素),对,应变量(结果变量),的影响大小,多变量分析方法,如,线性相关,线性回归,,Logistic,回归,,Cox,回归、生存分析等,(二)分析目的,对临床资料进行统计描述(二)分析目的,数值变量资料 计量资料,无序分类变量资料 计数资料,有序分类变量资料 等级资料,(三)资料类型,无序分类,:,指类别或属性间无顺序、程度之分,例如,性别(男、女),为,二分类,血型(A、B、AB、O),为,多分类,有序,分类,:指类别间,存在着次序,,或,程度上的差异。,例如,治疗效果:无效、好转、显效、治愈,实验室检验:、+、+、+,数值变量,:,每一个观察,对象,都有一个数值,,且,大小差异,有意义,例如,血红蛋白(g/L),,住院天数,产前检查次数,住院费用,数值变量资料 计量资料(三)资料类型无序分,任何统计方法都有自己的适用条件,只有当某个或某些条件满足时,统计计算公式才成立,适用条件可根据数据特征来判断,数据的分布特征(正态、偏态),方差齐性,理论数大小,样本量大小,(四)数据特征,任何统计方法都有自己的适用条件,只有当某个或某些条件满足时,,编号 年龄 性别 治疗组 舒张压 心电图 疗效,NO,X1,X2,X3,X4 X5,X6,1 37,男,A 11.27,正常 显效,2 45,女,B 12.53,正常 有效,3 43,男,A 10.93,异常 有效,4 59,女,B 14.67,异常 无效,108 54,男,B 16.80,正常 无效,108,例高血压患者治疗后临床记录,三、数据资料的描述,编号 年龄 性别 治疗组 舒张压,通过绘制,直方图,可以直观了解数据的分布,(一)数值变量资料的描述,偏态分布,近似正态分布,变异水平,平均水平,平均水平,通过绘制直方图可以直观了解数据的分布(一)数值变量资料的描述,偏态分布形状,研究中,右偏态分布更常见,如,住院时间,住院费用,病程,等,左偏态分布较少见,如,考生成绩,有时呈左偏态分布,偏态分布形状研究中,右偏态分布更常见,如住院时间,住院费用,,方差齐性,方差是否齐同(相等),粗略判断,两组标准差之比在,2.5,倍以上,就得警惕方差不齐,方差齐性,指标名称,适用的资料,均数(,X,),正态分布或近似正态分布,中位数(,M,),偏态分布、分布未知、两端无界,几何均数(,G,),对数正态分布、等比资料,标准差,(s),正态分布或近似正态分布,四分位数间距,偏态分布、分布未知、两端无界,极差(,R,),观察例数相近的数值变量,变异系数(,CV,),比较几组资料间的变异大小,描述数值变量资料的常用指标,指标名称适用的资料均数(X)正态分布或近似正态分布中位数(M,变异水平,平均水平,平均水平,偏态分布,近似正态分布,中位数,均数,标准差,P25,,,P75,四分位数间距,变异水平 平均水平 平均水平偏态分布近似正态分布中位数均,正态分布或近似正态分布,:,均数 与 标准差,偏态分布或未知分布,中位数 与,P25,、,P75,(四分位数间距),论文中最常用组合,正态分布或近似正态分布:论文中最常用组合,通常需要描述各个类别的,频数及频率,(百分比),(二)分类变量资料的描述,通常需要描述各个类别的频数及频率(百分比)(二)分类变量资料,二维频数表,研究中通常需要列出二维频数表,二维频数表研究中通常需要列出二维频数表,四、数据资料的组间比较,假设检验出发点,是:,判断样本之间差异由什么原因造成的,样本数据间的差异有两种原因所致,样本来自同一总体,差异因,抽样误差,所引起,样本来自不同总体,差异因,不同总体,所引起,假设检验以,P,值,大小作为推断依据,P,值大,表示差异由,抽样误差,引起可能性大,P,值小,表示差异由,抽样误差,引起可能性小,即由,总体不同,引起的可能性大,一般以,0.05,作为临界值来判断,(一)组间比较采用技术,-,假设检验,四、数据资料的组间比较假设检验出发点是:(一)组间比较采用技,根据资料类型选择,计量资料的,假设检验,t,检验、,F,检验(方差分析)、,Z,检验,、秩和检验,(,Wilcoxon,秩和检验、,H,检验、,Friedman,检验,)等,计数资料的,假设检验,卡方检验、,Z,检验,等,等级资料的,假设检验,秩和检验(,Wilcoxon,秩和检验,、,H,检验,、,Friedman,检验),(二)组间比较常用的假设检验方法,根据资料类型选择(二)组间比较常用的假设检验方法,比较目的,应用条件,统计方法,样本与总体比较,n,较大,Z,检验,n,大小均可,t,检验,两组资料的比较,(完全随机设计),n,较大,Z,检验,n,较小,正态分布,方差齐,t,检验,n,较小,非正态分布,方差不齐,Wilcoxon,秩和检验,t,检验,1,、常用,计量资料,的假设检验,比较目的应用条件统计方法样本与总体比较n较大Z检验n大小均可,比较目的,应用条件,统计方法,配对资料的比较,n,较大(任意分布),配对设计,Z,检验,(配对设计),n,较小,差值为正态,配对设计的,t,检验,n,较小,差值为非正态,配对设计的秩和检验,多组资料的比较,正态分布,方差齐,方差分析,(完全随机设计),非正态分布,方差不齐,秩和检验(,H,检验),配伍资料的比较,正态分布,方差齐,配伍设计的方差分析,(配伍设计),非正态分布,方差不齐,配伍设计的秩和检验,(,Friedman,检验),1,、常用,计量资料,的假设检验(续表),比较目的应用条件统计方法配对资料的比较n较大(任意分布)配对,比较目的,应用条件,统计方法,样本率,与总体率的比较,n,较小时,二项分布的直接法,np5,且,n(1-p)5,二项分布的,Z,检验,两个率,或构成比的比较(完全随机设计),np5,且,n(1-p)5,二项分布的,Z,检验,n40,且,T5,卡方检验,n40,且,1T5,校正,卡方检验,n40,或,T40,配对卡方检验,np5,且,n(1-p)5,校正配对卡方检验,多个率,或构成比的比较,(完全随机设计),全部格子,T5,或,1T5,小于,25%,卡方检验,T1,或,1T40配对卡方,比较目的,统计方法,两组比较(完全随机设计),多组比较(完全随机设计),Wilcoxon,秩和检验,秩和检验(,H,检验),配伍设计,秩和检验(,Friedman,检验),配对设计,符号秩和检验,3,、常用,等级资料,假设检验方法,比较目的统计方法两组比较(完全随机设计)Wilcoxon秩和,实例,1,30,只大鼠随机分为,A,、,B,、,C,三组,每组,10,只,分别给予三种药物,,5,天后测定某指标值如下表。,几个例子,资料特点:完全随机设计,计量资料,三组,不妥的方法:,t,检验,恰当的方法:方差分析,实例1几个例子资料特点:完全随机设计,计量资料,三组,实例,2,36,只大鼠随机分为,对照组,、实验组,1,、实验组,2,三组,每组,12,只,分别给予三种饲料,分别于,10,天、,15,天、,20,天、,25,天测定大鼠体重,如下表。,资料特点:完全随机设计,计量资料,三组,重复测量,不妥的方法:每个时间点用,t,检验或方差分析,恰当的方法:重复测量的方差分析,实例2资料特点:完全随机设计,计量资料,三组,重复测量,实例,3,72,只小鼠随机分为,3,组,每组,24,只,进行实验,分别于试验后,1,,,