单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Meta analysis原理和实施步骤,陈泽鑫,浙江大学医学院附属第二医院,临床流行病与生物统计研究室,样本与总体,研究总体离不开研究它的个体但在许多实际问题中,不可能对所有个体逐一进行研究,而只能从总体中抽取一部分个体进行观察(或试验),根据对这部分个体的观察结果来推断总体的分布情况,样本,总体,推断,样本与总体,统计学用抽样分布的理论来描述样本统计量的变化规律,单一样本推断总体存在不足:,存在抽样误差,并且抽样误差的大小与样本量的大小有关。,为了减小抽样误差,需要足够的样本量,样本推断总体,存在抽样误差,足够的样本量,减小误差,从一个均数为1.5,标准差为0.7的正态总体中进行随机抽样,样本量分别为20,50,100,200,300,500,1000,不同的样本量均进行20次抽样,共得到140个样本。,分别计算每个样本的均数,标准差和标准误。以样本的均数为横坐标,以样本量为纵坐标作散点图,由于抽样过程存在抽样误差,样本量较大时抽样误差较小。,所以从图中可以看出所有的点以样本量较大时的均数为轴,左右是基本对称的。,用方差分析的方法对不同的样本所对应的总体均数是否相等进行检验,方差分析的结果为F=0.862,P=0.878。,说明140个样本对应的总体均数是相同的。,用这140个样本的信息来估计总体的均数和标准差,,=1.501,=0.699。,这样做的结果是提高了估计的精度。,理想状态,我们把不同作者对相同问题进行的研究可以看作从同一总体中进行抽样得到的一个随机样本,如果他们都是按照相同的设计得到的研究结果,并且我们可以找到每一项研究的结果,这样就可以根据上面的原理得到一个更为可靠的结果。,实际情况,不同作者:,所使用的设计方案会有一定的差别,选择的实验对象有所不同,样本量差异,因此实际能够得到的资料可能是不完整的,甚至是有,偏性的,如阳性结果的文章,以及和目前大家普遍能,够接受的观点一致的文章可能更容易发表在专业杂志上。,Meta 分析,Meta,(,after,more comprehensive,secondary,)希腊词,定义,以综合研究结果为目的,通过查阅文献收集与某一特定问题相关的多个研究并对这些研究的结果所进行的统计分析,优点,几个、甚至上百个研究者在不同地区进行研究并发表研究结果进行整合后所得到的综合结果(证据)更有说服力,Meta分析的意义,海量信息需要整合,避免“只见树木不见森林”,克服传统文献综述的缺陷,连接新旧知识的桥梁,传统文献综述的缺陷,主观综合,缺乏共同遵守的原则和步骤,注重统计学是否“有意义”,等价对待每篇文献,无权重,定性而非定量,Meta分析的功能,定量综合,提供系统的、可重复的、客观的综合方法,通过对同一主题多个小样本研究结果的综合,提高原结果的统计效能,解决研究结果的不一致性,改善效应估计值,回答原各研究未提出的问题,Meta分析原理,固定效应模型(fixed effect model),假设各个研究之间只有一个真效应值(true effect size),研究直接观测到的效应值的差别来源于抽样误差(正态分布),随机效应模型(random-effect model),假设各个研究间(如不同国家,不同种族等),的真效应值是相互不同的,且各个研究的值服从正态分布,因此最后观测值的差别既包括真效应值的随机误差也包括抽样误差(正态分布)。,固定效应模型,圆形代表各个研究的真效应值,方形代表各个研究的实际观测值,代表抽样误差,真效应值相同,观测值的差异,仅来源于抽样误差,抽样误差符合正态分布,根据此分布特征,可以根据各个研究的值估计真效应值(类似于通过样本的效应值来推断总体的效应值),估计真效应值的方法,考虑到各个研究间抽样误差大小不同,因此对每个研究需要根据误差大小进行加权。,权重为:,V,Yi,为每个研究内部的方差,因此所有研究加权均数为,Y,i,为研究的观测值,估计的总效应均数的方差为:,(估计均数的权重等于方差的倒数),从而得到总效应值均数标准差:,得到均数估计的95%置信区间:,随机效应模型,各个研究的真效应值不是同一的,而是服从正态分布的,各个研究观测值的差别包括真效应值的误差()和抽样误差(),为各研究真效应值的平均值,估计真效应值的方法,估计方法和固定效应模型一样,区别在与随机效应模型需要考虑到真效应值之间的差异,即各个研究之间的方差,各个研究的权重:,其中,2,表示各个研究之间的方差,从而加权以后的平均值为,估计的总效应均数的方差为,从而得到总效应值均数标准差:,得到均数估计的95%置信区间:,估计,2,的方法,(类似于样本均数求方差的过程),加权离均差平方和(,weighted sum of squares,WSS,)(此部分为总的变异,度,),因此随机效应部分应该是加权总和减掉预期的离均差平方和,即超额变异(excess variance),预期的总变异的假设是各个研究真效应值相同,即其预期变异,度,为其自由度,因此,超额变异=观测WSS-预期WSS=Q-df,但是此时的超额变异是标准化后的总和,不依赖真效应的度量,且随着研究数量的增加和增加,因此需做转换,以原始的效应值度量衡量,并做平均,因此除以数量C。,结果均用森林图表示,固定效应模型与随机效应模型的比较,两种模型的选择,模型的选择应该根据各个研究本身的分布特点选择。一般医学研究中根据发表的文献进行分析,随机效应模型比较适合。,但是,如果只是因为异质性检验具有统计学差异,就从固定模型转为随机效应模型,这种做法是错误的,不推荐。,如果固定效应模型下,异质性较大,首先应考虑是否有异常研究纳入,通过敏感性分析进行排除,或者做亚组分析,若异质性仍较大,考虑是否因为本身选择固定效应模型不合适,尝试选择随机效应模型,Meta分析实施步骤,一、选题和立题,形成问题:1.相关性研究(病因学和危险因素);2.干预措施的评价;3.诊断方法评价;4.预后估计;5.病人费用和效益分析等。,合理选择对象,:应对要解决的问题进行精确描述,包括人群类型(疾病确切分型、分期)、治疗手段或暴露因素的种类、预期结果等,合理选择进行评价的指标。,合理选择指标,:指标的选择直接影响文献检索的准确性和敏感性,关系到制定检索策略。,制定纳入排除标准,。,二、文献检索,检索策略的制定,pubmed中Mesh联合free word检索。,文献检索,国内的有维普全文VIP,CNKI,万方数据库,外文的有pubmed,SD,OVID等。,文献管理,使用endnote,noteexpress等文献管理软件进行检索和管理文献,文献检索方法,:pubmed检索、google学术检索、若网上无法获取全文考虑给作者发email,文献筛选,摘要,全文阅读,阅读过程中,参考文献中的文章,重新搜索,是否有最新文献,三、,文献的质量评价,评价内容,该研究的试验设计是否明确,包括研究人群、治疗手段和结果判定方法;试验对象是否随机分组;病人的随访率是否理想及每组病人是否经过统计分析;受试对象、研究人员及其它研究参与者是否在研究过程中实行“盲法”;各组病人的年龄、性别、职业等是否相似;除进行研究的治疗手段不同外,其它的治疗是否一致;治疗作用大小;治疗效果的评价是否准确;试验结果是否适用于当地的人群,种族差异是否影响试验结果;是否描述了所有重要的治疗结果;,四、,提取数据,文献作者、年代、来源、,研究设计特征(设计方法、组别、盲法等),研究对象特征(地域、样本量等),干预特征(干预方法、是否盲法、剂量等),评价指标(仪器、指标、持续时间等),质量等,研究者应设计一个适合本研究的数据收集表格。,表格中应包括分组情况、每组样本数和研究效应的测量指标。根据研究目的不同,测量指标可以是率差、比数(odds)、相对危险度(relative risk,包括RR 和OR)。,各研究间作用测量指标不一致,需转化为统一指标。,五、,分析资料和报告结果,计算各研究的效应值、方差和权重,对各研究结果的效应值进行齐性检验,计算合并的效应值,固定效应模型的合并效应值,随机效应模型合并的效应值,绘制各研究的效应值和置信区间,森林图(Forest Plot),异质性检验,异质性种类,临床异质性,观察对象,年龄,性别,人种,疾病程度,病程长短,干预措施,剂量,,给药途径,疗程,结果测量指标,量度,,测量时间,测量方法,异质性检验的方法,I,2,:异质性的定量分析,I,2,值从0%至100%,0%时无异质性,,I,2,值越大,异质性越大;一般说来,用,I,2,=25%,或50%,或75%将异质性划分为低,中,高;,小于70可接受,超过70则建议分开描述,不能合并。,I,2,描述了去除抽样误差(机遇)后的异质性。异质性小只说明各个研究间研究方法、纳入标准、实施方案等没有大的差别,存在异质性可采取的措施:,得到每个研究的原始数据,并可对每个研究可以采用统一的多元回归模型进行分析,避免由于模型不一致导致的异质性,亚组分析。,敏感性分析。在排除可能是异常结果的研究后,重新进行Meta分析,与未排除异常结果研究的Meta分析结果进行比较,探讨被去除的研究对合并效应的影响程度。,选用Meta回归以及混合模型进行分析,若异质性过于明显,则应放弃进行Meta分析,只对结果进行一般性的统计描述。,Meta回归,Meta回归分析采用回归分析的方法探讨某些实验或病例特征等协变量对Meta分析中合并效应的影响以试图明确,各研究问异质性的来源,。探讨协变量对合并效应的影响。,纳入Meta回归分析中的协变量是,研究或试验水平的一些特征,:如研究设计、干预量、给药途径、疗程、患者的性别、年龄、研究样本量;也可以是单个研究内所包含病例的综合特征,如患者的平均年龄、平均身高等。但是,不能将单个患者的身高、体重等指标作为Meta回归分析的协变量,偏倚的识别与处理,偏性的估计,漏斗图(Funnel Plot)是以每个研究的效应值为横坐标,以每个研究的样本量或效应值方差的倒数为纵坐标做成的散点图。,对处理效应的估计,其准确性是随样本含量的增加而增加,小样本研究的效应估计值分布于图的底部,其分布范围较宽;大样本研究的效应估计值分布范围较窄,当没有发表偏倚时,其图形呈对称的倒漏斗状,故称之为“漏斗图”,六、,结果评价和解释,结果的解释,Meta分析结果除了要考虑是否有统计学意义外,还应结合专业知识判断结果有无临床意义。若结果仅有统计学意义,但合并效应量小于最小的有临床意义的差值时,结果不可取;若合并效应量有临床意义,但无统计学意义时,不能定论,需进一步收集资料。,结果的推论,在推广应用时,应结合该Meta分析的文献纳入/排除标准,考虑其样本的代表性,特别应注意研究对象特征及生物学或文化变异、地理区域、干预措施等方面是否与自己的具体条件一致。,Meta分析常用软件,RevMan,STATA,SAS,等,RevMan,录入比较方便,但是无法进行,meta,回归分析,,SAS,较,STATA,操作更复杂,而且,STATA,的图较美观,因此推荐使用,STATA,谢谢,