单击此处编辑母版标题样式,编辑母版文本样式,第二级,第三级,第四级,第五级,多重插补,多重插补,1,多重插补课件,2,多重插补的概念及由来,为什么要进行多重插补,多重插补的易侕软件操作,1,2,3,4,如何证明插补后对结果没有影响,6,5,实战举例,小建议,多重插补的概念及由来为什么要进行多重插补多重插补的易侕软件操,3,WHAT,Rubin,在,1978,年首先提出的,是指由包含,m,个插补值的向量代替每一个缺失值的过程,要求,m,大于等于,20,。,m,个完整数据集合从插补向量中创建。,它是用一系列可能的数据集合来填充每一个缺失数据值(这样也突出了所需插补值的不确定性);然后使用完全数据的标准程序去分析这些多重插补数据集;最后对这些分析结果归纳、综合。,点击,输入标题,文本,插补的目的并不是预测单个缺失值,而是预测缺失数据所服从的分布。,多重插补的概念及由来,WHATRubin在1978年首先提出的,是指由包含m个插补,4,所有数据完整?,添加标题,添加标题,添加标题,为什么要进行多重插补,无任何缺失遗漏?,你确定?,所有数据完整?添加标题添加标题添加标题为什么要进行多重插补无,5,删除数据,学术造假,闭口不提,complete-case analysis,不确定是否影响结局。,数据分布变量广泛。,统计学效能降低。,缺点:,坚决禁止!,点击此处添加标题,点击此处添加标题,点击此处添加标题,霸象文化,PPT,模板,请勿盗版。,点击添加内容,编撰数据,蒙混过关,数据缺失一般补救方法,删除数据学术造假闭口不提complete-case anal,6,multiple imputation,不违背学术道德,合理,合法,光明正大,把缺失数据科学的、最大程度符合真实的补足,multiple imputation不违背学术道德,7,适用原则与禁忌,结局变量不可插补,X,、,Y,不可插补,X,、,Y,不可插补,X,、,Y,不可插补,插补后,需进行,敏感性分析,适用原则与禁忌结局变量不可插补插补后,需进行,8,多重插补的易侕软件操作,第一步:,打开易侕统计软件,导入需插补的数据,数据操作,多重插补缺失生成新数据,多重插补的易侕软件操作第一步:,9,多重插补的易侕软件操作,第二步,1,2,3,4,多重插补的易侕软件操作第二步1234,10,多重插补的易侕软件操作,右键单击,出现一个列表,选,XLS,。直接变成,excel,格式,多重插补的易侕软件操作右键单击,出现一个列表,选XLS。直接,11,多重插补课件,12,如何证明插补后对结果没有影响,审稿人的疑虑:,怎么证明插过的数据对最终结果没有影响?,如何证明插补后对结果没有影响审稿人的疑虑:,13,怎样做好多重插补,怎样做好多重插补,14,如何证明插补后对结果没有影响,敏感性分析,如何证明插补后对结果没有影响敏感性分析,15,如何证明插补后对结果没有影响,敏感性分析,如何证明插补后对结果没有影响敏感性分析,16,如何证明插补后对结果没有影响,敏感性分析,如何证明插补后对结果没有影响敏感性分析,17,如何证明插补后对结果没有影响,敏感性分析,如何证明插补后对结果没有影响敏感性分析,18,如何证明插补后对结果没有影响,敏感性分析,尊敬的审稿人:,please shut up your mouth.,我,确实对缺失数据进行了插补,那又怎样?插补前和插补后的数据,并木有什么本质区别。所以,,,我,就是,插补了,你咬我?,如何证明插补后对结果没有影响敏感性分析尊敬的审稿人:,19,到底靠不靠谱?,到底靠不靠谱?,20,怎样做好多重插补,怎样做好多重插补,21,以前写文章,要讲清楚多少病人因为数据缺失退出本研究。且要在讲述研究设计流程图的时候要标清楚,甚至将临床资料不完全的患者也作为排除标准之一。现在,你只需要,These patients were included,in the analysis using multiple imputation methods to,estimate the missing values.The multiple imputation was performed by the MICE library within the S-Plus 2000 Guide to Statistics Volumes 1 and 2(MathSoft,Seattle,WA,USA),以前写文章,要讲清楚多少病人因为数据缺失退出本研究。且要在讲,22,小建议,1,、在,写文章的时候,应该报道每个变量中,有多少数据缺失。如果可能,还要讲出这些数据缺失的理由。,小建议1、在写文章的时候,应该报道每个变量中,有多少数据缺失,23,小建议,2,、此外,,在写,missing data,处理的方法时,几个关键词,要写:,(,1,)用的是多重插补法(,multiple imputation,),(,2,)原理是链式方程(,chained equation,),(,3,)计算是由MICE library within the S-Plus 2000 Guide to Statistics Volumes 1 and 2(MathSoft,Seattle,WA,USA)或者易侕软件。,小建议,24,最后的提醒:,第一:多重,插补并非万能。,譬如,100,个数据缺失,70,个,,那就,没有必要补了。,第二,,不能有,100,个样本,用插补插,100,个,,凑成,200,。这个就是学术造假。,第三,插补插补,本质上还是要补。不能无中生有。,最后的提醒:第一:多重插补并非万能。譬如100个数据缺失70,25,