Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,资料仅供参考,不当之处,请联系改正。,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,资料仅供参考,不当之处,请联系改正。,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,资料仅供参考,不当之处,请联系改正。,第一节 基本原理,过去 现在,比较 人数 暴露,a/(a+c)a,c,b/(b+d)b,d,病例,对照,+,-,-,+,病例对照研究(case control study):以一组患有某病者(病例)和一组或几组未患该病但在某些已知因素方面与病例组相似者(对照)为研究对象,调查他们过去是否暴露于某个或某些可疑致病因素或暴露剂量,比较两组暴露比值,推断研究因子作为病因的可能性。,暴露(exposure):指研究对象接触某些因素,或具备某些特征,或处于某种状态。,暴露因素(exposure factor):可以是机体固有的、先天的,也可以是体外的、后天的,暴露因素也叫研究变量(variable)。,混杂与混杂因素(confounding and confounding factor):研究某因素与某疾病关联时,由于某个既与疾病有制约关系,又与所研究的因素有联系的外来因素的影响,掩盖或扩大了所研究的因素与疾病的联系,这种现象或影响叫,混杂,,其所带来的偏倚叫,混杂偏倚,,该外来因素,叫混杂因素,。,二、研究类型,(一)不匹配:对照数目与病例相等或略多,(二)匹配(matching):要求对照在某些因素上与病例保持一致。,如年龄匹配,1、频数匹配(frequency matching):匹配因素所占比例在病例组和对照组一致。如病例组男女各半,平均年龄56岁。对照组亦应如此(无显著性差异)。,2、个体匹配(individual matching):病例和对照以个体为单位进行匹配。,目的:提高研究效率(study efficiency),匹配因素:已知或疑为混杂因子(confounding factor),常见匹配:1:1(配对);1:2;1:R,匹配过度,(over matching):匹配增加了对照选择的难度,把不必要项目列入匹配,丢失了信息,降低了研究效率。,匹配程度:连续变量可划分为若干组,按组匹配;离散变量可完全匹配。,两种因素不能匹配:,(1)研究因素和中间变量:,吸烟,血脂,心血管病,(2)只与可疑因素有关而与疾病无关的因素,避孕药子宫内膜癌,宗教,(三)巢式病例对照研究(套迭式;嵌入式),(nested case-control study):通过队列研究,确认随访时发生的病例,作为病例组,以同一队列的未发病者为对照。,优点,:(1)暴露资料在发病或死亡前获得,,时间顺序清楚,无回忆偏倚。,(2)两组可比性好,(3)可提高统计及检验效率,暴露率高;共同暴露开始时间,缺点:只能比较暴露的等级,例:Kent(1988):血胆固醇与癌症,第二节 研究实例,Herbst关于年轻女性阴道腺癌的研究,美国波士顿Vincent记念医院,1966-69年发现7例年轻女性阴道腺癌,该病为罕见病:占女性生殖系统癌症0.1%-0.2%,50岁以上多见,怀疑因素:使用阴道局部刺激物、阴道冲洗、阴道塞史;性交史;避孕药应用史,均无意义。,重新研究目的:用病例对照研究比较病例从胚胎期至发病前的情况。,研究对象:7例加1例另一医院的阴道透明细胞癌患者。,1:4配对:要求对照与病例在同等级病房中出生,时间前后10天,使用统一调查表,培训调查员,结果:此次怀孕流血、以往流产史及此次怀孕使用雌激素史三个因素有显著意义。,结论:母亲怀孕早期服用保胎药已烯雌酚使其女儿发生阴道腺癌的危险性增加。,第四节 病例对照研究的实施,(一)提出假设:可发现或检验病因线索,(二)明确目的,确定对照形式:,不匹配或频数匹配:探讨病因线索,个体匹配:提高统计效率,适于罕见疾病,对照数目:按Pitman效率递增公式:,效率=2R/(R+1)1:1时,效率=21/(1+1)=1,1:2时,效率=22/(2+1)=1.3,1:3时,效率=1.5,1:4时,效率=1.6,1:4以上,效率增加缓慢,但对照选择难度增加,故1:4,(三)研究对象选择,1、病例:,(1)以医院为基础(hospital-based):某期间内全部门诊,或住院病人;病案及出院记录,(2)以社区人群为基础(community-based):社区的监测、,普查、抽样调查中发现的病例,注意:明确的诊断标准(国内外统一;自定);与对照的,可比性(性别、年龄等);新发、现患、死亡病例,2、对照,:,(理想:全人群或非病人群的随机样本,现实:病例的定义可确定其源人群,对照应为病例源人群,的随机样本),(1)同一或多个医院其他病人:那些与暴露没联系者,吸烟与肺癌:排除呼吸道疾病入院者做对照,(2)人群对照(社区、社团非病例或健康人):随机抽样;,随机数字拨号,(3)朋友、同事、亲属及死亡对照,(四)样本含量的估计(size of sample),1、影响因素,(1)对照组的暴露率(,P,0,),(2)估计的,RR,或,OR,(3)希望的显著性水平(,a=,0.05 or=0.01),假阳性错误(false positive error)或称第一类错误(type I error),即由于判断失误,从而拒绝了原本正确的无效假设。在统计推断,上指允许犯假阳性的概率。1-,a 称为精确度。,(4)希望的把握度(,power)或称功效,(1-,b),b为假阴性错误(,false negative error or type II error),指由于统,计量(,t,)没有超过显著水平,从而接受了原本不正确的无效假设。,2、计算,(1)非匹配设计:病例数=对照数,例:吸烟与肺癌,预期,RR,=2.0,人群吸烟率(,p,0,)=20%,,定:,a,=,0.05(双侧),b,=,0.1 查表得:,U,a,=1.96,U,b,=1.28,p,1,=(0.22)/(1+0.21)=0.333,=(0.2+0.333)/2=0.267 =1-0.267=0.733,n,=20.2670.733(1.96+1.282)2/0.333-0.2)2,=232 (查表得:,n,=229),(2)非匹配调查:病例数对照数,设:病例数:对照数=1:,c,;则病例数为:,p,1,计算同上式;对照数=,cn,(3)1:1配对设计:Schlesselman公式:,总对子数:,M,m,/(,p,0,q,1,+,p,1,q,0,),m,为结果不一致的对子数,p,0,;,p,1,为目标人群中对照组和病例组估计暴露率,例:,研究口服避孕药与先天性心脏病的关系,设,a,=,0.05(双侧),,b,=,0.1;对照组暴露比例,p,0,=0.3;预期,RR,=2.0,求:需要的总对子数?,解:查表得:,U,a,=1.96,U,b,=1.28,p,1,=,P,0,RR,/1+,p,0,(,RR,-1)=0.32/1+0.3(2-1)=0.46,p,=,RR,/(1+,RR,)=2/(1+2)=2/3=0.67,q,1,=1-,p,1,=1-0.46=0.54,q,0,=1-,p,0,=1-0.3=0.7,总对子数:,M,m,/(,p,0,q,1,+,p,1,q,0,),=90/(0.30.45+0.460.7)=186(人)(196),(五)获取研究因素的信息,1、变量的选定:,与目的有关的变量不能少,,且要细致(吸烟:量、时间、种类、方式、戒烟时间等);,无关的项目不能有,。,2、变量的规定:明确规定,统一标准(吸烟者:每天吸烟至少一支,持续一年以上者),3、变量的测量:定性(是、否);半定量(经常、偶尔、不);定量(平均每周几次?平均每次多少?),4、使变量符合规定:以客观手段与证据为准绳(病情用医疗档案核准;职业史以工厂档案核准;空气、水污染用检测结果核准;吸烟量由亲属核准等),(六)资料收集,调查问卷;查阅档案;采样化验;实地查看等。,第六节 资料分析,一、原则(目的),1、比较两组暴露比例有无显著性差异,2、用暴露优势比估计患病优势比(联系强度),3、控制混杂因素:,匹配,;分层;多因素分析,二、方法,(一)描述性分析,1、研究对象的一般特征,2、均衡性检验,(,二)推断性分析,分析类型:,不分层资料,非个体匹配资料,分层资料,1:1配对,个体匹配资料 1:2配对,1:M配对,分级暴露资料,多因素分析,病例对照研究中表示联系强度的指标,比值比(比数比;优势比;交叉乘积比;odds ratio;,OR,):病例组暴露比值与对照组暴露比值之比。,病例组暴露比值:,对照组暴露比值:,比值比:,OR取值为0,OR1为“正”关联,说明发病危险度增大;,OR1为“负”关联,说明发病危险度减少。,ORRR的条件:1)良好的代表性,2)人群疾病频率较低(5%),OR与RR之关系,病例对照研究资料整理表 队列研究资料整理表,暴露,疾病 .,病例 对照 合计,+,a,b,a+b,=,n,1,-,c,d,c+d,=,n,0,合计,a+c,=,m,1,b+d,=,m,0,t,暴露,疾病 .,病例 非病例 合计,+,a,b,a+b,=,n,1,-,c,d,c+d,=,n,0,合计,a+c,=,m,1,b+d,=,m,0,t,当人群疾病频率很低时,可将RR计算公式中,a,/(,a+c,)和,b,/(,b+d,)中分母的,a,c,忽略不计,即:,a+b b;c+dd;,则:,因此,ORRR的条件:1)良好的代表性,2)人群疾病频率较低(5%),相对危险度(RR)与关联强度,(Monson RA,1980),RR,(,OR,)关联强度,0.91.0 1.01.1 无,0.70.8 1.21.4 弱,0.40.6 1.52.9 中等,0.10.3 3.09.9 强,10 很强,1、非个体匹配不分层资料,(1)整理表格,表5-5 口服避孕药(OC)与心肌梗死(MI)关系,(2)显著性检验,c,2,=(,ad,-,bc,),2,n,/(,a,+,b,)(,c,+,d,)(,a,+,c,)(,b,+,d,)=7.7,c,2,0.01(1),=6.637.7 P1.96 2.58 3.08 2.58 P0.01,(4)OR可信区间(confidence interval,,CI),1)Woolf法:,本例:Var(lnOR)=0.0826,OR95%CI=ln2.21.960.2874,=1.32180.2252,OR95%CI=exp(1.3218;0.2252),=1.253.75,2)Miettinen法:,本例:,2、非个体匹配分层资料,1)特点,(1)可评价分层因素本身作用及其与暴露之关系,(2)离散变量可完全控制分层因素的混杂作用,连续变量取决,于分层程度,(3)简单易行,一目了然,并帮助正确设计多因素模型,(4)缺点是丢失效率,分层太多,层中例数会出现“零”,2)资料整理,表5-6 病例对照研究分层资料整理表,暴露特征,第,i,层的发病情况,合计,病例 对照,+,a,i,b,i,n,1,i,-,c,i,d,i,n,0,i,合计,m,1,i,m,0,i,t,i,表5-7 口服避孕药与心机梗死关系病例对照研究按年龄分层分析,(3)计算各层OR:,OR,1,=(2159)/(26 17)=2.8,OR,2,=(18 95)/(88 7)=2.78,可见两层OR值均较不分层时大。,40,40岁 .,服OC 未服OC 合计 服OC 未服OC 合计,病例 21(,a,1,)26(,b,1,)47(,m,11,)18(,a,2,)88(,b,2,)106(,m,12,),