【势力抢分点】2018公卫医师【逆袭之路】流行病学【墙裂推举】☨第5章☨
2018年01月25日 来源:来学网第五章 病例对照研究
一、基本原理
病例对照研究(Case control studies):以确诊的患有某特定疾病的病人作为病例,以不患有该病但具有可比性的个体作为对照,调查他们对某个(些)因素的暴露情况,以研究该疾病与某个(些)因素的关系。这是一种回顾性从果查因的研究方法。
二、研究类型
1、病例与对照不匹配
设计原理:病例对照研究中,选择病例组后,无附加条件选择对照组;
实施较方便,能获得较多信息。适用广泛筛选、探索可疑危险因素,即探索性病例对照研究。
2、病例与对照匹配
(1)、匹配(Matching):又称配比,即要求对照组在某些因素或特征上与病例组保持一致。这些因素或特征称为匹配因素,匹配用以排除匹配因素的干扰。
(2)、匹配的类型:
匹配可分为频数配比与个体配比,个体配比又可分为1:1配比与1:M配比。
群组匹配:又称频数匹配(Frequency matching):以群体为单位匹配。
个体匹配(Individual matching):以个体为单位匹配,根据每个病例的某些因素或特征选匹配的对照。1个病例匹配1个对照,称1∶1匹配,又称配对(pair matching),1∶2匹配即1个病例匹配2个对照,以下依次为1∶3…1∶M匹配。
(3)、匹配的优点:
1)、提高研究效率:增加两组的可比性,表现为每一研究对象提供的信息量增加;
2)、控制混杂因素的作用:一些综合性因素如社会经济状况,受职业、文化教育等因素影响,不用匹配就难以区分各项因素的作用;
(4)、匹配的缺点:
1)、匹配过度(Over-matching)。一个项目一经匹配,不但使它与疾病的关系不能分析,而且使它与其他研究因子间的交互作用也不能充分分析。中间变量和与疾病无关的因素不应匹配,否则造成匹配过度。
2)、较不匹配的花费大,增加工作难度。
3、衍生的类型
(1)、巢式病例对照研究
设计思路:进行队列研究,收集每个队列成员暴露信息及有关混杂因素资料,确认随访期内发生的每个病例。以队列中的病例作为病例组,以同一个队列未患该病作为对照组,进行病例对照研究。
三、研究设计与实施
(一)、一般步骤
1、提出病因假设;
2、制定研究计划;
3、收集资料;
4、资料整理与分析;
5、总结并提交研究报告。
(二)、具体实施
1、提出假设;
2、明确研究目的,选择适宜的对照形势;
3、病例与对照的来源与选择:
(1)、病例的选择
1)、制定入选标准
内部特征:对病例的患病部位、病理学分型等明确限制;
外部特征:对年龄、性别、种族、职业等明确阐述;
病例类型有新发病例、现患病例与死亡病例,首选新发病例:回忆信息较真实、可靠;新发病例刚刚 发病,调查时间最接近暴露时间;提供的暴露信息未受到生存因素影响;有较大把握辨别暴露因素与 疾病的时间关系。
(2)、病例的来源
1)、选择医院就诊病人:
优点:易实施、省经费、受试对象合作,最常用选择病例方法。
缺点:易产生选择性偏倚。医院来源病例不能代表社区中患该病全体人群,代表性较差,易产生入院 率偏倚。
2)、以一般(社区)人群为基础选择:
优点:代表性好,能代表患该病全体人群;
缺点:可行性差。实际工作中难以调查到全部对象,调查对象依从性差。
2、对照的选择
根据研究目的,探索采用不匹配或频数匹配。检验采用个体匹配,提高检验效率。
根据能获得病例数量,研究罕见病,采用个体匹配,用最小样本获得较高统计学效率。
要求:
(1)、经过相同诊断被确认为不患所研究疾病,不能患有与所研究疾病有共同病因的疾病;
(2)、与病例组具有可比性;
(3)、 排除隐性病例、潜伏期病例。
来源:
(1)、同一或多个医疗机构中诊断的其他病例(使用最多);
(2)、病例的邻居或所在同一居委会、住宅区的健康人或非该病病人;
(3)、社会团体人群中的非该病病例或健康人;
(4)、社区人口中的非病例或健康人群(无偏样本);
(5)、病理的配偶、同胞、亲戚、同学或同事。
4、确定样本量
影响样本量的因素:
(1)、研究因素在对照组的暴露率P。:P1>P。且P1 - P。一定的条件下P。越接近0.5,所需样本量越大;
暴露组与对照组发病率之差d:d越大,所需样本量越小;
(2)、预期该因素的效应强度,即RR或者OR;
(3)、显著性水平(α):α越小,所需样本量越大;
(4)、把握度(1-β):β越小,所需样本量越大。
5、获取研究因素的信息;
6、资料的收集。
收集方法:查阅记录、询问、测量、现场观察。
四、资料整理与分析
1、资料的整理
(1)、原始资料的核查:纠正错误或补救不足,尽可能保证资料准确性与完整性;
(2)、原始资料的录入:资料适当编码后,输入计算机;
2、资料的分析
(1)、描述性统计:描述一般特征(性别、年龄、疾病类型等)、均衡性检验(以考核、判断病例组和对照组的可比性);
(2)、统计性推断:
1)、将资料整理成表格形式;
2)、病例和对照组暴露比例差异的显著性检验;即回答暴露和疾病是否有联系;
3)、估计暴露因素和疾病之间的联系强度;
4)、结果解释。可能存在哪些偏倚?得出什么结论?
举例:
不匹配资料分析
1)、将暴露因素与疾病的资料整理成四格表形式;
2)、χ2检验,检验病例组与对照组暴露率的差异
χ2 > 3.84,P。< 0.05;
3)、计算暴露与疾病的关联强度(OR)的大小
比值比(OR) = (a/b) /(c/d) =ad/bc
OR取值范围为0~∞。OR=1:无关联;OR>1:正关联;OR<1:负关联;
4)、OR值的95%可信区间。
1:1配对资料的分析
1)、将暴露因素与疾病的资料整理成四格表形式
2)、配对χ2检验:χ2 = (b-c)ˆ2/(b+c)
3)、OR=c/b,即:对照非暴露 病例暴露/对照暴露 病例非暴露;
4)、OR值的95%可信区间;
5)、归因分值(Attributable fraction)AF
分层资料分析
分析疾病与暴露因素关系时,混杂因素影响结果正确推断,识别和控制混杂因素可采用分层分析。
(1)、分层资料的整理
(2)、按暴露与否分层,计算OR值;
(3)、进行齐性检验:OR值无明显差别,合并OR值;
OR值有显著差异,不能合并OR值。
三、效力
四、常见偏倚及其控制
1、选择偏倚
(1)、入院率偏倚(Berkson’s bias/Admission rate bias):又称Berkson偏倚。是指利用医院就诊或住院病人为研究对象时,由于入院率的不同而造成的偏差。对照是医院的一部分病人,而不是全体目标人群的一个随机样本;病例只是医院的特定病例,因此病人对医院以及医院对病人双方都有选择性,病例组也不是全体病人的随机样本,难免产生偏倚。
(2)、现患病例-新发病例偏倚(Neyman bias/Prevalence-incidence bias):又称Neyman偏倚。如果调查对象选自现患典型病例,所得信息很多可能只与存活有关,而未必与发病有关,会高估暴露因素病因作用;另外某病幸存者改变了生活习惯,会降低危险因素的水平。
(3)、检出征候偏倚(Detection signal bias):即暴露偏倚。病人因某些在病因学上与某疾病本无关联的症状就医,提高了早期病例的检出率,从而过高地估计了暴露程度,产生的系统误差。
(4)、时间效应偏倚(Time effect bias)
2、信息偏倚
在从研究对象获取所需信息时产生的偏倚。
(1)、回忆偏倚:由于研究对象不能准确、完整地回忆以往发生的事情和经历时所产生的差异。
(2)、调查偏倚
3、混杂偏倚:在研究某因素与某疾病关联时,由于一个或多个混杂因素的影响,掩盖或扩大了所研究的因素与疾病的联系,从而错误地估计了二者之间的真正联系。
控制方法:
设计阶段:限制的方法、配比的方法
资料分析阶段:分层分析、多因素分析模型