第五节 病因的确定

前述几种流行病学模型为我们提供了确定因果关系的基本思路。但是在确定因果关联时还需要注意混杂因素与效应修饰。

一、混杂

在研究某一危险因素与某疾病的关联时,由于受某个既与疾病有关系,又与所研究的因素有联系的外来因素的影响,掩盖或扩大了所研究的因素与疾病的联系,这种现象或影响叫混杂(confounding)。其所带来的偏倚叫混杂偏倚(confounding bias),外来因素叫混杂因素(confounding factor)。例如:一项关于运动与肥胖症因果关系的研究,可能有3种研究结果:①经常运动者,易患肥胖症;②经常运动者,少患肥胖症;③运动与肥胖症无关。在该研究中,饮食是可能的混杂因素,可能影响研究因素的真实效应。

混杂因素具备以下条件:①是疾病的独立危险因素;②与所研究的暴露因素有关系;③不应是暴露因素与疾病因果链中的一个环节或中间变量。

例如,资料显示,男性秃顶与心肌梗死有关,但这种关联很可能不是因果关联,因为随着年龄增长,秃顶与心肌梗死风险均增加,这里年龄就是秃顶与心肌梗死关联的混杂因素。当两个或两个以上危险因素同时存在时,就不能确定危险因素是否有独立作用。比如,体力活动水平高的组观察到较低的疾病发病率,同时该人群特点是年龄较轻、吸烟率较低,这就不能下结论说体力活动的保护作用独立于年龄和吸烟。同样,静坐生活方式与疾病的关联可能由年龄较大、吸烟来解释,而不是体力活动不足。

观察性研究是体力活动流行病学研究常用的研究类型,较随机对照试验研究更容易出现混杂偏倚。随机对照试验由于采用了随机分组,减少了混杂偏倚的可能性。

例如,许多观察性研究显示:基线体力活动水平较高的个体与较低的疾病死亡率相关。那么是否提高体力活动水平可以降低死亡率?还是体力活动水平较高的人本身健康状况较好,从而死亡风险较低呢?大部分设计良好的观察性研究可以采用统计学方法校正混杂因素的影响,如血压和血脂不正常,肥胖、吸烟等,以确定体力活动水平对发病率与死亡率的独立作用。然而,有些混杂因素不能被准确测量或没有被认识。

很多研究报告在校正混杂后,体力活动与死亡率仍存在相关,这一结论仍可能有混杂。因为大多数研究不能测量所有潜在的混杂因素。比如,糖尿病或心理因素,往往不被考虑。在任何单一的观察性研究中,测量所有潜在的混杂因素几乎是不可能的。目前尚需要多项研究、测量不同的混杂因素,为体力活动与冠心病的关联提供更多的证据。

二、效应修饰

除混杂外,确定因果关联时还应考虑效应修饰(effect modification)或交互作用(interaction)。流行病学上,效应修饰指的是两个或多个危险因素的交互作用。例如, 2×2设计的研究中,效应修饰指的是暴露与疾病对健康结局的影响可能受到另外一个变量的影响。例如,静坐行为或活跃生活方式对冠心病的影响可能受到第三个变量的影响,如性别。体力活动可能降低男性冠心病风险,而女性则不然。这时,性别就是效应修饰变量。连续性变量的效应修饰可以被估计。比如,体力活动与冠心病的关联可能受体重指数(BMI)影响。体力活动最低组可能体重指数最高,体重指数被认为是体力活动与冠心病关联的效应修饰因子。确定某一因素作为效应修饰因子的作用可为制定预防性策略提供重要信息。比如,体重指数较高的个体仅在与正常或低体重指数组相比,他们同时也是不活动的群体时,冠心病风险高,应当制定干预策略,对于体重指数较高的群体实施干预,增加其体力活动水平。

混杂和效应修饰增加了流行病学研究中体力活动与健康直接关联的解释难度。由于年龄是疾病与死亡增加的直接危险因素,因此可能是体力活动与健康关联的混杂因素。在描述疾病与健康结局间关联时要去除年龄因素的影响。年龄同时可能作为效应修饰因子。例如,冠心病发病率随着年龄增长,血压增高,体力活动水平降低而增加,但是年龄也是体力活动降低和血压增高的影响因素。研究体力活动与冠心病关联时,必须控制年龄和血压的影响。流行病学研究中通常可使用统计学技术控制混杂,通过分层分析来处理效应修饰因子。当我们解释有关体力活动与健康结局的关系时,一定要注意潜在的混杂因素和效应修饰的影响,必须确定这些因素被很好地控制。

三、因果关联判定标准

当混杂与效应修饰都已经考虑,危险因素与疾病间关联有统计学意义时,如果满足以下因果关联的判定标准,则可能是因果关联。这一标准可追溯到1843年John Stuart Mill发表的《逻辑体系:推理与归纳》。其中,讨论了推论因果关联的五个准则:求同法、求异法、同异并用法、共变法、剩余法。应用到当代流行病学研究中,称为米勒准则(Mill's canons),如果满足以下几条,则更有可能是因果关系:①关联的时间顺序性(temporal sequence):如果怀疑病因X引起疾病Y,则X必须发生于Y之前;②关联强度(strength of association):一般而言,关联的强度越大,该关联为因果关联的可能性就越大。比值比,相对危险度等是反映分类资料的关联强度指标;③关联的一致性(consistency):指关联可以在不同的人群、不同的地区和不同的时间重复观察到;④量效关系(dose response):危险因素与结局间存在剂量反应关系;⑤关联的生物学合理性(biological plausibility):包括两个方面:①对于关联的解释与现有理论知识不矛盾,符合疾病的自然史和生物学原理,相当于客观评价;②研究者或评价者从自身的知识背景出发,支持因果假设的把握度,相当于主观评价。

本章对体力活动流行病学基本概念和方法进行了阐述,初步介绍了流行病学方法应用于研究体力活动与健康问题的基本原理与技术。比值比、相对危险度、归因危险度可以帮助确定体力活动能否降低疾病或死亡风险。流行病学研究设计——横断面研究、病例对照研究、队列观察或实验性研究、随机对照试验用于确定体力活动与疾病或死亡的关联及关联强度,并且需要控制混杂或效应修饰因子的影响。最后根据米勒准则确定因果关联:时间顺序、关联强度、关联一致性、剂量反应关系、生物学合理性。

参考文献

1.Rod Dishman,Gregory Heath,Richard Washburn.Physical activity Epidemiology.Human Kinetics 2004.

2. 谭红专主编. 现代流行病学(第2版). 北京:人民卫生出版社.2008.

3.Jerry R.Thomas,Jack K.Nelson,Stephen J.Silverman.Research Methods in Physical Activity.6th ed.Human Kinetics 2010.