字数:2918
阅读时间:20分钟
论文信息
标题:工具变量法在环境流行病学因果推断中的应用与进展
期刊:环境与职业医学
时间:2024.1.2
作者:石慧,郑古峥玥,赵星,黄守瑞,艾宝卓,吴佳隆,林华亮
导读:在环境流行病学研究中,有多种因果推断方法,其中,工具变量法(IV)作为一种能够很好控制未测量混杂因素的因果推断方法,逐渐应用在环境流行病学研究领域中。本研究介绍了 IV 的基本原理,阐述了如何判断IV是否可以应用于课题研究,如何利用IV评估因果效应,以量化环境暴露对健康结局的因果影响。
研究摘要
环境流行病学研究中环境暴露广泛而非随机、混杂偏倚较为复杂,对其因果推断带来了巨大的挑战。近年来,随着因果推断方法引入观察性研究中,其为环境流行病学因果推断研究提供了更多统计方法的选择。工具变量法(IV)作为一种能够很好控制未测量混杂因素的因果推断方法,逐渐应用在环境流行病学研究领域中。本研究介绍了 IV 的基本原理,归纳了目前应用 IV 进行环境流行病学因果推断的研究进展与局限性。当前环境流行病领域应用 IV方法进行因果推断研究尚处于初级阶段,合理使用 IV 并与其他因果推断方法的有效整合将成为环境流行病学因果推断的发展重点。本研究旨在为我国环境暴露的人群健康效应的因果推断研究提供方法学上的参考和依据。
1. 研究背景
在流行病学研究中,随机对照试验(randomized controlled trail, RCT)被视为因果推断的金标准。然而,由于环境流行病学研究中存在的广泛而非随机的暴露、高度异质的研究群
体以及复杂的混杂偏倚等问题,使得以观察性研究为主的环境流行病学研究难以开展 RCT,进而难以进行因果推断。近年来随着因果推断方法的不断发展,高质量的观察性研究也可以补充因果证据。因果推断方法包括倾向性评分、工具变量法(instrumental variable,IV)、双重差分法、断点回归等多种方法。其中,倾向性评分需建立在已考虑所有潜在混杂因素的假设下;双重差分法需基于平行趋势假设;而断点回归的样本是限制在接近阈值的个体,衡量的是局部平均效应。相比之下,IV 可解决遗漏变量、测量误差和互为因果等问题,在基于调查数据的定量分析中具有独特的优势。IV 是计量经济学中常用的因果推断方法,它可以克服由于未测量混杂造成的偏差,获得暴露因素对结局的无偏估计值。
2. 研究方法
2.1、基本原理
IV 的基本原理是在观察性研究中寻找具有类似RCT 随机分组作用的变量,通过该变量提取不包含未测量混杂效应的暴露变异,以此估计暴露与结局之间的因果关系(如图 1 所示)。IV 需满足以下三个基本假设:①与暴露因素 X 相关;②与关于 X 和 Y 的未知或
未测量混杂因素 U 相互独立;③只通过暴露 X 对健康结局 Y 产生影响。
2.2、应用实例
在孕妇吸烟(X)对婴儿出生体重(Y)的影响研究中,女性戒烟鼓励计划的随机化程序(Z)作为该研究的 IV。在这项研究中:IV 与 X 强相关(满足假设①),IV 的随机化使得其与混杂因素 U 独立,也满足假设②,除了通过改变吸烟行为之外,鼓励女性戒烟随机化程序(IV)对儿童出生体重没有影响。
另外一个关于环境暴露的例子是:拟开展一项关于空气污染物暴露对当地哮喘影响的研究,假设 XA 和 UB 分别代表该区域的两种空气污染物 A 和 B 的浓度,Y 代表该区域人群的哮喘率。其中,污染物 A 是研究的暴露因素,由交通和发电厂两者产生;而污染物 B 是未测量的、对哮喘率 Y 有影响的混杂因素,且仅由发电厂产生。在这项研究中,以交通密度 Z 为有效的 IV 来解决潜在的混杂问题。交通密度 Z 满足上述三个假设:①它与污染物A 有共同来源,因此 Z 和 XA 相关;②它不是污染物 B的来源,因此 Z 和 UB 不相关;③它与哮喘率 Y 之间不存在直接相关,只能通过空气质量来影响结局。IV 可通过经典的两阶段最小二乘回归(two-stage least square regression, 2SLS)来获得暴露与结局因果效应
的无偏估计。在此方法中,第一阶段回归利用 IV 将暴露因素 X 分解为与未测量混杂相关(X1)和不相关(X2)两部分;第二阶段回归利用与未测量混杂因素不相关的暴露因素估计值来估计因果效应。
2.3、应用条件
在实际工作中,首先应考虑是否真正需要应用 IV进行分析,即从理论上论证是否真的存在内生性,并通过统计检验来判断,常用的方法有 Hausman 检验和 Durbin-Wu-Hausman 检验。其次需考虑 IV 的有效性,有效的 IV 和暴露 X 之间的相关性不应太弱,否则就会产生“弱 IV”问题,导致较宽的置信区间,并增加假阴性概率。F 统计量、Cragg–Donald 统计量、Stock and Yogo 检验以及 Kleibergen-Paap Wald 等统计方法均可用于检验弱 IV。对于单个内生变量可采用 F统计量检验,F 统计量 > 10 被认为是强 IV,反之则是弱 IV。此外,有效的 IV 至少与暴露变量一样多(也被称为“阶条件”),如果 IV 个数大于暴露变量个数,则需通过过度识别检验来检测 IV 是否外生,常见的过度识别检验包括 Sargen 和 J 检验等。
3. 应用进展
为了解 IV 在环境流行病学研究中的应用进展,本研究对纳入的 49 篇文献进行分类总结,并对 IV 方法的应用进行质量评价。质量评价的依据是 IV 分析报告标准与规范指南。本研究提出了应用 IV 进行环境流行病学因果推断研究的质量评价框架,主要包括5 个方面的内容
随即得出应用工具变量法在环境流行病学领域进行因果推断研究的基本信息及质量评价结果
4、总结与讨论
4.1、局限性
首先,在实际工作中难以获得满足条件的 IV。尤其在以空气污染物为暴露的环境流
行病学研究中,由于多种污染物共享一个来源,导致使用单一 IV(如风向)无法完全剥离各个空气污染物的未测量混杂估计值。在实际工作中,可选择多个变量作为备选 IV,再利用统计分析方法筛选出理想的 IV。常用的筛选 IV 的统计分析方法包括置信区间法、自适
应套索 IV 选择法、聚合层次聚类算法等。当无法完全满足 IV 假设时,校正后 IV可作为敏感性分析方法来使用。
其次,污染物的共同暴露是环境流行病研究中普遍存在的现象,故使用 IV 估计单一污染物的健康效应时可能存在偏差,即估计的效应实为平均因果效应(local average treatment effect, LATE)。例如,在研究颗粒物与呼吸系统疾病的因果关系时,选择风向作为暴露的 IV,但风向对颗粒物不同组分的影响不同,导致估计的是 LATE。这种 LATE 可能会对政策制定和治理效果产生影响。
另一方面,应用 IV 估计多种污染物的健康效应时也需注意各种污染物对健康影响的方向可能不同(例如臭氧)。针对以上问题,可采用的方法是每次对单一污染物进行 IV 分析,在 2SLS 的第一和第二阶段的回归中将其他种类污染物作为协变量进行控制。或者将不
同的污染物通过其在污染源城市中的相应水平进行标准化,然后将标准化的污染水平同时纳入同一回归中。
最后,应用 IV 的环境流行病学还面临着污染物暴露效应的时变和非线性效应的问题。经典的 2SLS 方法无法解决暴露随时间变化以及暴露与结局非线性关联的情况。目前随着机器学习方法探索的不断深入,一些新的方法,如深度 IV 法在一定程度上可以解决这些问题。
4.2、研究展望
IV 作为一种广泛适用且能够解决未测量混杂因素之间因果效应的方法,在环境流行病学领域的气候变化、公共交通、空气污染以及水和土壤污染等问题的因果推断中发挥着重要
作用。气象因素、地理因素、生理因素、社会经济因素、相关政策和事件都可巧妙地作为 IV 以探索暴露与结局的因果关系,但研究人员需要注意选择合适的 IV,也特别需要注意污染物共线性的问题。此外,IV 的质量是其分析的核心问题,未来的研究可利用机器学习方法来优化 IV 的选择,以提高因果推断的精确性。
原文链接:
www.jeom.org/article/cn/10.11836/JEOM23325
本文编辑
王月川 大连工业大学环境工程专业
彭欢欢 天津城建大学经济与管理学院2022级本科生
关于我们
本公众号由复旦城市生态与暴露生态学研究组(Urban Ecology and Exposure Ecology Lab, UEEE)运营维护,发布相关研究成果,更传播城市生态与暴露生态学最新研究与实践。欢迎专家学者将研究成果在此发布(发送邮件:zhaowu_yu@fudan.edu.cn),让更多人了解您的研究及工作。