孟德尔随机化(简称MR)是一种利用非实验数据中的遗传变异来推断自变量对结果变量因果效应的分析手段,特点是以遗传变异(如单核苷酸多态性或SNP)作为工具变量。
公众号「遗传社科研究」栏目《A Practitioner's Guide to Performing Mendelian Randomization(孟德尔随机化实践指南)》,以专题形式简洁介绍MR实践分析中的一些重点和难点问题,并给出MR实践建议。适合已对MR有初步了解和分析基础的中高级玩家。均为原创性文章,作者朱晨(中国农业大学经济管理学院教授)。
线性 vs. 非线性关联
可用于Doubly-Ranked非线性MR分析的R包DRMR
目前来看,虽然对于NLMR的具体估计方法仍有一些争议,但在必要的情况下【比如队列或横断面分析显示出很强的非线性关联,并且这种J型或U型关系具有很重要的实践意义】,仍然可以采用Doubly-Ranked非线性MR法进行估计,但是在应用时需要重点注意以下几点:
如果暴露的遗传效应在人群中存在差异,那么使用残差分层非线性MR分析(R包中的nlmr)是不可靠的,应当采用Doubly-Ranked非线性MR法(R包中的DRMR)。
非线性MR分析应调整年龄和性别,以减少潜在的偏差;同时可以调整年龄平方项、年龄-性别交互项等。目前不建议调整年龄和性别以外的人口学变量,因为可能会造成对撞偏差(Collider Bias)。
弱工具变量有可能造成偏差(Bias);即使遗传变异在整个人群中具有中等强度,但由于分层后样本量减少,它们在人群的各个阶层分样本中也可能较弱。因此,如果在整个人群中进行的MR分析显示结果为阴性,而非线性MR分析表明有显著效应,则研究者应该格外谨慎——因为这可能反映了特定分层估计值中偏差的累积。
最后要说的是,科学是一门不断发展的学科,新发现常常修正或补充现有知识。科学论文的发布反映了我们对知识的不断更新,表明先前的理解可能是不确定的、不完整的,甚至是错误的。尽管科学文献中存在不正确的论文,但这体现了科学的本质,而非缺陷。我们应致力于尽量减少错误,但即使是基于当前最佳知识的分析也可能最终被证明是错误的。在这种情况下,我们应反思、学习、纠正和改进,而非简单停止探索。
参考文献:
欢迎阅读
《遗传经济学原理》
朱 晨 著
中国政法大学出版社(2022)