孟德尔随机化：工具变量三大假设

科技 2024-09-09 22:31 河南

大家好，我是邓飞。

今天继续学习孟德尔随机化的概念。上一次博客（孟德尔随机化的术语理解）介绍了变量工具、暴露因素、结局变量和混杂因素，对应的统计术语就是GWAS显著性位点SNP变量、x变量、y变量、协变量。

工具变量SNP，有三大假设，只有满足，才能进行孟德尔随机化分析，或者分析结果才有保证，分别是：

1，关联性假设

2，独立性假设

3，排他性假设

孟德尔随机化分析流程图：

1，满足关联性假设。从数据库中下载暴露因素x的GWAS分析结果，找到显著性SNP位点，这个位点就是工具变量，它是暴露因素x的显著性位点，SNP和暴露因素是有关联的。这个就是关联性假设，这个假设确保了选择的工具变量能够解释暴露的变异。如果 SNP 与暴露之间的关联不显著，分析将没有足够的统计功效去估计暴露对结果的因果影响。检验的方法是选择p值较小且效应值较大的SNP位点。

2，独立性假设。工具变量与混杂因素X变量之间必须是独立的。换句话说，工具变量仅仅影响结果是通过其对暴露的影响，而不通过任何其他途径。这个假设确保了没有其他因素影响工具变量和结果之间的关系。如果工具变量受到混杂因素的影响，可能导致偏倚的因果推断。如何检验呢？通常需要观察研究设计，例如在随机对照试验或前瞻性队列研究中，通过控制可能的混杂因素来检验独立性假设。此外，进行灵敏度分析有助于评估独立性假设的有效性。

3，排他性假设。工具变量对结果的影响必须完全通过暴露来实现，而不通过其他路径。如果工具变量通过非暴露途径（例如直接影响结果）影响结果，那么因果推断可能是错误的。只有当工具变量能够在暴露和结果之间充当中介时，这个假设才能成立。如何检验呢？通常很难直接检验排他性假设，但研究者需要通过已有的文献、已知的生物学机制和敏感性分析等方法，推测是否存在其他潜在的路径影响结果。

如何收集孟德尔随机化分析数据？

数据集1：从现有的全基因组关联研究（GWAS）或其他遗传研究中获取与暴露相关的单核苷酸多态性（SNP）作为工具变量。通常是GWAS的summary结果，包括SNP、染色体、物理位置、p值、se值、effect值等信息。

数据集2：结局变量Y的GWAS summary结果，包括SNP、染色体、物理位置、p值、se值、effect值等信息。

如何对孟德尔随机化数据进行处理？

筛选工具变量：通常选择p值小于某个阈值（如5e-08）的SNP作为工具变量，以确保其与暴露因素之间的强相关性。去除连锁不平衡（LD）的SNP，以确保工具变量之间的独立性。

合并数据：将工具变量的GWAS结果与结局变量的GWAS结果合并，以便进行后续分析。

孟德尔随机化分析有哪些方法？

常用的 MR 方法包括：

逆方差加权（IVW）
MR-Egger 回归
加权中位数法
MR-PRESSO

分析流程确定了，基本步骤也清晰了，下面就是下载数据，进行实际分析了，欢迎继续关注。

想要更好的学习和交流，快来加入飞哥的知识星球，这是一个生物统计+数量遗传学+GWAS+GS的社区，在这里你可以向飞哥提问、帮你制定学习计划、跟着飞哥一起做实战项目，冲冲冲。点击这里加入吧：飞哥的学习圈子

http://mp.weixin.qq.com/s?__biz=MzI0MTIzNjYwNQ==&mid=2247495975&idx=1&sn=5fb8f2951d1ee98562348ac23ead21d1

育种数据分析之放飞自我

本公众号主要介绍动植物育种数据分析中的相关问题, 算法及程序代码.

最新文章

GWAS分析中曼哈顿图如何添加基因信息

GWAS分析神器：GAPIT3.5安装教程

GWAS分析先做后学

基因组学再创新高，农业领域迎来颠覆性进展，解决育种历史科研难题

孟德尔随机化分析直接上手！

《Genome-Wide Association Studies》第六章：GWAS中多年多点表型数据处理

《Genome-Wide Association Studies》第五章：GWAS结果解读

多性状或者多个模型的QQ和曼哈顿重叠图

基因型数据进行PCA分组

R语言免费电子书，一看就会一用就废不看白不看系列

对统计学“又爱又怕”，到底如何学统计？

两天搞定育种中常用的遗传评估和GS

《Genome-Wide Association Studies》第四章：GWAS中的统计模型

GWAS的曼哈顿图和QQ图diamante

多基因平分（PRS）与全基因组关联分析（GWAS）有什么关系？

一行代码对100个性状进行gwas分析

GWAS分析QQ图挺好，曼哈顿图没有显著性，如何调整阈值

孟德尔随机化R包TwoSampleMR安装教程并设置token

孟德尔随机化分析：代码实战

GWAS分析效果好坏重点是看QQ图

遗传力计算 | 随机区组RCBD计算广义遗传力

基因型数据的聚类分析和PCA分析

十一在家把GWAS分析学会吧！

GWAS分析中PCA分层不明显怎么办？你秀什么优越感？

GWAS分析中显著位点如何注释基因：excel？？？

数量遗传学：加性效应、显性效应、替换效应和GWAS的effect效应值

一文搞定R语言箱线图添加显著性的方法

R语言导出数据和统计结果三线表到Word文档中（一文搞定）

从入门到出家：单倍型Haploview分析（万字详解）

中秋推荐书：《动物育种和遗传学》翻译纸质版

撞脸：为何两个路人会长得一样？

配合力和育种值BLUP为啥为负值，几个意思？

孟德尔随机化分析和GWAS分析有什么区别？

R语言实操：使用TwoSampleMR包进行孟德尔随机化分析

从一篇孟德尔随机化文章看MR常见结果形式

孟德尔随机化：工具变量三大假设

IBS和IBD的区别和计算方法介绍

孟德尔随机化的术语理解

GWAS中的分析模型介绍和注意要点

真心建议数据人冲一冲新兴领域，收入还在涨！

GWAS检测的显著性SNP哪个分型是优势基因型？哪个SNP影响大？

obsidian使用初体验

关于遗传力常见的误解

再见了，手机搜索引擎，再见了百度

《Genome-Wide Association Studies》第三章：基因分型平台介绍

一文解决R语言安装包报错的问题

《Genome-Wide Association Studies》第二章：表型数据的准备和管理

《Genome-Wide Association Studies》第一章：GWAS分析的主要步骤和关键要点

用BLUE值作表型进行GWAS分析

plink对100个性状进行gwas分析

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉