原创解读 Curr Opin Plant Biol | GWAS下游分析的新视角：从分子标记到因果基因，以实现更精准的作物育种

学术 2024-12-04 00:01

研究背景

全基因组关联研究（GWAS）是一种强大的统计方法，有助于揭示基因组变异与重要表型之间的关联。尽管 GWAS 确定了与性状有统计学关联的相关基因组区域，但这些区域并不总是因果性的。因为 GWAS 中的最高关联 SNP 通常不是因果 SNP，而是与因果遗传特征处于连锁不平衡（LD）状态。GWAS 之后可以使用许多不同的方法来缩小相关变体位置的范围，从而发现因果基因。传统的 GWAS 下游分析方法是精细定位，这需要对大群体进行密集的表型分析或测序。然而，通过整合多组学数据以及机器学习确定基因优先级已经变成近些年常用的方法。

2024年11月15日，Current Opinion in Plant Biology 在线发表了题为“New perspectives of post - GWAS analyses: From markers to causal genes for more precise crop breeding”的综述。这篇文章强调了利用广泛的公共数据集评估变异位点的重要性，并整理了用于因果突变识别和等位基因变异探索的生物信息学工具和基因组策略的最新进展。

研究结果

1、GWAS下游分析中多组学数据的整合

GWAS 下游分析常结合多组学数据以降低假阳性并更精准识别因果变异（图1）。例如转录组关联研究（TWAS）可探寻基因表达变化与表型的关联，类似的方法包括代谢组（mGWAS）、表观基因组（EWAS）和蛋白质组（PWAS）关联研究。但单一类型组学数据或小样本量仍易导致假阴性增加。整合多种组学数据能进一步减少假阳性和假阴性的可能性。另一种方法是结合 eQTL 和 GWAS，首先进行精细定位以识别候选变体，然后使用共定位方法评估 GWAS 和 eQTL 信号是否重叠。然后使用功能注释对候选基因进行优先级排序和验证，并通过植物转化和基因编辑等方法进一步进行实验确认。

将参考基因组、泛基因组和多组学数据整合到统一的数据库中对于增强数据交互和提高 GWAS 下游预测准确性至关重要。目前在作物育种方面已经有了大量的多组学资源，如大豆的 SoyOmics、棉花的 CottonMD 数据库、芸薹属的 BnIR、玉米的 ZEAMAP、Gramene 和 Phytozome。

2、减少标记数量与利用泛基因组辅助识别因果变异

育种家更倾向于开发与理想性状相关的标记，而不是识别表型背后的实际因果突变（CM）。因为标记主要用于基因组选择（GS）建模，并通过计算个体的遗传值达到育种目的。由于遗传值是个体相对于其可观察性状的遗传组成，GS 中使用的标记通常涵盖复杂的多基因性状。与控制质量性状的简单显性基因不同，复杂性状是由独立的基因座累积控制的，每个基因座携带多个具有不同等位基因效应的基因。因此，为 GS 开发的标记在识别复杂性状的单个小效应基因方面不是最优的。

最近的经验表明，数据生成速度快于数据利用率会导致总体数据可用性下降，因此GS 现在的趋势是减少分析中的标记数量，同时根据周围基因的功能注释或这些基因与标记的接近程度来识别 CM。然而，分析中较低的标记密度引发了一个问题，即 CM 与相关标记之间的距离可以有多远。最近的研究表明，可以利用从低密度基因型获得的标记来补充其他研究中重测序数据集缺失的表型，从而有助于更精确的 CM 预测。

在一个独立的育种计划（BP）中，与表型显著相关的标记仅能部分预测另一个BP的相同表型（图2）。这表明，测试群体的相似遗传背景可能导致高估所采用标记预测其他遗传相关性较低的BP中表型的效率。因此，有必要通过准确性测试来验证标记与变体位置或表型之间对应关系的有效性。此外，由于单一线性参考基因组无法捕获物种内的多样性，并可能扭曲我们对性状的基因组基础的理解，因此以泛基因组作为新参考来增加标记数量逐渐成为分子标记辅助育种的新方法。

3、应对罕见表型和多等位基因的策略

GWAS 在很大程度上依赖于样本量、基因型质量和表型分布。克服这一限制的一个趋势性方法是最大化输入数据。已有研究通过整合多个重测序数据集成功实现 GWAS 下游因果突变的识别。利用广泛的自然变异不仅能够发现可能被忽视的稀有变异，也增加了单基因中多个因果突变的检测机会，新开发的 MADis 工具可有效地识别单个基因中的多个等位基因，包括在数据集中仅出现一次的罕见等位基因。

4、GWAS 中的机器学习和人工智能

机器学习（ML）算法在 GWAS 数据的多个阶段都能发挥作用。数据预处理阶段可以对表型和基因型数据进行降维；GWAS 分析中可使用 ML 模型；GWAS 下游分析阶段有助于基因优先级确定和表型预测。不同类型 ML 算法适用于不同数据结构和分析需求，能处理复杂数据集，提升因果基因识别效率。

5、GWAS 下游分析常用工具

本文整理了用于作物和模式物种数据的 GWAS 后分析的可用工具和平台（图3）。迄今为止最全面的组学数据平台是玉米的 MODAS，它与 QTL-Finder 一样是少数具有基于 ML 分析能力的工具之一。像 MBKbase 和 Soyomics 这样的平台在组学数据类型上有限，但它们都支持分析输出的可视化。而Milletdb、BnIR 和 BnaOmics 的优势是整合了表观基因组学数据。

总结与讨论

GWAS 下游分析在减少假阳性、助力因果基因识别方面发挥关键作用。通过整合多组学数据、利用现有数据进行因果突变识别、利用广泛的遗传多样性以及运用机器学习和人工智能等手段，作物育种有望变得更加精准高效。

原文链接

https://doi.org/10.1016/j.pbi.2024.102658

扫描二维码关注我们

小麦族多组学网站：http://wheatomics.sdau.edu.cn

投稿、合作等邮箱：shengweima@icloud.com

微信群: 加群点击小麦研究联盟交流群

小麦研究联盟

本公众号意在分享小麦组学研究和生物信息学领域相关的知识，包括相关软件，方法，文章，编程相关的知识。bioinformatics

最新文章

山东省耐盐碱小麦育种概况及思考（一麦众承曹新有）

一作解读 | MP 大麦2035：作科所联合国外学者展望大麦基础研究与育种创新

Plant Com | 中国农科院作科所合作提出基于深度学习的作物全基因组表型预测模型Cropformer

原创解读 New Phytol | 大麦MLA免疫受体通过真菌非核糖体肽效应蛋白调控感病的分子新机制

小麦多组学网站上线周8425B基因组资源

Plant Com|河南农业大学王道文、陈锋和殷贵鸿团队构建小麦骨干亲本周8425B基因组物理图谱并解析其对小麦农艺性状的贡献

天成未来 | 大麦/青稞泛基因组外显子测序芯片

他山之石 | The Plant Cell | 古多倍体植物中的非经典转录起始具有组织特异性并受表观遗传调控

原创解读 | Plant Physiology | 四肽重复蛋白TaTPR-B1调节小麦穗密度

原创解读| Food Chem Glu-D1位点不同HMW-GSs的鲜面条加工过程中蛋白质和水分的动态变化

INT J BIOL MACROMOL | PRA结合可视化方法快速检测小麦条锈病

原创解读 | IJBM TaNAR2.1和TaNAR2.2对小麦氮素吸收和生长的影响存在差异

The Crop Journal | 中国农科院灌溉所揭示长期气候变化对华北平原冬小麦生产异质性的影响

原创解读 Plant Cell | phasiRNA动态调控及其在禾本科植物雄性器官发育中的演化机制

Genome Biology | 华中农大小麦团队揭示春化过程中的基因转录调控“牧羊”模型

他山之石 New Crops|点燃战火：植物免疫中的钙离子信号转导

(张学勇研究员) 小麦族基因组学与分子育种国际论坛 : 小麦泛基因组研究揭示我国重大品种演替规律

PBJ | 染色体工程新篇章II—韩方普研究组应邀撰写植物染色体工程综述文章

Phytopathol Res | 山东农科院刘成研究组联合多家单位创制了高抗条锈病小麦-黑麦T2DS·2DL-2RL新型易位系

原创解读| Food Bioscience 小麦TaDOF6过表达对籽粒淀粉和RS3抗性淀粉分子结构和理化性质的影响

原创解读 Curr Opin Plant Biol | GWAS下游分析的新视角：从分子标记到因果基因，以实现更精准的作物育种

原创解读 J Exp Bot | CRISPR/Cas9介导的γ和ω-醇溶蛋白基因编辑为无醇溶蛋白小麦铺平道路

河南大学“小麦逆境适应及遗传改良团队”师资博士后和青年教师招聘

JIPB|山东大学刘树伟课题组解析TaGPAT6调控小麦耐盐的功能及分子机制

Nature | 国内首篇小麦泛基因组揭示结构变异驱动适应性进化和育种改良

[重磅]17个中国代表性品种基因组发布并上线小麦多组学网站

一作解读 | 四川农大针对山羊草属创制新的分子标记和细胞学探针

人物 | 小麦专家——Jorge Dubcovsky

Plant Com | 中国农大鉴定调控小麦株高的新基因TaERF-A1并揭示其作用机制

麦族基因组学与分子育种国际论坛（2024 第VIII期）

一作解读 LWT-Food Sci Technol | 利用单个HMW-GS缺失改善弱筋小麦的面团质量和加工品质

Nature Commun | 东北师范大学张铧坤团队揭示小麦中RNA结构对RNA稳定性的调控机制

一作解读 | Nature : 76个大麦的泛基因组和结构变异

JGG | 中国农科院作科所小麦研究团队发现TaNPF6.2通过提高小麦氮素吸收效率改善农艺性状

TAG │ 扬麦两个籽粒产量相关位点的优异等位变异组合可以显著提高小麦产量

他山之石|Agric. For. Meteorol结合多个水稻物候模型和基于机器学习的遗传参数回归模型的双集合方法预测水稻抽穗期

麦族基因组学与分子育种国际论坛（2024 第VIII期）

西北农林科技大学康振生院士/刘杰教授课题组发现NLR蛋白介导小麦抗条锈病新机制

一作解读 | Plant Physiol 严六零课题组发现一个新的调控小麦发育进程的E3泛素连接酶基因

NC | 一个NLR基因同时抵抗两种小麦病害

张一婧|胡跃清|凌宏清课题组合作开发多倍体单细胞数据整合与发育核心基因排序的定量计算框架

一作解读 | TaRACK1B-TaSGT1-TaHSP90复合体动态调节NLR蛋白介导的抗病毒免疫

打造小麦“航母”编队，300余名院士、专家助阵！

他山之石Nat. Commun.|坏死营养真菌毒力所必需的效应子靶向植物HIR以抑制宿主免疫

PC&E|贵州师范大学杜旭烨教授和贵州大学任明见教授合作揭示TaWRKY17与 TaWRKY44互作，提高小麦耐盐性的分子机制

The Crop Journal | 中国农科院作科所联合中国农大揭示拟斯卑尔脱山羊草根系与叶片形态发生过程中的表观遗传调控

（天成未来）作物育种芯片/NGS类产品年终促销活动

一作解读 | IJBM 全球暗化背景下硫肥影响小麦饼干口感的多尺度淀粉结构调控机制

中国农业科学｜山西农业大学农业工程学院郑德聪课题组基于双输出回归卷积神经网络的燕麦株高估测研究

原创解读| PC 澳大利亚默多克大学西部作物遗传联盟李承道教授课题组泛基因组泛转录组时代的基因家族分析

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉