Cell Research | 浙大、农科院和阿里联合开发AI模型DeepFDML破译棉花品种改良“密码本”

文摘 2024-11-08 08:27 湖南

棉花产量与纤维品质如何受到DNA甲基化调控？在人工智能（AI）的帮助下，中国棉花育种专家成功破译这一“密码本”，并从中找出有望改良棉花品种的关键基因位点。

近日，由浙江大学棉花精准育种团队、中国农业科学院生物技术研究所和湖畔实验室智慧育种团队组成的联合科研团队，综合运用遗传学、生物大数据和AI技术，构建了涵盖207个品种的棉花全基因组DNA甲基化图谱，鉴定了2.87亿个单甲基化多态性（SMP）位点，规模为目前所有作物之最。联合团队从中发现43个潜在参与纤维发育的eQTM基因，为棉花育种提供重要的候选基因列表。相关论文发表在国际期刊《细胞研究》（Cell Research）。

棉花是全球最大的天然纺织纤维来源，需要通过不断聚合优异的基因组遗传位点，进行品种改良。在AI、大数据等技术加持下，农业正在步入“智慧育种”时代，通过综合作物基因型数据、表型数据和环境数据，预测作物性状，精准筛选出优异基因。

此次，联合科研团队聚焦于DNA甲基化对作物的影响。DNA甲基化可以在不改变棉花DNA序列的情况下，影响棉花产量、纤维品质等农艺性状，并通过自然进化和人工选择传递。团队收集了207个品种的棉花全基因组甲基化测序数据、基因组测序数据、转录组测序数据，再结合农艺性状的表型数据，进行关联分析，首次构建起群体尺度的棉花全基因组DNA甲基化图谱，涵盖2.87亿个单甲基化多态性（SMP）位点。其中，仅甲基化测序数据就达到17TB。

湖畔实验室融合AI、并行计算等技术开发了一套新型算法，加速海量遗传数据的分析处理。湖畔实验室智慧育种团队负责人顾斐表示：“相比起传统方法，AI加成的分析计算速度提升近100倍，有助于开展亿级序列对比、群体变异分析和多组学关联分析，在数百个遗传变异、数万个基因以及数亿个甲基化位点之间建立起复杂的映射关系。”联合科研团队进而首次绘制出与棉花纤维发育相关、独立于遗传因素的表观调控网络，揭示了43个潜在参与纤维发育的eQTM基因。其中一个位点已通过基因编辑实验，证实其调控棉花纤维长度的作用。此外，研究人员研发了深度学习模型DeepFDML，基于DNA甲基化位点附近的序列，预测影响基因表达的甲基化位点，未来有望发现更多具有育种价值的信息。

开发了一个名为深度功能 DNA 甲基化基因座（DeepFDML）的深度学习模型来预测功能性 SMPs，它们是与基因表达变异相关的 SMPs。DeepFDML 模型在与功能性 CG 位点相对应的基因组序列上进行训练，即与 2423 个 CG-eQTM 相关的 2336 个非冗余 CG 位点（即阳性样本）。为保证训练数据的平衡，随机选取另一组 2336 个 CG-SMPs 作为负组。每个 CG-SMP 基因座的侧翼序列通过 one-hot 编码进行转化。
为了评估 DNA 甲基化对基因表达的影响，首先构建了一个卷积模型，该模型由一个卷积层（内核大小为 11，通道大小为 128）和一个全连接层组成。使用五重交叉验证方法对模型进行评估，在受试者工作特征曲线（ROC）和精确率-召回曲线（PRC）中的准确性都达到了0.65。随后，构建了一个更复杂的 DeepFDML 模型来提高准确性，采用类似于预训练 Enformer 模型的架构作为其支柱。这个先进的 DeepFDML 模型包含一个由 7 个卷积池块组成的卷积部分和一个由 11 个 transformer 编码层组成的 transformer 部分。该模型实现了 0.82 的 ROC 和 0.78 的 PRC，大大超过了卷积模型的性能。基于这些结果得出结论，通过使用深度学习方法的预测模型，可以根据 DNA 序列模式识别功能性 SMP。

“这项研究成果证明了DNA甲基化数据可作为育种资源，为棉花品种改良提供新的思路。”来自浙江大学棉花精准育种团队的方磊表示：“依托生命科学+AI，育种家们将持续挖掘关键基因、预测农艺性状，加速培育‘超级’作物。”

据悉，湖畔实验室（数据科学与应用浙江省实验室）成立于2020年7月，依托阿里巴巴达摩院建设，聚焦数据科学领域的“数据智能”和“新型计算”两大方向。在智慧育种领域，湖畔实验室牵头研发全流程智慧育种平台，为育种家们提供包含育种数据管理和分析、计算加速、AI预测的“中央厨房”，大幅缩短培育新品种的周期。

参考来源：中国科学报

http://mp.weixin.qq.com/s?__biz=MzI0NzA3MTk2NQ==&mid=2662941199&idx=1&sn=7b905459467f036512be96a542b099d5

生物信息与育种

致力将生信、AI、大数据、云计算等技术应用于现代生物育种

最新文章

José Crossa综述：机器学习算法将大数据转化为对育种精度的预测

玉米研究越来越接地气了

DNA大模型：理解基因组语言的强大工具

中国工程院院士孙其信：我国智能育种有望实现根本性突破

Science Bulletin | 科学研究范式转变：从数据密集型科学到机器人科学家

先正达的育种DNA大模型AgroNT到底如何？

中科院75项首创科技成果公布，“分子设计育种”、“小偃6号”入选

反向育种要是做成了，种子行业会不会乱套？

综述 | 基因重复驱动的演化：基因组学时代的回顾与展望

中国科技期刊卓越行动计划二期拟入选项目公示！JIA评A档、Cell Research评B档？

软科2024最新世界一流农学学科排名发布，中农超越瓦大，成全球第一！

Cropin推出首个实时生成式AI驱动的农业智能平台Sage

农业知识智能服务应用场景构建

这篇发表在New Phytol.上的水稻基因研究文章值得大家借鉴

分子互作实验有哪些？酵母双/单杂、BiFC、Co-IP、EMSA、ChIP......该怎么做？

当AI开始思考：MIT教授、《人工智能时代》作者胡滕洛赫尔前瞻性演讲，探讨AI发展趋势及其对未来的革命性影响

关于征集“2025中国种子（南繁硅谷）大会”田间展示品种的通知

瑞典农业育种公司OlsAro融资开发人工智能作物育种平台

Cell Research | 浙大、农科院和阿里联合开发AI模型DeepFDML破译棉花品种改良“密码本”

第四届三亚国际种业科学家大会将于2025年1月8-10日举办

又一篇Science发布！多位农大教授联合发表，机器学习与深度学习在作物改良中的重要作用！

募格编辑论文润色，首单享9折优惠，免费提供润色证明

最新中国种企销售top20、品种top10

PBJ | 华中农大谢为博等开发水稻抽穗期跨环境精准预测新方法

Nature Genetics | 基因组所周永锋团队建立葡萄全基因组选择育种体系

JIPB | 李林综述：大数据和人工智能辅助作物育种进展与展望

邹学校院士综述 | 中国辣椒育种60年回顾与展望

第七届全国植物青年科学家论坛通知（第二轮）

玉米品种近40年来累计推广面积前20强及年度前10强排行榜

如何做分子互作实验？Y2H、Y1H、BiFC、Co-IP、EMSA、ChIP......

Mol Plant | 程时锋综述：植物基因组重测序与群体基因组学

加入CIMMYT，成为国际种业研发与推广的领航者！

酵母双杂、双分子荧光互补、免疫共沉淀、酵母单杂、凝胶迁移实验、染色质免疫共沉淀等核心技术（理论+实操）学习交流会

育种 4.0 与人工智能在作物改良中的应用概述

AI蛋白“相关”国内的公司

Annu. Rev. Plant Biol（IF=21.3）| 深度学习在植物表型中的应用

分子互作咋做？

继“总环”之后，不再拒稿的一区顶刊eLife也被On Hold了

GPB | 王向峰综述：机器学习技术驱动植物AI育种

重磅培训 |（理论+实操）2024分子互作分析技术学习交流会，酵母杂交，CoIP，RIP，REMSA等等

罗锡文院士：智慧农业的关键技术与实践

2024年软科中国大学专业排名（生物学、作物学、农学等）

Field Crop Res | 中国热科院甘蔗中心发布甘蔗智慧育种的全新架构

Nat. Genet | 中农董朝斌团队揭示玉米驯化基因tsh4在株型和穗型发育中的调控作用

生信人员与IT人员如何联动合作？

最新种业上市/拟上市公司盘点

重磅书讯！院士作序，北林教授出版《中国蔷薇属》专著

世界稻米产区三十强

Cell Res | 首个知识与数据联合驱动的跨物种生命基础大模型GeneCompass：解析基因调控密码，打造干湿融合新范式

中国工程院院士赵春江：农业大模型与知识服务平台

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉