首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
NAR | 刘毓文/倪建泉团队开发基于人工智能的DNA顺式调控元件设计新方法
文摘
2025-01-07 08:31
美国
近年来,基于
人工智能
(AI)
的蛋白质结构预测和蛋白质从头设计为整个生命科学领域带来了巨大变革,今年的诺贝尔化学奖也授予了该领域做出开创性工作的三位科学家。然而,相比于只占基因组3%-5%的编码区序列,利用人工智能设计基因组中非编码
顺式调控元件序列
(CRE)
的研究还非常少。CRE在基因表达的时空模式中扮演着关键角色,决定了细胞和组织的身份和功能。因此,无论是在合成生物学生物反应器中提高目标产物的表达、基因治疗中精准控制药物蛋白的表达,还是在生物育种中通过微调功能基因的表达量提升经济性状的表现,都迫切需要利用人工智能设计全新的CRE序列。
增强子
是CRE中最为重要的一类元件,控制着基因的时空特异性表达。然而,由于增强子调控语法的复杂性,传统的增强子设计方法通常依赖于繁琐的迭代突变以及已知DNA基序的组合操作,精准设计符合需求的增强子序列面临巨大的局限性。去年12月,
Nature
发表的两篇文章首次利用深度学习算法进行了增强子的从头设计,但是其计算模型还存在优化的空间,且设计的增强子在活性上相对于自然序列提升非常有限,并没有完全释放从头设计DNA序列在合成生物学领域的巨大潜力。
为进一步探索增强子设计的解决方案,中国农业科学院深圳基因组研究所
刘毓文
团队和清华大学
倪建泉
团队合作,于2024年10月18日在
Nucleic Acids Research
期刊发表了题为:
A novel interpretable deep learning-based computational framework designed synthetic enhancers with broad cross-species activity
的研究论文。
该研究开发了
DREAM
(
D
NA cis-
R
egulatory
E
lements with controllable
A
ctivity design platfor
M
,DREAM)
的计算框架,旨在彻底变革增强子等顺式调控元件的设计方式。DREAM代表DNA顺式调控元件的可控活性设计平台,这个名字恰如其分地反映了其核心功能。
DREAM具有高度的可扩展性和解释性,能够自动从头设计具有用户理想性质的启动子、增强子、沉默子。通过深度学习技术,DREAM自动学习和识别与调控活性相关的DNA“词汇”,并基于这些知识精确预测增强子的活性。
基于该方法,研究团队首次设计出了在超过10亿年分化物种
(包括哺乳动物、鸟类、鱼类、昆虫和酵母等)
中具有保守功能的增强子序列,揭示了增强子调控语法的跨物种保守性。此外,设计出的超强增强子活性显著高于不同物种中常用的最强增强子,同时也首次设计出了基因表达抑制效果显著的沉默子序列,为合成生物学基因表达操作提高了新的高效元件。最后,研究团队还将设计的增强子成功整合入果蝇基因组中,
首次获得了携带人工智能设计调控元件的成体动物
。在成体果蝇中,报告基因的表达量提升了1万倍以上,为基于CRE元件优化的合成生物学育种提供了重要理论依据和技术参考。
DNA顺式调控元件的可控活性设计平台
通过基于Squeeze-and-Excitation注意力机制的深度学习技术
(SENet)
,DREAM自动学习和识别与调控活性相关的DNA“词汇”,并基于这些知识精确预测增强子的活性。研究表明,与现有的其他基于序列预测功能的模型相比
(包括Nature论文中首次增强子设计用到的DeepSTARR算法)
,DREAM的增强子活性预测模块在准确性和性能上有显著提升。
DREAM具有超高的元件活性预测性能
此外,DREAM兼具超高的元件活性性能预测能力以及良好的生物学可解释性,因此DREAM可以将学习到的增强子的调控语法用于后续的元件设计任务之中。在PCC、MSE等四项指标上,DREAM均超越目前主流的顺式调控元件预测模型。同时DREAM能够有效地捕获调控元件相关的DNA motif的特征。同时基于该框架,研究团队揭示了增强子元件中motif具有的位置效应以及距离依赖的上位性效应。由于其透明性,用户可以明确地了解在调控元件的设计和优化过程中,元件活性有关的重要的DNA特征是如何被利用和组织的。
DREAM可以捕获增强子相关的DNA motif并揭示motif的位置效应以及距离依赖的上位性效应
研究团队利用DREAM模拟了果蝇基因组中发育增强子和持家增强子进化动态,并成功设计出具有超强活性的增强子元件。这些元件的序列分析表明设计序列在motif的数目,空间排布、多样性、结合力以及GC含量等方面具有与自然元件截然不同的性质。作者合成了增强子DreaMer001,通过双荧光素酶实验测定其活性达到了果蝇基因组中最强天然增强子的3.6倍,同时构建了转基因果蝇在体内测量了该元件元件的活性,结果表明该元件在果蝇体内可以提高报告基因转录活性约10000倍,进一步证明了该元件具有极强的增强转录活性的能力。
更为重要的是,这些经过DREAM设计的高活性合成增强子不仅在果蝇S2细胞中表现出超高的活性,还在包括人类、小鼠、猪在内的多种物种的不同细胞系中具有超强的活性
(平均为CMV增强子活性的2倍以上)
,在SF9细胞中DREAM设计的增强子活性是Hr5增强子活性的15.7倍,另外该人工设计元件在鸡
(DF1细胞)
以及鱼
(精原细胞)
分别是CMV增强子活性的7.6倍和26.6倍。这表明DREAM有能力通过计算设计比自然进化产生的更高效的基因调控元件,也揭示了增强子调控语法的跨物种保守性。另外,DREAM框架具有的良好可扩展性,研究团队进一步展示了细胞特异性的强增强子,高AT含量超强增强子,具有固定酶切位点强增强子,以及强沉默子元件的设计。值得注意的是,作者利用DREAM获得了能够降低基因表达44.7倍的超强沉默子DreaMer002。这些结果证明了DREAM的设计成果在实际应用中具有广泛的应用场景和可靠性。
DREAM设计的高活性增强子在多物种的不同细胞系中具有超强的调控活性
中国农业科学院深圳基因组所
刘毓文
研究员和清华大学医学院
倪建泉
教授为论文共同通讯作者;基因组所博士后
李昭宏
、博士生
张圆圆
、清华大学博士生
彭博
、基因组所硕士生
秦胜华
为论文共同第一作者。刘毓文研究员长期从事非编码CRE的高通量定量和调控语法解析,并应用于复杂性状遗传机制解析;倪建泉教授长期从事果蝇中基因编辑技术的开发和应用。
论文链接
:
https://doi.org/10.1093/nar/gkae912
来源 | 生物世界
编辑丨王多鱼
排版丨水成文
生物信息与育种
致力将生信、AI、大数据、云计算等技术应用于现代生物育种
最新文章
中国科学院专家:教您AI在教育教学、论文写作和学术科研中的应用实操(教师收藏)
跳出传统育种观念:猪育种中关键福利性状的选择
中国知网发布2024年“中国最具国际影响力学术期刊”
ISPRS | 弥合作物育种和GeoAI之间的差距:利用迁移学习从多光谱无人机图像预测大豆产量
SCLS | 李孟华综述:基因组时代的反刍家畜育种新策略
NAR | 刘毓文/倪建泉团队开发基于人工智能的DNA顺式调控元件设计新方法
只是你不熟悉Tidyverse罢了
人工智能如何赋能教育教学、学术论文和课程建设?
Hortic Res | 一种集成环境-表型-基因型的分析方法
国自然中标真不难!十年评审专家1v1本子精修,中标率可达58.6%!免费直播答疑
作物育种计数模型
Plant Com | 基于深度学习的作物全基因组表型预测模型Cropformer
如何利用公共基因型-表型-环境数据来做基因组预测?
最新日程 | 2025年1月8号-10号三亚国际种业科学家大会
JIA &《中国农业科学》再次入选“最具国际影响力学术期刊”(附全名单)
Nat. Rev. Genet. | 如何从组学-深度学习模型结果中获取基因相关的解释?
Plant Com | 升级版的跨条件多组学关联分析工具 MODAS2
JGG|南京大学陈迪俊团队开发深度学习模型Osei揭示水稻基因组的调控序列密码
Genome Biology | 表观基因组学预训练语言模型EpiGePT
国自然中标真不难!十年评审专家1v1本子精修,中标率可达58.6%!免费直播答疑!
Mol Plant | 基于植物基因组的DNA大语言模型
大麦大佬Nils Stein综述:大麦研究与育种的十年愿景
大数据驱动的“绿色超级稻”高效育种策略
线上直播 | 基于AI的蛋白质结构解析与智能设计
国际智能育种新动态
再生稻适宜品种筛选及其类型划分
Nature Methods | GPT-4领衔:大语言模型(LLMs)推动基因功能探索新高度
水稻研究者必备!RGAP 2.0来了,全面解析基因组奥秘!
国自然中标真不难!十年评审专家1v1本子精修,中标率可达58.6%!免费直播答疑!
科研经费尽其用,一次预存,随时取用!附赠3800购物卡!年末钜惠!
农林专业顶刊AFM:双重集成方法预测水稻抽穗期
【今日报名截止】智能育种高级研修班即将开讲!
JIA综述:全球转基因作物商业化趋势
Plant Communications:合成生物学和人工智能在作物改良中的应用
【开班倒计时】TFSeeds智能育种研修班开班在即!
MHOrT | 易干军、杨乔松团队:香蕉分子生物学与育种的最新进展及未来发展方向
东北农业大学韩德果教授团队:探秘野生草莓AP2/ERF基因家族
2024中国农业企业500强
最新日程 | 2025年1月8号-10号三亚国际种业科学家大会
顶级大佬VanRaden教你如何实施基因组选择(GS)
种康院士 | 作物育种进化史:从野生驯化到智能设计
专业培训 | 数字育种-智能设计育种
5460 个三系杂交稻品种的不育系细胞质来源分析
农业农村部发布第三次全国农作物种质资源普查,共13.9万份!
JGG | 多视图数据的植物基因组预测新方法MVBLUP
请查收!第四届三亚国际种业科学家大会最新日程安排!
种业最新书籍推荐:《作物种业前沿科技战略研究》和《畜禽种业科技创新战略研究》
Science发布“全世界最前沿的125个科学问题”
专业培训 | 数字育种-智能设计育种
Nature:如何用ChatGPT辅助学术写作?
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉