水稻(Oryza sativa)是保障全球粮食安全的重要农业作物。水稻基因组中的调控元件(包括启动子、增强子、沉默子和绝缘子)在基因表达调控中扮演着核心角色,由于与农艺性状密切相关的大量遗传变异都分布在这些调控区域,研究调控元件的功能对水稻性状的遗传改良至关重要。然而,揭示这些元件的调控密码——即它们如何通过序列信息精确地调控基因功能,一直是生物学领域最具挑战性的问题之一。
2024年12月18日,Journal of Genetics and Genomics在线发表南京大学陈迪俊团队题为“Deep learning on chromatin profiles reveals the cis-regulatory sequence code of the rice genome”的研究论文。该研究开发了一种名为Osei的深度学习模型(https://github.com/compbioNJU/Osei),用于分析和预测水稻基因组中多种染色质特征,包括转录因子结合位点、组蛋白修饰信号和染色质开放区域等,覆盖整个基因组的80%以上。该模型不仅能够精准分类调控序列,还可以量化遗传变异对调控活性变化及其对农艺性状的影响,为未来设计人工合成调控序列、提升作物性能提供新思路。
点击图片|阅读原文
相比于现有模型,Osei具有更广泛的数据覆盖范围,使用了超过850万条调控峰值数据,包括31种转录因子结合特征、373种组蛋白修饰信号和63种染色质开放性特征,这些数据集主要来自研究团队先前开发的ChIP-Hub平台。Osei模型由三个连续部分组成:具有线性和非线性路径的卷积网络,用于高效训练和复杂的交互学习;残差扩张卷积层,用于在不降低空间分辨率的情况下扩展感受野;以及空间基函数变换层,用于有效集成空间信息和降维。此外,Osei模型展现了出色的跨物种预测能力:基于基因组序列信息,在预测其它单子叶植物(如玉米)和双子叶植物(如拟南芥)的染色质状态时,其预测信号的分布与对应物种的实验数据高度吻合。这不仅体现了该模型在跨物种应用中的鲁棒性和迁移学习能力,也揭示了不同植物物种间可能共享的基因调控密码,为进一步解析植物基因组的进化与功能保守性提供了新视角。为方便研究人员使用,作者团队还开发了一个界面友好的在线数据平台(https://biobigdata.nju.edu.cn/Osei/),用户可以轻松访问并探索Osei模型的预测结果,进一步推动其在植物基因组学研究中的应用。
Osei模型结构示意图
作者简介
南京大学生命科学学院硕士研究生周欣恺(已毕业)和阮忠豪为该论文共同第一作者。南京大学生命科学学院、医药生物技术全国重点实验室陈迪俊副教授为通讯作者。相关工作得到国家自然科学基金委面上项目资助。
引用本文
Xinkai Zhou, Zhonghao Ruan, Chenlu Zhang, Kerstin Kaufmann, Dijun Chen. (2024). Deep learning on chromatin profiles reveals the cis-regulatory sequence code of the rice genome. Journal of Genetics and Genomics.
DOI:10.1016/j.jgg.2024.12.007
第一作者面对面
从左至右:周欣恺、阮忠豪
自我介绍
周欣恺:硕士毕业于南京大学生命科学学院,导师为南京大学陈迪俊副教授;现为柏林洪堡大学博士研究生,导师为Kerstin Kaufmann教授,研究方向为基于单细胞组学与深度学习模型探究植物叶片的环境可塑性分子机制。
阮忠豪:南京大学生命科学学院硕士研究生,研究方向聚焦于利用比较基因组学和深度学习模型,探索植物发育过程中的调控机制及其演化规律,导师为南京大学陈迪俊副教授。
你的目标或愿景
我们的目标是借助深度学习模型在植物基因组研究领域实现突破,利用组学大数据解决关键科学问题,推动学术进步。与此同时,更加注重将研究成果与实际应用相结合,为作物改良提供坚实的基础研究支持。我们致力于不断提升自身能力,并积极与志同道合的研究人员携手合作,共同开拓更广阔的未来。
在你的研究领域中,你认为亟待解决的问题是什么?
深度学习在多组学数据分析中的应用。随着多组学技术的迅猛发展,大量复杂且高维的生物数据持续涌现,深度学习以其强大的特征提取和模式识别能力,为这些数据的整合与预测提供了创新手段。这不仅有助于揭示复杂生物系统中的潜在规律和分子机制,还为实际应用提供了坚实的理论支持,加速了基础研究与应用科学的深度融合与发展。
在得知论文被接收后,你的感觉是什么?
在得知论文被接收后,我们感到非常高兴,这不仅是对我们长期努力的一种肯定,更是对研究价值的认可。我们由衷感谢审稿人和编辑对我们工作的审阅和认可,同时也感谢导师对我们的悉心指导。论文的接收让我们更加坚定了继续深入研究的信心,也激励我们在未来的科研道路上再接再厉,取得更多突破。
你心目中最喜欢或敬仰的科学家
我最敬仰的科学家是达尔文(Charles Darwin)。他提出的进化论和自然选择理论深刻改变了人类对生命起源与生物多样性的认识,也为现代生物学奠定了基础。我们的研究同样受到达尔文理论的启发,他的科学精神和卓越贡献始终激励着我不断学习与探索。
你认为平衡研究工作和生活的诀窍是什么?
我们认为平衡研究工作和生活的关键在于有明确的计划和目标,合理安排时间。同时在繁忙的科研任务中要做到张弛有度,并保持乐观的心态,用积极的态度面对难题。
为了能更有效地帮助广大的科研工作者获取相关信息,植物生物技术Pbj特建立微信群,Plant Biotechnology Journal投稿以及文献相关问题、公众号发布内容及公众号投稿问题都会集中在群内进行解答,同时鼓励在群内交流学术、碰撞思维。为了保证群内良好的讨论环境,请先添加小编微信,扫描二维码添加,之后我们会及时邀请您进群。小提示:添加小编微信时及进群后请务必备注学校或单位+姓名,PI在结尾注明,我们会邀请您进入PI群。