北京师大秦志伟团队: 使用最新算法可望实现自然语言“嵌入“微生物”

学术   2024-11-10 10:55   北京  

研究背景

从科研和应用的角度来看,科学家对微生物的了解和研究方兴未艾。可以想象,对某类模式生物和某些特殊微生物资源来说,第一手资料的及时获取是至关重要的,特别是这种“及时获取”可以通过简单的测序和分析即可完成(这种技术在今天,是相对快速和低成本的)。但目前,科学社区的研究成果主要是以海量的学术发表为载体,它们的时间跨度通常会较长。

相较于传统方式,DNA 存储具有存储密度高、存储时间长、占地面积小、维护成本低等诸多优点。除此之外,我们更关注的是整合到微生物染色体中的、含有可解码文字信息的、不具有遗传效应的外源 DNA 片段,其具有难以丢失和不易平行转移等特征,以此来避免信息丢失和信息污染等问题。

研究内容

近日,北京师范大学秦志伟课题组提出一种将自然语言通过编码方式转化成脱氧核酸 (DNA) 序列,从而将其保存在珍贵微生物资源中的一种构想。目的是当这些细菌,因故意或非故意的方式流传至环境中时,在不会改变遗传型的同时,能够为后来的研究者提供第一手有用的信息,而这种信息只需要通过简单的测序和读取就能够实现。
  • Figure 1. Using a DNA digital storage algorithm, we developed a standardized process to embed natural language within microorganisms.
  • Figure 2. The overall diagram illustrating the embedding of DNA-based natural language (DBNL) in microbes.

以天然产物化学家为例,如果他们通过测序,便可以得知他们开采的那些感兴趣的微生物若干年前在实验室的某种条件下能够产生哪些天然产物以及对应的化学结构,这毫无疑问是有重要意义的。

另外值得一提的是,不能排除这样的可能性:即由于进化或者其他方面的原因,研究者们目前能够培养的一些感兴趣的微生物,在相当长的一段时期之后可能便无法培养了,而文字信息的嵌入,可以至少从宏基因组的角度为研究者提供相关信息,能够使他们了解到他们的前人早期曾发现过什么,这将为生物史学等方面的研究提供重要的参考价值。

作为实验验证,该课题组还使用了由中科院先进技术研究院黄小罗博士等人开发的最新算法“悟空“来实现自然语言和 DNA 之间的编码和解码并通过课题组近期工作中发现的珍贵微生物进行了实验验证。

该观点性研究论文以 “Embedding DNA-based natural language in microbes for the benefit of future researchers”为题,发表在英国皇家化学会期刊 Digital Discovery 上。
‍‍

论文信息

  • Embedding DNA-based natural language in microbes for the benefit of future researchers

    Heqian Zhang (张鹤千北京师范大学), Jiaquan Huang, Xiaoyu Wang, Zhizeng Gao, Hang Li, Shanshan Zhou, Shang Wang, Shan Wang, Xunyou Yan, Song Meng. Xinwei Yang, Xiaoluo Huang* and Zhiwei Qin* (秦志伟北京师范大学)

    Digital Discovery, 2024
    https://doi.org/
    10.1039/D4DD00251B

作者简介

张鹤千 副教授

北京师范大学

本文第一作者,北京师范大学副教授,博士生导师,主要从事新型人工智能技术在生物医药中的开发及抗菌肽改造。发表 SCI 收录刊物论文 20 余篇,公开和授权发明专利 7 项,软件著作权 1 项,主持国家自然科学基金、广东省教育科学规划项目、广东省教育厅青年创新人才项目等。








秦志伟 研究员
北京师范大学
本文通讯作者,北京师范大学研究员,博士生导师,广东省重大人才项目入选者。主要从事先进人工智能技术和生物医药的交叉,致力于开发新型生防菌、抗生素和除草剂等。目前,在 Nature Communications, Chemical Science, Plant Physiology,Journal of Advanced Research,Critical Reviews 等刊物发表论文 30 余篇,主持国家自然科学基金、广东省自然科学基金多项。

相关期刊

Digital technologies that bring the future closer

rsc.li/digitaldiscovery

Digital Discovery

2-年影响因子*6.2
5-年影响因子*6.2
JCR 分区*Q1 化学-多学科
Q1 计算机-跨学科应用
CiteScore 分2.8
中位一审周期43.5 


Digital Discovery 的重点是数字化技术和自动化工具与基础科学的相互结合,将囊括人工智能、实验自动化、机器人技术、数据库以及先进数据分析等领域的创新成果。本刊发表的研究工作范围广阔,但需有坚实的化学基础。作为一本金色开放获取的期刊,读者可免费获取论文的全文,同时从该刊发布起到 2024 年年中免收论文发表费用。

Editor-in-Chief

  • Alán Aspuru-Guzik
    🇨🇦 多伦多大学

Associate editors

  • Matthias Degroote
    🇧🇪 勃林格殷格翰

  • Cesar de la Fuente
    🇺🇸 宾夕法尼亚大学

  • Jason E Hein
    🇨🇦 不列颠哥伦比亚大学

  • Kedar Hippalgaonkar
    🇸🇬 南洋理工大学

  • Linda Hung
    🇺🇸 丰田研究所

  • Joshua Schrier
    🇺🇸 福特汉姆大学

Editorial board members

  • Lee Cronin
    🇬🇧 格拉斯哥大学

  • Yousung Jung
    🇰🇷 首尔国立大学

  • Anat Milo
    🇮🇱 内盖夫本-古里安大学

  • Lilo D. Pozzo
    🇺🇸 华盛顿大学(西雅图)

  • Ekaterina Skorb
    🇷🇺 圣彼得堡国立信息技术机械与光学大学

* 2023 Journal Citation Reports (Clarivate, 2024)
 CiteScore 2023 by Elsevier
 中位数,仅统计进入同行评审阶段的稿件







欢迎联系我们发布论文报道
📧 RSCChina@rsc.org

点击下方「阅读原文」查看论文原文
↓↓↓

RSC英国皇家化学会
英国皇家化学会,是全球领先的化学学术团体,致力于推动化学科学的卓越发展。推送最新的国际化学新闻,分享顶尖的化学科研成果及丰富的化学学术活动。
 最新文章