研究背景
从科研和应用的角度来看,科学家对微生物的了解和研究方兴未艾。可以想象,对某类模式生物和某些特殊微生物资源来说,第一手资料的及时获取是至关重要的,特别是这种“及时获取”可以通过简单的测序和分析即可完成(这种技术在今天,是相对快速和低成本的)。但目前,科学社区的研究成果主要是以海量的学术发表为载体,它们的时间跨度通常会较长。
相较于传统方式,DNA 存储具有存储密度高、存储时间长、占地面积小、维护成本低等诸多优点。除此之外,我们更关注的是整合到微生物染色体中的、含有可解码文字信息的、不具有遗传效应的外源 DNA 片段,其具有难以丢失和不易平行转移等特征,以此来避免信息丢失和信息污染等问题。
研究内容
Figure 1. Using a DNA digital storage algorithm, we developed a standardized process to embed natural language within microorganisms.
Figure 2. The overall diagram illustrating the embedding of DNA-based natural language (DBNL) in microbes.
以天然产物化学家为例,如果他们通过测序,便可以得知他们开采的那些感兴趣的微生物若干年前在实验室的某种条件下能够产生哪些天然产物以及对应的化学结构,这毫无疑问是有重要意义的。
另外值得一提的是,不能排除这样的可能性:即由于进化或者其他方面的原因,研究者们目前能够培养的一些感兴趣的微生物,在相当长的一段时期之后可能便无法培养了,而文字信息的嵌入,可以至少从宏基因组的角度为研究者提供相关信息,能够使他们了解到他们的前人早期曾发现过什么,这将为生物史学等方面的研究提供重要的参考价值。
作为实验验证,该课题组还使用了由中科院先进技术研究院黄小罗博士等人开发的最新算法“悟空“来实现自然语言和 DNA 之间的编码和解码并通过课题组近期工作中发现的珍贵微生物进行了实验验证。
论文信息
Embedding DNA-based natural language in microbes for the benefit of future researchers
Heqian Zhang (张鹤千,北京师范大学), Jiaquan Huang, Xiaoyu Wang, Zhizeng Gao, Hang Li, Shanshan Zhou, Shang Wang, Shan Wang, Xunyou Yan, Song Meng. Xinwei Yang, Xiaoluo Huang* and Zhiwei Qin* (秦志伟,北京师范大学)
Digital Discovery, 2024
https://doi.org/10.1039/D4DD00251B
作者简介
北京师范大学
本文第一作者,北京师范大学副教授,博士生导师,主要从事新型人工智能技术在生物医药中的开发及抗菌肽改造。发表 SCI 收录刊物论文 20 余篇,公开和授权发明专利 7 项,软件著作权 1 项,主持国家自然科学基金、广东省教育科学规划项目、广东省教育厅青年创新人才项目等。
相关期刊
rsc.li/digitaldiscovery
Digital Discovery
2-年影响因子* | 6.2分 |
5-年影响因子* | 6.2分 |
JCR 分区* | Q1 化学-多学科 Q1 计算机-跨学科应用 |
CiteScore 分† | 2.8分 |
中位一审周期‡ | 43.5 天 |
Digital Discovery 的重点是数字化技术和自动化工具与基础科学的相互结合,将囊括人工智能、实验自动化、机器人技术、数据库以及先进数据分析等领域的创新成果。本刊发表的研究工作范围广阔,但需有坚实的化学基础。作为一本金色开放获取的期刊,读者可免费获取论文的全文,同时从该刊发布起到 2024 年年中免收论文发表费用。
Editor-in-Chief
Alán Aspuru-Guzik
🇨🇦 多伦多大学
Associate editors
|
|
Editorial board members
|
|
* 2023 Journal Citation Reports (Clarivate, 2024)
† CiteScore 2023 by Elsevier
‡ 中位数,仅统计进入同行评审阶段的稿件
📧 RSCChina@rsc.org