用1公斤DNA装下全世界?北大团队又发Nature!

政务   2024-10-28 10:26   北京  





龟甲、宣纸、磁带、硬盘……

数据怎么存、存在哪

始终是人们孜孜以求的问题


时代变迁,社会发展

我们的生活每天都在产生海量数据

传统硅基材料

难以满足日益增长的数据存储需求

北京大学张成、钱珑团队

与合作者另辟蹊径

表观修饰作为存储介质

通过分子信息并行写入实现信息存储

为这道难题提出新的解法

10月23日

团队研究成果已发表于Nature

△研究成果已正式发表于Nature

△北京大学DNA存储联合研究团队




1公斤便可“装下”全世界

2024年10月23日,北京大学计算机学院张成与定量生物学中心钱珑联合研究团队与合作者国际学术期刊Nature上发表题为Parallel molecular data storage by printing epigenetic bits on DNA的研究论文首次提出了一种基于并行写入策略的DNA存储策略,成功将信息打印DNA分子之上,犹如“活字印刷”,在白纸上批量印刷信息。团队在实验中,成功将中国汉代“白虎”瓦当和大熊猫的高清图片(数据量超过27.5万比特)写入DNA分子中,并无损还原了原始数据,解析出高清图片。

DNA具有超高存储密度,仅1克DNA就足以存储1000万小时高清视频数据;1公斤DNA,便可以装下全世界数据。此外,如果避免潮湿和紫外线照射,DNA可以保存数十万年之久,拥有超长寿命。相比之下,硬盘往往需要每隔几年更换一次以防止数据损坏。因此,DNA显示出作为颠覆性存储介质的巨大潜力。

然而,传统DNA存储依赖“从头合成”的信息写入路线,在成本和速度上面临着“速度慢”“易出错”“价格贵”的多重巨大挑战。不同于传统技术路线,张成-钱珑联合团队开发的“表观比特(epi-bit)”DNA存储技术,利用预制的DNA模板和“分子活字块”,通过DNA自组装介导的分子信息排版,经选择性酶促甲基修饰转移,实现了“活字印刷”,达到分子级“信息打印”的目的。

 表观比特DNA存储信息表示方法和Nature相关专题报道 

该技术不依赖于主流的“从头合成”写入路线原理,通过DNA自组装与选择性酶促甲基化(DNA分子的一种表观遗传修饰)的组合原理,无需合成,就像在纸上印刷文字。首先,研究团队设计并预制通用的单链DNA载体和互补短单链DNA“文字库”。然后,通过将“文字库”装到DNA载体的相同加载序列上,任意表观比特信息就得以被排版。接下来,碱基修饰(5-甲基胞嘧啶)通过酶的选择性甲基化以并行的方式稳定地“打印”在DNA载体上,一场精密、高效的“分子印刷术”就大功告成了。

这种被称为“表观比特”类似于传统的比特,以两个二进制数值中的一个(0或1)来存储信息,对应碱基是否甲基化。研究团队通过使用有限的700种DNA活字和5个模板进行编程,在自动平台上实现了约27.5万个比特的免合成写入,每个反应的写入输出为350比特,远超过去依赖DNA从头合成的数据存储系统每个反应约仅1比特的输出量,实现了重大突破。

同时,这一研究还成功实现了个人定制DNA存储示例,证明了便捷的分布式DNA存储应用潜力。该方法的建立,不仅为实现了快速、低成本的大规模分子数据存储奠定了技术基础,还为未来DNA存储的发展提供了全新思路。

 基于表观比特条码的高位并行大规模存储示意 



“这项技术的核心突破在于,我们能够通过预制DNA模板和活字块,在分子底层以排版的方式打印epi-bit信息,实现分子数据的精确并行写入,进而完成大规模并行DNA存储。”论文通讯作者、北京大学研究员张成介绍说,“与传统DNA数据存储方法相比,这种活字印刷并行写入方式仅需有限数量的预制DNA分子,从而避免了复杂繁琐DNA序列编码过程,不仅大幅降低分子信息写入复杂度,还能降低成本,提高操控灵活性。”






把照片“存在”DNA里

团队在实验中,将中国汉代“白虎”瓦当和国宝大熊猫“飞云”的高清图片成功写入DNA分子中,数据量超过27.5万比特,相比此前发表的其他非传统DNA存储技术,数据规模提升超过300倍。这些信息读取使用便携式纳米孔测序仪,实现了对DNA模板上复杂表观比特信息的高通量读取,并通过单次超240种不同修饰模式的并行解析,无损还原了原始数据,解析出高清图片,真正有望实现“经典永流传”。实验结果验证了该创新型分子存储技术的可行性和准确性,还展示了表观比特的稳定性。

值得关注的是,团队还展示了这项技术的分布式存储应用潜力。在个人定制DNA存储实验中,邀请了北京大学、华北电力大学等单位60名背景广泛的青年志愿者,由他们在日常环境下,将私人数据亲手写入DNA并由个人保存。这些数据直到使用时才被读取,可有效保障个人数据的隐私与安全。这种分布式DNA存储方式,不仅能极大降低DNA存储的使用门槛,且保障了数据隐私,有望推动DNA存储的个人应用。

 表观比特DNA存储原理流程和实验结果 

从二进制数据到DNA数据,从从头合成到并行写入,从DNA存储池到细胞存储,从二代测序到纳米孔测序……在多维技术的突破性革命与融会贯通下,诞生了如今的表观比特DNA存储框架,这一框架为大规模数据存储提供了全新的解决方案,有望突破DNA存储的成本和速度壁垒。此项技术的开发,还展现了非传统分子比特在数据存储中的独特优势,为未来新型分子信息处理系统的研发奠定了坚实的基础。



“在DNA这张白纸上批量打印信息,代表着DNA存储技术的重要突破与革新。”论文通讯作者、北京大学研究员钱珑表示,“可预见的是,在未来,无论身处何时何地,我们都将无需依赖大型实验仪器,就能实现简单、准确、高效的DNA数据存储。”



来源 | 北京大学融媒体中心、北京大学科学研究部、《光明日报》

编辑 | 李加逸

排版 | 唐儒雅

责编 | 郭雅颂

<<左右滑动查看栏目>>

北京大学
爱国 进步 民主 科学
 最新文章