从智能手机、社交媒体到电子商务和科学研究,各种因素都推动了数据创造的空前激增。然而,全球性的数据扩张,却给大规模存储数据带来了挑战。因此,我们迫切地需要更好的存储材料来提供解决方案。
自上世纪80年代以来,DNA就被视为是数字存储的理想介质,因为它具有非凡的存储密度和耐久性。与传统的硅基存储相比,同体积的DNA可存储多达10亿倍的信息,而且如果条件适当,在DNA中编码的序列可以保存几个世纪。
然而,目前的DNA存储通常涉及到从零开始合成新的DNA链,然后一次编码一个核苷酸数据,这些核苷酸会以预先确定的顺序被一个接一个地添加。这样的合成过程缓慢且昂贵,从根本上限制了写入速度和合成DNA的长度。
在一项于近期发表在《自然》的研究中,一个由中国科学家领导的研究团队受到表观遗传学的启发,创造出了一种能显著提高DNA的容量和效率的存储方法。这种被称为“表观比特”(epi-bits)的方法的运作方式类似于活字印刷,可以在一个通用的DNA模板上进行排列。
表观遗传学的启示
在表观遗传学中,表观遗传修饰可以在不改变基本DNA序列的情况下,通过在DNA中添加或删除化学基团来调节基因表达。这种调节可以影响蛋白质的产生,并驱动一些基本的细胞功能。
在新的研究中,研究人员将这种自然的机制用在了编码数字信息上。他们发展出的新的DNA存储法,不再需要从零开始构建DNA,而是对已有的DNA链加以利用。具体来说,它是通过在特定的DNA碱基上添加或删除被称为甲基(CH₃)的化学标记来编码信息的,这就减少了对合成的依赖。
甲基化是一种自然的生化过程,在这个过程中,酶会在胞嘧啶和鸟嘌呤碱基相邻的位点上,向含有胞嘧啶的核苷酸添加一个甲基。在生物系统中,甲基化在表观遗传学中起着关键作用。
在实验中,研究人员通过在特定的DNA碱基上增减甲基的方式,成功创造出了表观比特。这是一些功能类似二进制开关的微小分子数据点,甲基化碱基(epi-bit 1)和未甲基化碱基(epi-bit 0)就相当于计算机中使用的二进制代码0和1。
为了利用甲基化来进行数据存储,研究人员使用了一种被称为并行分子打印的方法。这种方法需要用到一条作为模板的通用DNA链,以及700个作为构建块的不同DNA片段。每个构建块都包含一个独特的表示数字信息的表观比特模式,只可以绑定到模板上的一个特定位置。每块构建块与模板的精确结合,都可以引导酶对模板中的特定位置进行甲基化,进而有效地将数据“打印”到模板上。
通过将这些构建块排列在DNA链上,研究人员编码了大约27万比特的数据,每次可以写入350比特。通过一些先进的测序技术,存储的数据可以被快速而准确地读取。
优势与挑战
现在,这种新方法回避了合成新DNA的漫长而昂贵的过程,让DNA存储变得更为快捷、经济。它有可能在极小的空间内长时间存储大量数据。研究人员将这种存储复杂数据(如图像)的方法描述为具有高保真度和最小错误率的方法。与传统的电子存储相比,表观比特可以提供更加可持续的、更节约资源的选择。与现有的DNA数据存储方法相比,这种新的技术更快捷、更经济。
尽管这是一种很有前景的方法,但挑战依然存在。甲基化碱基编码的复杂性和对化学修饰的精确控制需求,都需要复杂的技术和方法。实现高保真的写入和读取是至关重要的,因为甲基化过程中的错误或偏差都有可能导致数据丢失或损坏。
不过,这种存储介质具有巨大的潜在优势,比如它的紧凑尺寸、环境抗性和耐久性。随着进一步的发展,这项技术可以为高效的数据存储解决方案铺平道路,并有助于减轻大规模数据存储对环境日益增长的影响。
#创作团队:
撰文:糖兽
排版:雯雯
#参考来源:
https://news.asu.edu/20241023-science-and-technology-harnessing-natures-code-data-storage
https://www.nature.com/articles/s41586-024-08040-5
https://www.nature.com/articles/d41586-024-03443-w
#图片来源:
封面图&首图:Jason Drees via ASU News