首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
科技视野丨DNA存储:开启未来信息存储新时代
科技
2025-01-06 07:05
北京
「
编者按
」
在这个信息爆炸的时代,我们追求的不仅是知识的积累,更重要的是对科学精神的深刻理解以及对探索未知的无限热情。让我们一起在科学的世界里,遇见更广阔的天地,遇见更深刻的自己。
导读
在数字化飞速发展的时代,我们产生和需要存储的数据量呈爆炸式增长。传统的存储方式,如硬盘、磁带等,正面临存储容量有限、维护成本高以及存储设备寿命短等诸多限制。自20世纪60年代起,DNA分子因其高存储密度、高稳定性和易复制等特点,逐渐步入大众视野,成为未来存储技术的新希望。“DNA可以用作信息存储介质吗?”作为信息领域的前沿热点,被国际学术期刊《科学》列入125个科学问题之一。2022年,我国“十四五”规划将DNA存储列为与新一代移动通信技术、量子信息、第三代半导体等并列的新兴技术。
图片来源:视觉中国
揭开DNA存储的神秘面纱
DNA,即脱氧核糖核酸,是生物体内承载遗传信息的大分子。它由腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)、胞嘧啶(C)四种核苷酸按特定顺序排列而成,恰似计算机代码中的0和1,共同编织出生命的遗传密码。
DNA存储技术就是巧妙利用了DNA的这一特性,将数字化信息转化为DNA序列进行存储。简单来讲,就是把我们日常使用的二进制数据,比如电脑文件等,依据特定编码规则,转变为由A、T、G、C组成的DNA序列。例如,一段二进制代码通过编码,能够转化为一串DNA序列,再将合成好的DNA置于一定环境中,DNA信息存储便得以实现。
DNA数据存储的历史,可追溯至20世纪60年代中期,美国麻省理工学院教授维纳和苏联物理学家涅曼首次提出“遗传记忆”概念,但受限于当时DNA测序与合成技术,只是一个初步构想。1988年,哈佛大学教授戴维斯第一次设计并合成了一个包含18个核苷酸的DNA片段,并且将其转移至大肠杆菌中,这标志着DNA存储的首次实验实现。受戴维斯启发,全球其他科学研究团队也开始了基于DNA分子的活细胞存储研究。直到2012年,哈佛大学教授丘奇和欧洲生物信息学研究所科学家戈德曼实现了突破性科学进展,通过创新性的编码方式以及先进的生物技术手段,首次将图书内容完整存入DNA之中,充分展示出DNA作为存储介质的巨大潜力。
作为生物的遗传物质,DNA分子具有高密度的特点。理论上来说,1克DNA大约能存储215PB数据,相当于1000万小时左右的高清视频。据报道,1吨DNA分子的存储容量甚至能装得下全球所有数据总量。这为解决海量数据存储问题,开拓了广阔前景与新思路。
同时,DNA具有高度稳定性,在适宜条件下,DNA可保存数千年乃至更久。科学家从远古生物化石中提取DNA并开展研究分析的实例,充分证明了DNA极强的稳定性和长久保存信息的能力。相比硬盘等传统存储介质几年到十几年的使用寿命,DNA存储优势显著。
此外,在推行低碳可持续发展的时代背景下,DNA存储维护的低能耗优势不容小觑。传统存储方式能耗较高,而DNA存储额外耗能极低——合成并存储完毕后,在日常环境下便可保存信息。这对节能减排意义重大。
DNA存储何以实现
那么,如何实现DNA存储?
第一步,将数据写入DNA:数据与DNA序列转换的桥梁——编码。
编码是DNA存储的首要步骤,是将二进制数据转化为DNA序列。要实现精确编码,需制定严谨的编码规则。科学家通常依据DNA核苷酸合成的限制和数据的存储需求进行设计。比如,规定每2个二进制位对应一种核苷酸组合,00对应A,01对应T,10对应G,11对应C等。
不过,将数字信息准确编码为DNA序列并非易事,需要设计合适的编码算法和方案。一方面要确保信息能够完整、准确地合成为DNA序列,另一方面还要考虑编码效率和冗余度等问题,以便在后续存储和读取过程中实现高效操作。此外,传统DNA存储以化学合成的方式逐个加入代表信息的核苷酸,只能串行写入分子信息,当存储大量数据时,面临存储速度慢、成本高的问题。
第二步,构建存储信息的DNA分子:编码完成后,按编码的顺序逐个加入核苷酸,合成DNA链。
目前常用的传统化学合成方法是基于磷酰胺的化学合成法,但考虑到其合成速度慢、成本高等缺点,科学家也在探索新型DNA合成技术。其中,酶促合成法备受关注,它利用DNA聚合酶等催化DNA合成反应。
与传统方法相比,酶促合成法操作简单、步骤简便,但同时也存在酶的活性调控困难、精确数量的序列合成控制难等问题。
近年来,主流DNA存储技术是基于“从头合成”路线,串行进行分子信息写入。尽管从头合成技术在通量和效率上不断提高,但串行合成的底层本质仍严重影响了DNA存储写入速度和成本,阻碍了DNA存储的实用化发展。
第三步,存储与读取技术:保障数据的保存与恢复。
DNA存储对环境条件要求比较宽泛,一般需将合成好的DNA保存在低温、干燥且避光的环境中。低温(通常零下20摄氏度甚至更低)和干燥能有效减缓DNA分子降解速度;避光则是为了防止光照引发DNA分子的损伤,从而保障存储数据准确性。而读取DNA存储数据的方法,就是DNA测序。需依靠DNA测序技术获取其核苷酸序列。目前主流的DNA测序技术有桑格测序法、NGS测序和纳米孔测序等。
图片来源:视觉中国
并行DNA存储突破传统技术瓶颈
针对DNA存储信息串行写入的问题,北京大学DNA存储团队突破传统“从头合成”串行写入路线,提出了一种基于并行写入策略的新型DNA存储策略(该研究工作于2024年发表在《自然》上)。这种方法通过DNA自组装介导的选择性酶促甲基化(表观遗传修饰),对DNA中特定位点进行甲基化,以实现信息编码,避免了对从头合成DNA的依赖。这种方法被形象地比喻为DNA上的活字印刷技术,不仅可以加快信息的写入速度,并且由于采用预制的分子活字块和长链模板,方便批量操作,极大降低了存储成本。
首先预先合成700种“DNA活字”和5条DNA长链“白纸”模板。通过人工设计,使得每个“活字”块都可通过DNA自组装锚定到模板上的特定位置。其中,每个位置的DNA“活字”有两种:携带或不携带甲基修饰,分别代表0或1。随后,通过甲基转移酶介导半甲基化转移,将模板中的特定位置甲基进行转移,从而实现并行的选择性分子信息写入。
研究团队使用有限的预制DNA活字和长链模板排版编程,在自动平台上实现约27.5万个比特的并行甲基修饰信息写入,单次反应分子写入通量为350比特,极大提高了DNA存储的信息写入通量(从头合成的DNA数据存储中单个反应约1比特的输出量)。
这项技术的核心突破在于,能通过预制的DNA模板和活字块,在分子底层以排版的方式并行打印表观比特(epi-bit)信息,实现分子数据的精确高通量写入,进而完成大规模并行DNA存储。与传统DNA数据存储方法相比,这种活字印刷并行写入方式仅需有限数量的预制DNA分子,避免了复杂烦琐DNA序列编码过程,不仅大幅降低分子信息写入复杂度,还能降低成本、提高操控灵活性。
虽然DNA存储技术在持续进步,但仍面临一些亟待破解的问题。
DNA合成和测序成本仍较为高昂。DNA合成需复杂化学工艺和高端设备,导致DNA存储的成本居高不下。同样,尽管测序技术持续进步,但准确测序成本仍然较高,这使得DNA存储难以应用于现实生活。与硬盘等传统存储设备的读取速度相比,DNA存储走向实用化差距明显。此外,在DNA存储过程中,写入和读取环节错误率较高。例如,写入过程可能出现不正确的修饰等错误,读取时也可能因测序误差导致还原数据不准确等。这些分子数据存储自身存在的问题,将影响DNA存储的可靠性和实用性。
尽管如此,DNA仍是最具广阔应用前景的存储方式之一。
在长期冷数据存储方面,像国家历史档案、珍贵文物资料这类需要长期保存的数据,DNA有着超长存储时间以及高存储密度的优势,是理想的存储方式。将这些数据存于DNA中,哪怕过了数千年依然能完好读取,有力保障了人类文明的传承。
在航天领域,航天活动中数据存储的能耗和太空复杂环境是关键的考量要点。而DNA存储具备低能耗、高存储密度和高稳定的特性,因此有望适用于该领域。比如,科学家可以把航天器飞行数据、科学实验数据等存储在DNA中,既能减轻存储设备重量,又能在能源有限条件下实现数据的长期保存。
在生物医学领域,DNA可用来存储大量的基因数据、医疗诊断照片和病人病历等。随着个性化医疗不断发展,对于患者个体基因数据长期保存以及准确读取的需求也在持续增加。
在私人数据存储方面,并行DNA存储技术,由于操作简单、环境需求低和预制合成等特点,特别适合于高隐私要求的私人定制DNA存储应用。这也有望推动DNA存储的实用化发展,走入千家万户。
DNA存储作为新兴技术,已展现出巨大优势。未来,它很可能成为数据存储的重要方式之一,为海量数据存储与相关领域的发展提供有力支持。
来源:《光明日报》
作者:张成、钱珑
(分别系北京大学计算机学院副研究员,北京大学定量生物中心副研究员)
北京科协
——根植首都地区的创新文化价值观察和科学叙事。致力于弘扬科学精神,传播科学方法,服务国际科技创新中心建设。
最新文章
习近平在二十届中央纪委四次全会上发表重要讲话
中小学科学教育“二十条”出台,北京市将构建大中小贯通培养链条
三城一区|昌平生命科学创新走廊锚定世界级高地
京津冀协同发展指数出炉,创新发展指数领衔三地协同发展
科技视野丨DNA存储:开启未来信息存储新时代
学习贯彻党的二十届三中全会精神丨充分发挥科技创新对高质量发展的支撑作用
小寒丨酷寒即至,春意萌动
一周科技丨《加快工业领域清洁低碳氢应用实施方案》印发;地球发生特大磁暴
北京市科协推荐中国科学院老科学家科普演讲团荣获“2024北京榜样”年度特别奖
2025科学跨年丨2024北京科学传播大赛颁奖活动与你共赏科学之美
科学之光丨他们如何拍出获奖作品?来看创作分享
2025科学跨年之夜 | 2025科学跨年之夜精彩演讲全文来了
科学阶梯丨量子物理史上不可不知的10个里程碑
新年首个工作日,尹力、殷勇与专家座谈,共商北京“十五五”规划编制
首都科学讲堂预告丨我的父亲梁思礼:科学精神要一代代传下去
科学之光 | 欣赏获奖佳作,捕捉生活中的“科学之光”
科学人生绘 | 生物学家叶盛的跨界探索
首都工程师丨潘剑锋:用“冰刃”守护网络安全
千人进千企丨让建筑幕墙检测“有声有色”
“重走”科学大师的发现之路,北京科学中心“科学再发现”主题展开幕
“科学流言榜” | 2024年12月榜单发布,这些流言上榜→
点亮强国路上的科技之光——细数习近平主席二〇二五年新年贺词中的科技关键词
科协之声丨为传统节日增添“科味儿”
“北京科协”内容升级焕新,这些栏目值得关注→
科学阶梯 | 科学的社会功能是什么?
2025科学跨年之夜 | 嘉宾名单来啦!
2025科学跨年之夜 | High到尖叫的新年第一堂科普课,快快带娃玩起来!
北京市科协祝首都科技工作者新年快乐
北京市科协主席李静海2025年新年贺词
科技部发布2023年度全国科普统计数据
@最重要的您,北京科协政务新媒体平台诚邀您参与满意度调查
国家主席习近平发表二〇二五年新年贺词
首都科技人 | “首都科技人”系列宣传精彩来袭,一起见证他们的科学故事
科学人生绘 | 食品安全专家朱雨辰:探寻舌尖上的科学与生活哲学
2025科学跨年之夜 | 来一场说走就走的科技探访之旅
“科学”流言求真榜十周年系列活动举办,新闻媒体深度报道
市委常委会召开会议,传达学习习近平总书记重要指示精神,听取市人大常委会党组、市政府党组、市政协党组等工作汇报
早间时评 | 提升科学素质 赋能共同发展
2025科学跨年之夜 前来报到啦!
三城一区 | 怀柔打造科学家钟爱的“一生之城”
“智止流言 探求真知”——“科学”流言求真榜十周年发布活动举办,粉碎十大“科学”流言
北京市将打造细胞与基因治疗产业集群
科技视野丨“5倍声速”搭上“星链”,高超声速无人机时代拉开序幕?
学习贯彻党的二十届三中全会精神丨切实掌握进一步全面深化改革的科学方法论
一周科技丨新修订的《中华人民共和国科学技术普及法》开始施行;2025年全国两会召开日期确定
学习贯彻党的二十届三中全会精神丨让创新与产业互促发展
中国科技期刊影响力不断攀升,目标指向“世界一流”
北京市2024年全国科普日工作总结座谈会召开
科学阶梯丨暗能量简史
2024年“首都科学传播优秀案例”发布
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉