Nat Nanotechnol | 原始DNA存储和计算引擎

学术 2024-10-02 18:00 福建

大家好，今天分享的文献来自北卡罗来纳州立大学化学与生物分子工程系的Orlin D. Velev和Albert J. Keung教授课题组，标题为“A primordial DNA store and compute engine”，于2024年8月发表在Nat. Nanotechnol.上。Orlin D. Velev教授擅长胶体科学、纳米科学和微流体学。Albert J. Keung教授的主要研究领域为：合成生物学，神经与干细胞工程，生物工程。

研究背景：

迄今为止，基于核酸的分子信息系统大致分为两类：

①DNA分子本身既是数据又是信息基底。这些系统无需将DNA固定在基底上，因此具有极高的信息和计算密度，然而，读取和计算数据通常会破坏DNA；

②系统利用核酸结构的变化来存储信息。这些信息可以通过电、光或基于物理探针的信号读取，这些系统更适合重复使用，但更难扩展和执行其他功能，如通过PCR生成副本。

本文工作：

作者利用高表面积材料创建了一个混合系统，充分利用两类系统的优势。将DNA稳定地吸附在树枝状胶体材料上，并将多个不同的RNA启动子整合到DNA设计中，可以利用转录将数据非破坏性地复制到RNA中。

该系统利用分子生物学的丰富性来执行经典计算机常用的其他功能，可以单独或完全擦除多个不同的图像文件，可以将新数据加载到相同的树枝状胶体基质上，可以读取特定文件，并且可以在不破坏原始数据的情况下计算和解决简化的3×3国际象棋和数独问题。此外，该系统可采用连续微流体的形式实现，并与直接RNA纳米孔测序兼容。

结果与讨论

DNA在柔软的树突胶体上的吸附

如Fig. 1a所示，作者开发了一种具有大表面积与体积比率的聚合物粒子，称为软树突状胶体（SDCs），DNA吸附在这种具有高表面积的底物上，RNA能在不破坏DNA数据的情况下进行转录。作者用醋酸纤维素（caSDC）、纤维素（ceSDC）和琼脂糖（agSDC）分别制备了SDCs，并用200 nt的dsDNA进行孵育，DNA以浓度依赖的方式吸附到这三种类型的SDCs上（Fig. 1b,c）。作者进一步利用FITC或ATTO550染料标记的dsDNA证实了SDCs对DNA的吸附（Fig. 1d）。并且，当与DNA混合后，SDCs的ZETA电势变得更负（Fig. 1e）。以上结果证实DNA能够成功吸附在SDCs上。

Fig.1 A primordial DNA store and compute engine is enabled by adsorbing DNA onto soft dendritic colloids.

微流控通道中SDC结合的DNA的转录

作者制备了含有T7启动子的200 nt dsDNA，并将其吸附到与磁珠结合的SDCs上，装入聚四氟乙烯微管中，通过将体外转录（IVT）试剂通入系统中，利用外部的磁力分离（Fig. 2a），即可将DNA中的信息复制到RNA中。

作者将三种不同的SDC材料和另外两种商业化的非共价固定化DNA系统SpBioDNA、SPRI-DNA对比。SpBioDNA和SPRI-DNA最初产生了更多的RNA，但在五轮IVT后其产量显著下降（Fig. 2b）。三种SDC材料开始时的RNA产量较低，但SCDCs在连续十轮IVT的过程中能够保持相当大的RNA产量（Fig. 2c, d）。此外，延长IVT的孵育时间，产量可以进一步提高（Fig. 2e）。作者还发现，要产生可检测的RNA量，至少需要200 ng的DNA量（Fig. 2f），140 nt和更短的DNA的RNA产率显著下降（Fig. 2g）。此外，将吸附在SDCs上的DNA长度提高到1.5 kb并不会显著影响RNA的产量，这能够提供更有效的数据存储和计算，具有更低的编码成本用于索引和错误校正（Fig. 2h）。基于以上实验结果，在后续实验中，caSDCs被用于构建基于IVT反应的微流体系统，并吸附至少200 nt长度的DNA。

Fig. 2 DNA bound to soft dendritic colloids can be repeatedly transcribed in a microfluidic channel.

从SDCS重复访问文件是可靠和稳定的

前面展示了将单个DNA序列的许多拷贝吸附到SDCs上并转录RNA的能力。然而，真实的文件是包含了许多不同DNA链的库。扩展到实际数据的一个关键挑战是，组成文件或数据库的不同链分布不均匀，导致链丢失并影响解码和访问数据的效率和成本。作者设计并订购了2775个不同的243 nt DNA，分别编码三个JPEG文件（Fig. 3a）。首先检查了将DNA吸附到SDC上进行基于IVT的文件访问是否会影响读取分布。作者对与caSDC结合的DNA和未结合的DNA分别进行了IVT，将产生的RNA转化为cDNA并进行Illumina测序，发现基于IVT的样本的读取分布相似（Fig. 3b）。

接下来，作者测试了SDCs结合的文件1进行重复的IVT是否会改变测序链的分布。每轮IVT后cDNA的数量逐渐减少（Fig. 3c），这可能是由于清洗步骤造成的SDC表面的一些物质损失，但链分布保持高度一致（Fig. 3d）。每轮IVT都有一个非常低百分比的唯一链序列缺失，文件1被精确解码（Fig. 3e）。此外，测序效率仍然一致，表明RNA转录的质量在重复的IVT后得到了维持（Fig. 3f）。

为了考察DNA数据存储的稳定性，作者分别研究了多轮的SDC-DNA冻干、DNA冻干、不冻干溶液，分别如何影响cDNA的产量。在5轮冻干和文件3 SDC-DNA的IVT实验中，链保留率和cDNA数量的下降甚微（Fig. 3g），而溶液中的DNA和冻干DNA在链保留和cDNA收率方面的损失更大。对冻干的SDC-DNA复合物生成的cDNA进行Illumina测序，发现在5轮冻干和IVT过程中保持了相似的链分布和链保留（Fig. 3h, i）。

作者模拟了温度升高导致的加速老化，以冻干和溶液的形式制备了SDC-DNA，并在65℃下分别培养0、8、16、24、48小时，发现冻干的SDC-DNA的衰变比溶液的SDC慢（Fig. 3j）。相当于在4°C储存时, 冻干的SDC-DNA半衰期约为6000年，溶化的SDC-DNA为4000年，分别能在18℃储存200万年和80万年。在48小时的实验中，链分布和链保留保持不变（Fig. 3k, l）。以上结果表明，该系统支持长时间重复、稳定的文件访问。

Fig. 3 Complex DNA files can be stored, lyophilized and protected from accelerated ageing and repeatedly accessed on soft dendritic colloids.

擦除和加载SDC上的数据

传统计算机的核心功能是存储和处理不同的数据集，包括删除特定文件、添加新数据和擦除整个硬盘。SDC-DNA系统也能实现此类功能（图4a）。将文件1固定在SDC上，并添加DNase I，随后分别吸附文件1、2或3。与预期一致，DNase I使得文件1不能被解码（图4b），大部分总DNA链被去除，80%以上DNA链不再被检测到（图4c、d）。Illumina测序表明，新文件成功加载到SDC上，其链分布与原始未结合文件相似，尽管与原始SDC相比效率降低了约60%（图4e、f）。

为了在三个文件同时存在时实现对特定文件的选择性删除，不同文件的所有链都设计有共同的限制性内切酶识别序列。将三个文件一起固定在SDC上（图4g）。内切酶能够特异性地切割对应的文件，只有切割的文件不再被解码（图4h）。删除过程都会删除大部分DNA链，仅< 40%的序列被保留（图4i-k）。此外，该过程不会影响解码剩余文件和重新加载文件的链分布和错误率（图4k）。作者还发现碱和高盐条件下链保留的减少幅度比通过酶消化更大（图4l、m）。

Fig. 4 Data files can be specifically erased from and reloaded onto soft dendritic colloids.

RNA纳米孔测序实现连续操作

为了减少延迟，作者通过直接测序RNA来避免将RNA转换为cDNA的过程，使用牛津纳米孔技术公司（ONT）直接读取SDC-DNA系统生成的RNA（图5a）。首先检查了ONT测序是否会扭曲读取分布从而对数据的恢复产生负面影响。结果证实，文件1、2和3 IVT后获得的RNA读取与通过Illumina测序的原始DNA文库具有相似的分布（图5b），并且无论是从游离DNA还是从吸附到SDC的DNA访问，所有文件均被成功解码（图5c-f）。

Fig. 5 RNA nanopore sequencing promotes continuous data processing and reduces skewing of strand distributions.

可寻址存储计算的实现

最后，作者演示了非破坏性计算来解决3×3国际象棋和数独问题，订购了1000个不同的250 nt DNA，其中包含三个不同谜题的所有可能的正确和错误配置（图6a））。每个DNA由九个不同的20 nt位置组成，每个位置代表3×3谜题中一个方格的状态。因此，每个寡核代表一种潜在的棋盘配置。计算方法是取这些代表所有可能棋盘配置的寡核苷酸池，并消除那些违反谜题规则的寡核苷酸序列，只留下代表正确谜题解决方案的寡核苷酸。与每个谜题相关的所有DNA寡核苷酸都含有一个与其他谜题不同的共同RNA聚合酶启动子序列，谜题1：T7启动子；谜题2：Sp6启动子；谜题3：T3启动子。通过添加相应的RNA聚合酶（T7、Sp6或T3），从SDC-DNA转录与各个谜题相关的链（图6b）。作者设计了一种算法，包括添加与RNA互补的DNA组合以及RNase H，以破坏所有违反谜题规则的RNA链，只留下代表正确解决方案的RNA。经过计算，绝大多数幸存的链都是预期的解决方案（图6c、d）。

Fig. 6 Soft dendritic colloids support addressable in-storage computation.

总结

SDC-DNA系统能够实现信息系统的核心原始功能，包括以非破坏性的方式从基底上稳定地存储、擦除、重新加载、读取和计算特定数据的能力，SDC还可以在长时间储存以及反复冻干时为DNA提供保护。局限性：由于限制性酶和RNA聚合酶数量有限，无法用于大规模处理数据。

∨

微信号：HanDa-Lab

课题组网站：https://www.hanlab.net/

撰稿：杨姣

校对：张朝

编辑：江言

∨ 点击“阅读原文”直达文献

http://mp.weixin.qq.com/s?__biz=MzU5OTIzOTU2Nw==&mid=2247490670&idx=1&sn=20750e9ef264b03b051d10a3b27f5e11

韩达课题组

最新文章

中国科学院杭州医学研究所韩达课题组博士后招聘公告

PNAS | Zfp106 与RNA G-四链体结合并抑制由 G4C2 重复序列引起的 RAN 翻译和 RNA foci

课题组工作丨ACS Nano丨多重原位成像位点特异性m6A甲基化

Angew | 以突变对抗突变：进化改造核酸适体用于识别 SARS-CoV-2 突变刺突蛋白

JACS | 酶催化驱动的DNA合成的游泳体

分子医学论坛预告丨第60期：吉训明院士带来报告《中国脑血管病特点与防治策略》

Nat Commun | 从头开始的端到端学习与深度几何势能用于RNA 结构的从头预测

Nat Nanotechnol | 原始DNA存储和计算引擎

JACS丨用于核内阻断 RNA 蛋白相互作用的功能性适配体体外进化

Mol Cell | 核内PKM2结合pre-mRNA上的G4显示其基因调控功能

分子医学论坛预告丨第59期：薛文教授带来报告《CRISPR-Based in vivo Genome Editing》

Science | 通过恢复海马体葡萄糖代谢，挽救阿尔茨海默病人的认知功能

JACS丨激光诱导的微尺度相变控制蛋白质凝聚体中的药物分配

Nat Commun丨通过 RNA 转录激活对哺乳动物细胞进行条件性 RNA 干扰

Angew. Chem. Int. Ed.| 使用活性液滴调节核酸催化

分子医学论坛预告丨第58期：肖瑞平教授带来报告《转化医学之旅》

Nature Nanotechnology | 模块化DNA折纸纳米室，用于工程化无细胞、蛋白质展开和降解途径

Nat Biotechnol | 循环延伸扩增以提高质谱流式的检测灵敏度

Angew | 在酿酒酵母菌中构建人工无膜细胞器以提高化学品生产

Nat Nanotechnol丨自主展示细胞毒性配体模式的DNA折纸开关

分子医学论坛预告丨第57期：Taeghwan Hyeon教授带来报告

J Nanobiotechnology | 转铁蛋白受体核酸适体修饰框架核酸用于靶向递送CEBPA-saRNA治疗胰管腺癌

【喜报】课题组成员获国家自然科学基金面上及青年基金项目资助

专题分享丨RNA-seq建库方案

Nature Methods丨利用几何深度学习预测蛋白质-DNA结合特异性

JACS | 相分离调控RNA杂交的热力学和动力学性质

分子医学论坛预告丨第56期：郭德良教授带来《肿瘤脂代谢的新调控及其在癌症中的治疗潜力》

NUCLEIC ACIDS RES丨C2′-氟代核酸在生理盐条件下形成左手螺旋

Nat Mater丨DNA折纸装置在空间上控制CD95信号传导以诱导类风湿性关节炎的免疫耐受

Nature Methods | CRISPR阵列介导的非重复位点和多路基因位点的活细胞成像

Cell Reports Medicine丨单细胞乳腺肿瘤图谱揭示肿瘤上皮细胞与免疫细胞的错综复杂关系并预测抗PD-1疗效

分子医学论坛预告丨第55期：樊春海院士带来《转化医学：从理念到实践》

Nat Commun丨不依赖末端修饰的cf RNA 测序可实现灵敏的早期癌症检测和分类

SCIENCE丨解混是通过相分离形成的生物凝聚物的默认过程

Advanced Science丨YY2/BUB3 轴通过调节染色体不稳定性促进 SAC 过度活化并抑制结直肠癌进展

JACS | 离子对生物分子凝聚体微环境的影响

分子医学论坛预告丨第五十四期：Howard C.Hang 教授

NATURE丨使用 AlphaFold 3 准确预测生物分子相互作用的结构

课题组工作丨ANGEW丨一种精准可控的DNA编码扩增反应用于活细胞膜蛋白多重定量成像

课题组工作丨PNAS丨解密sgc8c DNA适体的复杂三维结构和功能优化

JACS丨开发一种伪细胞系统以量化决定细胞中G-四链体功能的特定相互作用

JACS | 生物正交用于细胞间相互作用的促进和检测

Nat Method丨校正UMI中的PCR扩增错误以生成测序分子的准确数量

分子医学论坛预告丨第五十三期：陈小元教授带来《肿瘤诊疗一体化》

Nat Biomed Eng | 融合唾液酸酶到双特异性T细胞衔接器用于肿瘤细胞的去唾液酸化与溶解

毕业季丨飞向广阔的未来，祝课题组2024届毕业生毕业快乐，前途似锦！

Sci Adv丨基于DNA分子控制器的可自主装配与拆卸的分子机器人

课题组工作丨Nat Commun丨可执行数学运算的核酸分子计算芯片用于癌症诊断

Sci Adv丨能够捕获和释放荧光适体的RNA机器人

Nano Today丨装载有STING拮抗剂的肾小管上皮细胞仿生纳米颗粒通过调节固有与适应性免疫从而缓解急性肾损伤

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉