译者的话:本文为自学译文,敬请批判性阅读。
有关早癌领域内容,新近关注的前辈及同行,请点击下方链接。
《自然》精选的正在或即将在未来撼动科学界的工具和技术。
单分子蛋白测序
蛋白质组代表了由细胞或生物体产生的全套蛋白质,可以提供有关健康和疾病的深入信息,但其特征仍然具有挑战性。
与核酸相比,蛋白质是由更大的构建模块基本要素组装而成的,大约有20种天然存在的氨基酸(与构成DNA和信使RNA等分子的4种核苷酸相比);这导致了更大的化学多样性。有些在细胞中仅以几个分子的形式存在——而且,与核酸不同,蛋白质不能被扩增,这意味着蛋白质分析方法必须适用于任何可用的材料。
大多数蛋白质组学分析使用质谱法,这是一种根据蛋白质的质量和电荷来分析蛋白质混合物的技术。这些图谱可以同时量化数千种蛋白质,但检测到的分子并不总是能被明确地识别出来,而且混合物中低丰度的蛋白质经常被忽视。现在,单分子技术可以对样品中的许多蛋白质(如果不是全部的话)进行测序,其中许多类似于用于DNA的技术。
Texas大学Austin分校的生物化学家Edward Marcotte正在研究一种被称为荧光测序的方法。Marcotte的技术是在2018年报道的,它基于一个循序渐进的化学过程,在这个过程中,单个氨基酸被荧光标记,然后一个接一个地从表面偶联蛋白的末端剪切下来,相机捕捉到产生的荧光信号。“我们可以用不同的荧光染料标记蛋白质,然后观察我们切割它们时的分子,”Marcotte解释说。去年,Connecticut的一家生物技术公司Quantum-Si的研究人员描述了一种替代荧光测序的方法,该方法使用荧光标记的“黏合剂”蛋白质来识别蛋白质末端的特定氨基酸(或多肽)序列。
其他研究人员正在开发技术,模拟基于纳米孔的DNA测序,根据多肽通过微小通道时在电流中引起的变化来分析多肽。Delft University of Technology的生物物理学家Cees Dekker和他的同事们在2021年用蛋白质制成的纳米孔展示了一种这样的方法,并且能够区分通过纳米孔的多肽中的单个氨基酸。Israel生物医学工程师Amit Meller的团队正在研究用硅基材料制造的固态纳米孔设备,这种设备可以同时对许多单个蛋白质分子进行高通量分析。他说:“你可能可以同时看到数万甚至数百万个纳米孔。”
虽然单分子蛋白质测序目前只是一个概念验证,但商业化正在迅速到来。例如,Quantum-Si已经宣布计划在今年推出第一代仪器,Meller指出,2022年11月在代尔夫特举行的蛋白质测序会议上,有一个专门针对该领域初创企业的讨论小组。他说:“这让我想起了下一代DNA测序之前的许多日子。”
Marcotte是Texas蛋白质测序公司Erisyon的联合创始人,他对此持乐观态度。他说:“问题不在于它是否有效,而在于它能多快到达人们手中。”
体电子显微镜(Volume electron microscopy)
电子显微镜(electron microscopy, EM)以其出色的分辨率而闻名,但主要是在样品的表面水平。深入研究需要将标本切成非常薄的薄片,这对生物学家来说往往是不够的。伦敦电子显微镜专家Lucy Collinson解释说,一个细胞的体积可能需要200个切片才能覆盖。她说:“如果你只拿到一个部分,那你就是在玩统计游戏。”
现在,研究人员正在将EM分辨率引入到包含许多立方毫米的3D组织样本中。
以前,从二维EM图像重建这样的体积——例如,绘制大脑的神经连通性——需要一个艰苦的过程,包括样品制备、成像和计算,以将这些图像转化为多图像堆栈。最新的“volume EM”技术现在大大简化了这一过程。
这些技术有各种优点和局限性。连续块面成像,在成像时使用薄连续层,相对较快,可以处理接近一立方毫米大小的样品。然而,它提供了较差的深度分辨率,这意味着产生的立体重建将相对模糊。聚焦离子束扫描电子显微镜(FIB-SEM)产生更薄的层——因此更精细的深度分辨率——但更适合小体积样品。
Collinson将volume EM的兴起描述为一场“无声的革命”,研究人员强调了这种方法的结果,而不是用于产生它们的技术。但这种情况正在改变。例如,在2021年,Virginia从事电子显微镜细胞器分割(COSEM)计划的研究人员在《自然》杂志上发表了两篇论文,强调了在绘制细胞内部图谱方面取得的重大进展。“这是一个非常令人印象深刻的原理证明。”Collinson说。
COSEM计划使用复杂的定制FIB-SEM显微镜,在保持良好空间分辨率的同时,将单次实验中可以成像的体积增加了大约200倍。利用这些机器与深度学习算法相结合,该团队能够在各种细胞类型的完整3D立体中定义各种细胞器和其他亚细胞结构。
1、训练数据和机器学习。
2、细胞器的分类。
样品制备方法是费力且难以掌握的,并且得到的数据集是巨大的。但这一努力是值得的:Collinson已在传染病研究和癌症生物学方面看到了新的见解。她现在正与同事们一起探索以高分辨率重建整个小鼠大脑的可行性——她预计这项工作将花费10年以上的时间,耗资数十亿美元,并产生5亿千兆字节的数据。她说:“这可能与绘制第一个人类基因组的努力在同一个数量级上。”
CRISPR
基因组编辑工具CRISPR-Cas9理所当然地赢得了声誉,因为它是在整个基因组的目标位点引入定义变化的首选方法,推动了基因治疗、疾病建模和其他研究领域的突破。但它的应用范围是有限的。现在,研究人员正在寻找绕过这些限制的方法。
CRISPR编辑是由一个短向导RNA协调的,它将相关的Cas核酸酶引导到目标基因组序列。但是这种酶也需要一个叫做原间隔邻近基序(PAM)的邻近序列;没有它,编辑可能会失败。
Massachusetts General Hospital基因组工程师Benjamin Kleinstiver利用蛋白质工程技术,从细菌化脓性链球菌中创造出了常用的Cas9酶的“近乎无pamless”Cas变体。一种Cas变体只需要由三个连续核苷酸碱基组成的PAM,中间有一个A或G核苷酸。“这些酶现在几乎可以读取整个基因组,而传统的CRISPR酶只能读取1%-10%的基因组,”Kleinstiver说。
这种不太严格的PAM要求增加了“脱靶”编辑的机会,但进一步的工程设计可以提高它们的特异性。作为一种替代方法,kleinver的团队正在设计和测试大量的Cas9变体,每个变体都对不同的PAM序列表现出高特异性。
3、一种高可靠的PAM预测算法
4、PAM分层聚类
还有许多自然发生的Cas变体有待发现。在自然界中,CRISPR-Cas9系统是一种细菌防御病毒感染的机制,不同的微生物进化出了具有不同PAM偏好的各种酶。Italy病毒学家Anna Cereseto和微生物组研究员Nicola Segata梳理了100多万个微生物基因组,以识别和表征一组不同的Cas9变异,他们估计这些变异可以共同针对98%以上已知的人类致病突变。
然而,其中只有少数能在哺乳动物细胞中起作用。“我们的想法是检测许多样本,看看是什么决定了这些酶正常工作,”Cereseto说。Kleinstiver说,在从这些天然酶池和高通量蛋白质工程努力中收集到的见解之间,“我认为我们最终将拥有一个相当完整的编辑器工具箱,允许我们编辑任何我们想要的碱基”。
单细胞代谢组学
代谢组学——研究驱动细胞的脂质、碳水化合物和其他小分子——最初是一套描述细胞或组织群体中代谢物特征的方法,但现在正转向单细胞水平。科学家们可以利用这种细胞水平的数据来解开大量看似相同的细胞中功能复杂性的谜团。但转型带来了严峻的挑战。
代谢组包含大量具有不同化学性质的分子。Germany代谢组学研究员Theodore Alexandrov说,其中一些是非常短暂的,周转率低于秒。而且它们很难被检测到:尽管单细胞RNA测序可以捕获细胞或生物体中产生的近一半RNA分子(转录组),但大多数代谢分析只覆盖细胞代谢产物的一小部分。这些缺失的信息可能包括重要的生物学见解。
“代谢组实际上是细胞中活跃的部分,”Illinois大学分析化学家Jonathan Sweedler说。“当你患有疾病时,如果你想知道细胞状态,你真的想看看代谢物。”
许多代谢组学实验室使用分离细胞,他们将其捕获在毛细血管中,并使用质谱法对其进行单独分析。相比之下,“成像质谱”方法捕获了关于细胞代谢物在样品中不同部位产生变化的空间信息。例如,研究人员可以使用一种称为基质辅助激光解吸/电离(MALDI)的技术,其中激光束扫描经过特殊处理的组织切片,释放代谢物,用于随后的质谱分析。这也捕获了样本中代谢物起源的空间坐标。
理论上,这两种方法都可以量化数千个细胞中的数百种化合物,但实现这一目标通常需要花费数百万美元的顶级定制硬件,Sweedler说。
现在,研究人员正在使这项技术大众化。2021年,Alexandrov的团队描述了SpaceM,这是一个开源软件工具,使用光学显微镜成像数据,使用标准的商用质谱仪对培养细胞进行空间代谢组学分析。他说:“我们承担了数据分析部分的繁重工作。”
Alexandrov的团队已经使用SpaceM分析了成千上万的人类和小鼠细胞中的数百种代谢物,并转向标准的单细胞转录组学方法,将这些细胞分类。Alexandrov说,他特别热衷于后一个方面,以及组装“代谢组学图谱”的想法——类似于为转录组学开发的那些图谱——以加速该领域的进展。他表示:“这绝对是一个前沿领域,将是一个巨大的推动力。”
写在最后:我的观点——在展望未来时,牢牢抓住那些不会变的方面尤为重要,因为其他的一切都会改变而这些却不会,比如物理定律、人体解剖学、生理学、病理学和疾病的发生机制,等等。