多元化竞争新时代,测序仪厂商是不是得开发提供自己的多组学产品?
Illumina说要保持开放平台,但又默默收购了单细胞公司,马上要推出自己的单细胞端到端产品。
如果考虑到Illumina马上还要推出的蛋白组学产品,那么在多组学这个CEO重点强调的战略发展方向上,Illumina眼下就需要考虑空间组学上如何来实现自己的解决方案。
不急,基于Illumina测序平台的空间组学技术,用户社群都已经开发好了。
我们前面已经介绍过重新利用HiSeq 2500开发的PySeq空间蛋白组学方案,改造MiSeq流通池开发的Seq-Scope空间转录组学方案。
随着Illumina不断推出新机器,这一次硬件黑客把对象瞄准了NovaSeq 6000测序仪,改造其S4流通池,使其变身为高效的空间转录组学研究的平台。
之前的文章里,我们已经提到Seq-Scope团队发表了相应的操作协议把MiSeq升级到了NovaSeq 6000。
但与此同期,马克斯·德尔布吕克分子医学中心柏林医学系统生物学研究所的研究人员在去年12月描述了Open-ST,而比利时VIB的一个团队在今年2月介绍了Nova-ST。这两个方法都是以密歇根大学研究人员发布的SeqScope化学为基础。现在Open-ST和Nova-ST也都公开发表。
这两种新的高通量方法的基本想法和实施都是类似的。首先,通过在NovaSeq S4流通池上加载特定的oligo,相当于在其图案化的纳米井中种下了带有空间条形码的簇,这包括一个独特的32bp序列和能够捕获RNA的序列,更多是polydT序列。这个空间条形码代表了他们在流通池中的坐标,通过第一次测序运行读取,这里使用35个循环的试剂盒运行即可,相应的信息用于稍后的数据分析。然后,流通池被剥离,切开,将组织切片覆盖其上,以此来捕获样品中的RNA。这样一来,组织样本中的RNA就被标记了空间条形码,释放之后,进行测序文库的构建,可以在兼容Illumina文库的测序仪上进行第二次测序。
本质上,这与其他的使用NGS作为转录读数的空间组学方法并没有实质性的差别,包括已经被商业化的10x Visium,Curio Slide-Seq/Seeker,华大的Stereo-Seq,Singular Genomics的G4X等。
既然已经有了这么多的成熟解决方案,为什么还要进行黑客开发?
普遍的一个反应就是商业化的产品肯定偏贵,而自己动手DIY能够降低成本。
Nova-ST的作者称,每样品10毫米乘8毫米tile的成本约为500到600欧元,这主要是由流通池的成本构成的,不包括测序成本。当然,这两种方法消耗了Illumina其中一个最昂贵的测序流通池。但500-600欧元依然比Visium HD的每个样品便宜大约5倍,如果按每平方毫米组织算便宜7到10倍。
而Open-ST团队表示,他们的每12平方毫米的捕获面积的样品准备成本低于150欧元,标准样品(3 x 4毫米,400M测序读数,∼100,000个细胞,∼1,000 UMI[唯一分子标识符]/细胞)的总成本为几百欧元,主要由测序成本驱动。
真实的成本可能需要具体去核算,但一上来就要拆掉一个成本超过10000美元的S4流通池,需要两次的测序运行,而第二次测序的数据量并不低,此外还需要耐心的操作和因此可能失败而废掉的材料成本等等。
但Nova-ST每个S4流通池可以产生80多块约1平方厘米的区块tile,并在不到一周的时间内生成数据。
致密的图案化表面使得Nova-ST实现了高的空间分辨率,有望捕获单细胞水平的基因表达,S4流通池纳米井的直径为300纳米,其中心相距625纳米。相比之下,10x的Visium HD上市也不久,提供2微米乘2微米的tile。然而,Visium提供了一个连续的捕获表面,而NovaSeq流通池在簇之间有捕获空间死角。
但从结果上来看,这两种方法的具体效果如何呢?
在文章中,Nova-ST将转录本分成三种尺寸的区域,25 µmx25 µm,50 µmx 50 µm,100 µmx 100 µm。大约85%的读数具有有效的条形码,并且能够映射,根据测序深度,独特分子标识符的百分比在36%到79%之间。在深度测序中,最小的bin产生了994个基因的中位数和2131个UMI。如果进行浅层测序,产生了251个基因和374个UMI的中位数。而最大的bin提供了6,318个基因和32,317个UMI(深度测序),2,503个基因和5,920个UMI(浅层测序)。
作者还在小鼠脑部位上将Nova-ST与Stereo-seq系统进行了比较。使用最大的bin,Nova-ST检测到6,318个基因的中位数,而Stereo-seq为4,092个。与Stereo-seq相比,这意味着Nova-ST可以减少bin大小以增加分辨率。
Open-ST的灵敏度与Nova-ST相似,在文章中,Open-ST团队报告了大约55%的读数可以映射到带有空间条形码的基因区域。他们在小鼠大脑部分使用了细胞分割方法,以近5亿次读取的深度进行测序。他们分割了近50,000个细胞,捕获了21,609个基因,中位数为621个基因,每个细胞880个UMI,42%的细胞包含1000多个转录物。
整体上来看,这两种方法都以低成本实现了高分辨率和高效的转录组捕获,提供了一个端到端的开源框架,可以捕获组织切片的组织形态和空间转录组,且灵敏度不亚于或者比商业化的产品更高,与多种组织类型兼容。本质上,任何研究者都可以根据发布的操作协议,仅使用标准实验室设备就可进行空间组学研究,较低的成本也提示了大规模研究的可能性。
Open-ST的二维数据足够稳健,可以计算集成到三维中(“虚拟组织块”)。单细胞分割、亚细胞分辨率以及三维组织重建和分析能力由为Open-ST数据设计的一组模块化和开源的计算工具支持。这有利于发现三维分子模式和潜在的生物标志物。
而Nova-ST的团队证明这种改造也适用于NovaSeq X系列的流通池。这些图案化流通池的表面布满了以六边形晶格排列的微小纳米孔。
但就像前面所说,这两种方法的一个缺点是纳米井之间的死区,这意味着捕获效率受到影响,死区没有条形码oligo就不会捕获到上方组织内的RNA。
同样,与Seq-scope类似,目前的方法仅限于转录本的分析,尽管理论上可以通过CITE-seq进行蛋白质分析,也可以与ATAC-seq和免疫细胞受体分析配对。但这还需要进一步开发和验证。
这些重定向利用无疑是把流通池的想象空间打开了,当然,这些黑客使用及其定制化都是基于拆解再定向所实现的,比如你需要把粘合在一起的两层玻璃分开并切割成你想要的尺寸。
这些方法的一些限制,如需要使用NovaSeq的流通池,对流通池芯片的切割需要一定的操作,最后还需要NovaSeq测序仪运行来产生完整的数据,对于Illumina来说并不是什么太大的挑战。这些工作再次提示了如果它想进入到空间组学的产品开发来,其实并不难,只需要Illumina能以合适的方式制造流通池,为空间组学的使用做更多的改进。只是我们不知道Illumina会不会走这条路,在空间组学这条路上会不会进入到自己的产品开发和提供上。
但从方法学的角度,Seq-Scope和Open-ST的作者都声明其为各自的方法申请了专利保护。
持续关注。
欢迎转发、分享给更多关注的朋友!!