空间转录组迈入高清时代的同时,对于空间上识别单个细胞的要求也越来越高,因为这样才能将测到的转录本分配给原始表达的细胞。今天我们就讲讲“细胞分割”。
细胞分割指的就是将细胞从显微镜图像中分割出来的任务。它是许多生物医学研究的基本步骤,并且被视为基于图像的细胞研究的基石。比如我们对切片进行了染色后,经常需要进行指定细胞类型的计数任务,如果使用特定软件进行细胞分割之后就会方便我们进行肉眼计数,甚至可以实现自动计数。同理,在基于图像的空间转录组学中,第一步就是图像分析,对细胞核、细胞质的边界进行描绘,也就是细胞核分割和细胞分割,形成研究的小单元。然后再是将转录本分配到这些小单元中实现对该细胞的转录本组成的精确描绘,这有助于后续对该细胞的正确分类,甚至可以发现稀少的新的细胞类型并对其功能进行探索,实现真正意义上的单细胞分析。
我们人眼进行细胞分割没有什么固定的规律和逻辑,但是机器学习工具基于图像进行细胞分割是有固定的逻辑的,可以拆解为首先对图片中目标进行检测,将其与背景区分开来,然后对检测到成块的目标整体进行边缘分割,然后对成块的目标整体内单个目标的边界进行预测分割,从而就将一个个的实例分割出来了。
目前可用于细胞分割的社区开发工具主要分为两大类,一类是基于图像的细胞分割,另一类是基于转录本的细胞分割(当然一般也会用到染色图像数据来优化细胞分割)。
几个代表性的工具罗列在下面,其中可接入xeniumranger后续分析的已被荧光标记。随着基于图像的空间转录组数据的积累,应该会涌现出越来越多的图像、转录本结合的细胞分割工具以及图像降噪信号强化工具。不过一大难点是目前没有通用的适合所有组织的细胞分割工具,其根本原因有不同细胞的大小、形状不一,没有适用所有细胞的细胞膜染色试剂,不同组织内细胞分布的疏密程度不一等。
结合第三方工具,我们总结了Xenium数据重新进行细胞分割的基本步骤,前面提到细胞分割第一步是目标检测,一般使用细胞核来定位细胞,因此第一个任务一般是进行细胞核的识别和分割。这一步是基于DAPI染色的图像进行细胞核分割,也就是说,使用DAPI的染色图像,加上细胞分割工具,可以轻松拿到细胞核分割结果,细胞核分割结果一般是描绘细胞核边界的封闭多边形或者掩膜位置文件。接下来的任务就是细胞分割,一般有4种策略,a.使用细胞核分割的边界进行扩张,直至遇到另外一个扩张边界或者扩张至阈值(如5微米);b. 第二个是基于细胞膜染色的图像进行细胞分割,也就是直接识别细胞膜的边界;c.基于细胞质和细胞核的染色图像进行细胞分割;d.基于转录本的空间分布特征进行分割。
Xenium官方的用于细胞分割的工具是Xenium ranger,由于Xenium Explorer使得用户能够更直观地分析和理解复杂的空间数据,有着极大的交互性和便捷性。因此我们的目标是输出一个和Xenium analyzer下机数据类似结构的文件夹,以供Xenium Explorer进行查看。而Xenium ranger就可以直接生成这样的文件夹。而第三方细胞分割的工具的生成文件要么使用第三方工具指定的可视化工具进行查看,要么生成Xenium ranger指定的细胞分割结果文件,通过import-segematation进行格式转换和生成必要的其他标准输出文件后,使用Xenium Explorer查看。
接下来,使用cellpose这款第三方工具的细胞分割来领大家对细胞分割入门,首先对其进行算法介绍。
Cellpose是一种通用的、无需过多模型训练和参数调整的基于深度学习的分割算法,其细胞分割模型的建立基于前期的人工注释和深度学习训练。首先通过人工手动注释真实的掩膜(也就是人工描绘细胞边界)后,从掩膜中心执行模拟扩散生成可用于神经网络预测的矢量流拓扑图,然后训练基于U-net架构的神经网络形成预测流场,最后基于预测流场对未做标记的细胞进行细胞分割。
因此使用Cellpose进行细胞分割一般需要先进行模型训练、图像预处理、细胞分割和优化等步骤,我们可以选择cellpose根据公共数据图片集训练好的模型进行细胞分割。
在1.0推出之后cellpose推出了2.0,主要是使用了更多更不同类型的图像进行训练和风格分类,用户还可以在这些预训练模型的基础上进行人工标注训练自己的数据,生成自己的模型。
之后又升级到3.0,3.0主要是可以处理因噪声、模糊或采样不足等导致质量下降的图像的细胞分割任务,也就是拯救我们的低质量成像图片。
如果您的Xenium数据只有DAPI染色图像,通过cellpose识别核掩膜之后,我们可以将其传入xeniumranger执行核扩张策略进行细胞识别。如果您使用的是细胞膜、质染色的工作流程输出的数据,就可以使用DAPI染色图像和细胞膜染色图像,选择两个通道执行cellpose细胞分割。
通过对Cellpose的介绍,我们可以认识到第三方的细胞分割工具是基于单个细胞分割模型进行细胞分割的,此外,如果我们的细胞边界染色清晰且完整,分割就会比较顺利,但实际上没有一个用于所有组织切片的通用细胞边界染色方案。
而且这种工具的输出文件并不提示哪些细胞边界是基于清晰染色判断的,哪些是推断而来的。
Cellpose也最多支持2个channel的图像,对于额外的channel信息需要重新训练模型或者融合channel进行使用。
因此Xenium推出了多模型细胞分割算法。它对DAPI图像使用机器学习算法推断细胞核边界,对多组织通用染色结果图像使用多模型细胞分割算法,简单来讲,若该细胞细胞膜被染色上了,就基于细胞膜图像的细胞分割模型进行细胞分割,若该细胞细胞膜未被染上,但细胞质染上了,就基于细胞质染色图像和细胞核染色图像进行细胞分割,若其膜、质均未染上,就基于DAPI染色的细胞核分割结果进行5um 的边界扩张。这些不同的分割结果在Xenium Explorer中可以通过细胞边界的颜色来查看,从而反映关注的细胞边界的真实程度。也就是说,Xenium可以支持多个channel进行细胞分割。
那么,如何评估我们细胞分割的质量呢,我们可以通过查看Web summary的“核扩张算法推断的细胞占比”,来评估,其值越小认为细胞分割质量越好,因为这意味着大多数的细胞是根据细胞质/膜染色进行分割的。
此外可以在Xenium Explorer查看细胞聚类的结果与组织形态特征的相符程度进行评估。比如这里A图是DAPI染色图像,B图是Xenium先前版本的基于核边界外扩15um的细胞分割算法拿到的细胞分割结果图像,C图是多组织通用染液染色后的荧光显微镜图像,D图就是该图像的细胞分割结果。可以看到细胞分割的结果和真实的情况非常相似。
不得不指出的是,目前Xenium细胞分割仍存在明显的缺陷,就是对于非常大的细胞核非常致密的组织的细胞分割结果效果不好。因此老师们应该在了解自己组织细胞形态特征的基础上采用该技术或结合第三方工具开展研究。
1. Caicedo J, Cooper S, Heigwer F, et al. Data-analysis strategies for image-based cell profiling. Nat Methods. 2017;14(849-863).
2. Stringer C, Wang T, Michaelos M, Pachitariu M. Cellpose: a generalist algorithm for cellular segmentation. Nat Methods. 2021;18(1):100-106.
3. Stringer C, Pachitariu M. Cellpose3: one-click image restoration for improved segmentation. bioRxiv. 2024.
本文系联川生物公众号原创文章,未经授权禁止转载,侵权必究! 扫描下方二维码 点分享
点点赞
点在看