人源肿瘤异种移植(Patient-Derived Tumor Xenograft,PDX)模型,是将患者来源的肿瘤组织以组织的形式移植至免疫缺陷小鼠体内,较于传统的细胞系移植模型(Cell-Derived Xenograft,CDX),PDX模型未经过体外培养,且能克服与细胞相关的局限性,较好地保持了原发肿瘤的遗传特性和异质性,是现阶段最优秀的肿瘤动物模型。尤其是在肿瘤药物开发过程中,其的主要困难包括缺乏能够重现患者肿瘤异质性的临床前模型(preclinicalmodels)、较差的生物学和遗传学重复性、现有模型的预测价值较差等。为了解决这些问题,PDX模型在临床前肿瘤模型研究中有着较为广泛的应用。而另一方面,在高通量测序的领域,单细胞测序这一新技术已经成为当红炸子鸡,以其精细到细胞级别的分辨率在各种不同的领域开疆拓土。单细胞测序与PDX模型的结合,已经成为了重要的研究手段。不过由于模型的特殊性,实验端无法直接将来自不同物种的细胞区分出来(除非通过特定的抗体进行流式分选),因此对于PDX模型的单细胞测序需要从分析端间进行区分。那么,具体的方法是怎样的呢?10X Genomics官方给我们提供了这样的分析方案,在官方开发的Cell Ranger软件当中有一个multigenome模式,该模式下会对测试数据针对两个不同物种的基因组数据库同时进行比对和cell calling,在得到细胞之后,根据同一个barcode下分配到2个基因组中的reads数量和比例,判断细胞归属于哪个基因组,或者被判定为多细胞(multiplet)。 数据分析前,我们需要针对PDX模型中的物种进行多物种数据库构建,完成后使用对应的数据库进行cellranger count分析即可。数据库构建指令:cellranger mkref --genome=GRCh38 --
fasta=Homo_sapiens.GRCh38.dna_sm.chromosome.chr.fa --
genes=Homo_sapiens.GRCh38.96.chr.gtf --genome=GRCm38 --
fasta=Mus_musculus.GRCm38.dna_sm.chromosome.chr.fa --
genes=Mus_musculus.GRCm38.96.chr.gtf --nthreads=12
-genome 物种基因及染色体前缀信息(注意:多个物种间命名字符串长度保持一致,否则会用----补充)最终输出的文件夹名字为--genome参数中间用_and_连接。
上图是使用多物种模式进行分析得到的人鼠混合细胞的结果,使用的基因组分别为GRCh38和GRCm38。可以看到分别有2869个细胞和3385个细胞被分配到了人和鼠,另外数据中还有121个细胞被鉴定为multiplet(下图灰色部分的散点)。经过这样处理之后,如果关注的主要是人的细胞,那么就可以将人的细胞所属的barcode单独提取出来,来开展后续的下游分析。当我们需要将其中一个物种单独拿出来进行分析的时候,我们可以根据cellranger输出的结果来进行提取,其中会有一个分配到不同基因组的细胞barcode:当然,官方推荐的细胞鉴定标准可能只是一种基于质量较好的测试数据得到的标准,实际数据当中可能会有部分细胞呈现出较难区分的情况(例如细胞整体RNA表达量较低)。所以在文献当中,针对PDX模型产出的单细胞转录组测序数据,有的时候也会采用与10x genomics官方略有差异的办法。例如在2020年发表的一篇Genome Medicine中,研究者就采取了更严格的方法,包含另一物种reads超过1%的barcode就被移除。
结合上述的分析方法,我们可以高效率地实现单细胞转录组与PDX模型的结合,并且发挥出两者最大的威力,为我们的科研工作进行高质量的提升。无论我们关注的是模型中的人源还是鼠源的细胞,我们都有办法将它们分离出来,并且避免由于同源比对造成的混淆和污染,为我们的数据分析保驾护航。
本文系联川生物公众号原创文章,未经授权禁止转载,侵权必究!