CD8⁺ T 细胞在适应性免疫应答中发挥着核心作用,它们利用其 T 细胞受体(TCRs)识别与感染、炎症和癌症相关的抗原,并发挥效应或杀伤功能【1】。然而,CD8⁺ T 细胞在各种生理和病理状况下呈现出显著的表型异质性。单细胞免疫组库技术的迅猛发展使得研究者可以在单细胞层面捕获到T细胞转录及配对的TCRαβ信息【2】。而随着这一技术的发展,公共数据中已存在百万级T细胞免疫组库数据。整合这些数据以创建一个全面的人类 CD8⁺ T 细胞参考图谱,对于增进我们对CD8⁺ T 细胞在免疫以及不同疾病情境下所发挥的多种作用的理解至关重要。近日,浙江大学医学院鲁林荣、浙江大学爱丁堡大学联合学院刘琬璐以及腾讯AI Lab姚建华团队合作在Nature Methods杂志发表了文章,题为Integrative mapping of human CD8⁺ T cells in inflammation and cancer。在此项目中,研究团队开发了一种基于深度学习的方法scAtlasVAE,用于整合大规模单细胞测序数据。利用该工具,研究者构建了一个全面的、涵盖百万级细胞规模且涉及多种疾病的人类 CD8⁺ T 细胞参考图谱,该图谱纳入了有关转录组以及TCRαβ受体库多样性的信息。同期,团队也在Nature Methods发表题为Human CD8⁺ T cell map with single-cell transcriptome and TCRαβ information的Research Briefings。研究团队基于先前建立的人类抗原受体数据库(huARdb)【3】,开发了 一个基于深度学习的模型scAtlasVAE,专门用于整合大规模单细胞 RNA 测序(scRNA-seq)数据以及进行跨图谱比较(图 1)。利用 scAtlasVAE,研究者成功构建了一个全面的人类 CD8⁺ T 细胞参考图谱,包含了来自 68 项研究、涉及 42 种疾病状况的 961 个样本中的 1,151,678 个细胞,同时包括转录组和的配对的TCRαβ信息(图 1)。这一图谱提供了 CD8⁺ T 细胞异质性的全貌,增进了我们对这些细胞在不同疾病情境下所起作用的理解。(图一, scAtlasVAE模型示意图和构建的人类 CD8⁺ T 细胞图谱)借助该参考图谱,研究者对癌症和炎症中人类 CD8⁺ T 细胞的表型异质性进行了全面分析。通过纳入有关 TCR 克隆扩增及共享的信息,分析揭示了不同细胞亚型之间的关联,发现了它们潜在的表型和功能转变。例如,通过这种方法,研究者定义了三种不同的耗竭型 CD8⁺ T 细胞亚型,它们在癌症、自身免疫性炎症以及免疫相关不良事件 (irAE) 中各自呈现出多样的转录组图谱和克隆共享模式。基于该研究建立的人类 CD8⁺ T 细胞参考图谱以及 scAtlasVAE 的迁移学习能力,可高效实现对全新的 scRNA-seq 数据中的 CD8⁺ T 细胞亚型的自动标注。这一特性有助于在不同研究和疾病情境下开展无偏倚且可扩展的分析,使得 scAtlasVAE 成为免疫学家及更广泛的研究群体的一个重要工具。展望未来,研究团队认为揭示TCRαβ库的功能多样性将对于进一步理解CD8⁺ T细胞的功能异质性及其与各种疾病的关联具有至关重要的作用。同时,对CD4⁺ T细胞的深入分析、单细胞水平的T细胞跨物种比较,以及整合T细胞与其他细胞类型之间的空间相互作用,都将为我们更加深入地理解T细胞在生理和病理条件下的功能异质性提供新的视角和思路。浙江大学医学院鲁林荣教授,浙江大学爱丁堡大学联合学院刘琬璐研究员,腾讯AI Lab医疗首席科学家姚建华为本文通讯作者,浙江大学爱丁堡大学联合学院博士研究生薛子为,浙江大学医学院博士研究生吴利则为本文共同第一作者,该项目也受到浙江大学医学院汪洌教授的大力支持。
该研究整合的人CD8图谱可通过HuARdb查询: https://huarc.net/v2/
scAtlasVAE源代码及使用手册详见
Github: https://github.com/WanluLiuLab/scAtlasVAE
Documentation: https://scatlasvae.readthedocs.io/en/latest/
原文链接:https://www.nature.com/articles/s41592-024-02530-0
免疫学单细胞图谱构建为我们了解复杂疾病的免疫状态提供了全新的方法。既往研究大多聚焦于肿瘤和肿瘤患者外周单核细胞 (PBMC)。本研究将CD8⁺ T细胞的异质性解析拓展到更广泛的疾病领域,包括感染、自身免疫疾病、炎症相关疾病以及免疫治疗引发的不良事件(irAE)。从“泛癌”到“泛疾病”,这一研究拓宽了免疫学图谱构建的边界,为系统性探索CD8⁺ T细胞在不同疾病中的作用提供了全新平台。本研究开发的scAtlasVAE,作为基于深度学习的整合分析工具,能够高效整合来自不同研究和技术平台的大规模单细胞RNA测序(scRNA-seq)数据,可自动标注查询数据集中的CD8⁺ T细胞亚型,为不同疾病背景的细胞类型鉴定提供标准化工具。本研究同时纳入配对的TCRαβ信息,从而实现从转录到克隆型的多维度数据分析。scAtlasVAE及其构建的参考图谱,为揭示T细胞异质性、解析疾病机制及开发免疫治疗新策略提供重要支持。
伴随单细胞组学技术的持续演进,日益丰富的公开数据为多样本、图谱级数据的跨样本整合创造了契机。不过,跨样本整合工作面临诸多棘手难题,诸如显著的批次效应以及大规模样本整合所需的庞大计算资源等。在前期的一系列研究中,已成功开发出基于变分自编码器(VAE)深度学习架构的跨样本整合算法,例如 scVI、scPoli 和 SCALEX 等。本研究提出了一个新的基于VAE的半监督学习模型scAtlasVAE,它通过编码器将基因表达数据 X 压缩到一个隐层分布z中,在这个过程中不考虑样本的批次,通过一个分类器利用 z 预测细胞类型,使编码器能学习到与批次无关的细胞类型信息。然后,用解码器还原基因表达数据:解码器接收z和对多层批次信息的编码向量作为输入,采用零膨胀的负二项分布进行建模。为处理不同数据集间细胞类型标注不一致的问题,scAtlasVAE 特别设计了多个分类头,分别适应不同的数据集。这种改进的模型结构既能通过编码器-解码器架构整合多个数据集的特征信息,从而提升了特征提取的效果,又允许对每个数据集的细胞标注进行独立训练,支持跨数据集的迁移学习。采用这种创新性设计,模型在处理百万级图谱数据整合任务时,达成了跨图谱整合以及跨图谱细胞类型注释的精准对齐。应用这一方法,研究者们成功整合出一个百万级别的人类 CD8⁺ T 细胞图谱。该模型所具备的迁移学习能力,使得针对人类 CD8⁺ T 细胞进行高效且自动化的注释成为现实,有望在免疫学研究领域成为极为关键的工具与资源,为后续深入探究免疫机制、疾病相关免疫应答等研究提供有力支撑与全新视角。在这项研究中,研究团队开发了深度学习工具scAtlasVAE,构建了包含42种人类疾病环境下的,总数达百万的CD8⁺ T细胞转录特征参考图谱,为免疫学研究提供了泛疾病分析的整合框架,可用于系统比较CD8⁺ 在不同疾病和组织中的表型差异。这一研究同时揭示了不同CD8+T细胞亚群的表型异质性与分化轨迹,比如能将耗竭CD8⁺ T 细胞 (Exhausted CD8+ T cells, CD8+ Tex) 按照转录特征和克隆共享特征进行更精准的细分。同时,该图谱还描绘了免疫检查点治疗相关炎症(irAE)中的CD8⁺ Tex独特的转录组特征,提示了irAE与传统自身免疫性炎症不同的致病机制,为控制癌症免疫治疗相关irAE提供了潜在的新的靶标。另外,本研究开发的scAtlasVAE能够比较新定义的细胞亚型和已报道的细胞亚型的统一性和差异性,为免疫学家比较不同来源的数据和不同注释标准下的细胞亚型提供了重要的分析平台。
制版人:十一
1. Zhang, N. & Bevan, M. J. CD8+ T cells: foot soldiers of the immune system. Immunity 35, 161–168 (2011).
2. Pai, J. A. & Satpathy, A. T. High-throughput and single-cell T cell receptor sequencing technologies. Nat. Methods 18, 881–892 (2021).
3. Wu, L. et al. huARdb: human Antigen Receptor database for interactive clonotype-transcriptome analysis at the single-cell level. Nucleic Acids Res 50, D1244–D1254 (2022).
BioART战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。