2025国自然热点:单细胞免疫组数据挖掘思路

企业   2024-11-21 17:07   浙江  


为什么要进行单细胞转录组(scRNA)与免疫组(scV(D)J)联合分析?



免疫系统是由各种细胞类型组成的复杂的网络,各种免疫细胞类型之间以及与组织实质细胞之间相互作用,在疾病发病机制中发挥核心作用,介导了免疫过程T/B 细胞是特异性免疫系统的两大主体细胞群其如何发挥作用一直是免疫学研究的核心问题。scRNA由于只能获取转录本基因表达层面信息,还是不足以详细的刻画出组织内的免疫微环境。  

scV(D)J利用独特建库方式对样本进行转录组测序同时,也可对T细胞与B细胞进行V(D)J区域测序,获得同一个细胞的基因表达信息与V(D)J序列信息,通过TCR/BCR的功能信息补充基因表达谱,从而更详细地了解不同T/B细胞群的行为更加全面的方式了解免疫微环境的复杂性和多样性。

在免疫与疾病这个热点领域,近几个月的研究更集中在疾病V(D)J 方向。值此节点,我司推出单细胞转录组与免疫组联合分析产品,通过提供丰富的分析场景及配套分析方案,竭诚助力各位老师能够紧随热点,快速产出。

   本产品属于两组学联合的进阶分析,个性化程度高。我司为订购本产品的每一个客户单位配备了专属技术工程师,可确保您分析无忧。


分析框架






分析数据准备




单细胞转录组与免疫组联合分析相对于两者本身是进阶分析,即需要建立在单细胞转录组T/B细胞的数据挖掘结果之上进行。联合分析之前需要对T/B细胞进行亚类鉴定,在亚类维度上,结合免疫组信息,寻找实验因素导致的T/B细胞分子机理及功能变化,锁定关键功能基因,寻找标志物。这可以为有针对性地操纵免疫系统提供理论基础。

单细胞转录组与免疫组合并分析示意图

首先对单细胞数据进行大类鉴定,之后对T细胞进行再分群后确定细胞亚类。

其次,将确定亚类的T细数据与免疫组数据进行合并分析,获取每一个T细胞的克隆型和CDR3全长序列信息。

一、T/B细胞异质性特征分析



免疫组库(Immune Repertoire,IR)指的是在特定时间段内,机体内T淋巴细胞和B淋巴细胞多样性的总和[3]它反映机体免疫系统在特定时间段内应对外界刺激应答的能,健康状态下体免疫组库的多样性要远于疾病状态。通过对其异质性的研究,可以准确地反映机体免疫系统的健康状况。


1.克隆型及CDR3多样性分析

机体受到病变细胞的袭击后,依照克隆选择原则,T/B细胞在识别主要组织相容性复合物呈递的同源抗原及共刺激信号的帮助下激活并增值,以期获得足够的T/B细胞开展免疫反应。因此病变的机体T/B细胞会发生一定程度的克隆扩增。免疫组测序覆盖 TCR/BCR的全部基因相关序列,可对 TCR/BCR 所有克隆亚型进行精准鉴定[4]。通过对对照组和疾病组的T细胞亚类的克隆型进行丰度统计,可以找到疾病负荷下发挥作用的克隆型及多样性。

Fig1a/c:V(D)J检测每个患者T细胞克隆的数量。 b/d: 1、2、3、6、7、9、10为患者及愈后检测到的T细胞克隆数分布趋势

愈后克隆型扩增的T细胞umap分布:

患者到愈后过程中显著扩增的克隆型:

T 细胞受体 (TR) 和 B 淋巴细胞特异表达的免疫球蛋白 (IG) 均具有特定的互补决定区 (CDR, complementarity-determining regions),能与 MHC- 抗原肽分子进行识别并特异性结合,进而发挥功能清除病原体或体内肿瘤细胞。互补决定区的多样性是适应性免疫应答机制的重要基石。重链抗体CDR3区域为最主要的抗原结合区,改变标志着 T/B 细胞对某一抗原发生了特异性应答。CDR3 区长度和序列变化,也用于评估 T/B 细胞的功能及免疫应答状态[5]


Fig4:患者愈后样本的CDR3 length分布图 


Fig5:患者与愈后的高频CDR3序列分布图


Fig6:克隆型分布甜甜圈图,最里层的 1、2 和 3+ 分别表示只出现一次的克隆、出现两次的克隆和多次出现的克隆占比情况。中间层的 Q1 (前 20%)、Q2 (接下来 20%)到 Q5 (后20%) 分别表示多次出现的克隆 (3+) 中 5 分位分布情况。最外层则为出现次数最多的前 5 个克隆蛋白序列信息。


2TCR/BCR的多样性分析

不同人类个体在免疫多样性组合分布上存在一定的个性化特征,如果长期保持一种单调分布模式,即少部分组合占比特别高,则可能提示个体免疫系统功能的整体水平较低。反之,若频度丰富,则提示个体免疫系统功能的整体水平较高。香农韦弗指数(Shannon Wiener Index) 和辛普森指数 (Inverse Simpson Index) 是反映TCR/BCR 多样性的两个重要指标:

Fig7:a/b分别为TCR和BCR的香农/逆辛普森指数箱线图

小贴士:“香农”来源于信息熵,衡量了机体中T细胞克隆的多样性。香农指数越高,代表T细胞克隆的多样性越高。香农指数既考虑了T细胞克隆种类的多少,也考虑了每种克隆的均匀度(频率)。逆辛普森指数反映的是扩增克隆在克隆群中的地位和作用,若克隆群中扩增克隆所占的多,其它非克隆克隆所占的比例则会减少,逆辛普森指数越大,代表克隆的多样性越高。

Fig7所示,CTR(患者)CPC(愈后)相比,存在一定差异。在免疫治疗过程中,可以结合香农韦弗指数及逆辛普森指数,预测和评估例如免疫检查点抑制剂 PD1/PDL-1/CTLA4 等药物治疗应答的效果[3]

基于mix and match strategy策略,V-(D)-J 基因片段能够进行产生性排上述提到的免疫组多样性基础。同种T细胞功能群在不同样本之间 V-J 组合种类和频率均有所不同。疾病组和健康组存在显著差异的 V-J 组合,可以进行追踪研究,探索某些V-J 组合作为该种疾病的生物标志物的可能性[3]

Fig8:健康组(HD1)和疾病组(UPN10UPN13)的V-J pair统计Skyscraper plots




3T细胞TCR/BCR的克隆种类重合、共享分析 overlap and sharing)

在外周血中,会存在许多与抗肿瘤反应无关的T细胞克隆。外周血中与肿瘤重叠的TCR库(外周血-肿瘤重叠库)可能在肿瘤反应性T细胞克隆中得到富集。所以,血肿瘤重叠库有助于监测抗肿瘤T细胞反应[3]

通过绘制两个样本间克隆种类配对比较图以及计算两个样本TCR克隆种类的共享情况,可以追踪机体治疗前后克隆种类变化,锁定到关键克隆型。

Fig9a为各样本之间的克隆型overlap values;b为不同样本之间各自的unique TCR及两者shared TCR的分布情况



二、抗原表位预测及TCR收敛群分析




1.抗原表位预测分析:

截至到目前,TCR靶向哪些表位依旧是该领域最具挑战的探索。这个问题的解决可以使我们找到发挥中和病原抗原的T细胞。CDR3区域为最主要的抗原结合区,基于此可比较目标细胞类型的TCR序列和公共CDR3序列来预测感染细胞的特异性抗原。

将我们的序列与McPAS-TCR数据库进行了比对结果如下:

Fig10TCR预计对CMV、流感病毒、结核分枝杆菌和EBV有反应性


Fig11:以参与者#1为例,其首要的扩增克隆型预计是CMV特异性的,并且随着时间的推移持续存在,这提示CMV的持续抗原刺激可能有利于hiv感染细胞的维持


2TCR收敛群分析:

抗原识别触发T细胞的下游信号传导,这是免疫系统发挥作用至关重要的生物学过程。因此,TCR介导的内在信号和外在信号都会影响T细胞的功能。对TCR及其转录组学综合研究,可解释TCR库变化与T细胞功能的关系。可对富集的CDR3进行分组,以鉴定存在于许多不同样品中的与潜在的共同抗原结合的TCR簇群。例如为了确定CD8或CD4 T细胞克隆扩增是否可能由共同抗原驱动,可使用GLIPH算法对T/B细胞的TCR互补决定区3 (CDR3)的相似性和共享特异性进行分组,形成TCR convergence groups(TCR收敛群),研究某个收敛群细胞的样本来源、对某种克隆型扩增的贡献度,VJpair使用情况的异质性。      

Fig12:a是各个CRG的样本细胞占比;b是各个CRG的TCR useage情况,c是各个细胞类型中CRG-1细胞的占比,d是CRG-1细胞的umap图


通过Fig12.d和Fig13.a发现,同属一个CRG的细胞t-SNE投射中位于一个集中的区域。通过计算cell distance(随机分组TCR的T细胞与表达不同TCR但属于同一个TCG簇T细胞的转录组相似性)(Fig13.c)来分析克隆扩增的T细胞与转录表型的相关性。

Fig13.b为Top8 CRG的WebLog;c为随机分组TCR的T细胞CRG T细胞的cell distance


为深入分析每个CRG中克隆扩增T细胞的共同转录特征可以比较特定CRGT细胞与所有其他细胞的基因表达差异。如下图 49TCRCRG特异性基因热图。对每个CRG的特异高表达基因进行基因GO富集发现T细胞活化和免疫应答基因以及细胞周期基因在大多数CRGs中上调。可以推断扩增的克隆是被激活的,并且可能由于细胞周期和免疫应答基因的上调而获得生长、存活和功能优势。

Fig14.a为49CRG簇的特异高表达基因分析热图,通过比较GLIPH分析后的特定CRG中的T细胞与所有其他细胞的基因表达来确定特异高表达基因b为每个CRG特异高表达基因GO富集到的免疫激活及细胞增殖相关通路热图

三、T/B细胞亚群组织动态关系研究




T细胞是疾病免疫治疗的关键要素,某些基本特性,如肿瘤内T细胞的发育和迁移,仍然是难以捉摸的。T细胞受体(TCR)库是识别外来和自身抗原所必需的,基于单细胞转录组和TCR α和β链序列作为谱系特异性标记,STARTRAC结合了几个独特的指数,包括STARTRAC-dist, STARTRAC-expa, STARTRAC-migr和STARTRAC-tran

来定量描述组织分布克隆扩增、组织迁移和发育分化,来研究具有不同功能和克隆性的T细胞亚群之间的动态关系。

原理:STARTRAC假设认为相同克隆型的细胞来源一致。

分析前首先对单细胞转录组和TCR数据进行展示:

       经过一系列的质量控制过滤,获得10805个细胞其中91.4%至少有一对完整的生产α和β链7274 clonotypes拥有独特的生产α-β双链,其中870clonotypes两个或两个以上的细胞


1STARTRAC分析:

startrack-dist指数揭示了不同T细胞的不同组织分布模式startrace-expa指数指出CD8+ TEX和TEMRA是克隆扩增程度最高的簇,其次是IELs。


CD8+簇的startrace-migration分析指出TEMRA细胞的迁移率最高,其次是TEM,两者都高于TEX(Fig17e)。此外,两两的startrace-migration分析显示TEMRA细胞在血液、正常粘膜和肿瘤中具有高度的TCR共享性,而TEX具有肿瘤专有性(Fig17f)。


STARTRAC-tran可以研究各细胞类型的分化关系分析表明TEMRATEX簇都与TEM高度相关(Fig18g)。这些CD8+亚类T细胞Monocle轨迹分析也证实了从TEM到TEMRA或TEX的发育轨迹(Fig18h)。



2.不同肿瘤疾病之间T细胞亚群分布的异质性研究

当比较不同癌症类型的T细胞群时,我们发现,虽然血液来源的T细胞的组成和丰度非常相似,但肿瘤和邻近正常组织中的T细胞模式不。值得注意的是,CRC和HCC肿瘤表现出更高的CD8+TEX和CD4+Tregs丰度,而NSCLC则表现出肿瘤TRM细胞的富集


Fig19:i不同组织来源的不同CD8+ T细胞在每种肿瘤类型中的组成j不同组织来源的不同CD4+T细胞在每种肿瘤类型中的组成


3.挖掘共调节协同信号:

将关注的细胞类型CXCL13+BHLHE40+ th1样细胞与其他细胞类型差异分析后发现,除高表达CXCR3、HAVCR2、PDCD1、ICOS和TIGIT外,值得注意的是,一个不太常见的基因IGFLR1也在这些细胞中上调。经过湿实验验证,IGFLR1可以与TCR信号协同传导,作为一种共刺激分子发挥作用

Fig20CXCL13+BHLHE40+th1样T细胞和肿瘤中其他TH细胞的差异分析火山图


注意事项:STARTRAC是应用于单细胞免疫组数据来揭示T细胞的动态变化分析的,故选用该分析之前要考虑样本的配对情况,以肿瘤为例,取样设置一般为外周血+肿瘤+癌旁。


四、抗原中和抗体预测



在重链和轻链上共享相同CDR3区域的B细为相同的克隆型,并根据观察到的克隆型细胞数量计算其富集程度。由于抗原激活的B细胞会从已有的初始和记忆B细胞中进行克隆选择和扩增[5],我们假设富集的B细胞克隆型更有可能产生高亲和力的SARS-CoV-2结合和中和抗体。

中和抗体鉴定过程示意图


已有报道,可以从外周血PBMCs分离B细胞。使用10X Chromium 5mRNA和VDJ测序对新分离的B细胞或CD27+记忆B细胞亚群进scRNAscVDJ测序scVDJ会富集丰富的IgG1克隆型 同时CD27+记忆B细胞的选择在很大程度上提高了记忆B细胞的数量以及IgG1克隆型。然而,实验发现从含有丰富IgG1+克隆型的记忆B细胞中选择的130个体外表达的单克隆抗体中,两个RBD结合单克隆抗体中只BD-23的单克隆抗体SARS-CoV-2表现出较弱的病毒中和能力。结合RBD的单克隆抗体和中和性单克隆抗体的鉴定效率较低,因此需要基于抗原亲和力的选择,这可以极大地丰富与刺突/RBD结合的B细胞。

建立筛选标准:

1.只选择含有表达IgG1的B细胞的富集克隆型,因为表达IgG1的B细胞对病毒刺激反应强烈

   2.表达IgG2的B细胞通常对病毒病原体的反应较弱,因此呈报IgG2的克隆型不被列为理想的候选者

   3.体细胞超突变率(SHM)高于2%的克隆型表明亲和力成熟不足,被排除在外

   4. 由于耗竭B细胞和初始B细胞对抗原刺激的反应较差,仅含有耗竭记忆B细胞或初始B细胞的克隆型不被认为是理想的候选克隆

Fig21:克隆型选择标准

逐层筛选后,从富集的克隆型中选择169个理想候选基因,通过转染HEK293细胞系中表达。同时,表达47个非理想候选细胞作为参考,验证选择标准的有效性。

Fig22:从富集的克隆型中筛选出的候选基因

注意事项:相关报道提出,对中和抗体的预测需要较高数量的经标准过滤后的B细胞,故选择该产品之前需进行综合评估样本细胞情况与方案的匹配性


五、TCR多样性与临床指标及预后关联分析




TCR库具有很大的诊断价值和临床实用性,其多样性反映了免疫系统的状态。

诸多研究人员已开始探索TCR库变化与疾病之间的关联,研究结果提出可使用TCR库分析作为免疫治疗患者分层和监测的生物标志物的方法。TCR库分析指标可用于预测治疗方案疗效。治疗前后TCR指标的动态变化与对应疾病患者的长期预后相关,有助于我们了解疾病患者的独特免疫学特征。同时,TCR库可以进一步深入了解免疫治疗疗效差异的潜在机制。

如有研究人员探索了TCR库指标与非小细胞肺癌NSCLC各项临床指标以及不同KRAS突变亚型之间的潜在关联。如下图,发现TCR库的Shannon index、Morisitaindex、Clonality指标表明其与年龄、性别、吸烟史和肿瘤分期等临床指标无关,但发现KRAS/STK11突变患者的Morisitaindex显著高于STK11野生型患者。Morisitaindex越高,肿瘤组织和配对外周血之间的相似性越高,表明NSCLC中的KRAS/STK11突变可能诱导独特的免疫特征。


与预后的关系方面,如下图,肿瘤中TCR丰度较高的患者比TCR丰度较低的患者具有更好的DFS。癌旁正常组织中TCR丰度与生存的关系无统计学意义。

 Fig24:高丰度TCR与低丰度TCR在肿瘤(d)与临近正常组织(e)中的Kaplan–Meier曲线


相关阅读


【联川苍穹-宏基因组云分析】玩转beta多样性分析


宏基因组——物种组成分析


【联川苍穹】新成员--【宏基因组云分析平台】正式发布

       




本文系联川生物公众号原创文章,未经授权禁止转载,侵权必究!

扫描下方二维码





点分享


点点赞


点在看





联川生物
一个提供科研入门学习资源、经验的平台。 分享前沿测序技术资讯、实用生信绘图技巧及工具。 发布高质量的科研论文精度、精炼科研思路。 我们的目标是持续提供“干货”,滋润您的科研生涯。
 最新文章