iScience丨不同PAMP分子激活单核细胞的多组图谱分析

学术   2024-11-17 16:22   意大利  

Chestnut Studying     

 摘要 

We performed long-read transcriptome and proteome profiling of pathogen-stimulated peripheral blood mononuclear cells (PBMCs) from healthy donors to discover new transcript and protein isoforms expressed during immune responses to diverse pathogens. Long-read transcriptome profiling reveals novel sequences and isoform switching induced upon pathogen stimulation, including transcripts that are difficult to detect using traditional short-read sequencing. Widespread loss of intron retention occurs as a common result of all pathogen stimulations. We highlight novel transcripts of NFKB1 and CASP1 that may indicate novel immunological mechanisms. RNA expression differences did not result in differences in the amounts of secreted proteins. Clustering analysis of secreted proteins revealed a correlation between chemokine (receptor) expression on the RNA and protein levels in C. albicans- and poly(I:C)-stimulated PBMCs. Isoform aware long-read sequencing of pathogen-stimulated immune cells highlights the potential of these methods to identify novel transcripts, revealing a more complex transcriptome landscape than previously appreciated.


我们对健康捐献者受病原体刺激的外周血单核细胞(PBMCs)进行了长线程转录组和蛋白质组分析,以发现在对不同病原体的免疫反应过程中表达的新转录本和蛋白质同工形式。长读数转录组分析揭示了病原体刺激时诱导的新序列和同工酶转换,包括传统短读数测序难以检测到的转录本。内含子保留的广泛丧失是所有病原体刺激的共同结果。我们强调了NFKB1 和 CASP1的新转录本,它们可能预示着新的免疫机制。RNA表达的差异并没有导致分泌蛋白数量的差异。分泌蛋白的聚类分析显示,在白假丝酵母和 poly(I:C) 刺激的 PBMCs 中,趋化因子(受体)在 RNA 和蛋白水平上的表达存在相关性。对病原体刺激的免疫细胞进行同工酶意识长读程测序,凸显了这些方法在鉴定新转录本方面的潜力,揭示了比以前认识到的更为复杂的转录本组景观。

 实验结果1 

实验设备

    作者用四种不同的微生物刺激物模拟细菌(大肠杆菌 LPS、金黄色葡萄球菌)、病毒(poly(I:C))和真菌(白假丝酵母)感染,刺激五名供体的PBMC。将 RPMI 培养液作为阴性对照(图 1A)。为了确定全长转录本结构的特征,作者对一名供体的 PBMC 进行了长序列测序(图 1B)。此外,作者还从所有五名供体样本的上清液中获得了霰弹枪蛋白质组学数据。蛋白质组学数据证实了不同基因/转录本的表达,并证明了通过长读RNA测序发现的新转录本具有编码蛋白质的潜力(图 1C)。所有五个供体的短线程 3′测序数据都是为了验证长线程RNA 测序产生的差异基因表达数据(图 1D)。

 实验结果2 

对照组和病原体刺激条件下的长读数转录组都显示出新颖性

    利用长读数测序技术检测到的序列根据其内含子链的新颖性进行分类。转录本分为三类,包括参考转录本(GENCODE)、目录中的新转录本(包含有注释的内含子的转录本)和非目录中的新转录本(包含无注释的内含子)(图 2A)。作者从所有样本的 11,872 个基因中共鉴定出 37,312 个独特的转录本序列。大部分转录本属于蛋白质编码基因,包括 10%的免疫相关基因。作者发现 47.4%的检测到的转录本是新的,而这些转录本只占总读数的 20.3%(图 2B)。每个新转录本的读数分布与已知转录本相似,只是略微偏向于较低的丰度。外显子伸长是区分新型转录本和已知转录本的最主要特征,在 RPMI 中发现的新型转录本中有近三分之一出现了外显子伸长。这与刺激条件下的情况类似(图 2C)。在所有条件下,新转录本的百分比和转录本偏差都相似(图 2D)。为了证实新型转录本的存在,作者分析了转录起始位点附近的 FANTOM5 CAGE 峰,以寻找具有新型 5′末端的新型转录本。作者发现,在所有条件下,有 8233 个(51.3%)5′末端的新型转录本得到了来自未刺激人单核细胞(150 个核苷酸以内)的 CAGE 峰的支持。

    对每个转录本的表达水平进行的主成分分析(PCA)表明,与 RPMI 相比,刺激条件下的转录本更相似。金黄色葡萄球菌和白假丝酵母彼此最为相似(图 2F)。基因和转录本在刺激条件下表达相似,基因和转录本的平均 Jaccard 相似指数分别为 0.9 和 0.82(图 2G)。与已知转录本相比,新转录本之间的 Jaccard 指数相似。差异表达分析得出每个条件下平均有 949 个差异表达基因(DEGs)和 2,076 个差异表达转录本。

    作者通过 3′转录本计数(QuantSeq)验证了 DEGs。作者根据转录本 3′端的序列差异收集了一组具有代表性的转录本(29,760 个转录本,占总数的 79.8%),并研究了长读数测序数据与同一供体单独生成的短读数数据集中差异表达的相关性。两个数据集之间重叠的 DEGs 相关性良好(R20.62-0.81)。短读数和长读数之间刺激条件的最佳匹配对证实了两种测序方法的一致性。

 实验结果3 

病原体刺激会导致不同途径的上调

    利用长线程测序数据进行的差异基因表达分析结果显示,与对照组相比,共有 1,733 个基因在刺激条件下有差异表达。作者使用gProfiler对每个条件进行了通路分析。通过对四种条件下富集的基因集进行重叠,作者发现了某些病原体刺激条件下特有的生物过程/功能。无论病原体是什么,宿主的反应都有很多不变的因素,事实上,在所有刺激条件的重叠中,最大的一组通路(211 个通路,图 3A)。这组路径富含参与 II 型干扰素(IFN-γ)反应的基因。在所有条件下,涉及三级和特异性颗粒的基因都富集在上调基因中,这些基因在抵御病原体的过程中发挥作用。令人惊讶的是,作者还发现这些基因集和相关基因集在金黄色葡萄球菌和poly(I:C)刺激下富集于下调基因中,这可能是炎症反应调节的结果。其他基因集包括对细菌源分子(包括 LPS)的反应、先天性免疫反应信号转导(如PRR信号转导)、抗原处理和呈递以及 IL-1 的产生(图 3B)。

    一些病原体刺激条件的共同富集通路多于其他条件。在白假丝酵母、金黄色葡萄球菌和poly(I:C)刺激条件下富集的 131 个基因集有明显的重叠。其中一些基因集在所有条件下都有重叠,如干扰素反应。排除 LPS 的集合显示出与病毒过程(如抵御病毒、调节病毒生命周期)有关的特别富集,这可能是由于干扰素刺激了STAT1、OAS1/3、OASL 和IFIH1 等基因的表达。此外,IRF-2、5、8 和9等转录因子结合配体(TRANSFAC)也被富集,反映了通过各种信号通路进行下游信号传导,从而导致干扰素的产生和免疫细胞的发育(图 3C)。

    LPS 和 poly(I:C)是对单一刺激具有最多富集通路的两种刺激。在 LPS 独有的 55 个基因集中,T 细胞受体信号传导下调,部分原因是CD4表达下调,而CD4表达下调曾被描述为 LPS 刺激下 TNF-α 和 IL-1β 内源性产生的结果。作者进一步发现,涉及氧化还原酶复合物和细胞对氧的反应等代谢过程的基因组上调,这可能反映了先前描述的单核细胞等免疫细胞在 LPS 刺激下发生的代谢变化。对于 53 个在 poly(I:C) 中独特富集的基因集,作者发现其功能包括病毒基因表达、与细胞凋亡相关的信号转导(调节半胱氨酸型内肽酶活性)以及与 B 细胞相关的基因集,如抗体水平增加和 BCR 信号转导。最后,MHC II 类 抗原呈递也得到了丰富(图 3E)。

 实验结果4 

同工酶转换突显了条件组和对照组之间的转录组差异

    同工型转换(IS)基因是根据特定转录本同工型表达量的变化(增加/减少)来定义的,以基因总读数的百分比来衡量。在不同的样本/条件下,特定转录本异构体可能包含特定基因的不同异构体分数(dIF)值。在此,对照组中至少 10%(0.10 dIF)的变化和病原体刺激条件下同一基因中不同转录本同工酶表达量至少 10%的相反变化(减少/增加)被视为 IS。

    在 398 个基因中共检测到 999 个 IS。在这些 IS 基因中,近一半(N= 192,48.2%)是在各自的刺激条件下特有的,而 10.3% 的基因在所有条件下都存在(N= 41)(图 4A)。大多数表现出 IS 的基因在各自条件下没有差异表达(327 个基因;77%)。发现发生 IS 的大多数基因只显示了一个 IS 实例。对发生 IS 的基因进行通路分析发现,参与新陈代谢过程、mRNA 剪接、蛋白质转运和分解代谢的基因组丰富。此外,免疫和应激相关途径,如 MHC I 型抗原处理和通过囊泡转运、炎症小体、氧化应激和细胞凋亡,也在发生 IS 的基因中有所体现(图 4B)。

    作者试图通过对参与IS转换的同工酶对的不同特征进行分类,来了解IS在病原体刺激下的分子后果。每个 IS 都被标注了以下一种或多种预测的蛋白质特征:ORF(开放阅读框)长度变化、ORF 增减、结构域增减、NMD 敏感性、内含子保留(IR)增减、编码概率(ORF 存在)和信号肽增减。这些后果并不是独立的,往往多种后果都可归因于一个 IS。作者观察到全基因组范围内 IS 的普遍趋势。令人吃惊的是,作者发现内含体缺失是本数据集中最常见的 IS 后果。在对照条件下,内含子保留的同工酶体在基因中的同工酶体比例较高,而在病原体刺激条件下,内含子排除的同工酶体在基因中的同工酶体比例较高。显示内含子缺失的基因富集于涉及mRNA 处理的通路,包括剪接体相关基因集、抗原处理和 IL-1 的产生。在包括巨噬细胞、粒细胞、和 B 细胞在内的各种免疫细胞类型的发育过程中,IR 被描述为 RNA 处理、剪接、囊泡运输和 I 型干扰素产生的调控机制。

    此外,作者还发现有较高比例的转录本具有结构域增益,而不是结构域缺失。这可能表明,病原体的刺激导致基因转而表达编码具有额外功能的蛋白质的转录本异构体。其他观察到的趋势包括病原体刺激诱导的转录本异构体的 ORF 更长和对 NMD 不敏感(图 4C)。

    由于结构域的增加或丢失可直接揭示蛋白质功能的变化,作者对具有这种结果类型的 IS 进行了探索。作者发现,具有结构域增益/缺失的基因(N= 158)富集于参与各种分解代谢过程。作者还发现了 T细胞活化基因的富集,这种效应以前曾被描述为 CD8+T 细胞协同刺激的功能性后果。其他富集的基因集包括白细胞细胞粘附和活化以及一般先天性免疫反应基因。当作者更具体地研究增益结构域本身的分子功能时,发现具有钾通道调节活性、激酶和转移酶活性、含磷基团和核酸结合的结构域富集。这些结果可能表明,IS 在免疫反应中产生的结构域增益具有功能性和细胞类型特异性效应。

    新转运体在 IS 中发挥了重要作用。在 999 个 IS 中,一半以上(N= 592)至少有一个新转录本参与了 IS。在大多数情况下(N= 438),转录本从新转录本转换为已知转录本(图 4D)。与只涉及已知转录本的 IS 病例相比,IS 的后果往往是 NMD 不敏感和 IR 缺失(图 4E)。相反,当 IS 从已知转录本转为新型转录本异构体时,较短的 ORF、结构域缺失和 NMD 敏感性更常见。总之,非刺激条件的特点是存在许多保留内含子的新型转录本,而这些转录本很难通过短读测序检测到。IR很可能是细胞在受到免疫刺激后准备快速行动的一种机制,此时保留内含子的剪接可迅速产生具有编码潜力的功能性转录本,例如,CD4+T细胞中就有这种情况。

 实验结果5 

包括CARD16和CASP1的新型通读转录本

    作者发现了一个包括CARD16和CASP1的直通转录本(图 5A),这是一个一旦验证就可能产生生物学影响的重大发现的例子。这一特殊的新转录本包含CASP1的编码区,并有一个横跨CARD16 的延长的5′ UTR,因此包含两个 ORF。该 IS 被注释为 IR 缺失,因为该新型转录本在其 3′ UTR 中丢失了一个内含子区(图 5B)。该 IS 中的已知转录本和新转录本都被预测为编码转录本(均为 100%)。发现CASP1在 poly(I:C) 刺激下有差异表达(log2FC 1.73,p= 0.049;图 5C)。已知转录本的同工酶表达在 poly(I:C) 刺激下降低,而新转录本的同工酶表达则升高(图 5D)。这进一步反映在异构体部分,从 8.3%增加到 24.8%,而已知转录本从 85.5%下降到 74.2%(图 5E)。

    CARD16和CASP1在促炎症 IL-1β 信号转导中都有作用,其中CARD16已被证明在CASP1组装中发挥作用,但关于CARD16对这一过程的确切调控作用仍有讨论。作者已鉴定出一种专门针对 poly(I:C) 刺激的 IS,发现CASP1的一种新型转录本在其 5′ UTR 中含有CARD16,在刺激时会上调。这一发现可能表明,IL-1β 信号传导中存在一种新的分子机制,可能是通过CASP1的调控因子CARD16 进行调控。

 实验结果6 

一种新的NFKB1编码转录本

    作者发现了一种新型NFKB1转录本,它在所有四种条件下都显示出 IS。该新型转录本比典型转录本短(图 6A)。进一步分析表明,该新型转录本的起始位点得到了附近多个 CAGE 峰的支持(图 6B)。令人震惊的是,该新型转录本缺少Rel 同源结构域的一部分,而Rel 同源结构域是负责二聚化和DNA 结合等功能的保守结构域(图 6C)。NFKB1在病原体刺激条件下的基因表达高于非刺激条件下(仅显示白假丝酵母,图 6D),但未发现NFKB1有显著的差异表达。新转录本的表达在病原体刺激下有所增加(图 6E)。这反映在异构体部分,它从 23.5%增加到 50.7%,而已知转录本从 39.0%下降到 21.2%(图 5F)。

    NFKB1在免疫反应中起着核心作用,它通过转录激活调节对感染的反应。此外,已知 Rel 同源结构域区域含有导致常见可存活免疫缺陷症(CVID)的致病变体,这突出了该结构域在正常 B 细胞功能中的重要性。这一发现可能暗示了NFKB1 的一种新的调控机制。

 实验结果7 

CLEC7A和OAS1以刺激特异性方式进行同工酶转换

    作者试图找出具有刺激特异性 IS 模式的基因。作者在CLEC7A 中发现了一种 IS,该基因编码 Dectin-1,它是一种识别真菌葡聚糖的受体,可触发免疫反应。虽然该基因在病原体刺激下没有差异表达,但作者确实在该基因中发现了白假丝酵母刺激的特异性 IS,涉及 NMD 敏感转录本表达的减少,而标准编码转录本和非编码转录本表达的增加。与此相反,CLEC7A中的 IR 丢失先前被确定为单核细胞受到多种病原体刺激的结果。虽然作者发现白丝假酵母刺激后CLEC7A中的 IR 丢失,但这也可能表明对病原体刺激的共同转录反应。

    此外,作者还发现了一个涉及OAS1 的 IS,该基因参与抗病毒免疫。该基因在白假丝酵母、金黄色葡萄球菌和 poly(I:C) 的作用下表达不同。作者在该基因中发现了导致内含子缺失和结构域增大的 IS。只有在poly(I:C)刺激下才能观察到该 IS,这可能表明该转录本是抗病毒免疫反应所必需的。先前的研究发现,常见的OAS1单倍型可通过 NMD 敏感转录本 p42 的表达导致蛋白质丰度下降,从而导致 COVID-19 的严重性。然而,作者发现上调的转录本缺乏抗病毒功能所需的前酰化位点,如 p46 所示。

 实验结果8 

检测分泌肽

    作者试图获得通过长读 RNA 测序发现的新转录本编码蛋白质潜力的证据。作者对来自五个供体的受刺激 PBMC 的 30 个分泌组样本进行了质谱分析,其中包括进行长读 RNA 测序的个体样本。这些样本包括 2 个对照样本和每个人每个 24 小时病原体刺激条件下的 1 个样本。

    作者设计了一个搜索数据库,其中包括作者怀疑可能存在于样本中的所有蛋白质。其中包括 GENCODE 人类蛋白质组、所用病原体的蛋白质组,以及通过长读程 RNA 测序发现的新转录本衍生的 ORF。新型转录本并不总是与新型 ORF 相对应;32% 的新型转录本的 ORF 存在于 GENCODE 参考数据库中。在收集的 30 个样本中,共鉴定出来自 15,964 个蛋白质的 38,703 个肽段。作者发现有 404 个(7.37%)鉴定出的蛋白质根据人类蛋白质图谱已知是分泌蛋白,这构成了显著的富集(OR = 2.12,p= 3.88x10-21 ,费雪精确检验)。作者没有在样本中检测到微生物蛋白。从转录组中预测出的许多新型 ORF 与 GENCODE ORF 有很高的相似性,因此有少量的新型肽可以唯一地识别这些 ORF。经过严格筛选后,作者无法确定与预测的新型 ORF 唯一映射的肽段。

 实验结果9 

分泌组中更广泛的表达偏差

    为了评估转录本表达的差异是否会导致分泌蛋白数量的差异,作者对细胞上清液中的蛋白进行了无标记定量。利用 PCA 方法,作者发现蛋白质组的大部分变化都是由个体间差异造成的,而且这些差异比免疫刺激引起的差异更大。

    在控制个体差异的情况下,作者发现刺激与对照之间共有 418 种差异表达蛋白(DEPs)。不同刺激之间的差异蛋白表达分布不均,超过三分之一(N= 131)的 DEGs 为 poly(I:C) 刺激所独有。除了金黄色葡萄球菌条件外,分泌组中显著下调的蛋白质多于显著上调的蛋白质。作者发现每个条件下重叠的蛋白质很少,这可能表明对不同病原体的反应具有高度特异性,也可能表明部分样本缺乏蛋白质分泌。

    为了确定哪种解释更有可能,作者将与刺激引起的反应相关的特定(组)蛋白质可视化。作者对按个体和刺激归一化的蛋白质表达值进行了聚类(图 7A;表 S19)。聚类结果显示,poly(I:C) 样品与其他刺激物之间存在差异。白假丝酵母在蛋白质表达谱中与 poly(I:C) 有很大的重叠。一些白假丝酵母样本与 poly(I:C) 样本进行了分组,这证实了差异蛋白表达分析的结果(34 个共同的 DEPs)。其他刺激条件无法从 RPMI 中可靠地分离出来。

    作者发现了一组在 poly(I:C) 和白假丝酵母中高表达的蛋白质(第 4 组,图 7A)。这组蛋白质富集了具有白细胞迁移和趋化功能的基因,以中性粒细胞迁移为例。作者还发现了参与 IL-1 反应、体液抗微生物反应以及细胞对 LPS 和 II 型干扰素反应的基因集的进一步富集。对这些基因分子功能的分析表明,细胞因子活性和受体结合、GPCR受体结合和各种催化功能的富集可能是由于免疫细胞分化和免疫细胞迁移过程中涉及细胞外基质蛋白降解的免疫反应(图 7B)。作者通过基因网络分析进一步评估了第 4 组中的蛋白质(图 7C)。在该网络中的 84 个蛋白质中,61 个在蛋白质水平上有差异表达(72.6%,任何情况下)。在这些 DEPs 中,18 个参与细胞因子信号转导(29.5%),其中 13 个基因是趋化因子(71.2%)。大部分蛋白质存在于细胞外区域(n= 47,77.0%),例如通过颗粒分泌。第 4 组 DEPs 的生物功能反映了第 4 组全部蛋白质的生物功能,主要对应于与中性粒细胞迁移和趋化功能相关的途径。由于这些通路不一定是这两种刺激所特有的,这可能表明poly(I:C)和白假丝酵母与其他刺激相比可能更有效地诱发差异蛋白分泌或分泌延迟较少。

 实验结果10 

与 RNA 表达的比较

    如前所述,多组学方法是目前了解人类免疫反应的最佳途径。RNA 和蛋白质水平之间的相关性或缺乏相关性可以提供宿主对病原体反应的重要线索。为了评估基因和蛋白质表达水平差异的相关性,作者评估了 RNA 和蛋白质水平差异表达的一致性。这一指标相当于两个水平上差异表达方向性一致的基因百分比(在两个水平上都观察到 DE 的所有基因中)(图 7D)。

    作者观察到,在不同的刺激条件下,RNA 和蛋白质水平上表达水平的方向性和折叠变化的总体一致性较差,白假丝酵母除外,其总体一致性为 73%。作者将聚类分析得出的第 4 组基因与发现在 RNA 和蛋白质水平上都存在 DE 的基因进行了重叠。在整个双水平 DE 基因组中,该组基因的比例过高(OR = 6.99,p= 4.813e-16)。进一步分析群组 4 中蛋白质产生的一致性差异表达匹配(图 7D 中的三角形),作者观察到白假丝酵母和/或 poly(I:C)诱导的基因具有很高的一致性。poly(I:C)和白丝假酵母诱导第 4 组基因的方向一致性明显高于总体方向一致性(p= 0.0313)。LPS 和金黄色葡萄球菌条件下的第 4 组蛋白位于右下象限,表明 RNA 的增加转化为这些基因分泌蛋白的减少(图 7D)。

    作者在 IS 分析中假设,宿主应对病原体的一个主要调控机制是失去 IR 以快速生成蛋白质。作者交叉引用了分泌蛋白来支持这一猜想。通过重叠 IR 丢失事件中的上调异构体,作者从 7 个基因中发现了 20 种情况。在这些基因中,有 2 个基因的蛋白质水平上调,支持了作者的假设。这两个基因分别是GZMB和B2M,它们都是重要的免疫调节基因,具有分泌功能,考虑到其余 5 个基因在蛋白质水平上的下调,这并不能令人信服地证明 IR 缺失总体上会使蛋白质产量迅速增加。


Chestnut Studying
科研小屋,主要研究方向:炎症,先天免疫,组学
 最新文章