✦
医学科研新动向
✦
Single-cell RNA sequencing of peripheral blood links cell-type-specific regulation of splicing to autoimmune and inflammatory diseases
Nature genetics
<2024年12月03日>
研
究
背
景
复杂疾病通常受非编码区域调控影响基因表达。然而,传统的GWAS(全基因组关联研究)研究在解读这些非编码信号的功能机制时仍面临挑战。现有研究表明,剪接数量性状位点(sQTLs)是另一种重要的遗传效应介导途径,与表达数量性状位点(eQTLs)不同,sQTLs主要通过调控mRNA剪接过程对复杂性状产生影响。
2. 细胞类型特异性在复杂疾病中的关键作用
疾病的发生与进展通常受到特定细胞类型内分子机制的调控。例如,免疫细胞中的mRNA剪接调控可能对自身免疫和炎症疾病的遗传风险具有重要影响。然而,现有研究往往局限于bulk RNA测序,难以解析细胞类型特异性调控事件。
3. 单细胞RNA测序技术的应用与突破
单细胞RNA测序(scRNA-seq)通过单个细胞水平解析基因表达和剪接特性。然而,传统scRNA-seq技术因文库构建策略的局限性(如3′文库偏向),难以全面覆盖mRNA的外显子区域。因此,开发新技术以实现高通量、全长覆盖的单细胞剪接分析是本研究的核心目标。
4. 研究目标
本研究旨在利用改进的单细胞RNA测序技术,在亚洲人群中系统分析外周血单核细胞(PBMCs)中与性别、祖先和细胞类型相关的剪接特性,并探索这些剪接事件在复杂疾病中的遗传作用。
研究设计
样本来源:从“亚洲免疫多样性图谱”(AIDA)项目中收集474名健康捐赠者(包含东亚、东南亚和南亚人群)。 单细胞RNA测序:使用10x Genomics平台,采用改进的5′文库制备技术,生成覆盖外显子区域的高通量测序数据。
剪接事件检测:利用LeafCutter软件识别差异剪接事件(DSEs),包括性别和祖先特异性事件。。 sQTL鉴定:在19种PBMC亚型中,通过线性回归和贝叶斯模型检测cis-sQTL和trans-sQTL。 动态剪接分析:基于伪时间推断(pseudotime trajectory),分析B细胞分化过程中动态内含子使用与sQTL效应。 共定位与功能验证:结合GWAS数据,使用COLOC工具分析剪接位点与复杂疾病遗传风险的共定位关系。
采用显著性检验(如False Discovery Rate < 0.05)筛选显著sQTLs。 与其他数据集(如GTEx和BLUEPRINT)对比,验证发现结果的可靠性。
核心结果
1:人群规模与剪接检测能力
本研究对474名健康亚洲捐赠者采集了约100万个单细胞数据,每人平均1,959个单细胞,检测深度为53,846个测序读取。
每个单细胞检测到的可变剪接基因数量中值为1,146(检测范围:1,013–2,081个基因),显著高于OneK1K数据集的267个基因。
单细胞中基因表达与剪接检测呈高度正相关(Pearson’s r = 0.95),约66%的表达基因显示剪接事件,而在OneK1K中该比例仅为12%。
数据显示,随着细胞数量的增加,可检测的AS基因数量达到饱和值约11,500个,饱和趋势由sigmoid曲线拟合,决定系数为R² = 0.92。
研究覆盖率的中值为85.3%,外显子区域的有效覆盖率(覆盖碱基总数/全部碱基数)显著提高至46.9%。
1)性别偏向剪接:
检测到48个性别偏向差异剪接事件(DSEs),覆盖32个基因。
例如,FLNA基因的短剪接变体ENST00000498491在女性成熟T细胞和NK细胞中的表达高于男性(t检验P值显著,FDR < 0.05)。
2)祖先偏向剪接
检测到509个祖先偏向DSEs,受1,031个剪接事件的影响,涉及不同的亚洲亚群。
SPSB2基因的剪接模式由rs11064437驱动。此位点的次等位基因频率在东亚为30.7%,东南亚为13.9%,南亚仅为3.4%。
东亚特异的剪接变体在CD8+ T细胞和NK细胞中频繁检测到,提示可能影响免疫调节。
3:剪接数量性状位点(sQTLs)
1)cis-sQTLs
识别到10,874个蛋白编码基因和703个长非编码RNA基因的cis-sQTLs。其效应主要集中在剪接位点附近(<25kb),尤其是外显子-内含子交界区域。
在19种细胞类型中,sQTL分布显示约16.1%的sQTL基因具有多个独立的调控位点,反映出等位基因异质性。
2)trans-sQTLs
共检测到607个trans-sGenes,64.7%仅在一种细胞类型中表达。
HNRNPLL基因的cis-eQTL与PTPRC基因的trans-sQTL在CD4+ T细胞中共定位,SNP的FDR值显著低于0.01。
数据验证了trans-sQTL的功能影响高度依赖特定细胞类型,且效应大小在跨细胞类型的复制中显著降低。
4:B细胞分化中的动态剪接
1)动态内含子使用在B细胞分化伪时间中,865个内含子的使用模式随伪时间变化,包括三种动态模式:
阶跃型(stepwise):如PAX5基因,其两个剪接变体PAX5A和PAX5B分别在初始B细胞和记忆B细胞中表达。
线性型(linear):如PTPRC基因,在B细胞分化过程中,外显子4的使用呈现显著线性减少。
二次曲线型(quadratic):如DOCK8基因,显示内含子使用在分化过程中短暂增加后下降。
2)基因调控效应
检测到107个动态sQTL位点,其效应随着伪时间的变化呈现增强(57.94%)、减弱(35.58%)或暂时性(10.28%)。
在B细胞分化伪时间中,865个内含子的使用模式随伪时间变化,包括三种动态模式:
阶跃型(stepwise):如PAX5基因,其两个剪接变体PAX5A和PAX5B分别在初始B细胞和记忆B细胞中表达。
线性型(linear):如PTPRC基因,在B细胞分化过程中,外显子4的使用呈现显著线性减少。
二次曲线型(quadratic):如DOCK8基因,显示内含子使用在分化过程中短暂增加后下降。
5:trans-sQTL调控网络
1)细胞类型特异性调控
HNRNPLL基因的cis-eQTL调控PTPRC基因的trans-sQTL,影响CD4+ T细胞比例。在CD4+初始细胞中,主导位点为rs6751481;而在效应记忆T细胞中,主导位点为rs74258942,两位点的LD相关系数为r² = 0.28。
2)遗传变异与细胞比例关联
HNRNPLL的表达水平显著影响PTPRC剪接变体(SpliZ评分P = 3.07 × 10^−197),并与CD4+ T细胞的记忆亚型比例显著相关。
6. 剪接与复杂疾病的遗传联系
1)GWAS共定位
在19种PBMC亚型的sQTL与20种GWAS特征中,免疫相关疾病(如SLE、RA和Graves病)的遗传信号显著富集。
检测到TCHP基因的东亚特异性剪接位点,由rs74416240驱动,该位点在Graves病遗传风险中显示显著效应(共定位概率H4 = 0.85)。
2)免疫疾病遗传力富集
使用分层LD得分回归(S-LDSC),PBMC中的sQTL显示在系统性红斑狼疮(SLE)、类风湿性关节炎(RA)等疾病的遗传力中显著富集,表明剪接调控在免疫疾病中可能具有致病机制。
小
结
1:技术突破与剪接解析
研究采用改进的5′单细胞RNA测序技术,对100万单细胞进行了高覆盖率的转录组测序,识别出21种PBMC亚型的~11,500个可变剪接基因,并揭示了66%的表达基因具有可检测的剪接事件。该技术的高灵敏度和全长覆盖为探索剪接调控提供了强大的工具。
2:性别与祖先特异性剪接调控
研究发现性别和祖先背景显著影响PBMC中的剪接模式。检测到48个性别偏向的差异剪接事件(如FLNA基因在女性T细胞中的特异性剪接),以及509个祖先偏向的剪接事件(如SPSB2基因由rs11064437驱动的亚洲特异性剪接)。
3:剪接数量性状位点(sQTLs)的广泛作用
识别到10,874个cis-sQTLs和607个trans-sQTLs,显示出高度的细胞类型特异性。其中,HNRNPLL的cis-eQTL通过调控PTPRC的trans-sQTL影响CD4+ T细胞的亚型比例,揭示了复杂的遗传调控网络。
4:B细胞分化中的动态剪接
通过伪时间分析,865个内含子在B细胞分化过程中表现出动态使用,分为阶跃型、线性型和二次曲线型三种模式。动态sQTL进一步揭示了遗传变异如何随分化进程影响剪接事件。
5:剪接与复杂疾病的遗传联系
在PBMC的sQTL中,免疫相关疾病(如系统性红斑狼疮、类风湿性关节炎和Graves病)的遗传信号显著富集。例如,TCHP基因的东亚特异性剪接位点(rs74416240)被验证与Graves病风险显著相关。
-END-
文字丨本人点滴积累,如有补充,下方留言即可
(后台回复“241204”即可获取全文)