Basic Information
英文标题: An organotypic atlas of human vascular cells 中文标题:人类血管细胞的器官型图谱 发表日期:20 November 2024 文章类型:Article 所属期刊:Nature Medicine 文章作者:Sam N. Barnett | Sarah A. Teichmann 文章链接:https://www.nature.com/articles/s41591-024-03376-x
Abstract
Para_01
人体血管系统由内皮细胞(ECs)和壁细胞组成,覆盖了体内巨大的表面积,为血液和组织环境之间提供了关键的界面。 不同特定血管床的功能差异存在,但其在各组织中的分子决定因素仍大部分未知。 在这项研究中,我们整合了来自19个人体器官和组织的单细胞转录组学数据,定义了约67,000个细胞(62名捐赠者)中的42种血管细胞状态,包括从大到小口径血管的动脉内皮轴上的过渡特征。 我们还表征了器官特异性群体,包括脾脏边缘区和血脑屏障内皮细胞,从而明确了这些重要细胞状态的分子谱型。 探究内皮-壁细胞分子对话揭示了与Notch、Wnt、视黄酸、前列腺素和细胞粘附信号相关的血管类型和器官特异性通信途径。 转录因子网络分析显示,在组织特异性模块中,下游目标基因的差异调节,例如在多个肺血管亚群中FOXF1的调节。 此外,我们对不同血管床内的血管药物靶点进行了机制推断。 这一开放获取资源增进了我们对人类血管细胞中血管多样性及器官特异性分子特征的理解,并对跨组织的血管疾病具有治疗意义。
Main
Para_01
血管网络构成了身体的循环基础设施,包括渗透组织的动脉、毛细血管和静脉的分层系统。 这个复杂的网络调节组织稳态,并在其输送血液流动以进行气体和营养物质交换的重要作用之外表现出功能异质性。 同时,淋巴管从组织中移除间质液,通过淋巴结运输和过滤后返回血液循环。 重要的是,血管参与了绝大多数疾病的发病机制,包括高血压、癌症、炎症性疾病和糖尿病。
Para_02
内皮细胞(ECs)是专门的细胞,它们衬在血液和淋巴管腔的内表面,其中95%来自毛细血管,几乎到达人体器官和组织中的每个细胞。 内皮细胞对重要功能做出贡献,包括凝血、免疫调节、血管生成和组织修复。 此外,除了连续型、有孔型和窦状隙型内皮在形态学上的区别外,内皮细胞还表现出器官特异性功能,如血脑屏障、血液废物过滤(肾小球)和红细胞过滤(脾脏边缘细胞)。 这些多样化的角色代表了尚未完全在分子水平上表征的器官间和器官内的异质性。
Para_03
壁细胞,包括血管平滑肌细胞(VSMCs)和周细胞,位于血管外层,在动脉-静脉轴上具有不同的形态和功能,动脉和静脉周围有多层的VSMCs,而微血管周围则有单层纵向或星形的周细胞。 VSMCs通过其收缩功能调节血压和血流,周细胞控制微血管稳态和血管生成。 尽管周细胞的组织特异性功能已被广泛认可,但最近的单细胞研究也显示了小鼠VSMCs中的器官型转录多样性。
Para_04
然而,人类内皮细胞和壁细胞在血管类型差异和器官特异性分化方面的分子基础仍然没有完全明确。 在这里,我们描述了19种人类器官和组织中的血管细胞多样性。 通过定义42种血管细胞群体,我们突出了组织特异性和共享的基因特征、调控网络、可预测的可药物靶向的血管细胞目标以及调节血管类型和器官特异性内皮-壁细胞相互作用的细胞间信号传导,为推进生理学、病理学和潜在治疗干预的知识构建了一个框架。
Results
An integrated multi-organ map of the human vascular system
人体血管系统的多器官整合图谱
Para_01
为了表征健康成年人的血管细胞异质性,我们整合了来自19个器官和组织的单细胞数据集(图1a和补充表1和2)。 经过质量控制(QC)后,全球对象包括大约800,000个细胞(67名捐赠者,166个样本)(图1b,补充数据图1和2及补充表3)。 数据整合使用单细胞变异推断(scVI)进行,未对器官变异进行校正(补充数据图2和方法)。 我们识别出主要细胞类型,包括内皮细胞、壁细胞、上皮细胞、成纤维细胞、免疫细胞和肌肉卫星细胞(图1b,c,补充数据图3和补充表4)。 内皮细胞(ECs)通过表达CDH5、VWF和PECAM1来定义,后者也在选定的免疫群体中检测到。 其他广泛的内皮细胞标记物包括与血管生成相关的EGFL7;在发育过程中调节血管母细胞分化的Wnt抑制因子TMEM88;以及被认为是肿瘤血管生成潜在靶点的C型凝集素CLEC14A(图1c和补充数据图4)。 壁细胞表达平滑肌细胞和周细胞标记物PDGFRB、NOTCH3、ACTA2、MYH11和RGS5,此外还包括收缩调节标记物肌球蛋白轻链激酶(MYLK)和leiomyomodin-1(LMOD1)。
Fig. 1: Overview of multi-organ vascular cell atlas.
a, 用于分析的器官和组织单细胞 RNA 测序数据集。 b, 包括血管和非血管类型的全球整合对象中所有细胞类型的 UMAP 表示。 c, 全球细胞类型对象中选定的内皮细胞和壁细胞标记基因以及其他主要细胞类型标记的点图表示。 d, e, 肠和骨骼肌中 TINAGL1 的 smFISH(比例尺,50 微米)及核复染(DAPI)(d),以及 TINAGL1 与 ACTA2(VSMC)和 CDH5(EC)共表达的量化(n = 3 个感兴趣区域 × 3 个供体)(e)。使用 Wilcoxon 秩和检验进行统计分析,并进行了 Benjamini-Hochberg 校正。* 校正后 P < 0.05;*** 校正后 P < 0.001。误差条表示标准误差。 f, 从全球整合对象中提取的广泛血管细胞类型的 UMAP 表示。 g, 血管隔室中主要细胞状态选定标记基因的点图表示。 h, 按器官划分的内皮细胞群体的层次聚类树状图。顶部颜色条:器官。底部颜色条:内皮细胞亚型。a 中的插图是用 BioRender 创建的。
Para_02
在内皮细胞和壁细胞之间也发现了共享的特征,包括由 TINAGL1 编码的整合素和 EGFR 结合分子(图 1c),这有助于体外血管形成,以及内皮细胞特异性粘附分子(ESAM)。 此外,免疫球蛋白受体、基底细胞粘附分子(由 BCAM 编码)及其结合伙伴层粘连蛋白-α5(由 LAMA5 编码)也被共享(图 1c),表明血管细胞之间存在共同的粘附特征。 使用单分子荧光原位杂交(smFISH)验证确认了 EGFL7 定位于内皮细胞,MYLK 定位于血管平滑肌细胞,而 TINAGL1 在两者中均有表达(图 1d,e 和扩展数据图 1a)。
Para_03
为了探索血管细胞的异质性,我们对内皮和基质部分进行了子集划分和整合,从62名供体中获得了约67,000个细胞,并鉴定出动脉、毛细血管、静脉和淋巴管内皮细胞(ECs)、周细胞和血管平滑肌细胞。 除了用于区分动脉、静脉和毛细血管EC的经典转录特征外,我们还突出了替代基因标志物。 值得注意的是,脾静脉窦的湖床内皮细胞的转录特征以单细胞分辨率进行了描述。
Para_04
与先前的研究结果一致,区分小鼠动脉(Efnb2)和静脉(Ephb4、Vwf 和 Nr2f2)内皮细胞的典型标志物在人类中显示出很少的血管类型特异性,支持了使用人类细胞参考的重要性。 其他基因在两个物种中都显示出特异性,包括动脉内皮细胞中的 Sema3g/SEMA3G。
Para_05
为了确定不同血管床内皮细胞(ECs)的相似性,我们根据器官对动脉、毛细血管和静脉内皮细胞进行了分层聚类。 这表明表型主要与血管类型身份(动脉与毛细血管与静脉)相关(图1h),这与之前关于小鼠内皮细胞的报道相反,之前的报道指出,来自同一器官/组织的器官特异性血管细胞大多聚集在一起,而不考虑它们的血管类型身份。
Arterial ECs exhibit transitional signatures
动脉内皮细胞表现出过渡特征
Para_01
我们接下来对内皮细胞群体进行了精细解析,表征了42种血管细胞状态,这些细胞状态具有特定的血管类型和器官类型(扩展数据图1e、f,补充数据图5和补充表6)。
Para_02
在动脉内皮细胞中,我们确定了三种血管类型细胞状态,包括来自主动脉和冠状动脉的细胞簇(aorta_coronary_ec)以及两种跨组织共享的人群(art_ec_1 和 art_ec_2)(图 2a,b)。 aorta_coronary_ec 和 art_ec_1 表达 BGN、ELN 和 SULF1,编码细胞外基质(ECM)成分和调节因子,有助于暴露于高压下的动脉血管壁结构和稳定性(图 2c)。 此外,art_ec_1 和 art_ec_2 表达来自 Notch 通路的血管稳态调节因子 HEY1 和 DLL4 以及 SEMA3G。 相反,aorta_coronary_ec 富含其他编码 ECM 蛋白的基因,如小富含亮氨酸的蛋白聚糖(SLRPs)OGN 和 OMD,以及糖蛋白 EFEMP1。 SLRPs 和糖蛋白在血管基底膜中起重要作用,促进细胞-基质相互作用并提供结构支持以承受跨壁压力。 此外,art_ec_2 表达 NEBL 和毛细血管标记物 GPIHBP1,表明具有中间小动脉表型(图 2c)。
Fig. 2: Endothelial heterogeneity in arteries and veins across tissues.
a, 动脉、静脉和心内膜细胞状态的 UMAP 表示,这些状态是在所有组织的血液内皮细胞(ECs)中识别出的。 b, 每种组织中细胞状态富集的热图表示。 c, 动脉、静脉和心内膜 EC 状态的转录特征的点图表示。 d, 使用多重单分子荧光原位杂交(smFISH)数据可视化动脉 EC(GJA5,SULF1)和静脉 EC(ACKR1,POSTN)标记物在一个动脉和一个静脉中的表达。MYH11 用作平滑肌细胞(VSMC)标记物,VWF 用作 EC 标记物。组织用小麦胚芽凝集素(WGA)染色以描绘细胞膜。 e, 用于分箱单独 ROI 和下游分析的示意图。 f, 使用多重 smFISH 在不同口径的动脉中 SULF1 的表达。顶部,显示两个动脉的空间图。底部,不同动脉血管内的 SULF1 表达。颜色条表示基因计数存在(1)或不存在(0)于各个分箱中。 g, 使用多重 smFISH 捕获的所有 ROI 中较大(>30 分箱)和较小(≤30 分箱)口径动脉内 SULF1 表达的箱线图表示。左侧,表达 SULF1 的分箱百分比。右侧,SULF1 的平均表达量(仅表达分箱)。n = 90 个血管,8 个切片,1 名供体。统计分析使用 Wilcoxon 秩和检验,并进行了 Benjamini–Hochberg 调整。**** 调整后的 P < 0.0001。对于 g 中的箱线图,中心线显示中位数;框限表示第 25 和第 75 百分位数;须表示最小值和最大值;点表示潜在异常值。 h, 显示动脉和毛细血管群体分区模式的轨迹推断。 i, 沿推断的分区轴 SULF1 和 NEBL 的表达。 j, UMAP(左)突出显示了河岸 EC 簇,点图(右)表示选定的河岸 EC 标记基因。 k, 使用 drug2cell 识别的药物作用目标细胞状态的矩阵图可视化。 l, 心内膜 ECs 中 EC 标记物 VWF 以及 SMOC1、INHBA、CGNL1、PLVAP 和 POSTN 表达的多重 smFISH 数据可视化。白色箭头指示心内膜层。比例尺,100 微米。e 中的插图是使用 BioRender 创建的。
Para_03
为了了解这三种动脉内皮细胞状态是否与动脉大小相关,我们使用了高分辨率、高度多重化的单分子荧光原位杂交(smFISH)(扩展数据图2a、b和补充表7)。 亚细胞水平(7 × 7-µm 二进制单位)的定性探索和基因相关性确认了SULF1在动脉内皮细胞中的特异性表达(GJA5和SEMA3G),以及它在静脉内皮细胞中(ACKR1、SELE和PLVAP13)的缺失(图2d–f和扩展数据图2c、d)。 此外,通过对二进制单位进行聚类以识别和分类单独的动脉(n = 90)为较大和较小的血管(>30和≤30个二进制单位,分别)显示,在较大的动脉中SULF1的百分比和平均表达量增加(图2f、g和扩展数据图2e)。 我们还使用低多重化smFISH确认了ELN和SULF1在动脉内皮细胞中的共表达(扩展数据图3a、b)。 为进一步证明这三种动脉内皮细胞状态沿区域轴存在,进行了轨迹推断,结果显示从主动脉冠状内皮细胞到动脉内皮细胞1、动脉内皮细胞2和毛细血管内皮细胞的区域变化,伴随着差异表达基因模块(图2h、i和扩展数据图3c–f)。 这包括沿区域轴SULF1表达的减少,而NEBL在动脉内皮细胞2中特别达到峰值。 这些数据表明,动脉内皮细胞在不同器官间具有共享的特征,并且沿动脉轴具有独特的标记。
Organotypic specificity of arterial ECs
动脉内皮细胞的器官特异性
Para_01
四种器官特异性动脉内皮细胞状态在肺(pul_art_ec)、脑(brain_art_ec)、肾(kidney_art_ec)和脾(spleen_art_ec)中富集(图2a,b)。
Para_02
Pul_art_ec 表达编码血管扩张介质的基因,包括 NPR3 和 VIPR1,以及编码血管扩张剂一氧化氮合成酶的 NOS1(图 2c)。 这些数据与肺循环的低压力和低阻力相一致。 Wnt 抑制剂 DKK2 由 pul_art_ec 和脑部对应细胞(brain_art_ec)表达。 后者还表达了编码非典型 Wnt 受体的 ROR1,这与 Wnt 信号在脑血管发育和稳态中的关键作用一致。 SLC4A4 编码的碳酸氢盐转运蛋白先前在星形胶质细胞中报道过,也映射到 brain_art_ec。
Para_03
Kidney_art_ec 表达出球小动脉标记物 SLC6A6、剪切应力和血管通透性调节因子 PI16 以及血管舒张调节因子 CHRM3 和 KCNN3(图 2a–c)。 这一特征表明了肾小球血液过滤所需的精细血管张力调节。
Para_04
脾脏动脉内皮细胞的主要特征包括凝血因子基因的富集,如抗凝血酶 SERPINA5(蛋白 C 抑制剂)和 GP9(糖蛋白 IX),以及 NOX5,这进一步证实了之前关于人类脾脏内皮细胞中 NOX5 表达的报道(图 2b,c)。
Venous ECs display shared and organotypic signatures
静脉内皮细胞显示共有和器官特异性的特征
Para_01
我们表征了四种静脉内皮细胞(EC)群体,其中一种(ven_ec_1)存在于大多数器官中,并表达ACKR1、POSTN和PLVAP。 第二种静脉内皮细胞亚型(ven_ec_2)在骨骼肌、脂肪组织和淋巴结中富集,并表达ICAM4和SELE,编码白细胞粘附分子和促炎因子IL6。 因此,这种内皮细胞可能处于免疫激活和/或转运的准备状态,类似于招募免疫细胞的静脉内皮细胞。 还鉴定出两种器官特异性静脉内皮细胞(图2c)。 一个肺部富集的人群(pul_ven_ec)表达HDAC9和IL7R,并且COL15A1阴性,这与先前的描述一致。 它们与脑部富集的静脉内皮细胞(brain_ven_ec)共同表达了与前列腺素相关的PTGDS和PLA1A,后者还以G蛋白偶联受体ADGRL3和SH3RF3为特征,后者与全基因组关联研究(GWASs)中的晚发性阿尔茨海默病相关。
Lymphatic ECs display organotypic features in lymph nodes
淋巴结中的淋巴内皮细胞表现出器官特异性特征
Para_01
淋巴内皮细胞(LECs)与血液内皮细胞不同,它们携带淋巴液,显示出包括 PROX1、LYVE1 和 PDPN 在内的独特特征。 LECs 包含七个亚群,其中一个亚群,即淋巴毛细血管内皮细胞(cap_lec),在多个器官中富集(扩展数据图 4a-c)。 TFF3 编码分泌蛋白 trefoil 因子 3,并且在乳腺癌中与淋巴血管侵袭有关,在所有器官的 cap_lec 中均有表达。 因此,TFF3 水平的增加应作为转移的潜在预测因子进行探索。 其他 LEC 聚类主要对应于淋巴结基础设施的亚型(扩展数据图 4a-d),如前所述。
Littoral ECs share venous and lymphatic EC signatures
沿海内皮细胞具有静脉和淋巴管内皮细胞的特征
Para_01
脾脏血管系统包括一个开放循环,其中开放性小动脉流入红髓,红细胞通过脾静脉窦被过滤。 这些结构由形态上拉长的滨岸内皮细胞(具有吞噬特性)组成,这些细胞表达泛内皮细胞标记物 PECAM1 和 VWF,以及先前描述的 T 细胞受体 CD8A 和 FHOD1,与之前的免疫染色和 qRT-PCR 数据一致。 静脉内皮细胞标记物 ACKR1 以及淋巴管内皮细胞标记物 PROX1 和 LYVE1 的共表达,提示了一种混合的静脉-淋巴表型。
Para_02
SCENIC43 用于预测脾脏内皮细胞中的细胞状态特异性转录因子和下游靶基因。 NR5A1(类固醇生成因子1)作为最重要的转录因子之一出现在边缘区_ec 和脾动脉_ec 中(图2c,j 和扩展数据图4g,h)。 值得注意的是,NR5A1 对于小鼠脾脏血管发育和红细胞过滤至关重要,而突变会导致人类无脾症,这表明 NR5A1 在脾脏血管稳态中起关键作用。 边缘细胞的转录因子还包括编码 NR5A1 结合蛋白的 JDP2 和通常在组织驻留巨噬细胞中表达的 MAFB(扩展数据图4g),这与边缘细胞的吞噬样表型一致。 这些结果突显了脾脏血管细胞中的器官特异性特征。
Endocardial ECs are an organotypic population of the heart
心内膜内皮细胞是心脏的一个器官特异性群体
Para_01
心腔内衬的心内膜(心内膜_ec)对于瓣膜和小梁的形成至关重要。 在这里,我们确认了标记物 SMOC1 和 INHBA 以及通常在静脉内皮细胞中表达的基因 PLVAP 和 POSTN 的表达(图 2c、l 和扩展数据图 2g)。 NPR3 的表达也在肺动脉内皮细胞中检测到,这表明沿着这一轴存在 NPR3 表达的连续性。 SCENIC 分析显示心内膜_ec 富含 GATA4 和 GATA6(扩展数据图 3g),编码参与流出道和房室管形态发生的转录因子。 这些转录因子在心内膜中的表达不仅与其在发育中的作用相关,还暗示它们可能在成人心内膜中具有稳态功能。
Inferring drug targets in arterial, venous and endocardial ECs
推断动脉、静脉和心内膜内皮细胞中的药物靶点
Para_01
我们使用了 drug2cell52,这是一种利用已知药物-蛋白质相互作用的计算机药物筛选工具,来预测不同血管床中的潜在细胞药物靶点。 我们在主动脉、冠状动脉和肺动脉内皮细胞(ECs)以及静脉和心内膜内皮细胞中发现了选择素P(由SELP编码),它是人源化单克隆抗体抑制剂crizanlizumab的靶点(图2k)。 这些数据表明,尽管crizanlizumab用于预防镰状细胞病中的微血管阻塞,但其效果可能扩展到其他血管床。
Para_02
此外,CHRM3(编码毒蕈碱乙酰胆碱受体3(M3R))是用于青光眼、眼内压增高和口干症的M3R激动剂毛果芸香碱的目标,也是用于慢性阻塞性肺疾病治疗的拮抗剂利凡卡因和溴己新乙酯的目标。 我们在这里展示,肾脏、主动脉和冠状动脉的内皮细胞可以成为这些药物的细胞靶点(图2k)。 这提供了评估这些药物通过调节内皮一氧化氮释放来控制这些血管的血管张力的机会。 有趣的是,CHRM3与高血压和内皮损伤后的血管收缩有关,这与观察到的主动脉和冠状动脉内皮细胞中的富集相吻合(图2c)。
Para_03
三帕诺尔是一种 DHCR24 抑制剂和降胆固醇药物,由于多种副作用而被撤市。 使用 drug2cell 分析表明,三帕诺尔对 DHCR24 的抑制可能影响边缘细胞的功能(图 2k)。 用于治疗甲状腺功能亢进的两种甲状腺过氧化物酶(由 TPO 编码)抑制剂——卡比马唑和丙硫氧嘧啶,也被预测会靶向边缘细胞以及脾动脉内皮细胞(图 2k)。 吸收后,卡比马唑的活性形式可通过增加氧化应激导致大鼠脾脏和其他器官的细胞损伤。 此外,研究显示丙硫氧嘧啶可引起脾肿大,这表明这些副作用可能是通过脾内皮细胞失调介导的。
Para_04
因此,对大血管内皮细胞(ECs)的血管类型和器官类型多样性的定义提供了对细胞特异性药物靶点的见解,突出了药物重新定位的候选者,并将机制推断与特定的细胞状态联系起来。
Organotypic specializations of microvascular ECs
微血管内皮细胞的器官特异性分化
Para_01
毛细血管内皮细胞被细分为12种状态,其中一种状态在大多数器官中共享(cap_ec),而其余状态则表现出器官特异性(图3a、b和补充表6)。
Fig. 3: Endothelial heterogeneity within the microvasculature.
a, 所有组织中血液内皮细胞(EC)识别出的毛细血管细胞状态的UMAP表示。 b, 每个组织中细胞状态富集的热图表示。 c, 毛细血管EC状态特征的点图表示。 d, 点图显示了组织内毛细血管EC区室内参与脂肪酸代谢的基因表达。 e, 多重smFISH分析显示心脏心房样本中心脏毛细血管ECs(RGCC)中与脂肪酸处理相关的基因标记(MEOX2、FABP4和TCF15),以及内皮细胞标记VWF和WGA对细胞膜的复染。 f, 肺特异性FOXF1(黑色)在整个肺部EC群体中的下游靶标。 g, 肝脏门周(x轴)和中央周(y轴)毛细血管EC群体中转录因子的富集(SCENIC评分)。 h, 点图显示了所有毛细血管EC状态下编码肝脏中央周和门周转录因子的基因表达。 i, 使用drug2cell鉴定的药物推断的毛细血管EC靶标的矩阵图可视化。LSEC,肝窦内皮细胞;TF,转录因子。
Fatty acid metabolism in muscle and adipose capillary ECs
肌肉和脂肪组织毛细血管内皮细胞中的脂肪酸代谢
Para_01
局限于心脏和骨骼肌(myo_cap_ec)的人群表达了对脂肪酸吸收至关重要的基因,这表明它们有助于满足肌肉组织的高能量需求。 标志物包括FABP4和FABP5(编码脂肪酸结合蛋白)以及转录因子基因MEOX2和TCF15(图3b-e和扩展数据图5a),这些基因诱导CD36(CD36)和LPL(脂蛋白脂肪酶)以促进脂肪酸通过内皮细胞的转运。 此外,一个富含脂肪组织的毛细血管内皮细胞群体(adip_cap_ec)也共享这些特征,并表达产脂基因ACACB和脂肪生成基因PPARG(图3a-d)。 adip_cap_ec还包括来自胸腺的细胞,可能是因为老化过程中胸腺脂肪生成所致。
Lung microvascular ECs include three cell states
肺微血管内皮细胞包括三种细胞状态
Para_01
定义了三种肺微血管内皮细胞(EC)群体,包括气细胞(aerocyte_ec)、肺毛细血管(pul_cap_ec)和顶端细胞(pul_tip_cap_ec)(图3a-c和扩展数据图5b)。 pul_cap_ec 和 aerocyte_ec 共同表达了对肾上腺素/去甲肾上腺素反应的标记物 ADRB1、与血清素相关的 SLC6A4 以及由 VIPR1 编码的血管活性肠肽受体1(扩展数据图1c)。 pul_cap_ec 的特征与人类肺部普通毛细血管和小鼠 gCap 内皮细胞重叠,表达 IL7R 和 FCN3(图3c)。 此外,位于肺泡气体交换前线的气细胞表达了 EDNRB、CA4、SOSTDC1 和前列腺素相关的 HPGD(图3c)。 肺微血管内皮细胞以及肺动脉和静脉内皮细胞中前列腺素相关基因的表达进一步支持这一途径可能有助于肺血管内的低血压。
Para_02
Drug2cell 预测了血清素/去甲肾上腺素再摄取抑制剂(SNRIs)多塞平和去甲文拉法辛(用于抗抑郁治疗)的靶标为表达 SLC6A4 的肺泡细胞和肺毛细血管内皮细胞(图 3i)。 这些发现表明,针对肺微血管内皮细胞可能有助于与 SNRI 使用相关的呼吸系统疾病和死亡率。
Para_03
SCENIC 分析显示 FOXF1(编码叉头框 F1)是所有肺内皮细胞群体的调节因子,具有共享和细胞状态特异性的下游靶点(图 3f 和扩展数据图 5b),这表明相同的转录因子可以调节具有血管类型和器官类型特异性的下游靶点。 值得注意的是,内皮细胞中的 FOXF1 可抑制小鼠肺纤维化,而突变会导致人类先天性肺静脉错位的肺泡毛细血管发育不良。
Para_04
第三种肺富集的内皮细胞群,pul_tip_cap_ec,表达促血管生成尖端细胞标志物 PGF、CXCR4 和 ESM1,这些标志物先前在肺癌中被描述过,并且还表达 CYTL1,这是一种由内皮祖细胞形成的细胞产生的促血管生成细胞因子(图 3c)。 这表明 pul_tip_cap_ec 是一个具有血管生成潜力和/或内皮祖细胞状态的群体。
Glomerular ECs display a distinctive molecular signature
肾小球内皮细胞表现出独特的分子特征
Para_01
肾脏富含两种微血管内皮细胞群体:肾小球_ec 和肾小管_cap_ec(图 3b)。 肾小球内皮细胞表达 EHD3,编码一种参与窗孔形成和肾小球滤过的内体转运蛋白,以及 MEG3,与糖尿病肾病有关(图 3c)。 肾小球_ec 还表达了硬化蛋白(由 SOST 编码)(图 3c),这是一种 Wnt 抑制剂,在小鼠中减少骨形成并防止血管钙化。 巧合的是,肾小球中的钙化很少见,这表明肾小球 SOST 可能保护它们免受钙化。 Drug2cell 预测肾小球内皮细胞是 romosozumab 的靶点(图 3i),romosozumab 是一种用于治疗骨质疏松症的 SOST 抑制剂,尽管没有报道过肾副作用。 肾小管毛细血管内皮细胞与肾小球_ec 共表达 IGFBP5(图 3c),在糖尿病肾病中涉及血管炎症。 此外,肾小管_cap_ec 表达毛细血管标记物 RGCC,在肾小球_ec 中缺失(图 3c),这可能代表了周围小管和/或直小血管的毛细血管,如在小鼠中所强调的那样。
Zonation of hepatic capillary EC populations
肝毛细血管内皮细胞群体的区域化
Para_01
在肝小叶中,肝细胞、间质细胞和内皮细胞(ECs)在门脉-中央轴上发生区域化。 我们确认存在两种肝窦毛细血管内皮细胞(EC)群体,包括门周(periportal_cap_ec)和中央周(pericentral_cap_ec)内皮细胞。 中央周毛细血管内皮细胞富含编码C型凝集素(CLEC1B、CLEC4G和CLEC4M)和凝集素途径的纤维蛋白(FCN2和FCN3)的基因(图3c和扩展数据图1f),这些与补体级联反应和免疫调节有关。 相反,门周内皮细胞则富含广泛表达于其他器官血管床的标记物(MGP、AQP1和CLEC14A)以及毛细血管内皮细胞标记物RGCC(扩展数据图1c)。
Para_02
基于它们表达的 CD4,肝窦内皮细胞被药物2细胞鉴定为抗 CD4 单克隆抗体伊巴利珠单抗的潜在靶点(图 3c,i)。 这用于防止 HIV 进入 CD4+ T 细胞;然而,CD4 的作用以及伊巴利珠单抗对中央周围和门周围内皮细胞的影响尚未被探索。 SCENIC 揭示了调节肝毛细血管内皮细胞的转录因子编码基因,包括 FOXN2、EGR2 和 NFATC1,MAF、NR2F1 和 GATA4 在中央周围内皮细胞中的得分更高(图 3g,h)。
The uterus contains endometrium-specific capillary ECs
子宫含有内膜特异性毛细血管内皮细胞
Para_01
我们识别出了一种新的细胞群体,来源于蜕膜化和非蜕膜化的子宫组织(子宫内膜),表达 APCDD1 和 SNCA,后者编码 α-突触核蛋白,调节内皮细胞 Weibel-Palade 小体中分子的释放,以及 HOXD9(图 3a-c)。 使用子宫空间转录组学数据确认了这些内皮细胞在子宫内膜中的定位(扩展数据图 5c,d)。
Brain capillary ECs show features of the blood–brain barrier
脑毛细血管内皮细胞显示出血脑屏障的特征
Para_01
我们定义了一个富含大脑的毛细血管簇(血脑屏障内皮细胞),该细胞表达了已知血脑屏障内皮细胞标志物的基因,包括溶质载体SLCO1A2、SLC38A3和SLC7A8以及脂肪酸转运蛋白和转胞吞作用调节因子MFSD2A。 Drug2cell预测血脑屏障内皮细胞是非奈利酮的目标,非奈利酮是盐皮质激素受体(由NR3C2编码)的拮抗剂(图3i)。 这种药物可以减少慢性肾病中的促炎和促纤维化过程,尽管它不能穿过血脑屏障,但它可能针对这些细胞内的盐皮质激素受体。
Para_02
总之,我们证明了器官型微血管内皮细胞显示出与组织功能相关的转录特征。 值得注意的是,与在小鼠中的报道相反,在人类中,VWF(一种凝血的关键调节因子)几乎普遍存在于内皮细胞中,除了气细胞、肾脏和肝脏毛细血管内皮细胞(图2c和3c)。
VSMCs and pericytes demonstrate angiotypic signatures
VSMC和周细胞表现出血管类型特异性特征
Para_01
VSMCs 构成了动脉和静脉的肌肉层,动脉壁更厚以承受更高的血压。 此外,周细胞形成围绕毛细血管的不连续层,为微血管提供重要的稳态和功能支持。 不同器官中周细胞和 VSMCs 的层次聚类主要显示了这两个细胞区室内的转录相似性(图 4a),这表明,像内皮细胞一样,壁细胞的特化主要由血管类型决定。
Fig. 4: Pericyte and SMC heterogeneity across the human vascular bed.
a,按器官划分的壁细胞群体层次聚类的树状图。顶部色条:器官。底部色条:壁细胞亚型。 b,所有组织中识别出的壁细胞状态的UMAP表示。 c,每种组织中细胞状态富集的热图表示。 d,VSMC和平滑肌周细胞状态的转录特征的点图表示。 e,多重smFISH分析显示动脉VSMC(MYH11+)中的RERGL表达。分别显示了内皮细胞标记物VWF、动脉和静脉内皮细胞标记物SEMA3G和ACKR1的表达。使用WGA进行细胞膜染色。 f,使用多重smFISH捕获的所有ROI中动脉和静脉内RERGL表达的箱线图表示。左侧,每个动脉或静脉VSMC簇中表达RERGL的bin百分比。右侧,动脉和静脉VSMC中RERGL的平均表达量(仅表达bin)。n = 297个血管,8个切片,1个供体。统计分析使用Wilcoxon秩和检验并进行了Benjamini-Hochberg校正。**** 调整后的P < 0.0001。 g,多重smFISH分析显示smc_pc_intermediate标记STEAP4和FGF7与VSMC标记MYH11和周细胞标记KCNJ8共表达于ACKR1+静脉周围。缺乏动脉内皮细胞标记物SEMA3G确认了静脉身份。使用WGA进行细胞膜染色。 h,使用多重smFISH捕获的所有ROI中动脉和静脉VSMC内STEAP4表达的箱线图表示。左侧,每个动脉或静脉VSMC簇中表达STEAP4的bin百分比。右侧,动脉和静脉中STEAP4的平均表达量(仅表达bin)。n = 297个血管,8个切片,1个供体。统计分析使用Wilcoxon秩和检验并进行了Benjamini-Hochberg校正。**** 调整后的P < 0.0001。对于f和h中的箱线图,中心线表示中位数;盒子的上下限代表第25和第75百分位数;胡须显示最小值和最大值;点表示潜在的异常值。 i,STEAP4与VSMC标记MYH11和周细胞标记KCNJ8共表达的点图表示。
Para_02
通过子集化壁细胞,我们鉴定了10种VSMC和平滑肌细胞群体(图4b–d和补充表6)。 一种动脉特异性的VSMC群体(art_smc)特征表现为表达RERGL,编码一个肿瘤抑制因子,CASQ2(钙库蛋白2),与钙储存有关,可能调节血管收缩,以及钾通道KCNAB1(图4d)。 多重smFISH证实了RERGL在动脉VSMC中的表达及其在静脉VSMC中的缺失(图4e,f)。 值得注意的是,主动脉和冠状动脉VSMC(aorta_coronary_smc)表达了编码ECM的基因ELN、OGN和OMD,类似于它们的内皮细胞对应物(图2c和4c,d),有助于壁结构和机械感应。 静脉VSMC(ven_smc)富集了与ECM相关的HMCN2,如小鼠所示,以及FLNC(丝状蛋白C)。
Para_03
在周细胞区室中,普通毛细血管周细胞(cap_pc)在器官之间共享,并通过已知标记物ABCC9、KCNJ8和RGS5的表达以及泛血管平滑肌细胞标记物MYH11的缺失来表征(图4c,d)。 这些细胞还表现出AGT(血管紧张素原)的表达,AGT是调节血压的关键肾素-血管紧张素系统组分,主要由肝脏产生。 这些细胞也存在于smc_pc_intermediate群体中,该群体具有周细胞和平滑肌细胞的特征(PDGFRB、ACTA2和MYH11)(图4d),表明处于表型中间状态。 这些细胞还表达了STEAP4,编码一种参与炎症的金属还原酶。 多重smFISH显示,静脉MYH11+细胞的STEAP4表达高于动脉VSMCs,表明其在静脉周围的存在更多(图4g,h)。 此外,单细胞RNA测序(scRNA-seq)共表达分析显示,大约20%的STEAP4+细胞在smc_pc_intermediate细胞中同时表达MYH11和KCNJ8(图4i),这与先前的指示相符,即血管壁细胞在整个血管轴上构成一个连续体。 其他标记物包括凝血相关蛋白C受体(由PROCR编码);FGF7,此前在肺免疫招募周细胞中被鉴定;以及CHRDL1(编码chordin样1)(图4d,g),据报道在缺氧条件下促进血管生成,也在ven_smc中表达。
The lung, uterus and brain comprise organotypic mural cells
肺、子宫和大脑由器官型壁细胞组成
Para_01
我们的综合分析显示,先前描述的肺血管平滑肌细胞(pul_smc)和肺周细胞(pul_pc)的特征仅限于肺部(图4b-d)。 除了确认它们自身的表达谱外,我们还识别出共同特征,包括TCF21的表达,该基因编码参与肺发育的转录因子,以及PERP和EGFL6的表达。 子宫和蜕膜也包含独特的周细胞和血管平滑肌细胞群体(分别为uterine_pc和uterine_smc)(图4b,c)。 Uterine_pc表达了干扰素信号标志物(IFI6和IFI27),以及LUM(lumican)(图4d),已知其在组织重塑中起作用,并可能在月经周期和妊娠期间的组织更新中发挥作用。 类似于子宫毛细血管内皮细胞,uterine_smc表达了Wnt抑制剂编码基因APCDD1,参与血管重塑,以及HOPX和NREP(图3c和4d)。
Para_02
来自大脑的动脉平滑肌细胞(brain_art_smc)表达了动脉平滑肌细胞标志物,以及磷酸二酯酶-4D(由PDE4D编码),该酶通过血管紧张素-2介导平滑肌细胞收缩,并且盐诱导激酶3(由SIK3编码),调节平滑肌细胞增殖。 因此,我们的研究结果表明,壁细胞之间存在异质性,动脉和静脉中的血管型平滑肌细胞特征不同,肺、脑、子宫和蜕膜中存在不同的器官特异性群体。
Vascular cell states are reproducible in single-nuclei data
血管细胞状态在单细胞核数据中可重复
Para_01
为了测试是否可以使用额外的数据集重现血管细胞状态,我们将来自七个器官/组织的公开单核数据与单细胞数据集进行了整合(补充表8)。 血管细胞状态的自动注释(CellTypist)显示,预测的状态既包括细胞也包括细胞核的贡献,并通过相关标志物表达的确认(扩展数据图6和7)得到了验证。
Angiotypic and organotypic EC–mural cell signaling
血管生成型和器官特异性内皮细胞-基质细胞信号传导
Para_01
我们使用心脏组织的空间转录组学来绘制可能相互作用的血管细胞伙伴(扩展数据图 8a)。 这证实了预期的细胞-细胞共定位,如动脉内皮细胞与动脉平滑肌细胞、毛细血管内皮细胞与周细胞以及静脉内皮细胞在静脉区域内的共定位,而中间型平滑肌细胞/周细胞同时存在于动脉和静脉微环境中(扩展数据图 8b)。 此外,手动注释区域的比值比分析进一步确认了这些结果(扩展数据图 8c-f)。 心内膜内皮细胞在静脉中也有所富集,这可能是由于它们与静脉内皮细胞的部分转录谱重叠。
Para_02
使用 CellPhoneDB98 预测基于配体-受体(LR)对表达的相互作用细胞。 预测了器官内动脉、静脉和毛细血管生态位中内皮细胞(ECs)与壁细胞之间的 LR 相互作用。
Para_03
Notch通路是血管形成和稳定的关键参与者,涉及Jagged(JAG)或Delta样家族(Dll)配体与邻近细胞上的Notch跨膜受体之间的相互作用。 特定的NOTCH LR相互作用表现出特定于血管的模式,例如NOTCH2依赖性信号在动脉平滑肌细胞中丰富,而NOTCH3存在于所有血管中,并具有一定的器官特异性,如子宫静脉中缺乏NOTCH3依赖性相互作用(补充数据图7a)。 相反,NOTCH1依赖性和NOTCH4依赖性信号主要存在于动脉内皮细胞中。 有趣的是,NOTCH信号在静脉和微血管内皮中显示出一些器官特异性。 例如,JAG1/2-血管素(VASN)相互作用可能调节人类血管功能,这由血管素在平滑肌细胞中的作用以及小鼠血压调节中所暗示(补充数据图7b和8)。 纤维连接蛋白介导的相互作用在各器官的动脉中均匀丰富,而在静脉和毛细血管中则表现出一定的组织特异性。 相反,胶原蛋白依赖的相互作用主要局限于静脉和毛细血管,反映了血管基底膜组成的差异。
Para_04
血管型 LR 相互作用包括来自心脏和淋巴结 art_smc 到 art_ec_2 的 VEGFA–VEGFR1 和/或 VEGFR2 信号(图 5a,b),这表明通过调节内皮细胞存活和血管舒张来维持动脉稳态的作用。 此外,来自 art_ec_2 到 art_smc 的 VEGFA–NRP1 信号在心脏动脉中丰富,这在小鼠中对血管发育和 VSMC 功能至关重要。 此外,预测从大肠动脉内皮(art_ec_1)到 VSMC 的视黄酸(RA)信号(图 5a,c),这表明 RA 在维持肠道动脉稳态方面具有器官特异性功能,而不仅仅是其在血管发育中的作用。
Fig. 5: Organ-specific signaling between ECs and mural cells.
a, 动脉中内皮细胞和壁细胞之间的 VEGFA 和 RA 信号传导中的 LR 相互作用。y 轴显示特定的 LR 对。点的大小和颜色代表缩放后的平均基因表达,红色圆圈表示显著的相互作用(P < 0.05),使用 CellPhoneDB 计算得出。 b,c, 点图显示了参与 VEGFA(b)和 RA(c)途径的 LR 基因表达,以及总结细胞-细胞相互作用的示意图。 d, 微血管中内皮细胞和壁细胞之间 WNT 途径的 LR 相互作用。y 轴显示特定的 LR 对。点的大小和颜色代表缩放后的平均基因表达,红色圆圈表示显著的相互作用(P < 0.05),使用 CellPhoneDB 计算得出。 e, 点图显示了参与 WNT 信号传导的 LR 基因表达及总结细胞-细胞相互作用的示意图。 f, 微血管中内皮细胞和壁细胞之间前列腺素(PTG)信号传导途径的 LR 相互作用。y 轴显示特定的 LR 对。点的大小和颜色代表缩放后的平均基因表达,红色圆圈表示显著的相互作用(P < 0.05),使用 CellPhoneDB 计算得出。PTGES,前列腺素 E 合酶。 g, LR 基因表达的点图和 PTG 细胞间信号传导的示意图。PGH2,前列腺素 H2。图 a-g 中的插图由 BioRender 创建。
Para_05
组织型相互作用包括心脏平滑肌细胞向内皮细胞发出的β神经生长因子信号(NGF-SORT1)在动脉中的作用,已被证明参与了动脉重塑。 雄激素受体信号预测出现在蜕膜化和非蜕膜化的子宫内膜微血管中,其中细胞特异性表达雄激素受体和睾酮产生酶(由SRD5A3和HSD17B12编码)。 在人类子宫中,雄激素通过调节子宫内膜增殖和妊娠建立期间的子宫内膜能力以及月经期间的组织修复来发挥作用。 相反,雄激素失调会导致子宫内膜异位症、癌症和不孕症。 因此,通过子宫内膜微血管进行靶向激素干预可能对恢复正常的血管功能至关重要。
Para_06
此外,WNT5A依赖的信号通路在子宫内膜毛细血管中富集,特定的受体组合在内皮细胞和周细胞上表达(图5d,e)。 鉴于WNT5A在组织修复中的已知作用,我们推测这种信号通路有助于月经周期中子宫的组织重塑。 与WNT5A相反,WNT6信号通路仅从周细胞传递到内皮细胞,并且在多种组织中更为广泛。
Para_07
前列腺素是脂质衍生的信号分子,在疼痛和炎症中起重要作用。 在这里,我们描述了具有器官特异性差异的前列腺素依赖性细胞通讯。 通过映射前列腺素E2 (PGE2) 合酶及其对应的前列腺素-E受体基因 (PTGER1 和 PTGER3),我们发现这种信号通路在胰腺毛细血管内皮细胞到周细胞中富集。 相反,PTGER4 信号通路在肌肉、脂肪组织和胸腺毛细血管内皮细胞中富集。
Para_08
总体而言,微血管 LR 相互作用表现出血管类型和器官类型的差异,这表明对微环境的适应。
Discussion
Para_01
尽管通过单细胞 RNA 测序(scRNA-seq)对特定器官和组织的分析最近确定了特化的人类血管细胞的分子特征,但这些特征在不同组织中的特异性仍不清楚。 通过生成来自 19 个器官和组织的整合多器官人类血管细胞图谱,我们定义了 42 个具有共享和组织特异性特征的血管群体。
Para_02
scRNA-seq 数据整合多个器官数据集的一个挑战是在保留生物学特征的同时适当地校正人为批次效应。 尽管没有被广泛接受的标准,但已开发了多种计算方法用于复杂数据集的整合,其中 scVI 是表现最好的方法之一。 采用这种方法,并进行层次聚类后,我们发现转录特征主要与血管类型身份(动脉、毛细血管或静脉)相关,尽管某些器官中的内皮细胞具有特定的功能,存在器官特异性,这表明发育起源和组织功能可能与血管表型共同适应。 这与之前关于小鼠研究中血管细胞器官特异性的报告形成对比,该研究未报告去除环境 RNA 的管道和整合过程。 然而,为了帮助揭示更精细的器官特异性基因特征,未来的研究将受益于结合批次协变量建模以考虑技术和生物学效应,可以使用如 MAST 等工具。
Para_03
尽管单细胞 RNA 测序 (scRNA-seq) 革新了血管研究,但其灵敏度仍然是一个挑战,因为基因检测的缺失并不一定意味着缺乏基因表达。 组织起始材料和解离协议可能会影响 RNA 表达和某些细胞类型的可重复性。 因此,通过使用互补的单细胞和单核 RNA 测序技术,从更多器官和组织以及额外个体扩展这一血管图谱将进一步提高其准确性和全面性。 这将有助于未来版本的人类血管图谱的分析,包括年龄、性别、祖先和地理多样性等协变量。
Para_04
跨多个血管床识别共享和特定的分子特征可以为广泛的和局部的血管细胞药物靶点提供信息。 例如,在健康组织中,我们预测了除微血管外的血管内皮细胞(ECs)会被P-选择素(SELP)单克隆抗体抑制剂crizanlizumab靶向。 然而,在镰状细胞危象期间,当需要该药物时,毛细血管内皮细胞上的P-选择素会上调。 因此,整合健康和疾病数据集对于揭示基因表达的变化并确定与感兴趣的疾病相关的血管细胞靶点是必要的。 这将为药物靶点和脱靶效应提供机制性见解,用于临床前筛选和潜在的治疗机会。
Para_05
为了优先进行功能验证,开发和实施高分辨率和多模态空间方法将能够将基因和蛋白质表达与(亚)细胞定位相关联,这将有助于了解健康和疾病中的血管。 此外,新兴的人类/人源化体外和体内系统的开发将允许在血管细胞中进行功能丧失和功能获得研究以及药物筛选。
Para_06
总之,我们的研究提供了一个独特的开放访问资源,用于理解不同血管床和器官中内皮细胞和壁细胞的分子身份和适应性,该资源提供于 https://www.vascularcellatlas.org/。 至关重要的是,这个多组织健康血管细胞图谱可以进一步用作参考,以了解血管细胞对疾病的影响,并指导开发针对特定器官血管床的靶向治疗策略。
Methods
Research ethics for donor tissues
捐赠组织的研究伦理
Para_01
所有组织样本均在研究伦理委员会批准后从移植捐赠者处获得,并获得了捐赠者家属的书面知情同意。 用于分子测绘和Visium实验的人类心脏样本由伦敦帝国理工学院根据协议REC参考号16/LO/1568,伦敦,伦敦桥研究伦理委员会获得。 人类回肠、淋巴结、脾脏和骨骼肌组织样本由剑桥转化医学生物库根据协议REC参考号15/EE/0152,东英格兰剑桥南研究伦理委员会获得,并经国家卫生和护理研究所(NIHR203312)批准。
Data sources
数据来源
De novo generated single-cell data
从头生成的单细胞数据
Para_01
用于单细胞 RNA 测序的脾脏和淋巴结组织的供体信息见补充表 2。 取出后,脾脏或淋巴结样本被转移到 HypoThermosol (Sigma-Aldrich, H4416-100ML) 中,并在 24 小时内用冰运送至惠康桑格研究所。 样本在 DBPS 中洗涤,去除脂肪和结缔组织,切碎并在含有 Liberase TH (Roche, 05401135001) 和 DNAse-I (Roche, 4716728001) 的 RPMI 培养基中消化。 30 分钟后,用 10% 胎牛血清(FBS)在 RPMI 中终止消化,消化后的细胞通过 70 微米筛网过滤,并以 500g 离心,然后使用 eBioscience (00-4333-57) 的缓冲液进行红细胞裂解。 如果 30 分钟后仍有剩余组织,则在新鲜的 Liberase TH 和 DNAse-I 的 RPMI 混合物中继续消化 15-30 分钟,并进行红细胞裂解。 为了分离间质细胞,采用了磁性分选(供体 A51)或流式细胞术分选(供体 A59, A60 和 A61)。 使用 Miltenyi Biotec 的磁性分选试剂盒,包括 LS 柱(130-042-401)和人 CD45 MicroBeads(130-045-801),进行 CD45+ 细胞的磁性分选。 对于流式细胞术分选,细胞重新悬浮于 FACS 缓冲液(PBS 中含 0.5% FBS 和 2 mM EDTA),在 TruStain FcX (BioLegend, 422302) 中阻断 10 分钟,并与 CD31 (抗 CD31 FITC, WM59 克隆;BD Biosciences, 555445;1:50 稀释),CD45 (CD45 BV785, HI30 克隆(小鼠);BioLegend, 304048;1:50 稀释),PDPN (PE 抗人 PDPN, NC-08 克隆;BioLegend, 337003;1:50 稀释) 和 THY1 (APC 抗人 CD90(THY1), 5E10 克隆(小鼠);BD Biosciences, 561971;1:50 稀释) 抗体及 DAPI 在 30 分钟内染色。 染色后,细胞用 Sony SH800 或 Sony MA900 分选仪(细胞分选软件版本 3.1.1)通过 130 微米喷嘴分析。 两个细胞部分——一个 CD31+ 和 THY1+ 阳性,另一个仅 THY1+ 阳性——在标准质量控制后,包括碎片和死细胞去除,被分选到 1% FBS 的 PBS 溶液中。 总分和分选分均重新悬浮至推荐浓度(每毫升 10^6 个细胞),并加载到 10x Genomics chromium 控制器上,使用 Chromium Next GEM 单细胞 5' 套件 v2(编号 1000263)生成细胞滴中的乳化液。 使用文库构建试剂盒(编号 1000190)准备 GEX 文库,并使用 Illumina 的 NovaSeq 6000 测序仪进行测序。
Publicly available scRNA-seq data
公开可用的单细胞 RNA 测序数据
Para_01
本研究中使用的公开可用的单细胞 RNA 测序(scRNA-seq)数据集列表见补充表 1,包括来自心脏、肺、骨骼肌、蜕膜、子宫、小肠和大肠、肾脏、气管、脑、食道、肝脏、血液以及 Tabula Sapiens 跨组织研究的样本。 供体的元数据(年龄、性别、器官、文库制备试剂盒和研究)列于补充表 2。 存储公开可用数据的仓库可以在‘数据可用性’部分找到。
scRNA-seq analysis
单细胞RNA测序分析
Data pre-processing
数据预处理
Para_01
除了 Tabula Sapiens 数据集之外的数据都使用 CellRanger(版本 3.0)和 STARsolo(版本 2.7.3a)映射到人类基因组 GRCh38 版本 3.0.0,并使用 CellBender(版本 0.2.0)去除了环境 RNA。 使用了预处理的 Tabula Sapiens 数据。 Python(版本 3)、AnnData(版本 0.8.0 和 0.9.1)、Pandas(版本 1.5.2 和 1.5.3)、NumPy(版本 1.21.6 和 1.23.5)、SciPy(版本 1.8.0 和 1.9.3)、Matplotlib(版本 3.5.2)、Seaborn(版本 0.12.2)和 Scanpy(版本 1.8.2 和 1.9.1)用于质量控制和下游处理。 使用 Scrublet(版本 0.2.3)检测双峰细胞,预测 Scrublet 分数 ≥ 0.4 且调整后的 Benjamini-Hochberg 校正 P 值 ≤ 0.7 的细胞为双峰细胞并过滤掉。 通过以下标准过滤低质量细胞:最小读取数 = 500,最小基因数 = 300,线粒体基因百分比 ≤ 0.4,核糖体基因百分比 ≤ 0.3。 然后使用 SCANPY 工作流程将数据归一化到 104 并进行对数转换(ln(x + 1))。 未转换的读数存储在层('counts')中。
Data selection, integration, clustering and annotation
数据选择、集成、聚类和标注
Para_01
使用 scVI 模型(版本 0.9.1)对全球细胞类型数据集(约 800,000 个细胞)进行了降维和批次校正,使用未转换的原始计数。 总共在每个数据集组中选择了 5,000 个高变异基因,采用 ‘seurat_v3’ 风格。 scVI 模型的层数设置为 2,同时提供了供体作为批次键,类别协变量如试剂盒和数据集组,以及连续协变量键如核糖体基因的百分比、线粒体基因的百分比、基因数量和计数数量。 Leiden 聚类揭示了基于已知标记基因表达注释的广泛细胞类型:内皮细胞(PECAM1、CDH5、VWF),肌壁细胞(ACTA2、MYH11、RGS5),成纤维细胞(DCN、PDGFRA、SCARA5),卫星细胞(PAX7、DLK1、MYF5),上皮细胞(EPCAM、CLDN7、CDH1),髓系细胞(C1QA、MRC1、MARCO),B 细胞(MS4A1、CD79A、CD19)和淋巴样细胞(CD3E、KLRB1、NKG7)。
Para_02
为了血管细胞的下游分析,样本被无偏见地下采样到每个捐赠者每个器官最多1,500个细胞,使用SCANPY中的‘下采样’功能完成。 每个器官至少由两名捐赠者代表,没有单一捐赠者贡献超过该器官血管细胞的85%。 五名捐赠者(621B、637C、A36、D496、D503)提供的外周血单核细胞(PBMCs)数据由于缺乏血管细胞而在所有细胞对象和血管对象之间丢失。 共有67,398个细胞用于下游聚类、注释和分析。 对于血管对象的数据整合,遵循上述相同的参数进行,但选择了1,500个高变基因。 使用Leiden方法进行了无偏见的聚类,将细胞分为四个隔室:血液内皮细胞(排除湖状细胞)(PECAM1+,PROX1-)、湖状细胞(PECAM1+,CD8A+,ACKR1+)、淋巴内皮细胞(PECAM1+,PROX1+)和肌壁细胞(ACTA2+,MYH11+,ABCC9+)。
Para_03
在每个血管细胞室中使用1,500个高变异基因和层数=1进行了进一步的数据整合。 层次聚类的迭代探索从低Leiden分辨率0.2开始,随后在每个更广泛的集群内进行无偏见的子聚类(分辨率约为0.2)。 使用SCANPY中的'rank_genes_groups'函数,通过Wilcoxon秩和检验并进行Benjamini-Hochberg校正来评估新子群中是否存在标记基因。 亚型是根据它们拥有特定的标记基因和/或与特定器官的显著关联(≥80%的比例)来分类的,而跨器官一致存在的细胞状态则被归类为共享的。 为了可视化,数据在去除集群的对象中使用scVI重新整合。 使用每种状态下贡献超过10个细胞的组织生成了细胞状态富集(log1p obs/exp)热图。
Differential gene expression analysis
差异基因表达分析
Para_01
使用 Wilcoxon 秩和检验对所有标准大小归一化的基因进行了细胞类型和状态之间的差异基因表达分析,并使用 Benjamini-Hochberg 调整,筛选条件为调整后的 P 值 < 0.05 和 |log2 折叠变化 (FC)| > 0.5,采用 SCANPY 的 ‘rank_genes_groups’ 函数完成。 图中显示的标记基因是根据现有文献的知识和/或在细胞类型和状态内的高表达和特异性手动选择的。
Gene regulatory network analysis
基因调控网络分析
Para_01
使用了 SCENIC 流水线(版本 0.11.2)来预测调控不同类型血管细胞的转录因子。 基于高分辨率的血管细胞注释进行了基因调控网络(GRN)分析,一次覆盖所有血管细胞类型,另一次仅覆盖毛细血管内皮细胞/肺血管细胞类型。 首先,根据共表达计算基因调控相互作用,进一步利用已知的转录因子结合基序进行修剪,然后构建隔室特异性调控模块(调控子)。 使用 AUCell 对每个细胞中的调控子进行评分。 对于毛细血管内皮细胞分析,通过选择在感兴趣细胞类型中差异表达的转录因子(使用 ‘scanpy.tl.rank_genes_groups’ 实现 Wilcoxon 秩和检验,P ≤ 0.05,logFC ≥ 1,表达比例 ≥ 0.25)与隔室内所有其他细胞类型相比,进一步筛选调控转录因子。 同样地,目标基因也根据跨隔室差异表达的基因进行了过滤(选择标准与转录因子相同,但 logFC ≥ 2)。 然后使用自定义脚本构建了调控转录因子和目标基因的网络。
Trajectory inference analysis
轨迹推断分析
Para_01
scFates117 被用于通过轨迹推断来推断动脉和毛细血管内皮细胞的分区模式。 从血管对象中提取了动脉内皮细胞(aorta_coronary_ec, art_ec_1 和 art_ec_2)和毛细血管内皮细胞(cap_ec)。 使用 Harmony118 对所有高变异性基因进行降维和批次校正,校正了供体差异。 在具有 100 维和五个节点的均匀流形近似和投影(UMAP)上推断出主曲线。 伪时间(分区)从根节点计算,确定了起点和终点里程碑之间的线性偏差,并计算和映射了轨迹上的重要特征(UMAP 或热图表示)。
Drug2cell
药物到细胞
Para_01
在包含血管细胞状态注释和其他区室的全局对象上进行了 Drug2cell 分析(图 1b),使用了 ‘drug2cell’ Python 包(版本 0.1.0)。 药物及其相应靶基因的列表从 ChEMBL(版本 30)获得(筛选至 2,395 项)。 根据目标基因的平均表达量,在每个单细胞中计算了 Drug2cell 得分。 随后,通过 Wilcoxon 秩和检验与 Benjamini-Hochberg 调整来评估针对不同血管细胞类型/状态的药物靶向显著性。 为了进一步筛选结果,要求靶基因在感兴趣细胞类型的至少 25% 细胞中表达,并且相对于所有其他细胞的对数折叠变化大于 2。 图中显示的药物是基于这些筛选条件以及与文献的相关性进行策划的。 所有血管细胞状态和非血管细胞类型的 Drug2cell 评分可以在补充表 9 中找到。
Spatially resolved cell–cell interaction analysis
空间解析的细胞-细胞相互作用分析
Para_01
在确定的空间生态位(动脉、静脉和微血管)上进行了细胞-细胞相互作用分析,并使用 CellPhoneDB(版本 4.0.0)和数据库版本 4.1.0(https://pypi.org/project/CellphoneDB/)对这些生态位内相应的富集细胞-细胞对之间的相互作用进行了分析,采用统计分析方法和微环境文件来限制每个器官内的细胞对。 在运行细胞-细胞相互作用分析之前,我们对每个器官应用了至少 20 个内皮细胞和壁细胞的过滤条件。 因此,由于当前整合分析中每个器官捕获足够细胞的限制,相互作用分析并不全面。 对于 CellPhoneDB 分析,根据以下标准检索显著的 LR 对:(1)LR 对中的每个基因在细胞状态中至少有 10% 的细胞表达;以及(2)通过 CellPhoneDB 统计方法框架(‘statistical_analysis’,P 值阈值 = 0.05)推断出特定于两种细胞状态的 LR 复合体。 LR 对被手动归类到特定的信号通路,如 Troule 等人所示。 使用 Python 库 ktplotspy 可视化 CellPhoneDB 分析结果。
Integration of single-cell and single-nuclei data for cross-modality profiling of cell states
单细胞和单核数据的整合用于跨模式分析细胞状态
Para_01
单细胞核数据来自七个组织的公开可用数据集,包括心脏、肺、肝脏、胰腺、大脑、肾脏和骨骼肌。
Para_02
首先,从这些组织中获得了所有细胞类型的一个单核对象。 类似于上述描述的所有细胞整合方法,使用未转换的原始计数,通过 scVI 模型对全球细胞类型数据集(约 970,000 个细胞)进行了降维和批次校正。 总共,每个研究选择了 5,000 个高变基因,采用‘seurat_v3’风格。 scVI 模型的层数设置为 3,同时提供捐赠者作为批次键,分类协变量包括试剂盒,连续协变量键包括核糖体基因百分比、线粒体基因百分比、基因数量和计数数量。 基于已知标记基因的表达,广泛注释了细胞类型:内皮细胞(PECAM1、CDH5、VWF),壁细胞(ACTA2、MYH11、RGS5),成纤维细胞(DCN、PDGFRA、SCARA5),上皮细胞(EPCAM、CLDN7、CDH1),髓系细胞(C1QA、MRC1、MARCO),B 细胞(MS4A1、CD79A、CD19)和淋巴样细胞(CD3E、KLRB1、NKG7)。
Para_03
为了下游血管分析,每个器官以无偏见的方式使用 SCANPY 中的‘subsample’功能随机选取了 20,000 个细胞。 通过保留 Scrublet 得分 ≤ 0.4 的细胞去除了双倍体。 共有 67,130 个细胞用于后续聚类、注释和分析。 根据上述概述的参数对血管对象进行了数据整合,但层数设置为 2。 使用 Leiden 方法进行无偏聚类,将细胞分为两个隔室:血液内皮细胞(PECAM1+,VWF+,CDH5+,PROX1−)和肌膜细胞(ACTA2+,MYH11+,ABCC9+)。 此外,将相同组织的单核数据与单细胞数据整合在一起。 具体来说,从单核数据集中分离出的内皮细胞(ECs)与单细胞数据集中的内皮细胞进行了整合。 首先从连接的对象中移除了细胞周期、线粒体和核糖体基因。 总共选择了每项研究 7,000 个高变异性基因,无论是单细胞还是单核数据集,均采用‘seurat_v3’风味。 这些高变异性基因的联合结果导致进一步用于 scVI 整合的 9,720 个基因。 scVI 模型中的层数设置为 1,同时提供了供体作为批次键,类别协变量如试剂盒、研究和分离技术(细胞或核),以及连续协变量键如核糖体基因的百分比、线粒体基因的百分比和基因数量。 对于肌膜隔室,采用了相同的方法,在高变异性基因联合后使用 9,875 个基因进行 scVI 整合。 最后,基于在七个器官细胞数据集中识别的血管细胞状态,使用高变异性基因,并结合单细胞/单核数据集,通过最佳匹配和多数投票方法生成了 CellTypist120 模型。
Spatial validation experiments
空间验证实验
Preparation of Visium spatial transcriptomics slides, library preparation and pre-processing
Visium空间转录组学切片的制备、文库构建和预处理
Para_01
新鲜分离的人心脏样本先在10%甲醛溶液中固定24小时,然后转移到70%乙醇溶液中。 样本随后被石蜡包埋,切成5微米厚的切片,并放置在Visium载玻片捕获区域(10x Genomics)。 根据标准协议进行苏木精和伊红(H&E)染色,并使用宽场显微镜(蔡司Axio Observer)进行成像。 cDNA文库制备按照制造商的说明进行,并使用Illumina NovaSeq 2 × 150配置进行测序。
Para_02
空间转录组学文库使用 SpaceRanger(版本 1.1.0)和默认参数映射到 10x Genomics 提供的参考基因组(GRCh38 版本 3.0.0),并与样本相关的 H&E 图像对齐。
Visium spatial transcriptomics data analysis
Visium空间转录组数据解析
Para_01
为了识别通过单细胞转录组数据分析定义的不同器官中的血管细胞类型的空间组织,我们根据 cell2location 文档的说明,在本研究生成的 Visium 数据集上应用了 cell2location(版本 0.1.3)。 简而言之,我们首先从 scRNA-seq/单核 RNA-seq (snRNA-seq) 数据中使用负二项回归模型估计参考签名。 为了确保基因特征的组织特异性和稳健估计,我们仅分析了该器官中相关的细胞类型,排除了可用细胞少于 10 个的细胞类型。 由于血管细胞在每个器官中通常是少数,我们在参考映射步骤中还包含了来自其他器官的血管细胞,并将器官作为批次协变量包含进来。 此外,我们将原始出版物标识符和 10x 实验类型作为分类批次协变量,以及表达基因的数量、总唯一分子标识符计数、线粒体基因表达百分比和核糖体基因表达作为连续批次协变量。 然后,我们利用第一步中学到的基因特征推断每个 Visium 位点的细胞类型丰度。 对于超参数选择,我们保留了原始出版物中的参数。 对于心脏切片,我们使用 7 作为 n_cells_per_location 和 20 作为 alpha。 对于子宫切片,我们使用 8 作为 n_cells_per_location 和 20 作为 alpha。 对于 Visium 切片的批次校正,我们将样本标识符作为批次添加。 为了识别共定位的细胞类型,我们使用了 cell2location 包中实现的非负矩阵分解 (NMF) 算法。 具体来说,我们预筛选了至少有两种预测细胞类型的高质量 Visium 位点,每种细胞类型的最小丰度为一个细胞。
Para_02
为了确定每个手动注释的组织区域中富集的细胞类型——例如,静脉和动脉——我们使用了来自 Python 包 statsmodels(版本 0.14.0)中的模块 statsmodels.formula.api.OLS 拟合了一个单变量回归模型。 对于因变量,我们构建了一个二进制变量来表示每个 Visium 点是否属于每个手动注释类别。 例如,如果一个点被手动注释为动脉,则我们将‘1’分配给这个点。 对于自变量,我们使用了从 cell2location 结果预测的细胞类型的丰度。 我们使用 Bonferroni 方法校正了每个手动注释区域测试的细胞类型的总数。
RNAscope (smFISH)
RNAscope(单分子荧光原位杂交)
Para_01
选择并切片了骨骼肌、心脏和回肠的福尔马林固定石蜡包埋(FFPE)组织,厚度为5微米,放置在SuperFrost Plus载玻片上。 切片在60°C下孵育30分钟,然后进行染色。 使用Leica BOND RX自动化仪器,根据制造商的说明,使用RNAscope LS多重荧光试剂盒v2测定法和RNAscope LS 4重辅助试剂盒(Advanced Cell Diagnostics (ACD) Bio-Techne)对FFPE切片进行RNAscope染色,所有切片均在95°C下进行15分钟的热诱导表位修复酶2处理和15分钟的蛋白酶III处理后进行染色协议。 在运行RNAscope探针面板之前,使用多重阳性(RNAscope LS 2.5 4重阳性对照探针;ACD Bio-Techne)和阴性(RNAscope 4重LS多重阴性对照探针;ACD Bio-Techne)对照评估FFPE样本的RNA质量。
Para_02
RNAscope 列表如下:RNAscope 2.5 LS 探针 - Hs- TINAGL1-C1(ACD Bio-Techne,857221-C2),RNAscope 2.5 LS 探针 - Hs- EGFL7-C1(ACD Bio-Techne,314008),RNAscope 2.5 LS 探针 - Hs- LMOD1-C1(ACD Bio-Techne,444148),RNAscope 2.5 LS 探针 - Hs- MYLK-C3(ACD Bio-Techne,533478-C3),RNAscope 2.5 LS 探针 - Hs- PROX1-C2(ACD Bio-Techne,530248-C2),RNAscope 2.5 LS 探针 - Hs- NTS-C4(ACD Bio-Techne,512568)和 RNAscope 2.5 LS 探针 - Hs- LYVE1-C3(ACD Bio-Techne,426911-C3)。
Para_04
探针和抗体使用 Opal 520、570 和 650 荧光染料(Akoya Biosciences,稀释比例 1:1,000)进行标记,其中一个探针通道使用 Atto 425-链霉亲和素荧光染料(Sigma-Aldrich,稀释比例 1:500)进行标记,该荧光染料首先与 TSA-生物素(Akoya Biosciences,稀释比例 1:400)孵育。
Para_05
共聚焦成像使用了PerkinElmer Operetta CLS高内涵分析系统,采用数值孔径(NA)为0.16、每像素0.299微米的20倍水浸物镜,Z轴堆栈9-11层,步进2微米。 通道:DAPI(激发波长355-385纳米,发射波长430-500纳米),Atto 425(激发波长435-460纳米,发射波长470-515纳米),Opal 520(激发波长460-490纳米,发射波长500-550纳米),Opal 570(激发波长530-560纳米,发射波长570-620纳米)和Opal 650(激发波长615-645纳米,发射波长655-760纳米)。 非共聚焦成像使用了Hamamatsu NanoZoomer S60荧光全切片扫描仪,采用40倍物镜镜头。 通道:DAPI(激发波长355-385纳米,发射波长430-500纳米),FITC(激发波长460-490纳米,发射波长500-550纳米),TRITC(激发波长530-560纳米,发射波长570-620纳米)和Cy5(激发波长615-645纳米,发射波长655-760纳米)。 共聚焦和非共聚焦图像堆栈分别作为单独的Z轴堆栈使用PerkinElmer提供的专有Acapella脚本进行拼接,并使用OMERO Plus(Glencoe Software)进行可视化。
RNAscope quantification
RNAscope 定量分析
Para_01
图像量化使用 Fiji(版本 2.14.0)进行。每个通道的背景去除如下:(1) 原始图像减法与高斯模糊变换 σ = 50;(2) 使用滚动球半径为 50 像素的背景减法;以及 (3) 将强度 <40 的像素(8 位图像)减少到零。每份样本选择三个感兴趣区域(ROIs)进行量化(三位捐赠者:2×回肠,1×骨骼肌)。ROI 被分箱(像素 × 像素),每个通道的最大强度被量化(ACTA2、CDH5、TINAGL1)。在确定 ACTA2 或 CDH5 与 TINAGL1 共表达之前,过滤掉同时表达 ACTA2 和 CDH5 的 bin。
Rarecyte CD8a antibody staining
Rarecyte CD8a抗体染色
Para_01
人类脾脏的福尔马林固定石蜡包埋(FFPE)组织块使用 Leica RM2235 微切片机切成 5 微米厚的切片,并放置在 Thermo Fisher Scientific 的 SuperFrost 滑片(12312148)上。 将载玻片在 60°C 下干燥 60 分钟,以确保组织切片牢固附着在载玻片上。 组织切片经过脱蜡处理,并使用 BioGenex EZ-Retriever 系统进行抗原修复(95°C 5 分钟,随后 107°C 5 分钟)。 为了去除自发荧光,用 AF Quench 缓冲液(4.5% H2O2,24 mM NaOH 在 PBS 中)漂白载玻片。 载玻片在强白光照射下以‘高’设置淬灭 60 分钟,然后在 UV 透射仪下以 365 nm‘高’设置进一步淬灭 30 分钟。 载玻片用 1× PBS 冲洗,并在 300 微升的 Image-iT FX 信号增强剂(Thermo Fisher Scientific,I36933)中孵育 15 分钟。 再次冲洗载玻片,向组织中加入 300 微升标记的 CD8a 一抗,随后在黑暗中、湿度盘中孵育 120 分钟。 CD8a 抗体根据公司推荐预先稀释。 用表面活性剂洗涤缓冲液清洗载玻片,并向载玻片中加入 300 微升的山羊稀释剂中的核染色液。 然后在黑暗中、湿度盘中孵育 30 分钟。 然后清洗载玻片并置于 1× PBS 中。 最后,用 ArgoFluor 封片介质封片,并在室温下避光过夜干燥。 第二天使用带有 20 倍物镜的 RareCyte Orion 显微镜对载玻片进行成像,并使用 Artemis 版本 4 软件应用相关的采集设置。
Molecular Cartography (multiplexed smFISH)
分子地图学(多重单分子荧光原位杂交)
Tissue sections
组织切片
Para_01
新鲜解剖的右心房心脏样本嵌入OCT浸泡的基模,并在干冰冷却的2-甲基丁烷(Sigma-Aldrich, M32631)浴中冷冻至-70°C。 然后使用低温切片机(Leica, CX3050S)将组织切片,10微米厚的切片放置在冷Resolve Biosciences载玻片的捕获区域内。 样品随后在干冰上送往Resolve Biosciences进行分子地图实验,如前所述。 到达后,组织切片在4°C下用1×PBS中的4%体积/体积甲醛(Sigma-Aldrich, F8775)固定20分钟。 固定后,切片在1×PBS中洗涤两次,每次2分钟,然后在室温下用50%乙醇和70%乙醇分别洗涤1分钟。 根据制造商的说明(协议1.3;仅限注册用户),从吸出乙醇并加入DST1缓冲液开始,进行分子地图绘制(100-plex组合smFISH)。 简而言之,在37°C下预处理组织30分钟,然后与所有目标基因特异性探针杂交24小时(详见探针设计细节和目标列表)。 杂交步骤后,清洗样品以去除多余的探针,并通过两步颜色开发过程进行荧光标记。 ROI如下所述进行成像,荧光信号在脱色过程中被去除。 颜色开发、成像和脱色重复多次,以构建每个目标基因的独特组合代码,该代码由原始图像得出,如下所述。 小麦胚芽凝集素(WGA)和DAPI分别用于细胞膜和核的反染色。
Probe design
探针设计
Para_01
针对100个基因的探针设计使用了Resolve Biosciences的专有设计算法。 简而言之,探针设计是在基因水平上进行的。 对于每个目标基因,如果该异构体具有GENCODE注释标签‘基本’,则使用Ensembl数据库中的所有全长蛋白质编码转录本序列作为设计目标。 计算计算成本较高的部分,特别是非靶标搜索,探针序列的选择不是随机的,而是限制在成功率高的序列上。 为了过滤高度重复的区域,使用Jellyfish从背景转录组中获得了k-mer的丰度。 每个目标序列都会被扫描一次所有的k-mer,那些具有罕见k-mer的区域更倾向于作为完整探针设计的种子。 通过扩展一个种子序列直到达到一定的目标稳定性来生成探针候选。 应用了一套简单的规则来丢弃实验中发现的问题序列。 经过这些快速筛选后,每保留下来的探针候选都被映射到背景转录组中使用ThermonucleotideBLAST,并且稳定非靶标命中率高的探针被丢弃。 然后根据靶标匹配数(异构体)对特定探针进行评分,这些匹配数按其相关的APPRIS级别加权,优先考虑主要异构体。 如果结合位点位于蛋白质编码区域内,则会增加奖励分数。 从接受的探针池中,最终集由选择得分最高的探针组成。 补充表7突出了由Resolve Biosciences设计的具体探针的基因名称和目录编号。
Imaging
成像
Para_01
样本在蔡司细胞发现者7上成像,使用了NA为1.2的×50 Plan-Apochromat水浸物镜和×0.5放大倍率转换器,最终放大倍率为×25。 标准CD7 LED激发光源、滤光片和分色镜与定制的发射滤光片一起使用,优化用于检测特定信号。 每张图像每个通道的激发时间为1,000毫秒(DAPI为20毫秒)。 根据奈奎斯特-香农采样定理,在每个区域获取z堆栈,每个z切片的距离也据此确定。 使用了自定义的CD7 CMOS相机(蔡司Axiocam Mono 712,像素大小为3.45微米)。 对于每个区域,每轮成像中对两种荧光颜色进行一次z堆栈成像。 每个位置共进行了八轮成像,导致每个区域有16个z堆栈。 每轮完全自动化的成像过程(包括水浸生成和在所有三个维度上的精确重新定位成像区域)通过使用蔡司ZEN软件(开放应用程序开发)的脚本API实现的自定义Python脚本实现。
Spot segmentation
点分割
Para_01
点分割算法是用 Java 编写的,并基于 ImageJ 库的功能。 只有迭代最近点算法是用 C++ 编写的,基于 libpointmatcher 库(https://github.com/ethz-asl/libpointmatcher)。
Pre-processing
预处理
Para_01
首先,所有图像都进行了背景荧光校正。 根据切片面积(μm²)乘以0.5的因子确定允许的最大值数量的目标值。 这个因子是通过经验优化的。 基于经验优化的阈值,确定每个平面最亮的最大值。 分别存储了各自最大值的数量和位置。 此过程独立地对每个图像切片进行。 排除了在相邻切片(称为z组)中没有邻近最大值的最大值。 通过调整Babs-Bback和Bperi-Bback的允许阈值,进一步在迭代循环中过滤得到的最大值列表,以达到特征目标值(Babs,绝对亮度;Bback,局部背景;Bperi,外围背景在一像素内的背景)。 这些特征目标值基于三维(3D)图像的体积。 只有在过滤后仍处于至少两个一组的最大值才能通过过滤步骤。 每个z组计为一次命中。 具有最高绝对亮度的z组成员用作特征并写入文件。 它们代表一个3D点云。 最终信号分割和解码:为了对齐来自不同成像轮次的原始数据图像,图像必须进行校正。 为此,使用提取的特征点云来找到转换矩阵。 为此目的,使用迭代最近点云算法最小化两个点云之间的误差。 每轮的点云与第一轮(参考点云)的点云对齐。 相应的点云被存储用于下游处理。 基于转换矩阵,使用三线性插值对相应的图像进行刚性变换处理。 对齐后的图像用于为每个像素创建一个由16个值组成的配置文件(16张图像来自两个颜色通道在八个成像轮次)。 像素配置文件通过总亮度归一化后的方差从零进行过滤。 匹配度最高的像素配置文件被分配为像素的ID。 具有相同ID的邻居像素被分组。 通过组大小、组内直接相邻像素数和两个像素尺寸的维度数对像素组进行过滤。 确定组的局部3D最大值作为潜在的最终转录位置。 通过在原始数据图像中预期出现最大值的数量对最大值进行过滤。 剩余的最大值进一步通过与相应代码的拟合进行评估。 剩余的最大值被写入结果文件,并认为代表相应基因的转录本。 实验中使用的代码匹配的信号与实验中未使用的代码匹配的信号的比例被用作特异性(假阳性)的估计。
Downstream analysis
下游分析
Para_01
初始图像分析使用 ImageJ 和 Resolve Biosciences 提供的 Polylux 工具插件进行,以检查特定的分子地图信号。
Para_02
由于 WGA 和 DAPI 染色难以用于心脏内单个细胞(心肌细胞可达 100 微米大小)的分割,为了下游分析,我们采用了一种分箱方法。 每个 ROI 的 x 和 y 坐标被分箱到最近的 50 像素(约 7 微米)质心,以预测基因共表达的亚细胞水平。 为每个分箱矩阵生成了一个 AnnData 对象,并将它们连接起来生成一个包含所有 ROI 数据的合并 AnnData 对象。 过滤掉每个分箱中多于一个基因和多于一次计数的分箱。
Para_03
为了进行基因相关性分析,通过 VWF、MYH11 或 KCNJ8 大于 0 的计数和 TTN 等于 0 的计数,将血管单元集合子集化。 使用 Pearson 相关性分析进行了基因相关性分析,并使用 seaborn 聚类图函数进行了可视化。 为了确定不同口径血管中的基因表达,我们使用了 Scikit-learn 的凝聚层次聚类函数,通过连接距离将单元分组为单个血管。 为了确定动脉内皮细胞的身份,通过对包含泛内皮细胞标记物 VWF 和动脉内皮细胞标记物 GJA5 具有每单元 ≥1 计数的数据进行子集化处理。 为了确定静脉身份,通过对包含泛内皮细胞标记物 VWF 和静脉内皮细胞标记物 ACKR1 具有每单元 ≥1 计数的数据进行子集化处理。 少于五个单元的簇被移除。 为了确定毛细血管身份,通过对包含泛内皮细胞标记物 VWF 和毛细血管内皮细胞标记物 RGCC 具有每单元 ≥1 计数的数据进行子集化处理。
Statistics and reproducibility
统计学与可重复性
Para_01
没有使用统计方法来预先确定单细胞 RNA 测序/单核 RNA 测序分析的样本量。 从最终的单细胞 RNA 测序数据集中移除的器官(来源于 Tabula Sapiens 数据集)包括眼睛、乳腺、前列腺、唾液腺、皮肤和舌头,原因是血管细胞数量较少和/或供体贡献不均衡。 实验未进行随机化。 研究者在实验分配和结果评估过程中并未被蒙蔽。
Para_02
多路复用的单分子荧光原位杂交(smFISH)实验(图2d、l和3e及扩展数据图2a、b)在一个供体的八个组织切片上进行。 针对TINAGL1、EGFL7和MYLK的smFISH实验(图1d及扩展数据图1a)在三个供体上进行。 针对ELN、SULF1和NTS的smFISH实验(扩展数据图3a、b和4d)在两个供体上进行。 针对CD8A的Rarecyte实验(扩展数据图4f)在一个供体上进行。 子宫组织的空间转录组学实验(扩展数据图5c)在两个供体的两个组织切片上进行。
Reporting summary
报告摘要
Para_01
关于研究设计的更多信息可在与本文链接的《自然组合报告摘要》中获取。
Data availability
Para_01
本图谱中的所有未发表的转录组学数据均可通过欧洲核苷酸档案库(ENA)(https://www.ebi.ac.uk/ena/browser/view/ERP165258)获取。 用于本研究的公开可用数据集记录在补充表1和8中。 所有相关的处理过的单细胞和Visium对象,以及一个用于探索这些数据和配体-受体相互作用数据的交互平台,都可以通过https://www.vascularcellatlas.org/获取。 用于本研究的公开可用数据集记录在补充表1和8中,包括以下内容:scRNA-seq:Litviňuková等人((HCA)数据协调平台(DCP),访问号ERP123138);Madissoon等人(ENA下访问号PRJEB52292和BioStudies访问号S-SUBS17);Kedlian等人(ArrayExpress,E-MTAB-13874);Vento-Tormo等人(ArrayExpress,E-MTAB-6701);Garcia-Alonso等人(ArrayExpress,E-MTAB-10287);Elmentaite等人(ArrayExpress,E-MTAB-9543,E-MTAB-9536,E-MTAB-9532,E-MTAB-9533和E-MTAB-10386);Stewart等人(人类细胞图谱数据门户,https://data.humancellatlas.org/explore/projects/abe1a013-af7a-45ed-8c26-f3793c24a1f4);Madissoon等人(人类细胞图谱数据协调平台和国家生物技术信息中心(NCBI)BioProject访问代码PRJEB31843);Brazovskaja等人(https://data.mendeley.com/datasets/yp3txzw64c/1);Winkler等人(基因型和表型数据库(dbGAP),phs002624.v2.p1);Dominguez Conde等人(ArrayExpress,E-MTAB-11536);Tabula Sapiens联盟,2022年(基因表达综合数据库(GEO),GSE201333)。snRNA-seq:Litviňuková等人((HCA)DCP,ERP123138);Madissoon等人(ENA,PRJEB52292,和BioStudies访问号S-SUBS17);Perez等人(GEO,GSE167186);Lake等人(https://portal.hubmapconsortium.org/);Andrews等人(GEO,GSE185477);Tosti等人(欧洲基因组-表型档案馆(EGA),EGAS00001004653);Garcia等人(GEO,GSE173731);Sun等人(https://www.synapse.org/Synapse:syn51015750);Yang等人(GEO,GSE163577)。
Code availability
Para_01
用于药物细胞分析的 ChEMBL 数据库可在以下 FTP 站点获取:https://ftp.ebi.ac.uk/pub/databases/chembl/ChEMBLdb/releases/chembl_30。 药物细胞 Python 包可在 GitHub 上获取(https://github.com/Teichlab/drug2cell)。 用于相互作用分析的 CellPhoneDB 数据库版本 4.1.0 可在 https://www.cellphonedb.org/ 获取。 本研究中进行的其他分析的自定义代码可在 GitHub 上获取(https://github.com/Teichlab/vascular_atlas 和 https://github.com/NosedaLab/vascular_atlas)。