代谢物是机体在生理或病理状态下产生的中间或者最终产物,其浓度反映了机体的代谢状态以及相关的分子过程。在人体内,代谢物的水平不仅受多种环境因素的影响,同时也受到遗传变异的调控。针对人群代谢组的遗传调控研究是分子流行病学领域的重要前沿,旨在揭示基因组对代谢通路的精细调控机制,从而使人们能够深入理解疾病生理和病理过程中的代谢变化以及潜在疾病干预靶点。
代谢组的全基因组关联分析(metabo-GWAS)是构建代谢物遗传调控图谱的基本方法。以此为基础的遗传变异-代谢物-疾病联合分析是揭示疾病发生与发展过程中代谢特征的有效路径。然而,迄今为止,该领域的研究主要集中于欧洲人群,针对东亚人群的研究仍极为稀缺且规模有限。通过对东亚人群代谢组进行系统性遗传分析,我们能够更加全面、深入地理解代谢异常与疾病易感性(特别是不同种族的差异性)之间的关系。这不仅为跨种族联合精细定位提供了支撑,也为疾病预防与治疗策略的制定提供了更加精准的科学依据。
北京时间 2025 年 1 月 20 日,西湖大学医学院/西湖实验室郑钜圣与浙江大学公共卫生学院周丹联合华中科技大学潘安、中山大学陈裕明、四川大学潘雄飞、浙江大学朱益民等多个研究团队,在国际知名期刊《细胞-基因组学》(Cell Genomics)杂志发表了题为「Genetic mapping of serum metabolome to chronic diseases among Han Chinese」的研究论文(图 1)。该研究系统性解析了中国汉族人群 2,759 种血清代谢物的遗传图谱,鉴定了慢性疾病相关的血清代谢物。此外,研究还结合转录组和蛋白质组的遗传调控信息,揭示了多种代谢物的潜在调控因子。以上发现为血清代谢物在慢性疾病中的生物学作用机制研究提供了新的见解,为基于中国人群的个性化健康管理和干预提供了数据支撑。
文章链接:
https://www.cell.com/cell-genomics/fulltext/S2666-979X(24)00372-0
图 1 文章截图
本研究对 2,759 种血清代谢物进行了定量分析,并在汉族人群中开展了全基因组关联研究(GWAS)。研究鉴定出 184 个显著性的代谢物数量性状位点(metaboQTLs),其中 88.59% 先前未见报道。
整合东亚人群的 37 种临床性状的 GWAS 数据,并通过基于遗传变异的因果推断,本研究鉴定了 906 种代谢物与临床性状之间的潜在因果关联。此外,结合转录组和蛋白质组的遗传调控信息,研究揭示了多种代谢物的潜在调控因子。本研究系统解析了我国汉族人群血清代谢组的遗传调控图谱,揭示了血清代谢物在慢性疾病中的潜在作用,为相关机制研究的开展提供了重要线索。
研究设计
本研究汇集了我国华东、华西、华南地区的四个多组学队列。其中,浙江代谢综合征队列(ZMSC)、西湖精准出生队列(WeBirth)、同济华西双流出生队列(THSBC)的 2,901 名参与者作为发现队列;广州居民营养与健康队列(GNHS)的 894 名参与者作为验证队列。研究采用基于超高效液相色谱-串联质谱(HPLC-MS/MS)的广泛靶向检测技术,测定了发现队列中的 2,759 种血清代谢物;利用靶向定量检测技术,测定了验证队列的 212 种血清代谢物。研究通过采用基于混合线性模型的 GWAS 分析方法(GCTA-MLMA),识别了代谢物数量性状位点(metaboQTLs),并在验证队列中进行靶向验证。研究还利用转录组和蛋白质组的遗传调控信息对 metaboQTLs 进行了多组学注释,探索了血清代谢物水平的潜在遗传调控机制。此外,研究利用日本生物银行库(BBJ)和韩国基因组与流行病学研究(KoGES)中的 37 种复杂性状 GWAS 数据,开展了基于遗传变异的代谢物-表型因果推断。该研究的实验设计及分析流程如图 2 所示。
图 2 研究队列和分析流程
主要发现
2.1 血清代谢物的全基因组关联分析
研究团队使用 GCTA-GREML 方法评估了代谢物基于单核苷酸多态性(SNP)的遗传力,即某种性状在群体中由遗传因素决定的比例。结果显示,所有代谢物的平均遗传力估计值为 17.53%,其中酚酸类的遗传力最高(23.06%),甘油磷脂类次高(18.81%),甘油脂类(8.87%)和醇类、胺类(7.79%)较低。
针对发现队列(ZMSC、WeBirth 和 THSBC)的代谢物,研究团队进行了 metabo-GWAS 分析。三个亚队列的遗传估计效应值相似(WeBirth vs.THSBC,r = 0.81;WeBirth vs.ZMSC,r = 0.71)。随后,研究人员对三个亚队列的 metabo-GWAS 结果进行了 meta 分析。曼哈顿图展示了 2,759 个代谢物 meta 后的 metabo-GWAS 结果(见图 3)。研究共鉴定出 931 个独立的全基因组显著的 SNP-代谢物关联(P < 5.00×10⁻⁸),涉及 549 个代谢物和 521 个信号区域(metaboQTLs)。在对 2,759 个代谢物进行 Bonferroni 多重检验校正后,364 个关联仍然显著,涉及 264 个代谢物和 184 个 metaboQTLs(P < 1.81×10⁻¹¹)。在 184 个 metaboQTLs 中,163 个 metaboQTLs 先前未被报道过。此外,研究通过对 319 个代谢物比值进行 GWAS 分析,鉴定了涉及 552 个信号区域的 1,750 个显著关联(P < 5.00×10⁻⁸)。
图 3 全基因组基因-代谢组关联分析
研究发现了尚未报道过的信号,包括 FAAH 基因座处(lead SNP:rs324420-A,β = 0.79,P = 1.34×10⁻¹⁰⁷,N = 2,887)N-肉豆蔻酰甘氨酸的信号;FADS1/FADS2 基因座处(lead SNP:rs174574-C,β = 0.48,P = 1.07×10⁻⁸²,N = 2,883)溶血磷脂胆碱(LPC, 0:0/20:4)的信号;PRODH 基因座处(lead SNP:rs4269009-G,β = 0.57,P = 1.60×10⁻³⁹,N = 2,889)处,顺丁烯二酸的信号等。
2.2 代谢物遗传调控信号的靶向验证
研究团队在验证队列(GNHS 队列)中,对发现队列中全基因组显著的 metaboQTLs(P < 5.00×10⁻⁸)进行了靶向验证。QQ 图显示在发现队列与验证队列中,这些 metaboQTLs 表现出了明显的关联性(图 4A)。研究人员在 GNHS 队列中验证了 12 种代谢物的全基因组显著信号,涉及 38 个 SNP-代谢物关联。其中包括 3-吲哚丙酸(IPA)、水杨酸、N-乙酰甘氨酸和甘氨酸等。研究还发现了肠道微生物来源代谢物的遗传基础, 如 IPA 和 IAA。曼哈顿图(图 4B)和 LocusZoom 图(图 4C)所示,研究发现了在 ZMSC、THSBC 和 GNHS 中 ACSM2A 基因座附近的遗传变异(lead SNP:rs59261767)与 IPA 存在显著关联。IPA 是肠道细菌产生的必需色氨酸代谢物,可在肝脏或肾脏转化为 3-吲哚丙烯酸(IAA)。研究还发现在 THSBC 中,IPA 和 IAA 均与位于 ACSM2A 附近的 SNP rs59261767 独立相关,进一步支持了 ACSM2A 基因座在色氨酸代谢中的调控作用。在 THSBC 中,IPA 和 IAA 水平之间的 Pearson 相关系数为 0.78。此外,研究发现 rs59261767 的 T 等位基因与较高水平的 IPA 和 IAA 相关,揭示了这两种代谢物遗传调控方向的一致性。
图 4 代谢物遗传调控信号靶向验证
2.3 代谢物遗传调控信号的跨种族比较
研究团队对具有全基因组显著性的 184 个 metaboQTLs 进行了跨种族比较。经过比对来自不同数据源的代谢物名称后,验证了 21 个 metaboQTLs,其中大多数信号在欧洲人群中得到了验证,有两个 metaboQTLs 在东亚/南亚人群中得到了验证。
为探索东亚和欧洲人群中共享的 metaboQTLs 与东亚人群的潜在特异性 metaboQTLs 间的差异,研究基于千人基因组计划(1 KG)第 3 阶段的数据,比较了东亚和欧洲人群的次要等位基因频率(MAF)差异。结果显示,仅在东亚人群存在特异性 metaboQTLs。这些 metaboQTLs 在欧洲人群中的 MAF 显著低于东亚人群的 MAF(P Wilcoxon 检验 = 0.004)。对于共享的 metaboQTLs,东亚和欧洲人群之间的 MAF 差异未表现出显著性统计学差异(P Wilcoxon 检验 = 0.97)。值得注意的是,11 个东亚人群潜在特异性的 metaboQTLs 在欧洲人群中是低频变异(MAF < 0.01)。此外,11 个东亚人群特异性的 metaboQTLs 中,rs2296651、rs61342118 和 rs147361130 在东亚人群中为常见变异,但在欧洲人群中表现为单态型。
研究发现,SLC10A1(又名 NTCP)编码区的错义变异(S267F,rs2296651)与牛磺胆酸(TCA)和牛磺去氧胆酸(TCDCA)相关(见图 5A)。胆汁酸是胆固醇的衍生物,主要在肝细胞中合成,并发挥多种生理作用。钠依赖性牛磺胆酸共转运多肽(NTCP)是从血液到肝细胞的钠依赖性胆汁酸转运蛋白,由 SLC10A1 基因编码。S267F 突变型 NTCP 具有正常的细胞表面表达,但几乎完全丧失胆盐的摄取功能。此外,S267F 变异是亚洲特有的变异,在不同亚洲血统中的 MAF 范围为 3.10%-9.20%。
图 5 潜在遗传-基因表达-蛋白质-代谢物关联证据链
2.4 代谢物遗传调控信号的多组学注释
为进一步基于以上发现的 metaboQTLs 探索背后潜在的生物学机制,研究团队聚焦于基因表达和蛋白质丰度,探索了遗传变异与代谢物之间的遗传调控路径。研究团队比对了当前研究中 metaboQTLs 与他们先前研究建立的中国汉族人群血清蛋白质数量性状基因座(pQTLs)信号(包含 304 种蛋白质,https://omics.lab.westlake.edu.cn/data.html)、英国生物样本库(UK Biobank, UKB)中的欧洲和亚洲人群的血浆 pQTL 信号(涵盖 2,923 种蛋白质),以及「基因型-组织表达(GTEx)」项目中欧洲人群的肝脏转录数量性状基因座(eQTLs)之间共享的遗传变异。通过 Bonferroni 校正的 184 个 metaboQTLs 中,18 个遗传信号参与了中国汉族人群血清蛋白质的丰度调控。基于英国生物银行的数据,122 个和 15 个遗传信号是欧洲人群和东亚人群中的 pQTLs,10 个遗传信号是肝脏 eQTLs,(PFDR < 0.05)。此外,研究还在中国汉族人群中识别了 233 个有强共定位证据(后验概率 > 80%)支持的蛋白质-代谢物关联。
进一步深入的研究为推测遗传-基因表达-蛋白质-代谢物证据链提供了依据。以凝血因子 FXII 的分子调控为例(见图 5B),在代谢物水平,研究发现位于 F12 基因座(lead SNP:rs1801020)的 metaboQTL 信号与一组氨基酸和肽类(包括 L-精氨酸、N-乙酰鸟氨酸、亮氨酸-缬氨酸和异亮氨酸-缬氨酸)相关。在蛋白水平,研究团队先前对东亚人群进行的大规模 pQTL 研究表明,rs1801020 是 FXII 及其相关肽类的 pQTL。同时,基于英国生物银行的血浆蛋白质组数据也发现了一致的结果,rs1801020 与欧洲人群中的血浆 FXII、丝氨酸蛋白酶抑制剂、以及丝氨酸/苏氨酸蛋白激酶 ULK3 的水平相关。
2.5 代谢物与常见慢性疾病的潜在因果关系
研究团队将鉴定的 metaboQTLs 作为工具变量进行全代谢组孟德尔随机化分析,探究了血清代谢物水平异常的潜在结局。使用 IVW、MR-Egger、MR-RAPS 及 GSMR 三种分析方法并结合 HEIDI 检验,识别出了 9,303 个血清代谢物-性状关联,涉及 2,759 种血清代谢物和 37 种复杂性状(包括人体测量学、代谢、炎症、以及肝肾功能参数等)。一级(Tier 1,最高级)、二级(Tier 2)和三级(Tier 3)的证据水平分别包含 906、2,527 和 5,870 个潜在因果关联。研究重点关注代谢(糖尿病和冠状动脉疾病)和免疫(类风湿性关节炎和哮喘)相关性状的一级潜在因果关联(见图 6)
图 6 孟德尔随机化分析鉴定了复杂性状相关代谢物
1)代谢物与 2 型糖尿病
研究团队鉴定了 27 个代谢物与糖尿病(本文特指 2 型糖尿病)的一级潜在因果关联。孟德尔随机化分析表明,一组溶血磷脂醇(LPE),包括 LPE(0:0/18:0)、LPE(18:0/0:0)和 LPE(0:0/18:2),其受遗传调控的血清水平增加与较低的糖尿病风险相关(见图 7A)。同时,该关联在 KoGES 的糖尿病 GWAS 数据中得到了验证。
研究团队进一步整合了转录组和蛋白质组数据,探索了 LPE 水平的潜在调控机制。在代谢水平,研究发现位于 LIPC 基因座的 metaboQTL rs1077835 与 LPE(0:0/18:0)和 LPE(18:0/0:0)相关。在转录水平,rs1077835 先前被报道为 GTEx 肝脏 LIPC 的 eQTL。LIPC 基因编码脂蛋白脂肪酶,该酶位于 HDL 颗粒上并促进脂质代谢。在蛋白质水平,英国生物银行的结果显示 rs1077835 作为反式 pQTL,与三个与脂质代谢相关的 HDL 颗粒蛋白相关,包括载脂蛋白 A1(APoA1)、磷脂转移蛋白(PLTP)和过氧化物酶 3(PON3)。在表型水平,本研究发现 LPE(0:0/18:0 和 18:0/0:0)与 T2D 之间存在潜在因果关联。综上,这些发现提示了从遗传位点(lead SNP: rs1077835)到基因/蛋白质(LIPC 基因和 HDL 相关蛋白),再到代谢物(LPE [0:0/18:0] 和 LPE [18:0/0:0]),以及糖尿病风险的潜在证据链,突出了脂质代谢在糖尿病发生发展中的重要作用。
此外,研究发现乙基 3-吲哚乙酸(吲哚-3-乙酸衍生物)水平升高与糖尿病风险的降低相关。尽管在验证中通过靶向分析未能检测到乙基 3-吲哚乙酸,但发现了吲哚乙酸(吲哚-3-乙酸衍生物)与糖尿病之间的负向关联(见图 7B)。
2)代谢物与冠心病
研究团队鉴定了代谢物与冠心病有 38 个一级水平的潜在因果关联。研究发现虾青素对冠心病具有潜在保护效应(见图 7C)。虾青素具有抗炎和抗氧化特性,有助于调节脂质和葡萄糖代谢。
3)代谢物与其它复杂性状
研究团队还鉴定了与其它临床性状的具有潜在因果代谢物。如,i)DHA 及其衍生物(±)4-HDHA 是类风湿性关节炎的潜在保护因子(见图 7D);ii)虾青素是哮喘的潜在保护因子(见图 7C)。3)L-脱氢抗坏血酸具有降低甘油三酯水平的潜能。
图 7 代谢物-表型潜在因果关联
交互式共享数据库资源构建
研究团队将 2,759 种血清代谢物的全基因组关联数据进行了可视化并共享在网站:https://omics.lab.westlake.edu.cn/data/metabolites/phenotypes。对于每种代谢物,网站提供了其类别、测定可信度、GWAS 的样本量、基因组 lambda、显著位点的数量以及全基因组中排名最高的信号。研究已经通过了科技部人类遗传资源信息开放使用事先报告。同时,研究团队将血清代谢物与健康表型的潜在因果推断结果共享在网站:https://omics.lab.westlake.edu.cn/resource/metabolomemr.html。对于每个代谢物-表型关联,网站展示了效应值、标准误差、P 值、工具变量数量以及孟德尔随机化分析方法。
总结
本研究对来自四个中国人群队列共 3,795 名个体的血清样本进行了全面的代谢组学检测和分析,通过将代谢组数据与全基因组数据相整合,绘制了 2,759 种血清代谢物水平的遗传调控图谱,为深入理解代谢物数量性状位点的潜在遗传分子调控机制提供了启示。研究揭示了血清代谢组与 37 种慢性病和相关临床性状之间的潜在因果关系,为中国人群常见慢性疾病的代谢分子特征研究和新型干预靶点开发奠定了基础。
浙江大学博士生程春晓、西湖大学许凤喆博士、四川大学潘雄飞研究员以及中山大学王澄博士为本文的共同第一作者,西湖大学郑钜圣研究员、浙江大学周丹研究员、华中科技大学潘安教授以及中山大学陈裕明教授为本文的共同通讯作者。本项研究得到了国家自然科学基金、国家重点研发计划、浙江省「尖兵」「领雁」研发攻关计划、西湖实验室(生命科学和生物医学浙江省实验室)的资助;课题实施过程中还得到了西湖大学高性能计算中心的大力支持。
西湖大学郑钜圣精准营养与计算医学实验室:
精准营养与计算医学实验室(主页:http://zheng.lab.westlake.edu.cn/)由郑钜圣研究员担任 PI,致力于运用人体和人群生物大数据,结合基因组、代谢组、微生物组和蛋白质组等技术手段,在人群层面探索发现人类疾病的全新干预靶点。近 5 年来,已经在营养微生物组、代谢以及衰老领域取得多项原创性研究发现,成果发表于 Nature Metabolism、Cell Genomics、Nature Communications、Gut 等杂志。欢迎有志于精准营养或者计算医学等多学科交叉研究的朋友加盟。联系邮箱:zhengjusheng@westlake.edu.cn。
浙江大学公共卫生学院周丹基因组流行病学实验室:
由浙江大学百人计划研究员周丹担任 PI,致力于开发、应用基于基因组的致病分子定位方法、构建中国人群多组学参考图谱,其中包括由国家脑库支持的「中国多地区人脑多组学图谱」项目(CBMAP)和由朱益民教授支持的「浙江舟山自然人群多组学队列」项目。近 5 年成果发表于 Nature Genetics, Nature Communications, European Heart Journal, Cell Genomics, Genome Medicine 等杂志。欢迎各位同道联系交流,详见 https://person.zju.edu.cn/danzhou。
本文及图片来源于西湖大学医学院、郑钜圣团队,作者转载