广西医科大学最新EI:血清代谢组与新型及传统全氟和多氟烷基物质暴露及甲状腺癌风险的关联:基于机器学习的多模块整合

文摘   2024-12-17 08:47   浙江  
摘要
背景:暴露于全氟和多氟烷基物质(PFAS)可能与甲状腺癌(TC)风险相关,但研究结果并不一致,且缺乏对混合暴露的研究,特别是关于新型PFAS化合物。此外,对这种关联背后的潜在机制知之甚少。
目的:探讨PFAS暴露对血清代谢组的影响及其与TC的相关性。
方法:一项1:1年龄和性别匹配的病例对照研究纳入了746例TC病例和健康对照。采用液相色谱 - 高分辨质谱法测定血清中11种PFAS和非靶向代谢组谱。运用弹性网络(ENET)和轻量级梯度提升机(LightGBM)模型探索暴露模式并进行变量选择。使用加权分位数和回归及贝叶斯核机器回归评估混合暴露效应。通过代谢组全关联分析评估与PFAS相关的代谢失调,并采用结构合成分析根据PFAS水平和代谢物模式检测潜在的TC患者亚组。    
结果:11种PFAS中有10种在超过80%的人群中被检测到。在单一化合物模型中,全氟己酸(PFHxA)和全氟十二酸(PFDoA)暴露与TC风险增加相关,而全氟己烷磺酸(PFHxS)和全氟辛酸(PFOA)与TC风险降低相关(均P < 0.05)。机器学习算法确定PFHxA、PFDoA、PFHxS、PFOA和全氟庚酸(PFHpA)是影响TC发展的关键PFAS,混合暴露对TC风险总体具有正向影响,其中PFHxA贡献最大。一种新的综合分析确定了一组TC患者,其特征为PFHxA、PFDoA、PFHpA水平升高,PFOA、PFHxS水平降低,以及以游离脂肪酸上调为突出表现的代谢物模式改变。
结论:PFAS暴露与TC风险增加相关,可能通过脂肪酸代谢变化实现。需要更大规模的前瞻性研究来证实这些发现,并且短链PFAS的作用需要更多关注。
主要内容
- 引言:PFAS是具有内分泌干扰特性的合成脂肪烃,广泛用于工业和家用产品,可通过多种途径进入人体,其致癌机制可能涉及多个生物学途径。甲状腺癌是一种主要的内分泌系统癌症,发病率在全球范围内显著上升。以往研究中,PFAS与甲状腺癌风险的关联结果不一致,且存在局限性,如样本量小、缺乏混合暴露综合分析、对短链PFAS研究不足以及区域差异未被充分考虑等。代谢组学可作为研究污染物暴露与疾病关系的有力工具,本研究旨在深入探讨新型和传统PFAS与甲状腺癌风险的潜在联系,并评估混合暴露的影响,同时通过整合分析研究血清代谢物变化与PFAS暴露及甲状腺癌发生的关系。
- 方法
    - 研究对象:参与者来自广西科技大学第二附属医院的甲状腺特定队列,包括经病理确诊的甲状腺癌患者和健康对照,按年龄和性别1:1匹配,完成问卷调查并提供血样,血清样本分离后保存用于分析,研究方案经相关伦理委员会批准,参与者签署知情同意书。    
    - 血清PFAS检测:采用特定方法检测血清中11种PFAS,包括7种长链和4种短链PFAS,通过加入内标、缓冲盐溶液、酶解、液液萃取、吹干复溶等步骤,最后用超高效液相色谱 - 串联质谱检测分析。
    - 血清代谢组筛选:对50对随机选择的病例 - 对照样本进行血清非靶向代谢组学分析,取血清样本加入混合溶液,经过涡旋、离心、静置、再次离心等处理,然后用特定色谱 - 质谱系统进行检测,构建数据库表征质谱检测数据。
    - 协变量定义:通过面对面访谈收集参与者社会人口学、生活方式、疾病史和家族史等信息,计算体重指数(BMI)并分类,定义吸烟、饮酒、被动吸烟状态,以及根据自报频率对肉类和海鲜消费进行分类。
- 统计分析:连续变量用均值和标准差描述,分类变量用频率和百分比描述,组间差异比较采用t检验或卡方检验,PFAS水平用中位数和四分位数间距表示并进行非参数检验,采用多种统计方法进行相关性分析,包括变量选择、暴露 - 反应关系评估、代谢组与TC关系分析以及PFAS与代谢组关联分析等,所有分析使用特定软件完成。
图 1.统计工作流程图。路径 1a 和 1b (Single Block) 侧重于每个单独的块与结果 (TC) 之间的关联。路径 2 (Interblock) 侧重于暴露组和代谢组之间的相关性。最后,路径 3 (Multiblock) 整合了与 TC 相关的暴露组和代谢组块。每条路径中使用的方法用斜体缩写标识:MLR,多变量 logistic 回归;RCS,受限三次样条;BKMR,贝叶斯核机回归;WQS,加权分位数和;ENET,弹性网络回归;lightGBM,光梯度提升机;LUCIDus,具有集成数据的潜在未知聚类;PCA,主成分分析;OPLS-DA,正交偏最小二乘判别分析;sPLS,稀疏偏最小二乘法。    
- 结果
    - 人群特征:共纳入373对甲状腺癌患者和健康对照,病例组平均年龄比对照组大1.8岁,病例组在民族、教育程度、家庭收入、家族史和吸烟暴露方面与对照组有显著差异,而BMI、体力活动、糖尿病、高血压、饮酒及肉类和海鲜消费频率无显著差异。
- 血清PFAS水平及探索性数据分析:11种PFAS中有10种检测率高于80%,PFOA和PFOS暴露水平最高,甲状腺癌患者血清PFDoA和PFHxA水平显著高于对照组,PFOA和PFHxS水平则相反,各化合物间相关性通过热图展示。
图 2.TC 和对照参与者中 10 种 PFAS 的浓度箱线图。
    - PFAS暴露与TC风险的关联(路径1a)
        - 机器学习算法变量选择:ENET和LightGBM模型筛选出PFHxA、PFHpA、PFOA、PFDoA和PFHxS为关键变量,LightGBM模型分类性能最佳,SHAP方法解释模型中各变量对预测的贡献。    
        - PFAS暴露对TC风险的影响:BKMR和WQS模型评估关键污染物混合效应,结果显示混合暴露与TC风险呈正相关,PFHxA贡献最大,PFOA呈不对称U形关联,部分化合物间存在显著交互作用。
图 4.使用 BKMR 方法的分析检查了污染物对甲状腺癌风险的综合影响,其中 h(Z) 反映了化学物质与指示甲状腺癌状态的隐藏连续标记之间的关系。(A) 描述了混合暴露对甲状腺结节的总体影响趋势,将某些百分位数的化学物质与第 50 个百分位数的化学物质进行比较。(B) 说明了单个化学品暴露对甲状腺癌影响的趋势,以及它们各自的 95% 置信区间。(C) 按四分位数总结了每种化学品的单变量风险。(D) 双变量暴露-响应函数描述了每种污染物(在 x 轴上表示)与甲状腺癌风险之间的关系,同时将 y 轴上的污染物固定在 10%(红线)、50%(绿线)和 90%(蓝线)百分位数,所有其他污染物设置在各自的中位数。    
        - 单一PFAS效应:RCS模型显示PFOA和PFHxA与TC风险呈非线性关联,PFDoA、PFHxS与TC风险呈线性关联,PFBS与TC风险呈非线性但总体效应不显著,不同模型中各PFAS与TC风险的比值比(OR)有差异,部分PFAS在亚组分析中有显著交互作用。
    - 代谢变化对TC状态的影响(路径1b):代谢组子集人群年龄较大,部分PFAS水平与总人群有差异,PCA和OPLS - DA分析显示甲状腺癌患者和健康对照血清代谢谱有明显分离趋势,筛选出293种差异代谢物,其中45种为定性I级,进一步分析其与PFAS的关联。
    - PFAS暴露与代谢组谱的相关性(路径2):sPLS算法确定与PFAS暴露最相关的代谢物,主要涉及PFHxA和PFDoA,这些代谢物包括脂肪酸、氨基酸、有机酸及其衍生物等,多数在甲状腺癌患者中上调。
    - 综合多模块分析(路径3):对筛选出的5种PFAS和14种代谢物进行分析,确定两个潜在聚类,其中一个与TC风险增加相关,该聚类中PFAS和代谢物有特定的正负关联模式。
- 讨论
    - 人体血清PFAS浓度:本研究检测到多种PFAS,PFOA和PFOS血清暴露水平较高,与其他研究结果相似,但PFOA浓度相对较低,可能与地区差异有关。
    - PFAS暴露与TC风险的关联:机器学习模型确定关键PFAS,混合暴露与TC风险正相关,PFHxA和PFDoA与TC风险正相关,PFOA和PFHxS与TC风险负相关,且部分关联呈非线性,本研究首次发现PFHxA和PFDoA与TC风险的关联,其机制可能涉及细胞因子表达和甲状腺功能影响,同时强调了短链PFAS对TC的影响。
    - 与PFAS暴露和TC风险相关的代谢失调:确定多种与甲状腺癌相关的差异代谢物,其中部分与PFAS暴露有关,结构整合分析发现特定PFAS和代谢模式与TC相关,PFAS可能通过多种途径影响脂质代谢,甲状腺癌患者脂肪酸代谢上调,可能间接影响TC发展,此外PFAS还可能通过其他致癌机制影响TC发生。
    - 研究优势与局限性:本研究是首次利用代谢组数据探讨混合PFAS暴露与TC关系的研究,具有创新的数据框架、大样本量、多种先进分析方法等优势,但存在病例对照设计无法确定因果关系、PFAS暴露评估单点测量代表性有限、部分协变量未纳入最终模型、代谢组学检测样本覆盖不足以及研究人群代表性有限等局限性。    
- 结论
混合PFAS暴露增加TC风险,PFHxA是主要贡献者,PFAS暴露与脂肪酸代谢失调有关,短链PFAS对TC的作用首次被报道,但需要更多大规模纵向研究深入理解PFAS与TC的关系及潜在机制。
引用该文献
Wang F, Lin Y, Qin L, et al. Serum metabolome associated with novel and legacy per- and polyfluoroalkyl substances exposure and thyroid cancer risk: A multi-module integrated analysis based on machine learning[J]. Environment International, 2025, 195: 109203.    
关注“新污染物监测与分析”公众号,获取更多最新文献推送与科研资讯
声明:本文仅供科研交流使用,文中所有观点均来源于已发布的论文,如有侵权或重大问题请通过后台与编辑联系。
欢迎高校、科研单位以及监测同行的朋友们投稿!邮箱6514064@zju.edu.cn感谢您的点赞、转发、在看,您的鼓励是我们更新的动力!
添加编辑微信 xwrw1234 加入读者交流群,与大咖在线交流

新污染物监测与分析
“新污染物监测与分析”致力于探索和分享新污染物研究动态、前沿热点以及最新发表的学术论文。为科研人员、学者、管理者搭建一个专业的信息交流平台,共同关注和应对新污染物带来的环境和健康挑战。
 最新文章