汞是一种全球性污染物,可随大气在全球范围内长距离传输。不同形态汞的毒性作用不同:无机汞主要对肾脏造成损伤,而甲基汞可通过血脑屏障从而伤害神经系统,并可穿过胎盘屏障影响胎儿神经发育。稻米是是世界一半人口的主食,全球超过114个国家种植水稻。食用被甲基汞污染的稻米是人体摄入甲基汞的重要途径。目前已有可以直接检测稻米中汞形态的方法,但该法包括复杂的样品前处理及仪器上机测试,整个过程耗时费力。因此,需要发展一种高通量、无损或微损检测技术,区分含不同形态汞的农产品,从而为环境汞治理以及降低人类通过食物摄入汞的风险提供支持。
贵州医科大学公共卫生与健康学院敖飘雪等基于上述背景,以水稻幼苗为研究对象,发展了一种基于同步辐射X射线荧光谱(SRXRF)结合机器学习的非靶标金属组学方法,可以区分暴露于不同形态汞的水稻,从而可为含汞稻米的可食用性提供参考,进而降低人体汞时暴露风险。研究结果刊登于《环境与职业医学》2024年10月刊。
来源:https://www.jeom.org/
研究方法
研究人员将水稻种子分别暴露于超纯水(对照组)、0.1mg·L–1的IHg(IHg组)或MeHg(MeHg组)溶液中,种子发芽后继续培养21d,收集水稻叶片、烘干、称重、压片。利用SRXRF测定各组水稻叶中金属组的含量,收集各组光谱数据。通过主成分分析(principal components analysis, PCA)对采集的SRXRF数据进行线性变换,实现数据降维。在PCA的基础上分别采用软独立建模聚类分析(soft independent modeling class analog, SIMCA)、最小二乘判别分析(partial least squares discriminantanalysis, PLS-DA)和逻辑回归(logistic regression, LR)等机器学习算法,建立判别分析模型,对不同组叶片的SRXRF全光谱进行分类和识别,筛选出区分效果最优的模型。为了减少数据计算时间,从高维线性相关的SRXRF光谱中挑选影响模型分类结果的特征光谱,建立特征光谱优化模型。
研究结果
1. 暴露IHg或MeHg的水稻叶片的SRXRF图谱
通道数在1~1024范围内的对照组、IHg组和MeHg组的原始SRXRF光谱(图1A)及均值光谱(图1B)中,三组样品的光谱强度不同,对应的元素含量不同。在231(S)、262(Cl)、641(Fe)通道中,对照组的SRXRF光谱强度均高于IHg组和MeHg组。在369(Ca)、590(Mn)、864(Zn)通道中,对照组的光谱强度均低于IHg组和MeHg组,在331(K)通道中光谱强度MeHg组>对照组>IHg组;在所有通道中,MeHg组的光谱强度均高于IHg组。
▲原文图1 暴露IHg或MeHg的水稻叶的SRXRF光谱
[注] A: 原始光谱,B:均值光谱。
2. PCA聚类分析
主成分分析得到的前3个主成分累积贡献率为已达到94.73%。对前三个主成分进行聚类分析发现,对照组(绿色)的光谱在前3个主成分分布上有明显的偏离,汞暴露组与对照组的光谱特征存在一定可区分度,但是IHg组(橙色)和MeHg组(紫色)的光谱有部分存在叠加现象。见原文图2。
▲原文图2 SRXRF光谱的PCA处理结果
[注] A:前3个PC的贡献率。B:前3个PC的得分散点图。
3. 基于SRXRF全光谱区分IHg或MeHg暴露水稻
在PCA分析的基础上,对SRXRF的全光谱进行建模分析。基于SRXRF全光谱的模型区分不同样品的结果如表1所示,三个模型训练集的准确率都高于98%,验证集的准确率都高于95%,交叉验证集的准确率都高于94%,说明三个模型都有很好的预测效果,其中LR模型预测效果最好。
▼原文表1 基于SRXRF全光谱的机器学习模型准确率
4. 基于特征波长的LR模型区分IHg和MeHg暴露水稻
每个分类的系数权重结果图如图3A所示。考虑到光谱数据值不同,需考虑数据的系数和权重。通过解析LR模型,然后根据每个通道的均值光谱和权重的乘积进行求和,挑选出特征光谱。每个通道所在位置的权重与所在光谱乘积绘制曲线如图3B所示,330(K)、359(Ca)、588(Mn)、655(Fe)、865(Zn)通道的IHg与MeHg谱图有明显差异。选择330、359、588、655、865为特征通道建立特征光谱优化的LR模型。
▲原文图3 线性模型的详细描述
[注] A:每个分类的系数权重。B:均值光谱和权重的乘积曲线图。
对特征光谱分类模型的评价结果如图4A和4B所示。在混淆矩阵(4A)中,特征光谱分类模型能够准确预测对照组,但IHg组与MeHg组存在误判的情况,有9个IHg组样本被误判为MeHg组,4个MeHg组样本被误判为IHg组。计算得模型准确率为92.05%。图4B中模型区分对照组的精确度、召回率和F1得分都为100%,虽然区分IHg组和MeHg组的精确度、召回率和F1得分都较对照组低,但都高于84.48%,可用于筛查暴露于不同形态汞的水稻。
▲原文图4 基于SRXRF特征光谱的LR模型的预测准确度
[注] A:混淆矩阵,B:分类效果图。
研究结论
本研究结果表明:基于SRXRF和机器学习的非靶标金属组学方法可快速识别暴露于不同形态汞的水稻。本研究所发展的方法无需对样品进行化学前处理,可快速准确区分暴露于不同形态汞的水稻,有利于开展含汞农产品的大规模筛查,从而降低人体摄入汞的风险。
作者简介
涂成龙
本文通信作者。贵州医科大学教授/博士生导师,贵州省食药用菌协会副会长、土壤学会副理事长,Plant & Soil、Environment Geochemistry Health、Chemical Geology等刊物特约审稿人。主持和参与国家重点基础研究计划子项目、中英重大国际合作项目子项目等国家级科研项目;在国内重要学术刊物和会议上发表论文70余篇,其中SCI、EI收录40余篇;参与撰写《生物地球化学过程与地表物质循环》(2009年),长期从事氟化物的人群耐受程度和环境暴露途径,以及重金属的生物地球化学过程研究。
商立海
本文共同通信作者。中国科学院地球化学研究所研究员/博士生导师,贵州医科大学兼职教授/博士生导师。中国科学院院长特别奖获得者、中国科学院青年创新促进会首批会员。长期从事重金属环境地球化学循环及其环境与健康效应研究。
李玉锋
本文共同通信作者。中国科学院高能物理研究所研究员/博士生导师,已发表学术论文140余篇,编纂专著3部,参编专著11部,授权专利2项。中国科学院卢嘉锡青年人才奖获得者、中国科学院青年创新促进会首批会员、中国科学院北京分院首批启明星优秀人才奖获得者、首届金属组学国际会议青年科学家奖获得者。主持和参与国家自然科学基金、科技部国家重点研发计划等项目,担任Atomic Spectroscopy及《中国无机分析化学》客座编辑、编委、《环境卫生学杂志》青年编委等。长期从事(1)基于大科学装置的金属组学研究;(2)重金属、纳米材料及微塑料的环境安全与健康效应研究。
敖飘雪
本文第一作者。贵州医科大学公共卫生与健康学院硕士研究生。研究方向:汞的环境健康效应。
本文内容来自《环境与职业医学》2024年10月刊,原文题目《基于同步辐射X射线荧光光谱与机器学习的非靶标金属组学方法区分暴露于不同形态汞的水稻》
引用格式:敖飘雪,魏超杰,解宏鑫,等.基于同步辐射X射线荧光光谱与机器学习的非靶标金属组学方法区分暴露于不同形态汞的水稻[J].环境与职业医学,2024,41(10):1095-1102.
原文链接:
https://www.jeom.org/article/doi/10.11836/JEOM24253
编辑 | 赵芸稼
审阅 | 陈 姣
推荐阅读
声明|本文未注明特定来源之图片均来源于网络,如涉及版权问题请与我们联系,将获得及时妥善处理。根据国家版权局相关规定,纸媒、网站、微博、微信公众号转载、摘编本微信作品,需包含本微信名称、二维码等关键信息,并注明《环境与职业医学》原创。
创刊于1984
报道内容
环境因素(自然环境、社会环境)、职业因素与人群健康关系研究成果
主办
上海市疾病预防控制中心
收录数据库
● 中国科学引文数据库(CSCD-C)源期刊
● 中文核心期刊(预防医学、卫生学类核心期刊)
● 中国科技论文统计源期刊(中国科技核心期刊)
● Scopus数据库
● EBSCO数据库
● DOAJ数据库
● Embase数据库
● WHO西太平洋地区医学索引(WPRIM)
● 日本JST数据库
● 美国化学文摘
● 乌利希国际期刊指南
● 英国国际农业与生物科学研究中心
● 美国剑桥科学文摘(自然科学)
官网:www.jeom.org
月刊,全文可在官网免费获取
电话:021-62084529
E-mail:jeom@scdc.sh.cn
关注我们
点击“赞”与“在看”,与更多人分享你的见识
点击 “阅读原文”,前往杂志主页,浏览更多精彩内容!