中科院南京土壤所、国科大、河海大学Nature Sustainability:中国土壤中砷污染不断加剧

文摘   2024-11-02 20:00   江苏  

1.对所读论文的理解

1.1问题是如何提出的

砷是地壳中的一种天然元素,其无机形式是剧毒的,如今中国面临着由密集的工业和农业活动造成的广泛的土壤砷污染,相当大一部分来自人类活动,主要包括采矿和冶炼、农业实践和化石燃料燃烧。作为世界上最大的工业强国和农业贡献国,中国在过去的几十年里向土壤中释放了大量的砷,导致了相当大的全国砷污染。

中国曾经进行了两次全国性的调查来评估土壤污染,主要集中在农田上。第一次调查采样密度较低,代表性不足,对中国土壤砷污染的整体评估缺乏全面性和准确性。第二次开展详细调查,但是结果目前尚未公布。因此,中国土壤中砷污染的分布、趋势和原因在很大程度上仍然未知。中国表层土壤砷浓度未来将会是何等趋势尚不清楚。

1.2 思路是如何形成的

1.3方法是如何构建的

本研究首先通过关键词检索已发表的研究,严格筛选文献,排除有特定污染源的数据,以确保数据客观反映中国土壤和水稻中典型的砷暴露水平。最终提取到3524份关于中国土壤中砷浓度的调查和374份关于水稻的砷浓度的调查。

3524份公开调查中提取了土壤砷含量数据,最终形成一个包含地理空间信息的数据集。研究系统地将3524个土壤砷调查划分为两个不同的数据集:90%用于训练,10%用于验证目的。确定了26个预测变量(不同预测变量的重要性值不同)后,创建一个包含200棵决策树的回归分析集成模型RF,在创建RF时,从数据集中随机抽取多个子集,使每棵决策树都能建立在不同的训练数据上,以增强模型的多样性,在构建每个决策树的过程中,只考虑一个特征的子集来进行特征分割,降低特征间的相关性,同时将 bagging (bootstrap aggregation)整合到该模型中以避免过拟合,并使用RF建立预测变量与土壤砷浓度之间的定量关系。在训练RF模型时,使用训练数据和验证数据的决定系数(R2)来衡量其性能。最后使用统计学习技术,并结合地理信息系统(GIS)等空间分析技术来生成预测地图。

1数据扩充策略

通过给行政区的每个网格点分配平均砷浓度值来人为扩展数据集,有效增加训练数据集的多样性和规模,丰富用于模型训练的数据,确保暴露于中国不同地区的环境下,增强RF模型的泛化能力,使其更能代表全国各地的不同环境条件。在扩大的数据集上训练模型,降低模型过拟合的可能性。

2自举汇聚(bootstrap aggregation

bagging是从训练集合中随机并且有放回地抽取若干个固定数量的样本集,来训练待组合的各个模型。比如随机森林(random forest)就是多个随机决策树平均组合起来以达到较优分类准确率的模型。
3特征选择
通过相关性分析从众多相关因素中筛选出可能对土壤砷污染有重要影响的特征变量,在随机森林模型中,通过计算每个特征在决策树构建过程中的贡献程度,来确定哪些特征对预测土壤砷污染最为关键。

1.不同预测因子在土壤砷浓度估算中的重要性值。1.DEM; 2.淤泥含量;3.黏土含量;4. pH5.砂的含量;6.土壤类型;20.有色金属的生产;21.石油消耗量;22.煤炭消耗量;23.猪肉和禽肉的生产;24.肥料消耗量;25.采矿;26.土地利用类型。(预测因子较多,这里不一一列举)
4模型训练
构建决策树:随机森林是由多个决策树组成的。首先,随机从训练数据中抽取多个样本子集,每个样本子集用于构建一棵决策树。在构建决策树的过程中,每个节点的分裂是基于随机选择的一部分特征来确定的,这样可以增加决策树的多样性,避免过拟合。

5模型集成

将训练好的200棵决策树集成起来,形成随机森林模型。对于新的输入数据,每棵决策树都会给出一个预测结果,然后聚合它们的预测来确定最终的预测结果。例如,如果大多数决策树预测此地区的砷污染程度较高,那么随机森林模型就会将该地区判定为砷污染浓度较高。

1.4结果表述、组织与讨论

1我国土壤中砷含量的时空变化
利用所开发的模型,该模型成功生成了2000-2040年中国土壤砷浓度年图,分辨率为1 km2。预测表明,中国土壤中砷的平均浓度从2000年到2020不断增加,特别是2033年至2038年期间,预计这些浓度将加速上升。同时在农业土壤中也出现了砷浓度的增长趋势。暴露于土壤砷的中国人群也持续增长。虽然平均砷浓度总体上有所增加,但中国表层土壤中砷浓度的空间分布基本保持稳定。

2. 中国表层土壤砷浓度。a,中国表层土壤中砷浓度(mgkg−1)和2000-2040年地表土壤平均砷浓度比例的时间变化。b-d,预测2000(b)2020 (c)2040 (d)中国表层土壤砷浓度。e-f2020年至2000(e)2040年和2020年之间(f)土壤砷浓度(mgkg−1差异分布。

2)各部门变量对土壤砷污染的贡献程度

通过构建具有特定参数的情景,研究2000年至 2040 年间有色金属开采和冶炼、能源消费和农业生产分别对平均土壤砷浓度、过量砷的农田和接触这些土壤的人口的累积影响。从结果来看,采矿活动影响最大,其次是冶炼和能源消耗,农业生产的影响相对复杂,随着时间推移,它们导致砷的平均浓度增加,同时促使高浓度砷的土地面积和居住在这些地区的暴露人口减少。这种减少可能源于作物在生长阶段对土壤中高浓度砷的吸收,这一过程被土壤中高浓度的砷所放大。

3.各部门对砷污染的贡献。a-c,估计各因素在中国土壤增加平均砷浓度(a),砷浓度超过20 mgkg−1土壤面积 (b)暴露于土壤砷浓度高于20 mgkg−1 的人口(c)的贡献.

4. 不同情景下中国土壤平均砷浓度。每条虚线表示一个场景,其中一个特定的因素(采矿)自2030年以来停止积累,而所有其他设置保持不变。

3)中国大米中的砷污染

通过收集中国大米中的砷含量的数据,同时根据大米生长地土壤中预测或观察到的砷含量进行了分析,结果表明,在土壤浓度的不同范围,水稻中的无机砷浓度随时间的发展趋势有所不同。在土壤砷浓度低于20 mgkg−1,大米中的无机砷浓度基本相当;当土壤砷浓度超过20 mgkg−1时,大米中的无机砷浓度随土壤砷浓度的增加而增加。大米中的砷超标率也随土壤砷浓度的增加而增加。通过大米砷含量与土壤砷含量,土壤砷浓度和砷超标率之间的关系,可以看出大米中的砷浓度在未来将持续增长。

5. 中国水稻中砷浓度。a,抛光稻中无机砷浓度与土壤中砷浓度的相关性。b无机砷含量超标大米比例的时间趋势. c2000-2040年间不同土壤砷浓度区间的超砷水稻的比例和产量。

版权声明

本文来源ECexposureLAB

若有侵权,请联系下方微信删除或修改!

生化环材BCEMers
致力于分享与生物、化学、环境、材料等学科领域的知识,以及相关软件的使用等信息。
 最新文章