两种从场地调查数据中分离土壤环境背景数据方法的比较

学术   2024-09-29 17:13   上海  

两种从场地调查数据中分离土壤环境背景数据方法的比较

吴运金1, 夏菲洋1, 杨敏1, 胡洁1, 潘成杰2, 邓绍坡1, 王荐1


【作者机构】1生态环境部南京环境科学研究所; 2江苏滨海经济开发区沿海工业园管委会
【来    源】《生态与农村环境学报》 2024年第5期 P718-728


摘要:地块土壤环境背景值在我国土壤环境管理中具有重要作用,土壤环境背景含量数据可采用间接方法从土壤污染状况调查数据中分离获得。采用稳健正态概率Q-Q图法和标准阈值法两种间接方法,从研究案例数据和模拟数据中分离土壤环境背景数据,并对两种方法的有效性和适用性进行比较分析。案例地块土壤钴(Co)含量数据呈现双峰分布,来源于两个不同总体。模拟数据M1M2来源于背景数据(B)和非背景数据(N1N2),M1BN1组成,两者之间重叠较多,M2BN2组成,两者之间重叠较少。研究结果显示,对于案例地块数据,利用稳健正态Q-Q图法和标准阈值法分离出的土壤环境背景数据之间差异较小,且与采用背景参考区法获得的土壤环境背景数据具有相似的统计特征。对于模拟数据,采用标准阈值法和稳健Q-Q图法都可以有效地从模拟数据M1M2中分离出背景数据,两种方法分离出的背景数据之间及其与B之间均没有显著差异,且模拟数据的不同重叠程度对分离背景数据的影响较小。但是由于采用标准阈值法分离出的背景数据与B更相近,且方法简单易操作,更适用于土壤环境背景数据的分离。该研究可为地块土壤环境背景数据的获取提供方法上的借鉴。

关键词:土壤环境背景;稳健正态概率Q-Q图法;标准阈值法;分离

土壤背景通常包括土壤地球化学背景和土壤环境背景两类[1-3]。土壤环境背景含量是指在一定时间条件下,仅受地球化学过程和非点源输入影响的土壤中元素或化合物含量[2,4-5]。土壤环境背景值是基于土壤环境背景含量的统计值,在尺度上一般包括区域土壤环境背景值[1,6-8]和地块土壤环境背景值[9-10]

地块土壤环境背景值在我国土壤环境管理中具有重要作用,可以概括为3个方面:一是判断地块土壤是否污染的重要依据,地块土壤中元素或化合物含量不超背景值的,判断是自然因素的原因,认为地块未受到污染[11];二是土壤修复目标值确定的主要考虑因素[12],国内外管理上一般要求修复目标值的下限不应小于地块土壤环境背景值[13-14];三是修复后土壤外运管理的重要依据,若修复后土壤外运到其他地块,可采用接收地土壤背景浓度与接收地用地性质所对应筛选值的较高者作为评估标准值[15]

地块土壤环境背景含量数据的获取方法可以概括为直接和间接两种方法。直接方法是通过选择合适的背景参考区进行采样获得土壤环境背景含量数据,间接方法主要是利用场地调查数据通过统计方法提取土壤环境背景含量数据[16-17]。背景参考区指在地块附近或内部,与被调查地块具有相同的物理、化学、地质和生物学特征,且不受地块及周围生产活动影响的用于收集地块土壤环境背景样本的区域[7,18-19]。但随着城市化的发展,有时在地块附近或者地块内很难找到合适的背景参考区。采用间接方法利用已有的场地调查数据提取土壤环境背景数据是一个可供选择的解决途径,还可以节省背景参考区调查的费用和时间[6,20-21]。场地土壤污染物含量是由连续背景过程和点源污染过程共同作用的结果[22-23]。污染数据往往表现为一个或多个异常值,或代表不同的总体[16]。从包含污染数据的场地调查数据中分离出土壤环境背景数据的方法有统计方法、图形方法及图形与统计相结合方法等。统计方法如X+2S迭代法、稳健(地)统计方法和线性回归法等[16,22,24-25]。基于正态概率图/正态Q-Q图的或经验累积频率的拐点来识别源自于多个总体的不同样本是较常用的图形方法[26-28]。虽然图形方法简便常用,但是通过观察图形来主观估计拐点存在不确定性,尤其是当多个总体之间存在重叠时,更容易掩盖拐点,而且异常观测值的存在也会使正态概率Q-Q图歪曲,以致于估计的拐点可靠性较差[25,29-30]。为避免仅依靠图形法所产生的误差,有研究提出了图形与统计相结合的方法来识别背景数据[28-30]。稳健正态概率Q-Q图方法[30]采用正态概率Q-Q图与稳健统计相结合的方法可以对同一正态概率图上的两个相邻总体之间的拐点产生更精确的估计,从而弱化仅从图形中选择拐点的主观性[20],该方法已作为美国国家环境保护局(EPA)[30]和州际技术和监管委员会(ITRC)[6]的推荐方法。有些研究提出了一种计算更简单的标准阈值法,该方法也是一种Q-Q图与统计相结合的方法,根据Q-Q图中的不同拐点分离背景样本,选择偏度最接近于0的分离样本作为最终的背景数据[16,28]。为了探讨这两种方法哪个更适合于从场地调查数据中分离土壤环境背景数据,笔者研究首先选择某一典型的土壤重金属污染场地为案例研究区域,分别采用稳健正态概率Q-Q图法和标准阈值法从场地调查数据中分离出土壤环境背景数据,再将其与通过在背景参考区调查获得的土壤环境背景数据进行比较;其次,基于模拟数据来比较分析采用两种间接方法分离的背景数据的差异性,旨在探寻基于场地调查数据分离土壤环境背景数据的更有效、更适用的方法,为场地土壤环境背景数据的获取提供方法依据,从而为场地土壤污染识别、修复目标值的确定等提供支撑。

1 材料与方法

1.1 研究案例

1.1.1 地块概况

案例研究区域为某化肥厂合成氨生产的部分区域,包括造气工段、压缩工段、合成车间和仓库等部分区域,面积约为2.67 hm2。该化肥厂建于20世纪80年代,南部为合成氨分厂,年产合成氨约10万t;中部为联碱分厂,年产纯碱55万t,氯化铵60万t;北部为热电分厂,发电装机总容量约为2.5万kW,锅炉产汽总能量为350 t·h-1。该厂区目前已完成拆除搬迁,地表有建筑垃圾覆盖。场地区域原地形平坦,6 m范围内第一层为杂填土,平均厚度约为3 m,第二层为粉质黏土,土壤类型为潮土。由于在合成氨生产过程中需要使用钼钴催化剂,研究区域存在土壤钴污染的可能。

1.1.2 背景参考区

背景参考区应不受调查地块及其他地块当前及历史上生产活动的影响,且应具有与被调查地点相同的物理、化学、地质和生物学特征,但不受地块活动的影响。通常从地块外上游、上坡和上风向的附近区域选择背景参考区。在某些情况下,不受干扰的地块内区域也可能适合作为背景参考区[10,13]。因地块附近区域很难找到合适的区域作为背景参考区,所以在北部的热电分厂内选择一个100 m×100 m的区域作为背景参考区,该区域距场地区域距离为340 m,与合成氨分厂仅一河之隔,历史上一直为荒地,判断其土壤钴含量受场地和周边企业生产活动的影响较小。调查结果显示,背景参考区土壤类型和地层分布与场地区域相似。

1.1.3 样品采集与分析

场地区域按照约20 m的网格进行布点,共布设采样点88个(图1)。背景参考区按照20 m的网格进行布点,共布设采样点25个(图1)。采用GP钻机采集6 m范围内杂填土下粉质黏土层土壤样品。在同一地层内每个点位尽量采集两个不同深度样品,采样深度间隔为1~1.5 m,场地区域共采集117份土壤样品,背景参考区共采集50份土壤样品。对于所有土壤样品的钴元素采用HJ 803—2016[31]的方法进行检测分析。

图1 研究案例区域及采样点位
Fig.1 Study area and sampling points

1.2 模拟数据

由于不同地块受污染程度有所不同,所以在进行模拟数据设置时,按照超背景数据的不同程度设置非背景数据,并分别将其与背景数据组合,形成两个模拟数据集。背景数据为来源于均值为10、标准差为3的正态分布总体(称为背景总体)的80个样本,表示为B,数据范围为1.5~16.6;非背景数据N1为来源于背景总体的20个样本分别与0~25之间的随机数相加得到,数据范围为6.3~41.2;非背景数据N2为来源于背景总体的20个样本分别与0~50之间的随机数相加得到,数据范围为11.0~63.6。BN1组成模拟数据M1,BN2组成模拟数据M2,N1中有6个数据小于B的最大值,N2中有1个数据小于B的最大值,M1的两个来源数据之间重叠较M2多。

1.3 分离背景样本数据的方法

1.3.1 稳健正态概率Q-Q图法

假设具有(g+1)个组成总体的混合总体的密度函数其中,g≥1,且fi(x;μi,σi)是第i个组成总体∏i的密度函数,且认为是呈正态或对数正态分布,其均值和标准偏差分别为μiσi;pi为∏i未知混合比例,i=0,1,2,…,P,且在进行数据计算之前,应进行适当的数据变换,以实现正态性或接近正态性。

假设有数量为n的样本x1,x2,x3,…,xn,目的是将其分解为g个组成总体,也就是找到ni≥0个观察值属于第i个组成总体∏i,且其中,nE≥0,是不属于任何(g+1)个组成总体的极端异常值的数量。

正态概率Q-Q图通常有助于判断混合总体中存在几个组成总体。正态概率Q-Q图通常采用基于的理论分位数作为X轴,Y轴为实际分位数。然而,组成总体之间不可避免地重叠和/或异常观察结果的存在通常会显著扭曲Q-Q图,导致一些组成总体被掩盖,特别是那些含量较低的组成总体。为了弥补正态概率图的不足,采用基于的理论分位数的稳健Q-Q图方法来识别组成总体。表示样本均值,s表示样本标准偏差,表示稳健样本均值,s*表示稳健样本标准偏差。

ω1(di)=ψ(di)/di,

ω2(di)=[ω1(di)]2,

υ=∑ω2(di)-1,

ψ(di)=di,如果did0,

ψ(di)=d0exp [-(di-d0)],如果di>d0

d02a水平下的临界值,符合的分布,n为样本量;

符合的分布。

第1步,识别极端异常值nE≥0,这些观察值可能需要进行个别处理或作进一步调查,不应包括在混合样本中,极端异常值的识别可采用正态概率图或者箱线图等多种成熟方法[5-6]

第2步,剩下的n-nE个样本用于Q-Q图分析,以揭示是否有来自较高含量总体的代表性样本,即∏g、∏g-1等。用Q-Q图上的断点来区分组成总体,采用样本观察值的稳健的置信区间来初步估计断点。假设估计的两个组成总体∏g和∏g-1之间的断点为cg,则不包括极端异常值nE的所有未分类的xcg用于计算第g个组成总体的稳健置信区间Ig=(LLTg*,LUTg*),其中,所有在此区间的未分类样本将都属于∏g

第3步,删除所有xLLTg*的观察值,剩下的数据用于计算新的稳健的置信区间和Q-Q图。通过Q-Q图估计∏g-1、∏g-2上断点cg-1。所有未分类的xcg-1用于计算第g-1个组成总体的稳健置信区间Ig-1=(LLTg-1*,LUTg-1*)。所有属于Ig-1的未分类样本将都属于∏g-1。在两个总体之间存在的未分类样本,则分配到距离最近的总体中。

第4步:重复上述计算,直到分离出∏0,作为背景数据集。

1.3.2 标准阈值法

来源于同一总体的地块尺度上的土壤环境背景数据或经转换后(如对数转换)的土壤环境背景数据大部分呈正态或近似正态的对称分布[31-32]。偏度是对分布对称性的一种度量,偏度为零,表示呈对称分布。由于正态分布是对称分布,其总体的偏度为零,因此,一般可以基于偏度最接近于0的方法来获取土壤环境背景数据[27,31]。标准阈值法就是根据Q-Q图并结合统计参数偏度来选择分离背景数据最优拐点的方法。首先,根据Q-Q图初步确定背景数据与非背景数据之间的可能拐点,将该可能拐点上下一定范围的样本值分别作为分离背景数据的阈值,计算不大于该阈值样本的偏度,选择偏度最接近于0的阈值为最优拐点,将不大于该最优拐点的样本作为背景数据。

1.4 数据统计与分析

描述性统计、直方图、箱线图和核密度图、累积分布曲线图用来展现数据的分布特征;当样本量小于50时,采用夏皮洛-威尔克检验(简称“S-W检验”)方法来检验数据是否符合正态分布,当样本量不小于50时,采用柯尔莫戈洛夫-斯米诺夫检验(简称“K-S检验”)方法来检验数据是否符合正态分布;正态Q-Q图既用来分离背景样本,也用来展示数据的分布特征。采用Origin 2021对上述数据进行统计与分析,采用R语言实现对稳健正态概率Q-Q图法的计算过程,采用ArcMap 10.5绘制研究案例区域及采样点位图。

2 结果与讨论

2.1 案例场地数据的统计特征

由土壤钴(Co)含量(wCo)的描述性统计特征(表1)可知,研究区域土壤Co含量均值为16.15 mg·kg-1,最大值和最小值之差为30.48 mg·kg-1,变异系数为41%,表明Co含量变异性较大。偏度为1.79,为右偏,正态分布检验表明Co含量不符合正态分布。进行对数正态转换后ln wCo的偏度、峰度和变异系数明显降低,正态分布的K-S检验的P值为0.045,近似正态分布,因此以对数转换后的数据作为后续分析的数据源。由直方图(图2)可知,研究区域土壤ln wCo呈现双峰分布特征,表明可能来源于两个不同的总体[6,28]

表1 土壤钴(Co)含量的描述性统计特征
Table 1 Descriptive statistical characteristics of Co content in soil

样本量为117个。1)单位为mg·kg-1

图2 土壤Co含量直方图
Fig.2 Histograms of Co content in soil

2.2 基于案例数据的背景样本分离

2.2.1 稳健正态概率Q-Q图法

由ln wCo的正态Q-Q图〔图3(a)〕可知,研究区域土壤ln wCo的分布来源于两个总体,横向虚线为全部数据的稳健95%置信上限LUT*=3.245,用来作为区分两个总体的初步估计断点c1。采用所有ln wCo>c1的数据绘制正态Q-Q图,并计算单边的稳健95%置信下限LLT1*为3.296〔图3(b)〕,将所有大于LLT1*的ln wCo数据都划分为来自总体∏1

(a)全部ln wCo数据的正态Q-Q图;(b)ln wCo>3.245数据的Q-Q图;(c)ln wCo<3.296数据的正态Q-Q图;(d)案例数据分离前后箱线图和核密度图。
图3 基于案例数据采用稳健正态Q-Q图法分离土壤环境背景数据的结果
Fig.3 Results of separating soil environmental background data from research case data using the robust normal Q-Q plot method

利用剩下的未分类数据(ln wCo<LLT1*)做正态Q-Q图〔图3(c)〕。由图3(c)可知,剩下未分类数据来自于一个总体,计算得到单边的稳健95%置信上限LUT0*为3.062,将所有ln wCo<LUT0*的数据都划分为来自总体∏0

在(LUT0*,LLT1*),即(3.062,3.296)之间有4个数(3.082、3.127、3.148、3.283)未进行分类,采用距离临近法将其分别归类到相应的总体中[28],即将前3个数据归类到总体∏0,将最后1个数(3.283)归类到总体∏1中。至此,实现了两个总体样本数据的分离,被划分到总体∏1的数据有12个,被划分到总体∏0的数据有105个,将总体∏0样本作为土壤环境背景数据。

由案例数据分离前后箱线图和核密度图〔图3(d)〕可知,分离前的全部数据呈现双峰分布,且较多数据超过了箱线图上限值(Q3+1.5IQR,Q3为75%分位数,IQR为75%分位数与25%分位数之差),分离后的总体∏1样本和总体∏0样本呈单峰分布,且均值和中值相近。K-S检验和双样本t检验表明,分离后的两个总体样本均符合正态分布(P值分别为0.804和0.993)且均值差异显著,说明分离后的数据来自于不同的正态总体。由此可见,通过该方法可以实现数据的有效分离,从而提取土壤环境背景数据。

2.2.2 标准阈值法

案例研究区域土壤ln wCo数据由来自两个总体的混合样本组成,图4中黑色箭头为基于正态Q-Q图判断的两个总体之间的可能拐点为3.148。以包含此拐点的上下11个不同样本值作为阈值分离背景数据的统计特征见表2,其中,样本值为3.352时的偏度最接近于0。按照标准阈值法,选择不大于3.352的样本作为最终的背景数据,分离出的背景数据有107个,较稳健正态概率Q-Q图法分离出的背景数据多2个。

表2 采用不同阈值分离的背景样本的统计特征
Table 2 Statistical characteristics of background data separated using different thresholds

1)单位为mg·kg-1

箭头代表可能的拐点。
图4 全部ln wCo数据的正态Q-Q
Fig.4 Normal Q-Q plot of total ln wCo data

2.2.3 基于两种方法分离的土壤环境背景数据与背景参考区法的比较

为了进一步分析采用标准阈值法与稳健正态Q-Q图法从场地调查数据中分离土壤环境背景数据的合理性,将采用两种方法分离出的土壤环境背景数据与背景参考区法得到的土壤环境背景数据进行比较。正态检验表明采用标准阈值法、稳健正态Q-Q图法和背景参考区法分离出的土壤环境背景数据均符合正态分布。3个背景数据累积分布曲线(图5)和统计特征(表3)相似,其中,均值接近于2.6,X+2S接近于3.1。我国七五土壤背景调查结果[33]显示,研究区域所在省份A、C层土壤钴含量均值分别为12.6和14 mg·kg-1,X+2S分別为26.42和28.98 mg·kg-1,采用上述3种方法获得的土壤环境背景数据均值在经反对数转换后与七五土壤背景值相近,X+2S在经反对数转换后略小于七五土壤背景值,进一步验证了基于3种方法获得的土壤环境背景数据的合理性,也表明案例区场地调查数据来源于环境背景和非环境背景的不同总体。双样本t检验结果表明,3个样本均值两两之间不存在显著差异。由此可见,基于标准阈值法和稳健正态Q-Q图法从场地调查数据中分离出的土壤环境背景数据之间差异较小,且与背景参考区法获得的数据具有相似的统计特征。虽然背景参考区法在国际上使用较广泛[6-7,13,18-19],但由于笔者研究中背景参考区是采用地块附近的参考区,在该参考区上获得的数据是地块背景数据的相似表达,采用该背景参考区数据来比较两种方法的优劣存在一定的不确定性,所以笔者研究进一步采用地块模拟数据来说明和比较两种方法的适用性。

表3 基于不同方法分离的ln wCo背景数据的描述性统计
Table 3 Descriptive statistics of ln wCo background data separated using different methods

1)单位为mg·kg-1

图5 基于不同方法分离的ln wCo背景数据的累积频率
Fig.5 Cumulative frequency of ln wCo background data separated using different methods

2.3 基于模拟数据的背景数据分离

2.3.1 标准阈值法

根据正态Q-Q图(图6),M1有1个明显拐点,M2存在多个拐点,可知M1M2均为来源于不同总体的混合样本,基于两个模拟数据估计的背景数据拐点均为13.6。包含可能拐点在内的11个不同阈值分离背景数据的统计特征见表4。对于M1M2,当阈值为16.6时,其偏度均最接近于0,因此,采用16.6作为M1M2的最优拐点来分离背景数据。从M1中分离出所有不大于该拐点的86个样本为来源于总体∏0的背景数据(表示为∏0-M1-阈值),包括B中的所有数据和N1中小于该拐点的6个数据。从M2中分离出所有不大于该拐点的81个样本为来源于总体∏0的背景数据(表示为∏0-M2-阈值),包括B中所有数据和N2中1个数据。

表4 基于模拟数据(M1M2)采用不同阈值分离的背景样本的统计特征
Table 4 Statistical characteristics of extracted background data based on simulated data (M1 and M2) using different thresholds

1)单位为mg·kg-1

图6 基于模拟数据(M1M2)的正态Q-Q图及可能背景数据拐点
Fig.6 Normal Q-Q plot of simulated data M1 and M2 and estimated cutoff point of background data

2.3.2 稳健正态Q-Q图法

根据稳健正态Q-Q图法得到的模拟数据M1的初步估计断点c1=19.57。使用所有大于c1的数据进行分析,计算得到的单边稳健95%置信下限LLT1*=14.95。所有大于LLT1*的数据都被划分为来源于总体∏1。采用所有小于LLT1*的数据进行分析,由图7(a)可知,剩下未分类数据来自于一个总体,计算得到的单边稳健95%置信上限LUT0*=13.83,所有小于LUT0*的数据都被划分为来源于总体∏0LLT1*LUT0*之间无未被分类数据,最终确定所有不大于13.83的83个样本为来源于总体∏0的背景样本(表示为∏0-M1-QQ),比采用标准阈值法分离出的背景数据少3个。

(a) M1≤14.95的正态Q-Q图;(b) M2≤29.77的正态Q-Q图;(c) M2≤13.86的正态Q-Q图;(d)和(e)基于M1M2采用阈值法和稳健正态Q-Q图法分离的背景数据的箱线图和核密度图。
图7 基于模拟数据(M1M2)采用稳健正态Q-Q图法和标准阈值法分离土壤环境背景数据的结果
Fig.7 Results of separating soil environmental background data from simulated data (M1 and M2) using the robust normal Q-Q plot method and the standard threshold method

根据正态Q-Q图(图6),M2存在多个拐点,依据稳健正态Q-Q图法得到的模拟数据M2的初步估计断点c2=32.29。使用所有大于c2的数据进行分析,计算得到的单边稳健95%置信度下限LLT2*=29.77。所有大于LLT2*的16个样本都被划分为来源于总体∏2。采用所有小于LLT2*的数据进行分析,由图7(b)可知,剩下未分类数据不来自于一个总体,计算得到的单边稳健95%置信上限LUT1*=14.96作为估计断点c1,对于所有大于c1的数据计算得到单边稳健95%置信度下限LLT1*=13.98。所有大于LLT1*且未分类的6个样本被划分为来源于总体∏1。采用所有小于LLT1*的数据进行分析,由图7(c)可知,剩下的未分类数据来源于一个总体,计算得到的单边稳健95%置信上限LUT0*=13.86,所有小于LUT0*的数据都被划分为来源于总体∏0LLT1*LUT0*之间无未被划分数据,因此,最终确定所有不大于13.86的78个样本为来源于总体∏0的背景数据(表示为∏0-M2-QQ),比采用标准阈值法分离出的背景数据少3个。

2.3.3 基于两种方法分离的背景数据的比较

采用这两种方法从M1分离获得的背景数据的数量比从M2分离获得的要多,这是因为组成M1BN1之间的重叠样本较多,所以有相对较多的N1中样本被错误地分离到了背景数据中,而组成M2BN2之间的重叠样本较少,所以有相对较少N2的样本被错误地分离到背景数据中。采用稳健Q-Q图法分离出的背景数据量比采用标准阈值法分离出的要少,这是因为稳健Q-Q图法更稳健、更保守[30],使得不仅存在更多的N1N2中的样本被错误地分离到背景数据中,还存在B中较大数据被错误地分离为非背景数据。

对来源于不同总体且存在重叠的样本,不可能基于某一阈值或者拐点实现来源于不同总体样本的完全正确分离,所以通过比较分析两种方法分离出的背景数据与B的统计特征的相似性来判断两种方法的适用性。采用标准阈值法和稳健Q-Q图法从M1M2分离的背景数据的箱线图和核密度图见图7(d)和(e),由图7(d)和(e)可知,分离前的全部数据中存在较多超过箱线图上限值(Q3+1.5IQR)的数据,且均值和中值之间的差异较大,而分离后的背景数据不存在超过箱线图上限的数据,且均值和中值相近。正态检验也表明基于上述两种方法从M1M2中分离获得的背景数据均符合正态分布,且双样本t检验表明基于上述两种方法从M1分离出的背景数据之间,从M2分离出的背景数据之间及其与B之间不存在显著不同,可见采用这两种方法都可以有效地从模拟数据M1M2中分离出背景数据。

虽然基于上述两种方法分离出的背景数据之间的双样本t检验不存在显著差异,但由分离出的背景数据的统计特征(表5)可知,基于标准阈值法分离出的背景数据的统计特征(均值、标准差及数据范围)与B更相近,说明基于标准阈值法分离出的背景数据更合理些。采用同一种方法从不同重叠程度的数据中分离背景数据的统计特征相近,说明两种不同重叠程度的数据对分离背景数据的影响较小。

表5 基于模拟数据(M1M2)分离的背景数据的统计特征
Table 5 Statistical characteristics of extracted background data based on simulated data M1 and M2

1)单位为mg·kg-1

综上可知,采用标准阈值法和稳健Q-Q图法都可以有效地从模拟数据M1M2中分离出背景数据,基于两种方法分离出的背景数据之间及其与B之间没有显著差异,但是基于标准阈值法分离出的背景数据与B更相近,且模拟数据的不同重叠程度对分离背景数据的影响较小。

3 结论

案例研究地块117个土壤Co含量数据呈现双峰分布,来源于环境背景和非环境背景两个不同的总体。采用稳健Q-Q图法和标准阈值法能够有效地从场地调查数据中分离出土壤环境背景数据,基于两种方法分离出的土壤环境背景数据与通过背景参考区法获得的土壤Co背景含量数据都符合正态分布,且均值、标准差和变异系数等都具有相似的统计特征。

模拟数据M1由背景数据B和非背景数据N1组成,两者之间重叠较多,M2由背景数据B和非背景数据N2组成,两者之间重叠较少。结果表明,采用标准阈值法和稳健Q-Q图法都可以有效地从模拟数据M1M2中分离出背景数据,基于两种方法分离出的背景数据之间及其与B之间均没有显著差异,且模拟数据的不同重叠程度对分离背景数据的影响也较小。但是基于标准阈值法分离出的背景数据与B更相近,而且方法简单易操作,所以更适合于基于土壤污染状况调查数据来分离地块土壤环境背景数据。


土行者
土行者作为土壤修复领域媒体,提供污染场地修复政策,土壤修复资讯,土壤修复招中标信息、土壤修复技术,修复案例分享、寻找修复设备,提供土壤修复会议、技能培训服务。搭建企业与用户衔接平台,从业者专业知识获取平台。合作联系:15201888915
 最新文章