在农业生产和水文循环中,土壤水分含量(SMC)是一个极为关键的因素。它如同生态系统的 “生命之水”,不仅影响着农作物的生长发育,还在气候调节、水资源管理等方面发挥着重要作用。然而,在巴基斯坦的半干旱地区,传统的土壤水分测量方法面临着诸多挑战,如成本高昂、效率低下等。近期,一项利用机器学习算法和遥感数据的研究为解决这一难题带来了新的希望,让我们一同深入了解其背后的奥秘。
一、研究背景与区域概况
巴基斯坦作为一个农业大国,农业在其经济中占据着举足轻重的地位。然而,气候变化导致的干旱等问题,给当地农业生产带来了巨大的威胁。在半干旱地区,精确获取土壤水分数据对于合理灌溉、提高农作物产量以及保障粮食安全至关重要。但以往依靠大规模实地实验和实验室分析的重力测量法,虽有一定准确性,却存在耗时耗钱的弊端,难以满足实际需求。
此次研究选取了巴基斯坦旁遮普省中部的曼迪巴哈丁(Mandi Bahauddin)作为研究区域,这里地理位置独特,位于杰赫勒姆河(Jhelum)和奇纳布河(Chenab)之间,海拔约 244 米。该地区气候条件较为恶劣,但得益于河流灌溉,依然是重要的农业产区,主要种植小麦、甘蔗、玉米和烟草等作物。其土壤类型以冲积土为主,肥沃且排水良好,但部分地区存在盐碱化问题,给农业生产带来一定挑战。
[研究区域的地图,展示曼迪巴哈丁在巴基斯坦的位置以及 39 个采样点的分布情况]
二、数据收集与处理方法
研究团队运用了多种先进技术手段来收集数据。在土壤水分实地测量方面,采用了便携式多传感器电容设备(PR2),对 10、20、30、40、60 和 100 厘米等六个深度的土壤体积含水量进行测量,其测量精度在一定范围内可满足研究需求。通过对研究区域的土地利用类型和土壤类型进行详细分析,利用 Landsat - 8 的 30 米分辨率数据绘制了土地利用图,并结合巴基斯坦测绘局和 SoilGrids 的数据确定了 39 个采样点,确保采样的科学性和代表性。
卫星数据则主要来源于 Landsat - 8 的热红外传感器(TIRS)和陆地成像仪(OLI),其 16 天的重访周期和丰富的波段信息为研究提供了重要支持。同时,还引入了土壤水分主动被动(SMAP)卫星和气候灾害组红外降水与站点数据(CHIRPS),用于对比和验证研究结果,从多源数据角度保障研究的可靠性。
在数据处理环节,研究团队利用 PCI Geomatica 2016 软件的大气校正(ATCOR3)模型将 Landsat 图像的数字量化值(DNS)转换为地面反射率,并结合 ASTER DEM 数据进行地形调整,模拟地形对卫星数据的影响。对数据进行严格的统计分析和预处理,确保数据质量符合建模要求,为后续的机器学习模型训练奠定坚实基础。
三、机器学习模型的应用与结果
研究中应用了随机森林(RF)、支持向量机(SVM)、人工神经网络(ANN)和弹性网络回归(EN)等四种机器学习模型。这些模型在不同的研究领域都展现出了强大的数据分析能力,此次研究旨在探索它们在半干旱地区土壤水分预测中的表现。
通过 10 折交叉验证和外部测试对模型进行训练和评估,结果令人瞩目。随机森林(RF)模型脱颖而出,其纳什效率系数(NSE)高达 0.73,均方根误差(RMSE)为 5.77%,平均偏差误差(MBE)为 3.378,表现出卓越的预测性能。与其他模型相比,RF 模型在处理复杂的土壤水分与土地利用、光谱反射率等关系时更加稳健,能够更准确地捕捉土壤水分的变化趋势,为土壤水分的精准预测提供了有力工具。
[不同模型预测的土壤水分含量(SMC)地图图片,对比展示 RF、SVM、EN 和 ANN 模型在 2020 年 6 月 6 日和 10 月 14 日对研究区域土壤水分的预测情况,直观呈现 RF 模型的优势]
从光学波段与土壤水分的关系来看,研究发现短波红外(SWIR)、近红外(NIR)、红光和绿光波段的光谱反射率与土壤水分呈非线性关系,而地表温度(LST)和蓝光波段则呈线性关系。例如,随着土壤水分的增加,在 0.4 米至 1 米波长范围内光谱反射率会下降,这为利用光学数据预测土壤水分提供了重要的理论依据。同时,土地利用类型与土壤水分密切相关,如灌溉作物区的土壤水分含量相对较高,而灌木和草本区受河流影响,在部分区域土壤水分含量最高可达 85%,这种差异反映了不同土地利用方式下土壤水分的分布规律。
在土壤水分预测方面,RF 模型的优势在不同土地利用类型和时间节点上均得到了体现。与 SVM、ANN 和 EN 模型相比,RF 模型在预测土壤水分的空间分布时,能够更好地适应地形和土地利用的变化,减少误差。例如,在山地等地形复杂区域,RF 模型能够准确预测出土壤水分的低值区域,而在河流冲积平原等湿润区域,也能合理地反映土壤水分的高值情况,为区域土壤水分的精细化管理提供了可靠的技术支持。
进一步分析农田土壤水分状况发现,土壤类型、植物类型和微气候等因素共同影响着土壤水分的分布。即使在灌溉作物区,由于作物种类、灌溉时间和生长阶段的不同,土壤水分含量也存在显著差异。这表明在农业生产中,需要综合考虑多种因素来优化灌溉策略,提高水资源利用效率,保障农作物的生长需求。
[农田不同植被覆盖度下土壤水分状况的图片,展示研究区域农田在不同 NDVI 类(密集、中等和稀疏植被)下的土壤水分状态,辅助说明农田土壤水分的复杂性]
四、研究的对比分析与局限性
将 Landsat - 8 估算的土壤水分与 SMAP 和 CHIRPS 数据进行对比分析,发现虽然由于分辨率差异在像素级对比上存在一定困难,但仍能从整体趋势上验证研究结果的合理性。这也凸显了多源数据融合在土壤水分监测中的重要性,为未来的研究提供了新的思路和方向。
然而,研究也存在一些局限性。Landsat - 8 数据的时间分辨率较低,难以捕捉土壤水分的快速变化;空间分辨率虽然较高,但仍可能遗漏像素内的局部水分波动;实地观测数据的相对不足也在一定程度上影响了模型的精度。针对这些问题,未来研究可考虑引入 Sentinel - 2 等更高时间分辨率的遥感数据,结合无人机等获取的高分辨率地理数据,以及土壤质地、地形和气象等补充变量,进一步提升土壤水分预测的准确性和可靠性。
五、研究的意义与展望
这项研究为巴基斯坦半干旱地区的土壤水分监测提供了一种创新且有效的方法,随机森林模型的成功应用为农业水资源管理和干旱监测带来了新的契机。随着技术的不断进步和研究的深入,我们有理由相信,在应对气候变化和保障农业可持续发展的道路上,土壤水分监测技术将发挥越来越重要的作用,为全球农业生产和生态环境保护贡献力量。让我们共同期待这一领域的更多创新成果,助力人类与自然的和谐共生。
doi:10.1016/j.apsoil.2024.105687