第一作者:Wei Zhi
通讯作者:Li Li
DOI:https://doi.org/10.1038/s44221-024-00202-z
文字摘要:理解和预测内陆水体质量是一项挑战,特别是在预期未来气候极端情况加剧的背景下。这些挑战部分源于调控水质的复杂过程,以及繁重且昂贵的数据收集工作,这加剧了数据稀缺的问题。传统的基于过程的和统计模型在预测水质方面往往表现不佳。在该综述中,作者认为深度学习是一种尚未充分利用但极具前景的方法,可以解开高维数据中复杂的结构和关系。作者展示了深度学习方法通过填补时间和空间的缺口,以及通过识别影响水质的重要驱动因素,来帮助解决数据稀缺(data scarcity)问题,并有助于构建和测试假设。该综述强调了与传统方法相比,深度学习方法的优势和局限性,并强调其作为克服挑战和发现水质科学新知识的新兴和不可或缺的方法的潜力。
在这里,作者认为DL为解决水质挑战提供了有希望的机会,特别是因为DL能通过利用多样化的、广泛可得的数据预测水质并填补数据空缺。特别是,DL能预测稀少测量的水质变量并在高度复杂的关系中检测模式。在这里作者:
(1)描述了DL可以帮助解决的水质科学中的挑战;
(2)回顾了DL在水质预测中的机会,特别是在解决数据稀缺和促进新知识方面;
(3)介绍了新兴工具如过程引导的DL(PGDL)、差分模型(DM)和可解释DL(XDL)方法;
图 1. a和b展示了全球站点报告至少一个流量(Q)数据点(a)和水质数据点(b)的时间趋势,数据分别来自全球流量指数和元数据档案(GSIM)和全球河流水质档案(GRQA)。插图显示了全球测站位置。数据长度(c)和时间覆盖(d)的25%、50%(中间线)和75%百分位数。时间长度(年,c)是指拥有数据点的年数。覆盖率(%,d)是指数据点在日数中的时间覆盖百分比。流量Q从30,959个站点共有3.74亿个数据点,而总悬浮固体(TSS)从68,592个站点共有约200万个数据点。其他变量包括总磷(TP;1.9百万个数据点,来自44,943个站点)、溶解氧(DO;1.2百万个数据点,来自48,066个站点)、硝酸盐(NO3;1.2百万个数据点,来自44,551个站点)和颗粒有机碳(POC;62万个数据点,来自22,877个站点)。流量(Q)测量从1880年代在美国开始,并持续稳定增加直到1960年代,当时测站开始扩展到欧洲和其他大陆(a)。
深度学习方法被批评为“黑匣子” :算法找到层和权重函数的最佳组合来拟合数据,但没有提供对机制的洞察。这种黑匣子方法不会揭示其内部工作原理和新流程知识。随着对这一局限性的认识不断提高,对判断深度学习方法可信度的方法的追求日益增长,旨在将黑匣子变成可解释性和知识发现的透明玻璃盒(图 4)。
此类技术的工具箱正在不断壮大。可解释的深度学习(XDL)方法旨在通过评估模型“推理”、解释模型决策以及提取模式和驱动因素来阐明“黑匣子”(图4)。XDL 包括与模型无关和特定于模型的方法,它们识别和排序有助于模型预测的重要特征、关系和机制。模型无关概念包括积分梯度、预期梯度、Shapley 加性解释(SHAP)和代理模型(如局部可解释的模型无关解释(LIME))。它们不需要特定的模型结构,因此可以为不同的模型提供可比较的输出。特定于模型的方法包括注意力机制、显著图和决策树,并且可以为特定模型(例如,分别是Transformer、CNN 和基于树的算法)定制解释。这些技术阐明了深度学习的“行为” 至关重要。因此,这个过程促进知识发现,增强基于过程的理解,并促进更具解释性的预测和明智的决策。
PGDL: process-guided deep learning,过程引导的深度学习
DM: differential modelling,差分建模
XDL: Explainable deep learning, 可解释机器学习
深度学习在水质领域的未来
作者认为深度学习方法在改善全球水质方面的新兴力量将通过以下方式实现:
(1)整理公开的时空数据,探索它们与水质变量的关系,以进行时空预测; (2)带来新工具和新视角,发现调节水质动态的隐藏模式、过程和关系; (3)预测未来和未监测的水质状况,探索在极端气候下以及在快速变化的世界中管理和减轻水质损害的方案。
结果不仅可能对水质领域产生深远影响,而且可能对理解和预测全球碳、营养物、其他元素及其他元素循环的未来产生深远影响。
该综述提供了大量的有价值的观点以及研究文献评述。本推文仅摘录其中一部分进行分享。强烈推荐阅读原文获得更多启发
点击“原文链接”,查看论文
声明:本公众号分享的前沿学术成果来源于各学术网站,不依法享有其所有权。若原作者发现本次分享中的文字及图片涉及侵权,请立刻联系公众号后台或发送邮件,我们将及时修改或删除!
邮箱:environmodel@sina.com
若您认为有用,欢迎
将Environmodel设为星标,或
点击“在看”或“分享”给他人