-宣扬地学成果,传播勘查技术方法-
点击上方“覆盖区找矿”,关注更精彩!
可解释性矿产预测人工智能模型
左仁广1,成秋明1,2,许莹1,杨帆帆1,熊义辉1,王子烨1,Oliver P.KREUZER3,4
1 中国地质大学(武汉)地质过程与矿产资源国家重点实验室
2 中山大学地球科学与工程学院
3 Corporate Geoscience Group(CGSG)
4 Economic Geology Research Centre(EGRU),Collegeof Science and Engineering,James Cook University
第一作者:左仁广,教授,博士生导师,长期从事数学地球科学研究,国家杰出青年科学基金和国家优秀青年科学基金获得者。现任国际应用地球化学家协会副主席、国际数学地球科学协会Council、国际经济地质学家学会Fellow、Computers & Geosciences等5种SCI收录期刊的Associate editor。聚焦数据驱动矿产预测的不确定性评价,提出了数据驱动矿产预测不确定性分析理论与方法,建立了数据和知识耦合的矿产预测人工智能模型,研发了智能矿产预测软件。连续多年入选爱思唯尔中国高被引学者,曾获得国际应用地球化学最高奖-AAG金奖、国际地球化学协会Kharaka奖、国家科学技术进步奖二等奖、中国地质学会青年科技奖金锤奖,以及侯德封矿物岩石地球化学青年科学家奖。
人工智能技术的迅速发展正在改变地质工作的范式。矿产预测已开始应用人工智能模型。然而,人工智能驱动的矿产预测目前仍面临一些挑战:人工智能模型通常是数据驱动的黑箱模型,存在可解释性差、泛化能力弱、预测结果与物理规律不符等问题。其根源在于建模过程中忽视了先验知识、专家经验以及成矿理论知识等,没有及时嵌入。许多地质学家对具有黑箱特性的人工智能模型预测结果存在顾虑,往往难以理解。本文在前人研究的基础上,建立了一种更加透明且可解释的矿产预测人工智能模型。正在构建的白箱模型,不仅将成矿理论和关键控矿要素引入至人工智能模型中,还实现了整个建模过程中先验知识和专家经验的嵌入,包括数据输入、模型设计及模型输出等环节,能够体现不同区域成矿的特殊性和有效找矿经验,从而提高矿产预测人工智能模型的可解释性和预测性能。本项研究成果为未来矿产预测研究提供了一个有价值且广泛应用的方向。预计在不远的将来,广大地质矿产勘查科技工作者将拥有一种可解释、可操作的人工智能成矿预测技术,这也是一种广泛需求。基金项目:国家自然科学基金项目(42321001,42172326)湖北省自然科学基金项目(2023AFA001)
1 引言
2 可解释性矿产预测人工智能模型
2.1 数据可解释性
2.1.1 输入数据
2.1.2 训练样本
2.2 模型可解释性
2.2.1 构建隐含层
2.2.2 构建损失函数
2.3 结果可解释性
2.3.1 可视化技术
2.3.2 归因算法
3 讨论
随着社会和科学技术的不断进步,人工智能(Artificial intelligence,AI)模型正在逐步地应用于各个领域,包括医学、工程、物理和地球科学等。与其他领域相似,人工智能技术的快速发展也改变了地球科学的研究范式。人工智能模型的优势在于:(1)能够借助不同的数学函数对输入数据进行多层次抽象特征映射;(2)逐层学习输入数据的内在特征;(3)借助模型强大的非线性拟合能力和参数化技术,提高高级特征识别能力和预测精度。矿产预测是一种重要且被广泛应用的矿产勘查工具,旨在圈定研究区内找矿远景区。近年来,人工智能模型被广泛应用于矿产预测,其研究重点包括:(1)如何利用人工智能模型有效整合多源找矿信息;(2)如何提高矿产预测人工智能模型的预测能力和准确性。然而,矿产预测人工智能模型通常是数据驱动的黑箱模型,存在模型参数和结果的泛化能力弱、可解释性差以及预测结果与物理规律不一致等问题。忽视先验知识和专家经验使得地质学家更难解释矿产预测人工智能模型的结果。此外,矿产勘查是一项高不确定性和高风险的经济活动,不理想的建模结果会对决策和商业价值产生负面影响。上述问题阻碍了人工智能在矿产预测中的应用。因此,开发可解释的人工智能模型(Explainable artificial intelligence,XAI)是缓解上述负面影响的必要步骤。可解释的人工智能模型可以从人工智能模型中提取潜在的知识,这些知识涉及数据中包含的关系或模型学习到的关系。因此,可解释性矿产预测人工智能模型可以得到可解释的结果,从而提高预测结果的可靠性。同时,可解释性矿产预测人工智能模型获得的潜在知识能够反馈至成矿机制,有助于更好地理解复杂的成矿系统。 本文在前人工作的基础上,根据人工智能在矿产预测中的工作机制,提出了可解释性矿产预测人工智能建模框架,包括输入数据、模型设计和模型输出的可解释性。具体而言,在输入数据的可解释性方面,根据成矿模型和找矿模型收集地质找矿大数据,并采用特征工程对其进行预处理和标注,然后利用合理的数据增强和负样本选择方法为矿产预测人工智能模型提供足够数量且可解释的训练样本。在模型的可解释性方面,将关键控矿要素引入至人工智能模型中,以矿床形成过程作为硬约束建立隐含层;将矿床空间分布与控矿要素之间的空间耦合关系通过软约束嵌入至人工智能模型的损失函数,实现模型的可解释性。在预测结果的可解释性方面,采用可视化技术观察每个隐含层的输出,以更好地理解找矿信息的提取和融合过程(正向);同时,使用归因算法计算输入变量的重要性,确定每个输入变量对矿床形成的贡献(反向)。结合正向和反向解释策略使模型的中间过程相对透明,提高结果的可解释性。在本研究中,可解释性矿产预测人工智能模型指的是矿产预测全流程的可解释性,包括数据输入、模型设计和模型输出(图1)。本文详细描述了这三方面可解释性的相应算法和构建流程。人工智能模型借助数学算法分析数据集来识别隐藏模式并进行预测,是一种数据驱动方法,其输入数据的质量决定了模型性能的上限。深入理解与输入数据相关的地质过程,为输入数据提供明确的地质内涵是提高数据可解释性的有效手段。此过程通常包括:(1)利用地质找矿大数据构建与成矿系统(源、运、储和保)相关的可靠输入数据集;(2)采用特征工程处理和注释构建的地质找矿大数据,保证输入数据的完整性;(3)结合地质知识进一步对输入数据进行处理,制作矿产预测人工智能模型的训练样本。数据可解释性工作流程示意图见图2。增强输入数据可解释性的方法之一是根据成矿机制解释每个输入变量的地质含义。输入数据应包括直接相关信息和间接相关信息。直接相关信息包括各类显式数据(如地质、地球化学、地球物理、遥感和/或钻孔数据),可表达找矿模型中的勘查指标。间接相关信息通常指反映重要地质过程(如S、Lu-Hf同位素以及流体包裹体数据)和矿床变化保存程度(如磷灰石裂变径迹数据)的各类隐式数据。这两类数据构成了全面可信的地质找矿大数据,可反映整个地质过程中矿床形成和保存的环境。构建可解释的输入数据的关键是将成矿系统的组成部分(即关键过程及其可映射的表达)转化为勘查指标,也称为替代指标。在矿产预测中替代指标的案例包括:(1)水系沉积物地球化学异常,例如,Smith等(1999)使用水系沉积物中的Au-As-W异常发现了阿拉斯加与Pogo侵入体相关的超大型金矿,该异常是“储”和“保”的替代指标;(2)重力和磁异常,例如,与澳大利亚南部奥林匹克坝氧化铁-铜-金矿床分布范围大体一致的重力和磁异常,表明地球物理异常是“源”、“运”、“储”的替代指标;(3)遥感异常,例如借助遥感异常发现了大红柳滩锂矿床,表明遥感异常是“储”的替代指标。上述案例能够直接表征或推断地质过程,而其他替代指标,特别是与“源”过程有关的替代指标,通常更加隐蔽(图3)。“源”通常包括与金属和流体来源有关的多个组成部分。变质或岩浆构造热事件可以触发和提供金属和流体的来源,并为成矿系统的形成提供能量。侵入体是表示“源”这一勘查指标的合适例子。大量侵入体是上地壳热量增加的指标,通常在金属沉淀中起到直接或间接作用。地质、地球化学、地球物理和遥感数据可用于识别侵入体的空间分布,这在侵入体与矿化空间分布明显相关的地区尤其重要。例如,Cheng(2012)应用水系沉积物地球化学、航磁和重力数据,识别了与中国东天山铁矿床相关的火成岩。Zhang等(2017)借助空间加权逻辑回归等方法,基于地球化学、航磁和重力数据,识别了可能为成矿提供热量、流体和金属来源的隐伏岩体。向运川等(2014)利用勘查地球化学数据和因子得分比值来推断花岗岩侵入体的空间分布。Wang等(2020)基于ASTER和Sentinel-2A数据集圈定了与稀有金属成矿密切相关的喜马拉雅淡色花岗岩。岩石渗透性增强的区域(如断裂或剪切带、含水层)通常是热液运移的主要通道,可以通过地球物理、地球化学和遥感等技术进行探测。此外,矿床的形成和保存过程在三维空间中发生,确定三维勘查指标(如隐伏的深部结构)并将其投影到二维平面上,能够在一定程度上减少不确定性。地球物理反演可估算地质体的属性(如弹性和孔隙度)及其位置,它们可作为矿产预测的重要工具。如上述案例所示,如何确定成矿系统的映射组分并整合相关的地质、地球化学、地球物理和遥感替代指标,对于矿产预测至关重要。 图3 成矿系统中关键过程和转换为一系列的替代指标(勘查指标、预测图)示例
除上述数据外,还应收集间接相关数据,因为这些数据可以反映隐蔽地质过程和矿床保存的证据(图3)。矿床形成的许多基本要素都体现在流体特征上,如pH值、Eh值、盐度、流体捕获压力和流体均一温度等,这些特征可以从脉体或蚀变岩组合中的流体包裹体中获得。例如,一些花岗岩型矿床与岩体存在成因联系,可通过详细的流体包裹体研究加以识别。此外,一个地区的找矿潜力不仅取决于地球动力学背景和成矿作用,还与矿床的后期变化和保存条件密切相关。如果一个地区的隆升和剥蚀厚度略小于成矿深度,则表明该地区有巨大的找矿潜力。裂变径迹定年是研究区域隆升和剥蚀的有效方法。锆石U-Pb定年、Lu-Hf同位素分析和全岩地球化学有助于更好地了解成矿事件及其地质背景。锆石和磷灰石裂变径迹热年代学是探测盆山系统出露历史和主导因素的常用工具。因此,综合利用裂变径迹法、流体包裹体岩相学、显微测温以及地壳厚度可以反映目标矿床的变化和保存状况。此外,我们需要进一步探索如何利用这些数据来约束人工智能模型,以及如何将这些数据转换为人工智能模型可以使用的数据格式。利用上述方法,可以将成矿系统中各个关键要素转化为替代指标,最终用于构建更加全面、可靠的地质找矿大数据。特征工程是指为人工智能模型提取和选择特征信息的所有过程,其目的是降低模型的复杂性,提高模型精度并使模型更快地收敛。利用特征工程进行数据清理和注释,可确保人工智能模型能够正确有效地提取找矿信息。研究表明,基于先验知识和特征工程选择输入数据有助于提高人工智能模型的预测精度。特征工程的基本流程可分为三个方面:数据预处理、特征提取与特征选择。特征选择是特征工程中最重要的部分,是在数据集中寻找最优特征子集的过程,可以满足从成矿系统不同过程的替代指标中选择最优特征的需求。特征选择方法包括过滤法、包装法和嵌入法。其中过滤法并不依赖于特定的模型来选择特征子集,而是专注于数据本身的特征,因其计算效率高,通常被应用于大数据处理)。对于具有特殊输入结构的人工智能模型,如图神经网络(Graph neural network,GNN),可以相应地构建施加先验知识的可信输入数据集。GNN的输入是包含节点和边信息的图,可以聚合邻域信息。Xu和Zuo(2024)基于断裂或地层边界通常更易发生地质条件突变这一先验信息,构建了矿产预测地质约束图,通过删除输入图中跨越地质边界的边使构建的图更符合实际地质情况。监督的人工智能模型需要正、负两种训练样本。已知矿床(点)通常被用作正样本,而负样本通常是随机选择的。在选择负样本时需要结合先验知识使所选负样本更接近无矿地区的真实情况。Nykänen等(2015)提出在矿产预测中选择负样本(或非矿床)时应遵循以下标准:(1)与已知矿床类型无关;(2)受地质约束的随机样本;(3)无矿化或蚀变的未见矿钻孔。因此,负样本的选择通常应尽可能远离已知矿床和成矿系统中有利控矿要素,或位于不利于目标矿床形成的区域内。同时,还应考虑成矿地质条件发生变化的情况,如控矿断裂两侧,以生成合理的训练样本。由于成矿是稀有地质事件,已知矿床数量较少,矿产预测通常受到训练样本数量不足的影响。因此,在矿产预测中通常使用数据增强方法解决这一问题。基于地质事实的数据增强方法在矿产预测中已被证明其可行性。如像素对匹配法是一种适用于卷积神经网络的数据增强方法,已被证明适用于矿产预测卷积神经网络训练样本扩充。Li等(2021)发展了一种具有地质意义的随机失活数据增强方法,可应用于矿产预测卷积神经网络。Yang等(2022)提出了一种基于裁剪的数据增强方法,该方法保持了地质数据的方向特征。Li等(2022)应用生成对抗网络为矿产预测扩充训练样本,同时保证扩充的样本符合原始地质模式。上述案例表明在输入数据和样本生成中嵌入先验知识是提高人工智能模型可解释性的有效方法。然而,人工智能模型的推理过程(即输入变量与输出之间的函数)无法保证满足先验知识。因此,将先验知识纳入模型设计过程对于构建可解释性矿产预测人工智能模型至关重要。在模型隐含层(硬约束)和损失函数(软约束)的构建中加入先验知识可以约束模型的训练和预测,从而提高模型的可解释性。Zuo(2016)提出了地质特征与矿床空间关联的非线性数学模型,可将这一先验知识集成到人工智能模型的损失函数和隐含层中以提高模型的可解释性。该数学模型可表示为ρ=Cεα−2,其中ρ为特定类型矿床的空间分布密度,C为常数,ε为地质特征的缓冲区宽度,α为奇异性指数。该数学模型能够定量表征矿床数量随地质特征(控矿要素)距离的增加呈幂律减少的规律,这一思想已经用于建立地质约束的人工智能模型。在该非线性数学模型的指导下,成矿系统中的各个控矿要素均能被定量化。在神经元权重和激活函数中引入关键控矿要素(或替代指标),能够在人工智能模型的内部结构中构建与矿床形成过程相关的新的隐含层。同时,基于成矿系统建立替代指标与矿床空间分布之间的数学模型,构建能够借助地质知识约束模型训练过程的新的损失函数。结合上述过程,将关键成矿因素嵌入人工智能模型中,最终确保人工智能模型的训练过程满足先验知识,实现模型的可解释(图4)。硬约束是将物理机制嵌入人工智能模型中的有效手段,它能确保给定的控制方程在某一域或整个域内得到严格满足。例如Jiang等(2020)将径流动态方程集成到深度神经网络中,并阐述该隐含层可以提高预测精度。本文构建了一个新的隐含层实现成矿模型的嵌入,旨在对人工智能模型施加硬约束(图4)。该隐含层由一个线性模型和非线性激活函数组成。其中,线性模型利用权重参数ω与偏置项参数h得到输出。激活函数位于线性模型之后,其目的是向神经网络中引入非线性因素。在研究区成矿动力学背景和成矿模型的基础上,根据关键控矿要素与已知矿床之间的空间耦合关系构建隐含层。隐含层中的线性模型定义为y=ωx+h。其中,ω为利用控矿要素(如侵入体)与已知矿床空间耦合数学模型计算的证据图层的赋值,h为待训练的偏置项参数,y为线性模型的输出。此外,将软阈值函数(一种信号降噪的重要工具)作为激活函数,实现双边激活,并使得激活空间可调节,从而使模型的表达能力更强。软阈值函数定义为φb>0(y)=sgn(y)max{|y|−b,0}。其中,阈值b定义为关键控矿要素(如断裂)的值;sgn(∙)为符号函数,该函数可使得与关键控矿要素相乘后的输入变量x经过激活函数后的分布模式再次发生改变,即当y的绝对值小于阈值区间,y设置为0,而当y的绝对值大于阈值的区间,y设置为y的绝对值减去阈值。软约束是将控制方程作为正则化项嵌入到损失函数中的一种方法,它计算了模型预测与物理机制之间一致性程度的加权平均值,使得预测在平均意义上符合物理约束。在矿产预测中,软约束借助已知矿床与控矿要素间的空间耦合数学模型构建新的损失函数,这一过程结合了成矿模型和专家知识,对人工智能模型的训练过程进行全局控制,确保输出结果符合成矿模型。Xiong等(2022)构建了一个地质约束损失函数,并将其集成到深度学习算法的原始损失函数中作为物理约束的正则化项。本文构建了一个嵌入成矿模型的新损失函数,旨在对人工智能模型施加软约束。具体来说,在人工智能模型的损失函数中添加关键控矿要素作为地质约束条件(图4)。根据关键控矿要素与已知矿床之间的空间相关性,得到一个包含成矿模型的新损失函数Lnew,即Lnew=LAI+λLgeo。其中,Lgeo为基于矿床空间分布规律构建的正则化项,可表示为Lgeo=‖fsigmoid(y(i))−ε(i)‖2fsigmoid(y(i))是模型对于输入样本的成矿概率预测值,ε(i)是输入样本对应的关键控矿要素证据图层的网格单元赋值,λ为权重系数,LAI表示人工智能模型的原始损失函数。添加的正则化项为模型提供额外的先验知识,以惩罚高成矿概率区远离关键控矿要素或低成矿概率区出现在关键控矿要素内部或周围的两种情况。该损失函数使得模型在反向传播过程中学习矿床的空间分布规律,确保输出结果与成矿模型一致,进而对人工智能模型的训练过程加以约束和指导。人工智能模型复杂的非线性变换和黑箱属性使得预测过程难以理解,从而导致矿产预测结果的可解释性差。因此,需要额外的模型以建模者易于理解的方式检查和解释预测结果。其中,大多数研究都侧重于通过归因算法或可视化技术分析训练后模型预测结果的可靠性。为了解释人工智能模型获得的预测结果,发展了各种可解释性方法,旨在不改变底层模型的情况下能更深入地了解人工智能模型所学内容。可视化技术将模型从输入端(控矿要素)到输出端(成矿概率)进行逐层可视化,从而正向解释矿产预测结果。归因技术从输出端(成矿概率)到输入端(控矿要素)计算输入特征贡献,从而反向解释矿产预测结果。上述方法通常用于将黑箱模型的抽象概念映射到可以理解的领域,分析人工智能模型的工作机制,并从正向和反向两个角度解释其决策结果(图5)。图5 结果可解释性工作流程示意图
由于隐含层和激活函数的复杂变换,人工智能驱动的矿产预测模型可以从高维输入数据中自动学习特征。然而,理解人工智能模型学习到的复杂关系具有一定挑战性。正向特征可视化方法能够展示模型计算过程中的中间内容,从而通过可视化网络各层的输出观察从输入端到输出端的特征提取过程。此外,研究人员还发展了多种可视化方法来帮助理解训练完成的模型学习到的特征。类激活映射及其变体(如Grad-CAM)可以帮助研究人员理解人工智能模型提取特征图的空间结构并进一步解释特征融合的过程。例如,Yang等(2023)使用类激活映射分析卷积神经网络提取的空间特征图结构与输入的地球化学变量空间分布之间的相关性,以理解地球化学异常识别过程中地球化学指标的提取过程。归因算法通过计算每个输入变量对输出结果的贡献值来解释人工智能模型,进而解释预测结果。归因算法计算的贡献分数可以表示为两类效应的加权和,即每个输入变量的独立效应和输入变量之间的交互效应。近年来发展了多种归因算法,如SHAP(Shapleyadditive explanations)和DeepLIFT(Deep Learning Important FeaTures),这些方法可以表示为模型所建模的交互效用分布,以及对应不同交互效用分布比例。基于归因算法的可解释性方法也逐渐被引入到矿产预测用于分析输入变量的重要性)。归因算法中,输入特征对预测结果的贡献进行排序或计算,称为特征/变量重要性、相关性或影响方法,其原理是为单个特征分配重要性分数。一般来说,正(负)分值较大的变量对预测结果有较高的正(负)贡献。大多数解释方法都属于这一类,该类解释有助于理解哪些特征对预测结果的影响较大。在这些方法中,SHAP是应用最广泛的方法,能够解释地球科学中的各类模型。SHAP的主要思想是通过计算每个特征对模型预测结果的边际贡献来解释每个测试样本中输入特征的重要性。根据不同人工智能模型的特点,发展了不同类型的SHAP方法,如treeSHAP(用于解释树模型)、linearSHAP(用于解释线性模型)和deepSHAP(用于解释深度学习模型)。一般而言,模型预测的第i个样本结果f(xi)可计算为f(xi)=fbase+f(xi,1)+f(xi,2)+f(xi,3)+…+f(xi,m),其中xi表示第i个样本,fbase表示所有样本预测结果的平均值。f(xi,j)是第i个样本中第j个特征的SHAP值,表示第j个特征对预测的边际贡献。SHAP值的平均绝对值表示输入特征对模型预测结果的影响,可视为输入特征的贡献值。在未来的应用中,SHAP将用于分析矿产预测结果,不仅可以分析基于专家知识的可解释性矿产预测人工智能模型的可靠性,还可以反馈到成矿系统和勘查指标中,以更好地了解找矿信息对矿床形成的潜在影响。人工智能驱动的矿产预测模型在地质找矿大数据分析中的应用越来越广泛。然而,在矿产勘查的实际应用中,人工智能模型的优势尚未得到充分发挥。因为在一定程度上,许多地质学家对具有黑箱特性的人工智能模型获得的预测结果存在顾虑。这些预测结果往往难以理解。因此,通过调研先前的研究,本文提出了一个新的策略,即将领域知识嵌入人工智能驱动的矿产预测全流程中,构建可解释性矿产预测人工智能模型。本文提出的可解释性矿产预测人工智能模型包括输入数据、模型设计和模型输出三个可解释性模块。目前可解释性矿产预测人工智能模型仍在试验中,该模型被广泛使用之前仍有几个问题需要注意。在数据可解释性方面,本文阐述了如何根据先验知识生成可信的输入数据和训练样本。对于生成基于成矿系统的可信输入数据,直接地质找矿数据在矿产预测中得到了广泛应用。但是,对于矿产预测同样重要的间接相关数据(如流体包裹体和Lu-Hf同位素数据),通常呈现稀疏的空间分布。如何将采样稀疏的间接地质找矿数据与高采样密度的地质、地球化学、地球物理和遥感数据等直接地质找矿数据结合以提高矿产预测的性能,有待进一步探讨。一种策略是首先利用人工智能模型根据输入的直接地质找矿数据输出成矿概率,再根据稀疏的间接地质找矿数据构建评估标准,修正该成矿概率得到最终结果。另一种策略是将稀疏的间接地质找矿数据直接转化为人工智能模型的输入。此外需要注意的是,在生成训练样本时,数据增强方法应基于一定的地质意义进行样本扩充。完成样本扩充后,应根据结构相似性指数等标准对扩充后的样本进行评估,确定生成样本的合理性和可用性,从而避免产生虚假数据,影响人工智能模型的训练。此外,应进一步探索如何在数据中嵌入先验知识,促进生成更可靠的替代指标和训练样本,为构建高质量的地质找矿大数据集奠定基础。在模型可解释性方面,本文提出了将先验知识嵌入人工智能模型的两种策略,包括软约束和硬约束。人工智能模型设计嵌入物理机制的隐含层(硬约束),可以确保人工智能模型的运行机制与地质实际一致。这种方法能够在构建多层堆叠的人工智能模型时产生一些启发,不仅构建单层嵌入先验知识的隐含层,还可以尝试将先验知识嵌入每个隐含层,旨在赋予每个隐含层特定的地质意义。此外,选择控制方程表征所构建的隐含层中的物理机制时,可以考虑使用偏微分方程(Partial differential equations,PDEs)表示一些复杂的动态成矿过程。软约束通常是根据已知矿床与控矿要素(即λLgeo)之间的空间相关性的数学模型来构建正则化项。在构建正则化项时,既可以使用单个控矿要素(即一个正则化项λLgeo),也可以使用多个控矿要素(即多个正则化项λLgeo)。其中,用于构建正则化项的多个控矿要素应与已知矿床具有显著的空间相关性(即α<2,α越小表明空间依赖性越显著)。与硬约束类似,在软约束中,应探索能够代表动态成矿过程的新控制方程。将先验知识嵌入损失函数的一种代表性方法是构建物理信息神经网络(Physics-informed neural networks,PINNs)。该方法能够将物理方程嵌入网络,使用基于物理定律构建的物理信息损失函数进行训练,并求解复杂PDE。综上,在人工智能模型的内部结构中嵌入更多可解释性模块,可以提高模型推理过程的透明度。在结果可解释性方面,本文提出了利用可视化技术(正向)和归因算法(反向)相结合的方法对预测结果进行解释。对于正向解释,需要注意的是,在应用可视化技术对人工智能模型提取的特征图进行可视化时,并非所有可视化的特征图都能够被直接理解。一般而言,接近输入端的低级特征图容易被理解,而接近输出端的高级特征图则难以解读,这些特征图可能需要额外的数据分析工具,如主成分分析和t分布随机邻域嵌入,以进一步被理解。对于反向解释,除了使用归因算法中的全局分析计算特征贡献值外,还应重视局部分析,有助于解释看似异常的预测结果,即局部成矿特征与全局成矿特征不一致的现象。此外,除了关注不同特征对预测结果的贡献值大小,还应关注不同特征值大小对预测结果是呈现正反馈还是负反馈,从而进一步理解预测结果。如Beucher等(2022)使用SHAP对分类结果进行解释,结果表明低海拔值通常对酸性硫酸盐土壤分类结果具有较大的正反馈。总之,正向与反向相结合可以增强对模型运行机制和预测结果的解释。本文从输入数据、模型设计和模型输出等三方面出发构建可解释性矿产预测人工智能模型。该模型可以扩展到不同的矿产预测实例研究,以施加基于地球动力学背景和成矿作用的先验知识。可解释性人工智能模型旨在使黑箱模型更加透明,最终达成未来构建白箱模型的目的。因此,除了输入数据、模型设计和模型输出外,还需要从其他可解释性方面继续努力。
人工智能模型因其强大的非线性特征提取和融合能力被广泛应用于矿产预测。然而,人工智能模型通常为数据驱动的黑箱模型,其可解释性差在一定程度上与忽略先验知识和专家经验有关。本文提出从三个层面建立适用于矿产预测全流程的可解释性人工智能模型,其关键要素包括:(1)数据可解释性,构建可靠的、具有明确地质内涵的地质找矿大数据;(2)模型可解释性,设计具有物理规律一致性的隐含层和损失函数;(3)结果可解释性,可视化每层网络输出并计算输入特征贡献。基于本研究提出的工作流程,我们认为未来的工作应致力于提高矿产预测人工智能模型的预测性能和可解释性,从而进一步推动人工智能在矿产预测中的应用。致谢 感谢四位审稿人对本文的评审及提出的建设性意见。原文来源:左仁广,成秋明,许莹等。可解释性矿产预测人工智能模型[J]。中国科学(地球科学),2024,第54卷(9):2917-2928。 封面标题、导读评论和排版整理等:《覆盖区找矿》公众号.
推荐读者下载、阅读和引用原文!
智能地质调查:喜马拉雅淡色花岗岩多源数据融合识别方法
地质大数据与人工智能前沿热点及研究机构分析(Cite Space)