方铅矿和闪锌矿是Pb-Zn矿床中最常见、最重要的矿石矿物(Li et al., 2022),出现在交代碳酸盐矿床(CRD)、浅成热液矿床(Epithermal)、密西西比河谷型矿床 (MVT)、海底热液喷流沉积矿床 (SEDEX)、矽卡岩型矿床(Skarn)、火山成因块状硫化物矿床(VMS)、脉状矿床(Vein-type)等多种矿床类型中。不同成因类型的矿床具有不同的来源、物理化学条件和成矿过程,显著影响矿物中微量元素组成 (Gregory et al., 2019; Zhao et al., 2023)。闪锌矿微量元素组成已被广泛用于Pb-Zn矿床类型判别,并取得显著成功 (Frenzel et al., 2016; Li et al., 2023; Zhao et., 2023; Meng et al., 2024),为方铅矿的地球化学研究提供了重要参考 (Li et al., 2022),这一领域的研究仍处于起步阶段 (Ye et al., 2016; Li et al., 2022),尚缺乏成熟的二元或三元判别图,也没有相应的判别程序(如机器学习)。
传统的机器学习方法 (如RF、SVM、PLS-DA、PCA、t-SNE)在捕获复杂数据特征和泛化能力方面相对有限,这可能是由于浅学习网络的层数较少,学习参数较少以及线性。相比之下,深度学习以其多层非线性网络架构区别于传统机器学习 (Baldi et al., 2014; Diro and Chilamkurti, 2018)。它具有较强的非线性学习能力,可以捕获更深层次的数据特征,具有较强的泛化能力。此外,使用这些传统机器学习方法的地质研究人员往往没有系统地进行判别分类、可视化分析、可解释性分析和模型效果评价,导致一些深层地球化学特征和机器学习过程没有得到完整的呈现。
在这项研究中,我们提出了一种基于深度学习(1D-CNN)的方铅矿微量元素识别Pb-Zn矿床类型的算法。我们利用UMAP这种能够平衡局部和全局结构的特性 (McInnes et al., 2018),对深度学习模型的全连接层进行可视化,并应用SHAP方法 (Lundberg and Lee, 2017)进行模型解释。采用统计分析方法、混淆矩阵和ROC曲线对模型的有效性、判别精度进行评估。
▲图1 本研究流程图
▲图2 方铅矿微量元素箱形图
▲图3 不同Pb-Zn矿床类型的方铅矿微量元素数据的降维可视化
▲图4 深度学习模型训练集与验证集的loss和accuracy曲线
▲图5 测试集在不同训练轮次(第1轮、第5轮、第150轮)的模型的分类可视化效果
▲图6 基于SHAP方法的特征重要性可解释性分析
论文信息
上述成果近期发表于矿床学领域重要期刊《Ore Geology Reviews》,论文第一作者为中国地质大学(武汉)博士研究生李帅兵,通讯作者为中国地质大学(武汉)赵志新副教授、魏俊浩教授。合作者包括中国地质大学(武汉)缪腾峰、李笑龙、余司琪、张依梦、湖北汽车工业学院邹坤讲师。
相关论文