岩石矿物智能识别研究进展与发展趋势

文摘   2024-11-16 09:02   四川  

-宣扬地学成果,传播勘查技术方法-

点击上方“覆盖区找矿”,关注更精彩!

         

 

基于深度学习的岩石矿物智能识别研究进展与发展趋势

邓乃尔1,徐浩2,周文2,唐小川3,王浩1,闫晓闯3,蒋柯1

1 成都理工大学能源学院(页岩气现代产业学院)

2 成都理工大学油气藏地质及开发工程全国重点实验室

3 成都理工大学计算机与网络安全学院(示范性软件学院)

         

 

第一作者:邓乃尔,硕士研究生,研究方向:油气藏开发地质。

通信作者:徐浩,副教授,研究方向:油气储层评价。

         

 

导读:
传统的岩石矿物识别方法主要依赖人工经验和半自动系统,存在效率低、成本高的缺点,且只能实现矿物特征的定性分析,应用范围受限。随着人工智能技术的飞速发展,岩石矿物的智能识别已成为必然趋势深度学习凭借其卓越的特征提取和自动学习能力,为复杂矿物的自动化智能识别提供了全新解决方案。
本文系统分析了基于深度学习的岩石矿物图像识别的最新进展,重点探讨了矿物重构、矿物分类以及矿物分割三大处理任务的研究和应用。总结了岩石矿物图像特征和模型优化措施,并对比了各类卷积神经网络模型在矿物识别中的性能表现。还探讨了矿物智能识别在储层精细评价、沉积环境及成岩作用中的应用前景。
研究认为,通过结合传统分割算法与深度学习技术,构建“集成图像-智能识别-数据分析-数据应用”一体化结构,并建立基于多模态知识决策的岩石矿物图像识别体系,有望进一步提升岩石矿物智能识别的精度和效率。

基金项目:国家自然科学基金项目(42472189,42202189);四川省自然科学基金项目(24NSFSC4997)。

------内容提纲------

0引言

1 深度学习图像处理原理

2 基于深度学习的岩石矿物图像识别进展

2.1 矿物重构

2.2 矿物分类

2.2.1 单标签矿物分类

2.2.2 多标签矿物分类

2.3 矿物分割

3 讨论    

3.1 基于深度学习的岩石矿物图像数据特征

3.1.1 图像数据类型

3.1.2 图像数据量

3.2 卷积神经网络模型优化措施总结

3.3 不同卷积神经网络模型性能对比

3.3.1 矿物图像分类模型性能对比

3.3.2 矿物图像分割模型性能对比

3.4 矿物图像智能识别应用展望

3.4.1 储层精细评价

3.4.2 沉积环境分析

3.4.3 成岩作用分析

3.5 矿物图像智能识别发展趋势

3.5.1 深度学习与传统算法结合的矿物图像识别

3.5.2 建立基于多模态知识图谱决策的岩石矿物图像识别体系

3.5.3 构建“集成图像-智能识别-数据分析-数据应用”一体化结构

4 结论

-----------
0  引言

岩石矿物是组成岩石的基本单元,通常以晶体形式存在,具备特定的化学成分和物理性质。岩石矿物的识别是地质研究中的重要基础工作,可应用于石油与天然气勘探、沉积环境分析、地质灾害监测以及星球地质演化等研究中。与其他矿物主要依赖表面特征识别不同,岩石矿物的识别通常基于其物理特征(如硬度、颜色、光泽、解理等)和化学组成。相机图像识别的应用相对有限,因其难以提供矿物微观结构和物理特征的准确分析。传统的显微镜观察技术依赖人工经验,存在效率低、成本高的缺点,且只能实现矿物特征的定性分析。随着地质研究的深入,获得岩石中矿物的定量化数据(如矿物占比、特征参数)变得尤为重要。X射线荧光光谱、电子探针微分析和X射线衍射技术等方法推动了矿物识别从传统定性方法向半自动化的物理化学分析发展计算机视觉和图像处理技术使得矿物识别从人工操作向高效自动化转型,扫描电子显微镜、自动矿物识别系统、微图像拼接等技术极大提高了识别的效率和精度。扫描电子显微镜通过电子束与样本表面的相互作用,结合二次电子成像、背散射电子成像和X射线光分析等方法,可提供矿物的样貌、元素组成和晶体结构信息通过减少人工干预和主观误差,这一阶段的技术不仅推动了矿物识别的研究进展,还广泛应用于地质勘探和地质灾害预测等领域。

现代基础设施如5G、人工智能、工业互联网的快速发展,促进了人工智能在地质领域的应用,逐步形成了以“地质+人工智能”为核心的研究体系机器学习作为人工智能的重要分支,通过数据提取模式或规律进行预测,极大提升了矿物识别的效率,降低了人工操作的复杂性。例如,叶润青等(2011)使用多尺度分割算法实现了砂岩薄片中矿物的自动分割,成功提取了石英矿物的边界、体积分数、周长、圆度等特征参数,验证了该方法在统计矿物含量和颗粒形态特征提取中的有效性。魏雨(2022)针对现有方法在识别凝胶填充不足的溶蚀孔隙和颜色相近的矿物颗粒时的局限性,提出了基于遗传算法的改进方法,分割识别精度达到90%以上。

早期的岩石矿物图像识别主要依赖于传统机器学习算法,如阈值分割、分水岭算法、K-Means算法和决策树算法,这些算法基于低阶视觉信息(如颜色、亮度和纹理)对矿物图像进行分析。具体来说,阈值分割通过像素强度值的差异区分矿物和背景;分水岭算法模拟水文过程•将矿物图像视作地形图来完成分割;K-Means聚类根据颜色或灰度值对图像像素分组;决策树则通过将像素分类到不同类别实现分割。然而,传统算法流程复杂,难以处理复杂纹理和边界,限制了处理效率和性能。深度学习作为机器学习的一个特殊分支,通过模拟人脑的工作方式,从大量数据中学习并识别模式,成为矿物图像分析的强大工具。与传统方法相比,深度学习可以实现端到端的学习,直接从原始矿物图像生成分割结果,简化了多个步骤。基于深度学习的矿物图像识别流程包括四个主要阶段:图像采集(图1A)、图像预处理(图1B)、模型训练(图1C)以及图像识别(图1D)。此外,深度学习可精准实现矿物的重构、分类和分割,建立矿物图像参数与地质特征的映射,进而为构造演化、沉积环境及成岩作用等地质过程的分析提供有力支撑(图1E)。

图1 基于深度学习的岩石矿物图像识别流程

           

 

鉴于深度学习在矿物图像识别中的卓越性能,本文全面总结了基于深度学习的岩石矿物智能识别的最新研究进展。文章介绍了深度学习在图像识别中的基本原理,并详细探讨了矿物重构、分类和分割三个主要任务的最新研究进展。最后,总结了矿物图像数据特性、模型优化方法及其在地质领域的应用,并展望了未来的发展方向,旨在为地质领域学者和相关研究者提供宝贵的参考,同时探索地质学与计算机科学交叉融合的新路径。

1  深度学习图像处理原理
深度学习的核心是神经网络,而神经网络有很多层,每一层负责处理不同的任务。如识别矿物图像时,前几层仅负责识别简单的信息(如分辨率或颜色),接下来的几层逐渐识别出更复杂的信息(如纹理或边缘特征),直到网络“看到”整张图像中的矿物或背景卷积神经网络(CNN)是深度学习中最成功且广泛应用的架构,尤其适用于图像识别任务(图2)。其核心机制在于层层计算与传递特征信息,每一层的输出作为下一层的输入。在训练过程中,CNN通过链式法则和误差反向传播算法不断优化节点的权重,使预测结果逐步逼近真实值,从而形成输入数据X与目标输出Y之间的映射关系。与传统神经网络不同,CNN采用离散卷积运算进行特征计算,这种方法能够保留图像的局部空间结构,使得CNN在图像信息处理方面表现尤为出色,成为强大的特征提取工具。
图2 卷积神经网络结构
           

 

CNN由多个层次的模块组件组成,包括卷积层、激活层、池化层、全连接层和跳跃连接等(图2)。输入数据(如矿物图像)首先通过卷积层进行特征提取,滤波器捕捉局部特征并生成特征图;随后,激活层对特征图引入非线性,使网络能够学习更复杂的特征;池化层则用于降低特征图的空间尺寸,并增加图像位移的不变形。在特征提取之后,数据通常被展平并通过全连接层进行分类或回归任务。高级架构可能还包括跳跃连接、残差模块及密集连接,以提升CNN的效率和准确性。
图像分类、目标检测和语义分割是计算机视觉领域中三大主要的CNN应用任务。图像分类的目标是识别图像中的主要对象,早期的解决方案依赖于传统机器学习算法,如支持向量机。AlexNet的成功标志着深度学习在图像分类领域的兴起,随后诸如VGGNet、GoogLeNet、ResNet和EfficientNet等改进网络架构的不断涌现,通过更深的网络和创新结构显著提升了性能目标检测不仅要识别图像中的多个对象,还需要预测每个候选区域的边界框坐标,并对其进行分类。R-CNN及其变种FastR-CNN、FasterR-CNN是这一领域的早期代表,而YOLO通过将检测任务转化为回归问题,实现了快速高效的检测。近年来,基于Transformer的模型如DETR在目标检测领域取得了重要进展。语义分割的目标是为图像中的每个像素分配类别标签,FCN作为第一个将CNN应用于语义分割的模型,通过将全连接层转化为卷积层,实现了像素级分类。随着多尺度特征融合、空洞卷积及注意力机制的引入,语义分割的精确度得到了进一步提升。
基于深度学习的岩石矿物图像识别可以归纳为上述三大任务之一任务的不同选择将直接影响模型设计及训练标签的表现形式等关键实施步骤。下文将通过实例研究,从技术方法角度探讨基于深度学习的矿物图像识别的研究进展。
2  基于深度学习的岩石矿物图像识别进展
依据深度学习的应用场景(图像分类、目标检测和语义分割),岩石矿物图像识别任务可分为矿物重建、矿物分类和矿物分割三大类矿物重建是通过矿物学、显微成像和计算机图像处理技术,将矿物的结构、形态和分布情况重新构建,形成三维或二维的矿物模型。重建结果可用于解释矿物成因,提供更精细的微观分析。矿物分类是依据矿物的形态、颜色、纹理及光学特性,将不同矿物划分为不同类别。准确的矿物分类有助于评估矿产资源、分析地质构造成因及研究地质演化历程。矿物分割则是将矿物图像中的不同矿物区域从背景或其他矿物中分离出来,分割的目的是精确定位图像中各个矿物的边界,识别每个矿物颗粒或晶体的轮廓。精确的矿物分割为后续的形态学分析和物理性质测量提供了基础,从而能够进一步明确岩石的形成过程、沉积环境和流体动力学条件。鉴于岩石矿物相机图像识别的应用相对有限,本文重点描述通过显微镜、扫描电镜(SEM)以及CT扫描技术对岩石矿物进行图像识别的方式。
2.1 矿物重构
图像重建技术在岩石矿物图像识别中扮演着重要角色,能够提升矿物识别和分割的准确性与效率,同时实现图像去噪、增强、超分辨率Li et al.(2019)早期结合计算力学和深度学习方法,训练岀卷积神经网络,有效预测页岩电镜图像。针对CT图像伪影区(局部电子累积)导致的图像分割中断问题,Anderson et al.(2020)利用卷积神经网络和条件生成对抗网络(cGANs)实现了图像显著的定性和定量改进,有效减少了伪影区域。此外,为提升图像矿物细节表现,程国建等(2021a)提出了一种基于金字塔结构的SinGAN岩石薄片超分辨率重建方法,允许模型在不同尺度上学习图像细节,显著提升了图像分辨率,为岩石薄片的进一步识别和分割奠定了基础Liu et al.(2024)提出了一种结合ResNet和GAN模型的超分辨率技术,用以增强岩石薄片图像的纹理特征。然而,计算资源和训练时间的限制阻碍了神经网络在图像重建中的广泛应用,同时现有的图像质量评估指标难以全面反映模型性能,尤其在处理矿物图像等复杂成像问题时,这一不足更加明显。
2.2 矿物分类
基于深度学习的矿物分类分为单标签和多标签矿物分类。单标签分类通常采用图像分类模型(图3A),而多标签分类更多依赖目标检测网络(图3B)和语义分割网络(图3D)。
图3 矿物识别分类结果
2.2.1 单标签矿物分类
程国建等(2017)首先基于CNN卷积神经网络实现了长石砂岩薄片的分类,测试集分类准确率达98.5%。为了减弱偏光显微镜对矿物分类的光学影响,白林等(2019)选取了6种常见岩石薄片作为数据集,首次使用VGGNet模型(图4)对矿物进行分类,测试集分类准确率为82%。朱世松等(2020)则采用VGG16模型对单偏光和正交偏光下的8种矿物薄片进行训练,测试集平均分类准确率达到98.1%,单张薄片的识别时间仅为1.5秒。张利军等(2024)进一步选取了不同岩石类型、矿物成分和成像条件的岩石薄片,显示VGGNet模型分类准确率均在90%以上,其中砂岩的分类准确率最高,鲕粒的分类准确率则相对较低。
图4 VGGNet网络模型结构
           

 

为了提升VGGNet模型的特征提取能力,姜基露(2023)对VGG16模型进行了改进,引入了深度可分离卷积、SE注意力机制及BN层通道剪枝方法,有效压缩了模型参数,同时保持了模型性能,分类准确率达85.3%。为了减少模型参数量,程国建等(2021b)将轻量级卷积神经网络SqueezeNet应用于长石砂岩薄片分类,结果显示该模型分类精度达到90.88%,且模型大小显著减少。
2.2.2 多标签矿物分类
区别于单标签矿物,多标签矿物分类面临矿物特征相似及类别不均衡的挑战白林等(2018)选取了15000张岩浆岩、沉积岩和变质岩薄片图像,使用Inception-v3模型进行训练,验证集分类准确率为63%娄威(2022)通过在不同角度下拍摄的花岗岩薄片作为数据集,利用Inception-v3模型分类,测试集分类准确率超过90%谢涛(2020)通过引入注意力机制,改进了FasterR-CNN模型,显著提升了煤矿扫描电镜图像中矿物分类的准确率Wang et al.(2023)结合VGG16和ResNet50,改进FasterR-CNN用于鲕粒薄片图像分类,测试集平均分类精度为92.25%。表明训练样本图像的不均匀分布和图像复杂性显著影响了模型分类结果。
Liu et al.(2022a)和Liu et al.(2022b)结合多模态图像自标注数据增强技术,利用MaskR-CNN模型对砂岩中的石英、长石、黏土矿物和方解石进行了分类,平均识别准确率超过85%。Koh et al.(2021)以122张金矿扫描电镜图像为数据集,比较了SOLOv2和MaskR-CNN在识别黄铁矿和脉石矿物时的表现。结果显示,SOLOv2在高平均分类精度(AP=50.4%vsAP=44.3%)的同时,处理速度比MaskR-CNN快四倍(20帧/秒vs5帧/秒),每分钟可识别120,000个矿物颗粒,速度约为人类专家的2000倍、SEM/EDS的180倍。为解决单偏光下岩石薄片中矿物特征相似的问题,朱斌斌(2023)收集了单偏光和交叉偏光下从不同角度拍摄的砂岩薄片,建立图像融合机制,并结合空间金字塔池化模块对YOLOv3模型进行改进,提出了Multi-angle-YOLOv3-SPP模型。测试结果表明,改进后的模型检测精度比原YOLOv3提高了5%,其中对钾长石和斜长石的检测精度达83.1%,为解决矿物特征相似问题提供了新的思路。
徐述腾等(2018)使用UNet模型对金矿薄片中的黄铁矿、黄铜矿、方铅矿及闪锌矿进行语义分割,测试集分类准确率超过90%,开启了语义分割模型在多标签矿物分类中的应用。Li et al.(2021)将UNet应用于页岩扫描电镜图像中,实现了石英、黄铁矿、白云岩、钾长石、伊利石和方解石的分类,准确率介于86%到92%。为了提高UNet模型的矿物分类精度,Hassan et al.(2024)结合ResNet作为UNet的骨干网络,利用960张花岗岩薄片作为数据集,石英、钾长石、斜长石、黑云母、白云母、绿泥石及锆石的分类精度均达到90%以上。为了研究图像数据集的多样性对语义分割模型矿物分类的影响,徐圣嘉等(2022)结合火成岩中的石英、斜长石、黑云母和绿泥石等9种矿物的单偏光和正交偏光图像,使用软投票法融合单偏光和正交偏光图像的识别结果,最终测试集的DeepLabv3+模型识别总体精度达到86.7%尽管语义分割模型在多标签矿物分类中表现出较高的精度和自动化程度,但该方法依赖于大量标注数据和计算资源。同时,与娄威(2022)提出的通过不同角度拍摄矿物薄片的策略相比,单偏光与正交偏光图像融合的分类效果相对较低。
此外,改进后的图像分类模型也适用于多标签矿物分类。例如,徐圣嘉(2021)结合SLIC分割算法和VGG16模型,成功实现了花岗岩扫描电镜图像中石英、钾长石和斜长石的分类。SLIC算法首先获取矿物的边界信息,再将其融入VGG16模型进行特征融合,测试结果显示石英的分类精度超过85%,而钾长石和斜长石由于相似性,精度在52%到94%之间刘烨等(2024)将迁移学习运用到VGG16模型,提高矿物识别准确率至98.73%,有效解决了数据集规模小带来的深度学习模型泛化能力不佳的问题,显著提高了模型性能和稳定性。Liu et al.(2022c)将SLIC算法应用于CNN矿物分类,实现了砂岩薄片中石英和黏土矿物的识别。针对多标签矿物分类,多个研究也进行了不同图像分类模型的尝试。郭开睿(2022)、余晓露等(2023)、杜崇娇等(2023)以及吴博等(2024)利用ResNet模型对砂岩、灰岩中的矿物进行了分类识别,SkNe,MobileNetV2,MobileVIT和Next-ViT也被证明适用于多标签矿物分类。
针对SLIC算法在提取扫描电镜图像中的矿物信息时存在边缘不连续和边缘丢失的问题,本课题组结合均方误差对SLIC算法进行了改进。SLIC作为一种超像素分割算法,将图像像素转换为特征向量和颜色空间,然后为特征向量建立距离度量尺度,达到局部像素聚类的目的均方差可以有效反映图像中高频信息,均方差越小表示图像中高频成分越少,像素之间灰度值差异较小;均方差越大表示高频成分越多,说明该区域的像素灰度差异较大,通常位于图像边缘。改进后的SLIC算法能够更好地适应灰度图像,利用均方误差有效降低噪声影响,生成的超像素能够更精确地拟合真实区域,避免了传统SLIC算法中分割不连续和模糊的问题,且在处理较小颗粒时也能生成合适尺寸的超像素(图5)。
图5 传统分割算法分割扫描电镜矿物图像结果
2.3 矿物分割
单个矿物的精准分割是进行形状参数统计的关键前提。然而,岩石矿物图像的分割常面临以下三大挑战:①矿物颗粒形状各异,可能导致颗粒与背景难以准确分离,进而出现边缘模糊或误分割现象;②矿物颗粒之间常相互接触或重叠,容易将多个颗粒误判为一个整体,或无法精确识别接触区域的边界;③不同矿物类别的样本数量存在不均衡,易导致多数类样本对模型产生过大影响。传统机器学习的图像分割算法如阈值分割法边缘检测法K-Means聚类分割分水岭算法以及随机森林法主要基于像素特征和局部信息,适用于结构简单的图像分割任务,但在处理复杂场景和噪声方面存在局限性。随着深度学习的发展,基于卷积神经网络(CNN)的图像分割算法通过多层卷积自动提取特征,大幅提升了分割的准确性。
矿物分割可分为主体分割和边界分割,前者侧重识别矿物颗粒或区域,后者则更关注颗粒的边界,特别是不同矿物相的分界线。在实际应用中,主体分割与边界分割常需结合使用,以提供更全面的矿物图像分析。姜枫(2018)首次利用卷积神经网络实现了砂岩薄片中石英、长石和岩屑颗粒的分割,并结合VGG16模型与区域合并方法FCoG,设计出RockNet模型用于矿物信息提取,验证集显示RockNet模型的分割平均准确率达93.22%。Tang et al.(2020)使用U-Net模型同样实现了砂岩薄片中石英、长石和岩屑矿物的分割,分割精度超过90%。Li et al.(2022)将U-Net模型应用于页岩CT图像矿物识别,验证了U-Net在矿物特征和空间结构分割中的优势。U-Net模型的典型结构呈U形,左侧为卷积网络,通过连续卷积层和池化层逐步降低图像的空间维度,即编码过程;右侧为解码器,通过上采样和卷积逐步恢复图像的空间维度U-Net通过在编码器和解码器之间建立跳跃连接,将高分辨率特征图直接连接至上采样特征图,帮助保留图像细节,并通过融合局部和全局特征处理多尺度问题这些特性使U-Net成为矿物图像分割与识别任务中的首选模型之一(图6)。

图6 U-Net网络模型结构


针对矿物颗粒形状各异导致的边缘模糊和误分割问题,唐为东(2022)引入了RCF网络,提升了U-Net模型在砂岩薄片中提取矿物边界的能力。RCF网络通过融合CNN不同层次的特征,结合浅层高分辨率和深层语义特征,捕捉丰富的边缘信息。
同时,结合形态学膨胀与腐蚀操作,增强了U-Net模型对矿物边缘的分割能力。验证集结果显示,改进后的U-Net模型相较传统U-Net模型,在F1值和P值上分别提升了20%和29%,且显著减少了噪点。薛章涛等(2023)参考DenseNet模型的密集连接模块,将其与U-Net结合,进一步优化了U-Net的特征表示能力密集连接模块通过浅层精细特征与深层高级语义特征的结合,提升了分割效果,并通过复用特征减少冗余计算,提高了模型的参数效率与内存利用率测试结果显示,该模型的mIoU值比经典U-Net模型提高了1.7%。总之,在矿物图像分割任务中,结合形态学操作(如膨胀、腐蚀)或边缘增强算法有助于改善边缘清晰度。此外,选择合适的边缘检测损失函数也可以提高模型对边缘的敏感性。
Pei et al.(2022)将U-Net与LeNet-5结合,提出了MagNet模型,用于分割磁铁矿扫描电镜图像。由于磁铁矿形状规则、呈圆形,分割精度超过95%,但在处理重叠矿物颗粒边缘时存在一定困难石英胶结是指在岩石孔隙中由石英矿物形成的胶结物,它的存在不仅显著改变岩石的物理性质,还可视为矿物颗粒边缘的重叠区域。Carbonari et al.(2024)设计了一个10层的U-Net模型,其中5层用于收缩路径,5层用于扩展路径,增强了模型捕获复杂特征的能力验证集结果显示,该模型对砂岩中石英颗粒的分割精度达到91%,石英胶结的分割精度为78%,孔隙识别精度达到95%。针对矿物颗粒重叠问题,研究提出结合注意力机制和空间注意力机制,引入残差网络、轻量化模型以及半监督学习以提高模型性能。注意力机制通过为不同输入特征分配权重,能够使模型聚焦于任务关键信息,从而提升处理效率和性能然而,这一机制高度依赖高质量的标注数据,且其内部工作原理仍较为黑箱化
图像类别不均衡是影响矿物分割的关键因素之一。部分类别的样本数量远超其他类别,导致模型更偏向多数类样本,忽视少数类特征,从而降低模型的泛化能力。为解决这一问题,研究引入了类别损失函数以及Focal和Dice损失函数,通过为不同类别矿物设定权重来缓解类别不均衡的影响。然而,调整加权损失函数中的权重较为复杂,且并非适用于所有情况。
受ResNet模型启发,本项目组改进了传统U-Net模型,通过引入密集连接模块与多级残差结构(图7)。该改进模型在上采样阶段结合密集连接模块(图7A),增强图像特征。基于经典U-Net模型,设计了三种残差网络。ResNetl(图7B)由64个不同尺寸的(1X1)和(3X3)卷积核组成;ResNet2(图7C)将128个卷积核串联;ResNet3(图7D)则由256个卷积核并行连接。改进后的U-Net-Im模型对电镜图像中的黄铁矿分割精度超过90%。
随着研究的进展,新模型和技术不断被提出与改进,以应对图像分割中的挑战。

图7 U-Net-Im模型结构Fig.7U-Net-Immodelstructure(A)密集连接模块;(B)、(C)、(D)分别是ResNet1、ResNet2、ResNet3残差神经网络结构图;(E)改进后的UNet-Im模型结构   

           

 

DeepLabv3+模型使用深层卷积神经网络(如ResNet和Xception)作为编码器,用以提取图像的高级语义特征(图8)。其编码器通过应用不同膨胀率的Atrous卷积(即空洞卷积)捕捉多尺度上下文信息,并通过空间金字塔池化进一步提升特征捕捉能力。为提高边界分割质量,模型在编码器后引入了解码器模块,逐步恢复空间分辨率,并结合编码器的高分辨率特征图,细化边界区域的分割结果,从而提升边界区域的精度。Saxena et al.(2021)结合DeepLabv3+和ResNet18,实现了砂岩薄片中石英、长石、岩石碎片和碳酸盐颗粒等10类矿物的分割。Filippo et al.(2021)与Tang et al.(2023)通过增加跳跃连接和全连接结构,进一步优化了模型,矿物整体分割精度均超过90%。

图8 DeepLabv3+网络模型结构

表1 岩石矿物图像识别中基于深度学习的矿物类型分类
           

 

表2 基于深度学习的岩石矿物图像识别的图像类型分类    

表3 基于深度学习的岩石矿物图像识别中的图像数据量分析

图9 常见的注意力模块结构

(A)空间自注意力模块;(B)SE自注意力模块;(C)坐标自注意力模块
表4 矿物图像分类模型性能对比

注:计算效率(FPS,Frames Per Second)指的是模型每秒钟能够处理的图像帧数,FPS越高,表示模型能够在单位时间内处理更多的图像,说明该模型的计算效率越高;mIoU(mean Intersectionover Union)表示模型计算真实值与预测值两个集合交集和并集之比的均值,取值范围为0~1,值越接近1,表示模型的分类性能越好;FlScore是衡量分类模型性能的综合指标,该值介于0和1之间,值越接近1,表示模型的性能越好,能够同时兼顾精确率和召回率。

表5 矿物图像分割模型评价指标对比

注:准确率(Accuracy)表示模型预测正确的样本数与样本总数的比值,取值范围为0~1;均交并比(mloU)表示模型计算真实值与预测值两个集合交集和并集之比的均值,取值范围为0~1;Kappa系数表示模型预测结果与实际分类结果的一致性,取值为-11,通常大于0;Dice系数表示模型预测样本与实际分裂样本的相似度,取值范围为01。

           

 

   
图10 神经网络模型分割扫描电镜矿物图结果

图11 基于深度学习分割的草莓状黄铁矿粒径数据在沉积环境分析中的应用

注:U/TH为铀元素与钍元素的质量分数之比(无量纲);Al%为铝元素含量占比;D为草莓状黄铁矿集合体平均粒径(μm);d为草莓状黄铁矿微晶平均粒径(μm);Area为草莓状黄铁矿微晶面积(μm2);C为草莓状黄铁矿微晶周长(μm);R为草莓状黄铁矿微晶圆度值;TOC为总有机碳含量

图12 基于多模态知识决策的岩石矿物图像识别体系

-------END------    

原文来源邓乃尔,徐浩,周文,唐小川,王浩,闫晓闯,蒋柯.基于深度学习的岩石 矿物智能识别研究进展与发展趋势J/0L].成都理工大学学报(自然科学版).

https://link.cnki.net/urlid/51.1634.N.20240929.1717.002.

封面标题、导读评论和排版整理等:《覆盖区找矿》公众号.

推荐读者下载、阅读和引用原文!

------往期精彩回顾------

1.  基于深度学习的镜下岩石、矿物自动识别  

2.自动识别岩石薄片矿物的一种人工智能方法

3.一种基于现场岩石照片的智能岩性识别模型

------关注“覆盖区找矿”,拥有更多新方法------

宣讲成果,助力转化,激励创新!

覆盖区找矿
宣扬地学成果,传播勘查技术方法!
 最新文章