本文版权归天然气工业杂志社所有
未经允许,不得转载
王跃祥, 赵佐安, 唐玉林, 等. 基于知识驱动图版约束的致密砂岩气储层测井参数智能预测[J]. 天然气工业, 2024, 44(9): 68-76.
WANG Yuexiang, ZHAO Zuo'an, TANG Yulin, et al. Intelligent prediction of logging parameters of tight sandstone gas reservoirs based on knowledge-driven chart constraints[J]. Natural Gas Industry, 2024, 44(9): 68-76.
作者简介:王跃祥,1985 年生,高级工程师,主要从事测井评价方法和测井地质应用研究。地址:(610051)四川省成都市高新区天府大道北段12 号。ORCID: 0001-0000-2895-2944。
E-mail: wyuex@petrochina.com.cn
通信作者:赵佐安,1975 年生,高级工程师;现从事地球物理测井生产与管理工作。地址:(610051)四川省成都市府青路一段5 号。ORCID: 0000-0002-6179-7223。
E-mail: zhaoza@petrochina.com.cn
王跃祥1 赵佐安2 唐玉林2
谢 冰1 李 权3 赖 强1
夏小勇1 米 兰4 李 旭3
1. 中国石油西南油气田公司勘探开发研究院
2. 中国石油西南油气田公司
3. 中国石油集团测井有限公司地质研究院
4. 中国石油勘探开发研究院
摘要:中国致密砂岩气资源潜力巨大,是天然气增储上产的重要对象,但致密砂岩储层空间类型多样,纵横向变化大,“四性”关系复杂,测井系列多样,测井项目少,常规测井技术评价致密储层参数难度大、效率低。为此,以四川盆地金秋、天府气田致密气为对象,构建构造区块—油气田—油气藏—测井解释图版主线,形成了致密砂岩气储层测井参数解释知识图谱,并通过神经网络算法对样本数据进行处理并约束模型结果,建立了图版约束的人工智能储层测井参数预测模型,实现了专家经验与数据双向驱动的储层测井参数智能预测。研究结果表明:①新智能模型融入了专家经验图版信息,且构建了专家经验与数据双向驱动的智能参数预测方法,极大地提升了模型对测井领域知识的理解能力和实践能力;②基于常规测井曲线,通过特征处理实现多维特征的挖掘,衍生出新曲线,与常规曲线一起作为输入进行模型强化训练,有助于提高解释模型的准确率;③实际应用结果表明,采用知识驱动图版约束的致密砂岩气储层参数智能预测方法计算的孔隙度和渗透率与岩心分析孔隙度及渗透率之间的误差分别为7.9% 和15%,计算的含水饱和度与密闭取心饱和度之间的误差仅为5%。结论认为,基于知识驱动图版约束的致密砂岩气储层参数智能预测技术可以解决老井人工评价工作量大,测井解释标准不统一的问题,并可实现快速高效测井智能评价及潜力优选,将有力地推动了人工智能在测井领域的深度应用。
关键词:四川盆地;致密砂岩气;储层测井参数;知识驱动;神经网络算法;智能预测;人工智能
0 引言
测井评价储层参数的核心任务是建立储层孔隙度、渗透率、饱和度解释模型[1]。不同于常规砂岩储层,致密砂岩储层具有储集空间小,物性差、含气饱和度低的特点,导致流体对测井响应的贡献小, 主要反映岩石骨架的测井响应[2-5],并且常规三孔隙度测井[ 补偿声波曲线(AC)、补偿中子曲线(CNL)、补偿密度曲线(DEN)] 在气层段的响应特征不明显, 单一的识别方法很容易将气层漏失或误判,因此需要融合多种方法进行综合判定。
致密砂岩气的半定量识别主要依赖于对天然气敏感参数的提取,利用交会图版法对气层进行识别。常用的交会图版包括孔隙度—电阻率交会图、双孔隙度交会图、孔隙度—含水饱和度交会图、束缚水饱和度—含水饱和度交会图等[6-8],由此可见,孔隙度和饱和度是识别致密砂岩气层的重要参数指标,精确计算这两个参数是识别油气层的重要基础。
目前,测井解释主要包括现场一次解释和测井综合解释两种方法。现场一次解释中孔隙度的计算主要基于“岩石体积物理模型”,即根据岩石的组成及其测井响应特征的差异,把单位体积的岩石分成岩石骨架、泥质、孔隙和流体等若干组成部分,并研究每一组成部分对岩石宏观物理量的贡献程度, 把岩石的宏观物理量视为各部分贡献之和[9-10]。渗透率的解释多采用经验模型,一般是基于孔隙度、束缚水饱和度、粒径和地层因素的统计模型;含水饱和度解释多采用阿尔奇公式计算。测井综合解释中孔隙度的计算多采用岩心物性实验与孔隙度测井曲线(如补偿声波曲线、补偿中子曲线、补偿密度曲线) 进行相关性分析,优选敏感参数并确定孔隙度模型。通常渗透率模型根据岩心实验测量的孔隙度与渗透率关系拟合得到,含水饱和度的计算多采用岩电参数标定后的阿尔奇公式、西门度公式或印度尼西亚公式。
测井领域数据分析中,可供选择的指标变量种类较多,且变量之间关系错综复杂。20 世纪90 年代末开始,大量学者开始运用神经网络算法对测井物性参数进行研究[11],利用神经网络解决此类问题,无须考虑明确的数学模型,即可实现不确定性和非结构化数据进行有效的表述和预测。1994 年, Mohaghegh 等[12] 设计了三层神经网络方法计算渗透率。Saemi 等[13] 提出一种新的基于遗传算法(GA, Genetic Algorithm)神经网络自动设计方法,并在波斯湾盆地南帕尔斯气田取得了良好的应用效果。马力等[14] 应用改进的人工神经网络 BP 模型,大大提高了储层孔隙度和渗透率的预测精度。Orugant 等[15] 通过机器学习算法构建含气饱和度预测模型。同时, 知识图谱开始与神经网络相结合,并对神经网络计算结果进行约束及强化等方面发挥作用。知识图谱的概念最初由谷歌提出,因其具有强大的语义处理能力和开发组织能力,目前已被广泛应用在医疗、教育、金融等领域,并产生了丰富的成果。
国内外开始将知识图谱引入到机器学习中,对神经网络计算结果进行约束及强化,进而建立更具解释性的机器学习模型[16-29]。知识图谱的构建主要包括本体构建、知识获取、知识融合、知识存储及知识应用,共计5 个部分,本体构建主要依赖专家知识, 构建业务领域内的知识模型;知识获取和知识融合就是通过自然语言处理技术,将抽取出来的知识融合到统一的知识库中,形成知识图谱,存储到图数据库,支撑上层的知识应用。例如智能问答、搜索和知识推理等[30-39]。针对致密砂岩气层的测井评价, 本文将知识图谱中的储层参数图版引入到深度学习中,通过专家知识对数据驱动的约束及强化,提升预测结果的可解释性,使其更接近专家认识,并提高了预测精度。
1 知识驱动图版的构建
知识图谱由一条条知识组成,每条知识表示为一个SPO 三元组(Subject—Predicate—Object)。一个三元组包含(Subject、Predicate、Object)3 个部分, 即主语、谓语、宾语。例如,< 天府气田,位于,川中核心建产区> 就可以简单的用一个三元组来表示。一条三元组代表了对客观世界某个逻辑事实的陈述。多个三元组头尾相互连接就形成了一张描述万物关系的图谱。
知识图谱的构建主要涉及本体与实体的构建。本体主要包括概念、关系和特征等3 个部分。本体的构建是获取、描述和表示测井领域知识,旨在总结该领域内标准的概念词汇,从不同层次以形式化方式给出概念与概念间相互关联的明确定义,建立公共认知的测井领域知识体系。领域本体能够描述复杂测井相关数据的知识模型。具体是根据测井岩性识别的需求和专业知识,将与测井相关的数据知识体系进行框架划分,对概念与实例进行分类,确定概念之间的关系,明确属性与规则,最终以概念、关系、属性、规则、实例等元素表达出来[16]。
基于测井相关业务流程,结合实际研究需求, 对测井解释过程中的各种概念、模型进行抽象,并映射出本体关系,构建测井领域知识图谱本体模型。对照测井领域,概念共确定为3 类:地质、井、管理。其中地质包括层名、油气藏、图版等;井包括地质分层、测井油气解释、岩心物性分析、试油数据、气测数据、岩心岩性、产能级别等;管理包括盆地、油气田公司、构造区块、油气田等,表1 为部分测井领域本体。关系用于连接两个实体,并与实体一起表达文本的主要含义[16],如表2 ;属性一般指实体的属性或组成实体的成分[16],见表1 属性列。
侏罗系沙溪庙组致密砂岩气核心建产区主要位于四川盆地中部(以下简称川中),由天府气田和金秋气田构成。沙溪庙组分为沙溪庙组一段(以下简称沙一段),沙溪庙组二段(以下简称沙二段),本文基于沙溪庙组致密砂岩气藏,以构造区块—油气田— 油气藏为主线,构建天府气田测井知识图谱,其知识图谱概念及属性根据图1 构建,将天府气田长期研究过程中确定的孔隙度、渗透率、饱和度图版纳入知识图谱(图2,表3),建立图版、公式与油气藏的关联关系,为建立基于知识驱动图版约束的致密砂岩气参数预测模型提供基础数据。
2 建立预测模型参数
基于知识驱动图版约束的参数预测模型是在常规深度神经网络基础上,融合知识图版约束形成的混合神经网络模型,用于对致密砂岩气储层参数的预测。首先通过测井曲线进行多维度、多变量的特征提取,将测井曲线数值特征输入到混合神经网络中, 实现对测井曲线特征学习,再以图版作为训练的误差约束,最后通过一个输出层得到致密砂岩气储层参数。该模型融入专家经验总结的图版信息,实现专家经验与数据双向驱动的智能参数预测方法,极大地提升模型对测井领域知识的理解和运用能力,同时让模型预测结果具有一定的可解释性。利用图嵌入技术,基于构建的知识图谱训练实体向量,对应同区块、同层位的实体向量具有相似,即向量中包含不同井所在层位特征。在构建网络模型时,不仅包含测井数据特征的输入,还包含样本所属井所在层位的向量输入。相比传统的测井数据特征作为单一数据,本方法构建的模型考虑了知识约束,与传统方法对比, 其准确度更高。
模型构建主要步骤包括岩心样本与测井深度对齐、特征挖掘、知识图版约束、知识驱动图版约束下的模型训练、模型评估。
2.1 岩心样本与测井深度对齐
本文采用岩心物性数据为样本标签,不同类型的曲线以及特征挖掘后的新曲线为样本特征,以深度作为匹配条件完成样本深度对齐。首先按照岩心物性深度值,从测井曲线中筛选出最邻近的测点; 其次判断曲线深度值是否与测点重合,如果不重合, 通过对测井数值进行插值计算后完成曲线数值与岩心物性数据的对齐;如果重合,直接进行曲线数值与岩心物性数据的对齐。以补偿声波(AC)曲线为示例,计算公式如下。
不重合时,插值计算公式:
2.2 特征挖掘
基于常规测井曲线,通过特征处理实现多维特征的挖掘,衍生出新的特征,与常规曲线一起作为模型的输入进行训练,有助于提高模型的准确率。例如研究区测得的三孔隙度曲线对孔隙度的表征均有一定程度的反映,可将三孔隙度曲线进行曲线衍生, 衍生出补偿声波—补偿中子包络面、补偿声波—补偿密度包络面曲线等。本文特征处理的方法包括对多条曲线的相加、相减等处理。第一步对每条曲线进行归一化处理;第二步按照在沙溪庙组非储层段曲线重合的原则,计算两条曲线转换的系数;第三步以转换系数计算储层段曲线值并进行相加、相减等运算, 衍生出新的曲线。以AC 曲线、补偿中子(CNL)曲线为示例,计算公式如下:
归一化计算公式:
2.3 知识图版约束
在建立测井解释图版时,通常将异常点进行剔除,即岩心数据中存在不符合业务认识的异常点需要被剔除,人工智能算法的样本数据同样需要对样本数据进行预处理。处理方式是以知识图版作为约束, 对样本进行清洗,剔除明显不符合图版约束的异常样本,从而使得参与训练的样本都满足业务专家对该地区的地质认识。试验区按照层段划分并选择图版, 利用图版中的公式对取心样本数据进行清洗,剔除与图版计算结果相对误差超过100% 的样本。知识图谱可在数据处理时自动调用井所对应的区块和层位图版,对整个研究区样本进行处理,避免了单个区块(层位)建立样本库的繁琐,且在一定程度上保障了样本量的充足。具体步骤为:①从知识图谱中提取关联的约束图版公式,以样本井对应区块与图版进行关联;②利用图版中的公式计算取心样本点的标签值;③对取心样本数据进行清洗,剔除与图版计算结果相对误差超过阈值的样本(图3),该部分样本被认定为不符合业务专家对该地区地质认识的异常数据,从而保证了预测结果的偏差不会严重超出业务专家认知。
2.4 知识驱动图版约束下的模型训练
基于知识驱动图版约束的致密砂岩气储层参数预测模型相比于普通的回归预测网络,在输出层增加图版计算结果,即同时输出两个预测结果,第一个输出结果为取心数据,第二个输出结果为图版计算结果。基于该网络结构进行模型训练,使得训练的模型既符合图版约束,又逼近取心数据,保证了模型预测的结果不偏离图版认识,实现从以往单一的数据驱动转变为知识驱动图版约束下的智能预测。此次以井为对象进行样本分割,按照8∶1∶1 方式把样本井分割为训练样本、测试样本和验证样本,这样的处理方式可以有效地防止按照样本数据直接进行样本分割导致样本泄露,保证了训练出的模型具有较强的泛化能力。网络结构如图4 所示:
通过设置不同隐藏层数(3、5、7、9)、网络层节点数目(64、128、256)、网络层激活函数(relu、elu)、优化函数(SGD、Adam)、损失函数(MAE、MSE)、学习率(0.01、0.001)等超参数训练不同的模型,并利用模型评估方法进行超参数的调整。
神经网络输入分为曲线特性和知识图谱提取的向量特征,输出两个结果,第一个输出结果为标签数值,第二个输出结果为图版计算结果。通过在损失函数中增加图版约束的方式,约束模型输出结果符合地质认识,避免存在异常数据导致预测结果严重偏离地质认识。图版最大相对误差指生成图版的数据点与图版公式拟合结果的最大相对误差。
自定义损失函数为:
将损失函数加入图版后的测试结果见表4,可见加入损失函数后,孔隙度与含水饱和度模型的预测误差明显降低。
2.5 模型评估
选取平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、 均方根误差(RMSE)作为评价指标[8-10], 计算公式如下:
通过对神经网络超参数的调整,训练不同参数配置的模型,用验证集对模型预测结果进行评估。以迭代次数(100、500)和隐藏层数(3、5、7、9)为例, 预测结果与实际数据误差精度如表5。
3 应用分析
本文采用的样本数据来源于四川盆地侏罗系沙溪庙组归位后的岩心物性数据,基于人工智能平台进行智能预测。川中核心建产区沙溪庙组为一套巨厚杂色泥岩夹块状砂岩地层,储层岩性以岩屑长石砂岩、长石岩屑砂岩为主,储集空间主要为残余粒间孔、粒间溶孔、长石粒内溶孔,总体表现为低孔隙度、低渗透率特征,孔隙度主要分布在8% ~ 12%,渗透率分布在0.1 ~ 10 mD。样本按层段划分,沙二段样本居多,有3 395 个样本点,沙一段有1 737 个样本点;按气田划分,天府气田居多,有5 078 个样本点, 金秋气田752 个样本点。经验图版来源于天府气田沙二段的岩心孔隙度—补偿声波图版、岩心孔隙度— 岩心渗透率图版。
通过相关性分析, 选择了GR( 自然伽马)、AC、CNL、DEN 曲线建立孔隙度模型。渗透率模型除了需要GR、AC、CNL、DEN 曲线外,还增加了孔隙度预测曲线,保证了孔隙度和渗透率预测曲线间的相关性。含水饱和度模型除选择了GR、AC、CNL、DEN 曲线外还增加了电阻率曲线。将总样本随机选择了20% 作为测试集,计算结果显示:孔隙度相对误差为7.9%,渗透率误差为15%(渗透率误差计算方法:预测值与真实值在同一数量级区间范围内为正确,误差= 1 -正确数量/ 总数),含水饱和度绝对误差为5%。
为了进一步分析该模型预测结果在沙一段、沙二段的准确率,选择了不同层段、不同区域的7 口井进行孔隙度预测分析。分析认为通过人工智能方法预测沙二段孔隙度误差均小于8%,沙一段误差较沙二段大(图5),其原因主要是沙二段的样本数更多; 整个沙溪庙组人工智能方法预测孔隙度误差总体在8% 以下,预测模型的效果稳定。
图6 是采用人工智能方法对致密砂岩储层在同一地层进行储层参数预测的结果,孔隙度主要分布在6% ~ 9%,常规测井解释孔隙度的方法为体积模型法,利用三孔隙度曲线联立求解,根据岩心孔隙度与补偿声波、补偿密度和补偿中子的相关性高低, 确定补偿声波时差曲线权重为1,补偿密度曲线权重为0.5,补偿中子曲线权重为0.3。人工智能方法与常规测井解释的孔隙度,两者计算的结果比较接近, 均与岩心孔隙度吻合较好,由此验证了基于知识驱动图版约束的储层孔隙度预测模型的准确性。且人工智能方法可以解决老井人工评价工作量大,测井解释标准不统一的问题,实现快速高效测井智能评价及潜力优选。
4 结论
1)针对储层参数预测的知识图谱,主要以构造区块—油气田—油气藏为主线,将油气田长期研究过程中确定的孔隙度、渗透率、饱和度图版纳入知识图谱,建立图版、公式与油气藏的关联关系,为建立各气田各层的致密砂岩气参数预测模型提供专家知识约束条件,并起到样本增强作用。
2)针对常规神经网络算法预测储层参数存在优化困难和过拟合的问题,通过知识图谱约束数据,强化样本数据,使得预测结果更具可解释性,更接近专家认识,并提高准确性。
3)天府气田沙溪庙组的实例证明,通过知识驱动图版约束的致密砂岩气储层参数预测方法,可达到孔隙度相对误差为7.9%、渗透率误差15%、含水饱和度绝对误差5% 之内的预测效果,由此可见,知识驱动图版约束的人工智能方法可以实现较准确的致密砂岩气层参数预测。
4)人工智能技术能解决老井人工评价工作量大, 测井解释标准不统一的问题,实现快速高效测井智能评价及潜力层优选。
编 辑 韩 建
论文原载于《天然气工业》2024年第9期
基金项目:中国石油天然气集团有限公司“致密砂岩气藏储层精细描述技术研究”(编号:2023ZZ25YJ01)。
排版、校对:张 敏
审核:罗 强 黄 东
点击阅读原文,链接到《天然气工业》官网