本文版权归天然气工业杂志社所有
未经允许,不得转载
卢聪, 罗扬, 郭建春, 等. 融合物理约束的压裂水平井产能智能预测框架构建与应用[J]. 天然气工业, 2024, 44(9): 99-107.
LU Cong, LUO Yang, GUO Jianchun, et al. Establishment and application of an intelligent productivity prediction framework for fractured horizontal wells with physical constraints[J]. Natural Gas Industry, 2024, 44(9): 99-107.
作者简介:卢聪,1983 年生,教授,本刊青年编委;主要从事油气藏增产改造理论、技术教学和研究工作。地址:(610500)四川省成都市新都区新都大道8 号。ORCID: 0000-0002-9551-9459。
E-mail: lucong@swpu.edu.cn
通信作者:罗扬,1992 年生,博士;主要从事油气藏增产改造理论与技术的研究工作。地址:(610051)四川省成都市成华区建设路10 号。
E-mail: luoyang@zhenhuaoil.com
卢 聪1 罗 扬1,2 郭建春1 曾凡辉1
1. 油气藏地质及开发工程全国重点实验室·西南石油大学
2. 振华石油控股有限公司
摘要:水平井分段压裂是实现非常规油气藏有效开发的关键技术,准确预测压裂水平井产能对于井位优选和压裂参数优化至关重要。随着历史开发数据的不断积累和人工智能技术的迅速发展,数据驱动的人工智能方法为压裂水平井产能预测提供了新的渠道。为此,从压裂水平井生产物理过程出发,分析了产能智能预测的物理约束,提出了与物理过程相匹配的产能智能预测框架,并结合四川盆地南部(以下简称川南)地区页岩气开发生产数据开展了实例验证。研究结果表明:①压裂水平井产能智能预测需要以压裂段为单位进行特征融合处理,单井产能是由初始压裂段到末尾压裂段依次累计作用的结果,各压裂段之间存在顺序关系,各单井的因素输入维度存在差异;②采用循环神经网络能够完全匹配压裂段之间的顺序关系和汇聚作用,而Mask 屏蔽机制则能够解决各单井压裂段数量不统一的矛盾。结论认为:①该智能预测模型能够学习各单井输入序列与产能之间的复杂映射关系,训练集相对误差为0.098、测试集相对误差为0.117,较循环神经网络(RNN)模型误差的下降幅度分别为37.6% 和37.0%,较多层感知机(MLP)模型误差的下降幅度分别为77.3% 和77.4%,展现出优异的预测性能;②该研究成果能够为非常规油气藏压裂水平井产能预测的技术进步和快速发展提供新的思路与借鉴。
关键词:四川盆地南部;页岩气;水平井;分段压裂;特征融合;产能预测;人工智能;循环神经网络;物理约束
0 引言
近年来,世界油气工业的勘探开发领域正不断从常规油气转向非常规油气,非常规油气的突破推动了世界能源行业的格局变化[1]。2023 年,中国油气产量当量超过3.9×108 t,连续7 年保持千万吨级快速增长势头,年均增幅达1 170×104 t 油当量。这一成绩的取得,非常规油气资源的开发功不可没。2023 年,中国非常规油气勘探开发取得重要突破,其中页岩油产量突破400×104 t 再创新高,非常规天然气产量突破960×108 m3,占天然气总产量的43%,成为天然气增储上产重要增长极[2]。
非常规油气藏是一种“人工油气藏”,主要靠水平井及分段压裂技术实现有效勘探开发[3]。压裂水平井产能的准确预测是井位优选、压裂效果评价和压裂参数优化的关键。随着人工智能技术的迅速发展, 越来越多的学者提出将人工智能理论应用于压裂水平井产能预测过程,基于矿场实际数据建立智能预测模型,从而辅助开发决策[4-12]。截至目前,中国各油气田已实施千余口井、万余段的非常规油气压裂改造作业,积累了海量的地质、工程和生产数据,为利用人工智能方法解决非常规油气压裂产能预测问题提供了数据支持[13-20]。通过将压裂水平井生产物理约束与人工智能算法相融合,能够提升产能预测的准确性,从而实现数据赋能,提高非常规油气储层压裂改造效果。
1 产能智能预测物理约束
非常规油气蕴藏在微纳米级的有机质或无机质孔隙中,通常无法自然流动和产出,水平井钻井和水力压裂是实现非常规油气规模有效开发的关键。通过水平井分段压裂的方式,能够将渗透能力较低的储集体“打碎”,在井筒附近一定范围内形成裂缝网络,实现对储层长、宽、高方向的三维立体改造,扩大基质与裂缝的接触面积,减小基质内流体到裂缝的渗流距离, 从而人为提升流体在储层中的整体流动能力[21-22]。
非常规油气藏中,水平井以压裂段为单位依次进行分段压裂改造。相较于储层基质,压裂形成的裂缝网络具有较高的渗透性和导流能力,是流体流动的主要通道。实际生产过程中,储层流体的流动是一个从微纳米孔隙到裂缝网络,再到水平井筒的多尺度流动过程。随着渗流尺度的增加,流体在不同孔隙空间中的流动规律也将发生变化。整体而言, 基质孔隙中的气体首先进入各压裂段所形成的裂缝网络中,然后经裂缝网络汇聚至水平井筒,最终流向地面(图1)。因此,压裂水平井的生产可以视为各压裂段的综合作用,应将各压裂段的特征因素进行综合考虑。
压裂水平井产能智能预测的主体思路为:基于现场实际地质、工程和生产数据,以单井产能作为输出,以产能影响因素作为输入,采用机器学习方法建立智能化的产能预测模型。通常产能以单井为对象进行表征,输入参数也需要统一到单井层面,常规方式是将所有压裂段的影响因素进行平均或求和处理, 但考虑到长水平井筒所对应的地质和施工参数差异, 该处理方式无法对单井真实情况进行准确描述,可能存在较大的误差。因此,压裂水平井产能智能预测需要以压裂段为单位进行特征融合处理,并且应进一步考虑三个方面的物理约束:①各压裂段所处位置具有顺序关系;②相邻压裂段之间存在相互影响作用, 单井产能是由初始压裂段到末尾压裂段依次汇聚的累计作用结果;③各单井的压裂段数量不完全统一, 因素输入维度存在差异。
2 产能智能预测框架构建
针对上述产能智能预测物理约束,笔者提出循环神经网络与Mask 屏蔽机制相结合的产能智能预测框架,其中循环神经网络能够完全匹配压裂段之间的次序关系和汇聚作用,而Mask 屏蔽机制则能够解决各单井压裂段数量不统一的矛盾。
2.1 循环神经网络机制
循环神经网络(RNN)是处理序列数据的合理方式,其能够对序列历史状态进行存储和利用,充分考虑序列前后之间的内在关联关系,有助于获取更加准确的序列建模效果[23-24]。RNN 典型结构如图2 所示,其中RNN Cell 代表循环神经元,在运算过程中始终保持不变,Xt、Ht 分别表示模型在步骤t 的输入与隐状态输出(区别于模型最终输出,隐状态输出代表当前步骤的隐状态,为包含模型状态信息的高维数据)。从展开后的结构图中可以发现,上一步骤中的输出将会作为当前步骤中输入的一部分参与神经元运算,从而实现序列信息的持续传递。循环神经元中输入与输出的具体运算方式如图3 所示。
将图3 中的运算方式进一步用公式可表示为式(1),可以发现第t 步的输出结果将由第t 步的输入和第t - 1 步的输出所决定,而第t - 1 步的输出又将由第t - 1 步的输入和第t - 2 步的输出所决定, 依此类推,理论上第t 步的输出将受到之前步骤中所有序列信息的影响,从而实现对于历史数据的存储与利用。
基于循环神经网络运算结构,可以将具有顺序关系的压裂段视为序列位置,不具有顺序关系的压裂段因素视为序列输入,而单井产能则视为序列信息累计作用之后的最终输出结果。如图4 所示,首先将压裂段1 的m 项因素输入至神经元,得到对应的隐状态H1 ;然后将压裂段2 的m 项因素和隐状态H1 一起输入神经元,得到对应的隐状态H2,该隐状态是压裂段1 和压裂段2 中各项因素的累计作用结果;以此类推,将所有压裂段的因素依次输入,最终得到的隐状态Hn 中将包含着压裂段1 ~ n 中所有因素按顺序累计作用的结果,并与单井产能相对应。可以发现,该处理方式与压裂水平井整体物理生产过程完全吻合,从而实现了算法结构与物理过程的准确对应。
2.2 Mask 屏蔽机制
循环神经网络算法结构中输入数据的维度需要提前明确并保持固定,通常的维度形式为“批量大小× 序列长度× 特征数量”。针对压裂水平井产能预测问题,批量大小为一次运算的单井数量,序列长度为单口井压裂段的数量,特征数量为单个压裂段的输入因素数量,其中批量大小和特征数量均能够提前明确并保持固定,但由于各单井的压裂段数量存在差异,序列长度无法始终保持统一。针对上述矛盾,常用的处理方式将输入序列长度设置为样本序列长度的最大值,并在序列较短的样本末尾充填0 值,以满足输入维度要求,具体如图5-a 所示。该处理方式虽然能够保证数据正常运算,但存在两个方面的弊端:①处理方式对应的物理表达不合理,数值0 本身是一个具有特定含义的数值,充填0 值后相当于在压裂段末尾继续增加了多个本来不存在的压裂段; ②在样本中充填大量0 值后会影响模型对于有效序列中信息的获取和传递。
针对上述矛盾,考虑通过Mask 屏蔽机制进行处理,该方法在自然语言处理(NLP)中最为常见,可用于统一不同词语或句子的序列长度[26-27]。具体而言, 该方法首先仍然将输入序列长度设置为样本序列长度的最大值,并在序列较短的样本末尾统一充填任意标识数值(常用0 或1 充填);然后根据标识数值所在充填位置构建Mask 序列,记录有效数值和充填数值的位置信息,其中“1”代表该位置为有效数值,“0” 代表该位置为充填数值(图5-b);最后将因素序列与Mask 序列一起作为模型输入参与运算,由Mask 序列决定在计算过程中对因素序列哪些位置的数值进行屏蔽,只有Mask 序列中“1”对应的位置能够对模型输出产生影响,而Mask 序列中“0”对应的位置则不会改变模型的输出结果。通过该处理方式, 既能够满足RNN 算法输入结构的要求,同时保证了整体运算流程与实际物理过程的完全吻合。
2.3 产能智能预测框架
基于循环神经网络和Mask 屏蔽机制,压裂水平井产能智能预测框架如图6 所示。首先,为实现对单井各压裂段特征的准确描述,以压裂段为单位对各单井(样本)的特征因素进行表征,构建二维的原始因素序列。其次,针对各单井压裂段数量不统一的特点,以压裂段数量最大值Nmax 为基准,在压裂段数量不足Nmax 的单井序列末尾充填0 值,统一各单井的因素序列结构,并构建Mask 序列记录有效数值与充填数值的位置信息。然后,将各单井的因素序列与Mask 序列一起作为模型输入参与运算,运算过程中各压裂段的因素向量和Mask 向量被依次输入RNN 神经元中,由Mask 向量决定是否对当前运算进行屏蔽:当Mask 向量为1 时,该运算步正常进行, 单个压裂段的隐状态输出将直接作用于下一个压裂段的RNN 神经元计算,以表达序列的累积作用;当Mask 向量为0 时,该运算步被屏蔽,虽然RNN 神经元仍会执行计算,但不会影响该运算步的隐状态输出,即该压裂段的隐状态输出与上一个压裂段保持一致,以此实现对充填压裂段的屏蔽;最后,将序列末尾的隐状态通过全连接层(Dense)映射得到单井产能预测值(Out),结合产能真实值计算训练误差, 通过误差反向传播对神经元中可训练参数进行更新, 并不断循环直至达到精度要求。
3 产能智能预测实例应用
基于提出的产能智能预测框架,理论上可以对任意区域和储层的压裂水平井产能进行建模和预测, 预测效果的差异将主要体现在数据收集的完备性和特征提取的准确性。下面以四川盆地南部(以下简称川南)威远页岩气田为例,基于100 余口页岩气井的地质、工程和生产数据,开展压裂水平井产能智能预测框架应用。
3.1 数据来源
基础数据来源于威远页岩气田前期已投产的100 余口非套变井,实施时间为2014—2022 年。威远页岩气田建产区域面积1 520 km2,划分为自201、威202、威204 等3 个井区。区块主力层系为奥陶系五峰组—志留系龙马溪组,沉积于海相深水陆棚环境, 发育一套富有机质海相页岩,储层整体表现为西北高、东南低的单斜构造格局,中部构造较陡,地层倾角6°~ 8°,东南部构造相对平缓,地层倾角2°~ 3°。储层厚度180 ~ 600 m,储层埋深由西北向东南逐渐增加,整体埋深范围2 000 ~ 4 000 m,其中埋深 3 500 m 以浅的面积占比为50.5%。区块现阶段开发层位为五峰组—龙一1 亚段,龙一1 亚段可进一步细分为龙一11、龙一12、龙一13 和龙一14 小层,其中龙一11 小层为区块主力层位[28]。
3.2 特征选择
页岩气压裂水平井的产能表征方式主要包括测试产量、首年平均日产气量、预估可采储量等,其中测试产量代表气井压裂施工完毕后的即时产能、首年平均日产气量代表气井初期生产能力、预估可采储量代表气井长期生产能力。考虑到单井测试产量受压裂施工效果的影响最为直接、数据来源单一, 并且模型实际应用过程中容易开展验证,选择测试产量作为页岩气压裂水平井的产能表征指标,即后续压裂水平井产能预测模型建立过程中将以单井测试产量作为模型的最终输出。
页岩气压裂水平井在生产过程中涉及多个不同尺度的流动,但就整体物理过程而言,可以从物质基础、流动通道和生产制度3 个角度出发,对页岩气井产能的影响因素进行分析。页岩气井的物质基础主要指气井的地质储量,是决定气井产量的内在地质因素。页岩气以吸附气、游离气和溶解气3 种状态赋存于页岩储层中,因此页岩气的总地质储量为吸附气、游离气和溶解气三者储量之和,可通过静态法进行估算:
页岩气生产过程中完整的流动通道包括从基质孔隙到裂缝网络,再到水平井筒的全部路径,其中裂缝网络是整个流动过程中最为关键的环节,也是压裂改造的结果,并且能够通过人为措施进行优化布置,因此重点针对裂缝网络开展研究。对于裂缝网络的描述可以从裂缝分布范围、裂缝复杂程度和裂缝导流能力3 个方面进行开展。其中,裂缝分布范围可通过微地震监测得到裂缝体长度、裂缝体宽度和裂缝体高度进行表征;裂缝复杂程度可通过微地震事件点的分布密度进行表征[ 式(3)],事件点分布越密集,对应空间内岩石发生破裂的次数就越多,越容易形成复杂裂缝网络;裂缝导流能力目前业内尚缺乏直接的监测手段,考虑采用等效方式进行表征,即基于微地震监测得到的裂缝分布范围,结合压裂施工过程中的支撑剂泵入总量,采用Li 等[29] 提出的解析公式进行计算:
页岩气井在测试过程中的生产制度主要指压力控制,即通过控制井口压力与储层压力之间形成的驱动压差,进一步控制气井整体流动状态。因此,可通过地层压力与测试稳定套压之间的差值,即驱动压差,对气井的生产制度进行表征。由于数据来源区域未实施产气剖面测试,测试过程均以单井为对象开展,因此在处理过程中单口井各压裂段的驱动压差保持一致,不同井之间则仍然具有差异。
综上所述,从物理过程出发,页岩气压裂水平井产能主要由物质基础、流动通道和生产制度3 个方面的7 项中间因素所决定,具体包括地质储量、裂缝体长度、裂缝体宽度、裂缝体高度、微地震事件点分布密度、裂缝等效导流能力和驱动压差。同时, 该7 项中间因素又被井间距、储层厚度、施工排量、加砂等多项原始因素所影响。采用7 项中间因素代替多项原始因素进行产能预测,一方面能够确保输入特征与实际物理过程相对应,另一方面能够大幅缩减模型输入因素数量,从而缓解由于特征因素多而数据样本少所带来的机器学习高训练误差。
3.3 模型训练与对比
基于抽提得到的单井产能及其影响因素,进一步将全部样本按照8∶2 的比例划分为训练集和测试集,并开展模型训练。模型训练轮次设置为800,批量大小设置为10,采用Adam 优化器对模型权重参数进行更新,训练过程中模型的误差变化曲线如图7 所示。可以发现,随着训练不断进行,模型的训练误差和测试误差均不断下降,下降速率先快后慢;当训练至600 轮次左右时,模型误差逐渐稳定;训练完毕后,模型的训练均方根误差(RMSE)为0.015 9, 测试RMSE 为0.013 0。
进一步分析模型在训练集和测试集中的具体预测表现(图8),可以发现,模型对于单井测试产量的预测值与真实值之间整体吻合程度较高,模型在训练集中的平均相对误差(MRE)为0.098、测试集中的MRE 为0.117,由此说明模型能够学习各单井输入序列与测试产量之间的复杂映射关系,并对大多数样本实现相对准确的测试产量预测。
为对比本模型与其他机器学习模型的预测效果, 分别采用多层感知机(MLP)和常规RNN 模型进行对比训练。针对MLP 模型,其基本结构决定了无法以压裂段序列的模式进行输入,因此将各压裂段的输入因素以单井为对象进行笼统处理,其中地质储量和裂缝体宽度采取求和处理,其余因素则采取平均化处理,以此对按压裂段开展因素精细描述的作用进行对比分析。针对RNN 模型,其基本结构与本模型类似,但模型中未引入Mask 屏蔽机制,训练过程中直接将末尾补0 后的压裂段因素序列作为输入, 以此对Mask 屏蔽机制的作用进行对比分析。
上述两种模型与本模型的对比结果如图9 所示, 其中MLP 模型的预测效果最差,模型预测值与真实值之间的吻合程度较低,大多数预测值集中分布在(20 ~ 30)×104 m3/d,模型训练MRE 为0.432、测试MRE 为0.518,由此可以在一定程度上说明以单井为对象的笼统参数表征无法准确反映单井实际情况,从而极大地限制了模型精度。同时,可以发现, RNN 模型的表现明显优于MLP 模型,模型预测值与真实值的吻合程度显著提升,训练MRE 降低至0.157、测试MRE 降低至0.186,降低幅度分别为63.7% 和64.1%,由此说明通过对单井各压裂段的因素进行精细描述,并结合RNN 循环神经网络结构, 能够实现对于单井产能的相对准确预测。另外,对比本模型与RNN 模型的预测表现可知,通过在RNN 模型中引入Mask 屏蔽机制,模型的预测效果得到了进一步提升;本模型的训练MRE 为0.098、测试MRE 为0.117,相对于RNN 模型误差的下降幅度分别为37.6% 和37.0%,相对于MLP 模型误差的下降幅度分别为77.3% 和77.4%,展现出了优异的预测性能。
1)基于压裂水平井生产物理过程分析,认识到产能智能预测需要以压裂段为单位进行特征融合处理,各压裂段之间存在顺序关系,单井产能是由初始压裂段到末尾压裂段依次累计作用结果,并且各单井的压裂段数量不完全统一,因素输入维度存在差异。
2)提出了循环神经网络与Mask 屏蔽机制相结合的产能智能预测框架,其中循环神经网络能够完全匹配压裂段之间的顺序关系和汇聚作用,而Mask 屏蔽机制则能够解决各单井压裂段数量不统一的矛盾。
3)以川南威远页岩气田为例,开展了压裂水平井产能智能预测框架应用,结果显示本模型能够学习各单井输入序列与产能之间的复杂映射关系,训练集相对误差为0.098、测试集相对误差为0.117,较RNN 模型误差的下降幅度分别为37.6% 和37.0%, 较MLP 模型误差的下降幅度分别为77.3% 和77.4%, 展现出了优异的预测性能。
编 辑 罗冬梅
论文原载于《天然气工业》2024年第9期
基金项目:国家自然科学基金面上项目“深层页岩压裂人工干预转向多裂缝动态扩展机制”(编号:52374044)。
排版、校对:张 敏
审核:罗 强 黄 东
点击阅读原文,链接到《天然气工业》官网