本文版权归天然气工业杂志社所有
未经允许,不得转载
和婷婷, 张强. 知识图谱在油气勘探开发中的应用现状与发展趋势[J]. 天然气工业, 2024, 44(9): 55-67.
HE Tingting, ZHANG Qiang. Application status and development trend of knowledge graph in petroleum exploration and development[J]. Natural Gas Industry, 2024, 44(9): 55-67.
作者简介:和婷婷,女,1998 年生,博士研究生;主要从事人工智能、大语言模型和知识图谱、石油勘探开发等方面的研究工作。地址:(163319)黑龙江省大庆市高新技术产业开发区学府街99 号。ORCID: 0009-0000-4022-9270。
E-mail: hetingtingjiayou@163.com
通信作者:张强,1982 年生,教授博士研究生导师;主要从事智能计算与应用、知识表示、石油大数据智能分析与辅助决策等方面的研究工作。地址:(163319)黑龙江省大庆市高新技术产业开发区学府街99 号。ORCID: 0000-0001-8896-0994。
E-mail: nepu_zq@163.com
和婷婷 张 强
东北石油大学计算机与信息技术学院
摘要:在油气能源产业中,知识图谱对油气资源的高效勘探开发有利于推动石油天然气工业的高质量发展。知识图谱作为一种基于人工智能和知识表示的新兴技术,逐渐成为油气勘探开发领域的研究热点和重点。为此,按照物探、钻完井、测井和油藏工程4 大领域系统总结了知识图谱在石油勘探开发中的应用现状,在此基础上,结合大语言模型,剖析了知识图谱在石油勘探开发中所面临的挑战,并展望其未来发展方向。研究结果表明:①在油气勘探开发领域,知识图谱结合深度学习模型和专家经验,广泛应用于地质数据管理、信息解释、异常检测与分析、智能决策支持、故障诊断、测井数据综合分析、测井资料解释、测井曲线自动匹配、油藏描述、油藏数值模拟、油藏管理及设备故障维护,实现了数据质量提升、资料利用率提高和油藏动态实时监控等功能,有效提高了勘探开发效率;②知识图谱在油气勘探开发中面临数据多源异构、专业知识获取与表示、知识更新和维护、算力资源需求、跨学科协作与应用等挑战,需要在技术、标准、协作机制等方面进行持续探索和创新,以充分发挥知识图谱在石油勘探开发中的潜力。结论认为:①知识图谱技术具有广阔的应用前景,可开展油气勘探开发中的知识搜索、知识推荐、知识共享、智能问答以及知识推理、知识计算、知识图谱与大语言模型融合;②聚焦油气勘探开发大模型、基于机理模型和智能模型结合的仿真模型、多模态技术探索等方面的技术攻关,将推动行业向更加智能化、智慧化、高效化和精准化的方向发展。
关键词:油气勘探开发;知识图谱;物探领域;钻完井领域;测井领域;油藏工程领域;大语言模型
0 引言
随着科技的飞速进步和油气田的大规模勘探开发,地质资料日益丰富,油气生成、运移、聚集等规律的认识得到深化。油气田勘探方法的质量显著提高,精度和深度达到较高水平,新型寻找油气技术的出现大大提高了勘探效率。21 世纪以来,全球油气勘探开发取得显著进展,石油探明储量持续增长,天然气快速发展,非常规油气实现工业化开发, 生产规模不断扩大[1]。然而,中国油气消费规模增长迅速,国内产量增速仍落后于消费需求,供需缺口扩大。由于新的低碳、廉价和商业化能源难以规模化, 油气仍将是中国能源消费中的战略资源[2]。
油气资源的逐渐枯竭和能源需求的不断增长, 对于更有效率、更精确的勘探开发技术的需求也日益迫切。在这个背景下,知识图谱(Knowledge Graph, KG)作为一种基于人工智能和知识表示的新兴技术, 逐渐成为油气勘探开发领域的研究热点之一。知识图谱是一种结构化的知识表示方法,可以将大量的地质、地球物理、工程等多源数据整合并构建成具有语义关联的知识网络[3]。
在油气勘探开发中,知识图谱不仅可以帮助管理和分析地质信息、油气藏数据等复杂数据,还能够实现油气田开发的智能化决策支持。通过知识图谱技术,油气勘探开发人员可以更准确地识别潜在油气资源、评价油气藏储量、优化油气田开发方案, 从而提高勘探开发效率和资源利用率[4]。如Zhou 等[5] 借助知识图谱中的行业专家知识反哺数据挖掘,提高测井解释的准确性。刘国强等[6] 创建油气层测井知识图谱,并在此基础上提出知识驱动的神经网络油气层评价模型,有效地解决了油气层识别中存在的鲁棒性问题,推动了油气层智能识别的发展。龚仁彬等[7] 实现了一体化油气勘探开发知识成果共享、搜索、推荐与智能化应用。刘兴昱[8] 提出一种基于循环神经网络的迁移学习模型来提升在勘探开发领域专有名词语义匹配的准确率。邓小亚[9] 提出了石油勘探开发领域的本体构建方法,并以采油工程为例说明此方法的可行性。苗超[10] 设计并实现了基于勘探知识图谱的推理问答系统,能够对复杂知识内容进行深层次推理和解答。
目前,知识图谱用于油气勘探开发的工作渐渐涌现,然而对于这些成果的整理仍缺乏。为此,笔者通过对知识图谱在石油勘探开发领域中应用现状的总结,探讨了其未来的发展趋势。首先,介绍石油勘探开发和知识图谱的基本概念和技术原理;其次, 将详细探讨知识图谱在石油勘探开发中的具体应用, 包括地球物理勘探(以下简称物探)领域、钻完井领域、地球物理测井(以下简称测井)领域和油藏工程领域;最后,将结合大语言模型(Large Language Models, LLMs)展望知识图谱在石油勘探开发中的发展趋势,并讨论其面临的挑战和未来的发展方向。
1 基本概念
1.1 勘探开发基本概述
勘探开发指通过一系列的地质勘探、工程技术和管理手段,从地下油气藏中开采油气资源的过程[11]。油气包括石油和天然气2 大资源,笔者以石油资源为例进行说明。
石油勘探开发过程包括地质勘探、钻井、测井、评估储量、设计开发方案和实施生产等多个环节[12]。这些环节互相紧扣、相互依存、密不可分。地质勘探旨在确定潜在的石油储集层的位置、规模、性质和分布特征,是运用地质学、地球物理学和地球化学等学科,系统地寻找、识别和评价地下石油资源的过程。地质学家和地球物理学家利用如地震勘探、地表地质调查、岩心采集等勘探手段寻找地下含有石油的地质构造和地质体系。经过地质勘探,将发现储油区块。钻井工作即利用专业设备和技术,在预先选定的地表位置,向下或者一侧钻出一定直径的井眼,钻达地下石油层。钻井是石油勘探与开采的重要环节和关键手段。测井是通过测量岩层的电化学特性、导电特性、声学特性和放射性等地球物理参数来获取地下信息的一种方法,是应用地球物理的方法之一。在石油钻井过程中,钻至设计深度后必须进行测井,又称完井电测,以获取石油地质和工程技术资料,作为完井和油田开发的基础数据, 这类测井称为裸眼测井。在油井下完套管后进行的测井称为生产测井或开发测井。测井的发展经历了模拟测井、数字测井、数控测井和成像测井4 个阶段[13],目前正在跨入智能测井时代。储量综合评价指根据油田的性质、产能、丰度、规模和埋藏深度等因素对储量进行全面评价,以衡量勘探的经济效果,并指导储量的合理开发利用。油田储量的规模和品质直接影响勘探和开发的效果及经济效益。由于各油田储量的差异和条件不同,无法用统一指标衡量,必须进行综合评价[14]。该过程涉及地质学、地球物理学和地球化学等多个领域。
总的来说,石油勘探开发是一项复杂而系统的工程项目,涉及地质学、地球物理学、地球化学、工程技术和经济管理等多个学科领域,需要多学科、多技术的综合应用。随着石油资源的逐渐枯竭和勘探开发技术的不断创新,石油勘探开发领域也面临着日益严峻的挑战和新的发展机遇。
1.2 知识图谱基本概述
在数字化信息时代,人类活动与自然界及社会互动产生了数据海洋,这些数据信息封装了关于客观世界规律性发展的丰富非结构化知识,如文本、图像、音频和视频等。为了使计算机系统能够有效处理这些数据,必须对其进行语义理解,剖析非结构化信息中的语义元素以及它们之间的相互联系,进而将这些信息转化为结构化数据,以便于存储、检索和进一步分析。知识图谱是一种将数据结构化并与已有的结构化数据进行关联的方式,以便更好地表示和组织知识。知识图谱技术是知识图谱建立和应用的技术, 是融合本体建模、知识表示、信息抽取和知识推理等方向的研究,于2012 年由谷歌公司提出[15]。
目前,关于知识图谱的准确定义尚未形成统一标准。维基百科将其定义为谷歌公司用于构建语义网络和优化智能搜索的一种知识库[16]。具体来说, 知识图谱采用三元组的形式,将现实世界的实体及其相互关系以结构化的方式进行存储,可以表示为G=(E,R,S),其中G 是知识库,E 是实体集合,R 是关系集合,而S 是包含在R×E×E 中的三元组集合。每个三元组通常代表了特定领域内的一条事实,包括头实体、尾实体以及它们之间的关系。在某些情况下, 这些“关系”被称为“属性”,相应的尾实体则被视为属性值,这些属性值可以是实体的对象,也可以是数字、日期和字符串等文本类型对象,甚至是音频、视频等媒体对象。石油勘探开发知识图谱以结构化的形式描述石油行业的概念、实体及其相互关系。
尽管当前的知识图谱大多采用三元组的形式来表达各类知识,但其在知识表示上的内涵远超出了简单的二元关系所构成的三元组。知识图谱实质上涵盖了更为细粒度和多层级的语义单元,包括实体、类别、属性和关系等,这些语义单元之间存在着复杂的关联。如一个盆地可能包含一个至多个油田,一个油田可能包含一个至多个油藏。
知识图谱在逻辑上可以划分为模式层和数据层。在模式层中,节点用于表示本体概念,边表示本体中概念间存在的关系。知识图谱构建过程可看作本体的实例化数据填充过程,其中数据层能看成本体中概念的实例。构建知识图谱是一个复杂的过程,主要有3 种不同的方式:自底向上、自顶向下以及将两者混合的方式[15],其中涉及本体构建、信息抽取、知识融合、实体链接和知识推理等多个关键技术。本体构建是对现实世界中特定领域概念、实体及其关系的规范化描述;信息抽取是从非结构化或半结构化数据中提取有用信息的过程;知识融合是将来自不同数据源的知识进行整合,以便形成一个统一的知识体系;实体链接是将文本中的实体链接到知识图谱中相应节点,从而建立起实体与知识图谱之间的关联;知识推理是基于已有知识进行推理,得出新的知识或结论的过程。
1)自底向上方式侧重于构建数据层,利用知识抽取相关的技术获取文本中的实体和关系,然后将抽取得到的数据添加到知识图谱中。对数据层中的数据向上进行归纳抽取出概念知识,进而构建知识图谱模式层。该方法对于大数据量的知识图谱构建有不错的效果,但模式层构建相对困难且准确性难以保证。
2)自顶向下方式通常先定义知识图谱的本体, 从顶层出发逐步细化模式层的层次,可通过本体编辑器或手工构建方法来构建知识图谱模式层,然后将数据添加到概念中。该方法可确保知识图谱构建过程中领域知识概念和类别层次是正确的,但是人工依赖性较强,对于小规模的领域知识图谱构建较为合适。
3)第3 种方式为结合上述2 种方法构建知识图谱。首先,对已有的知识和数据进行知识抽取,并在此基础上构建初步的本体,然后对于新知识同样进行归纳总结,在此基础上更新原有知识图谱的模式层。但模式层的构建相对于前2 种方法具有较大难度。
以石油勘探开发领域知识图谱自顶向下构建的方式为例,总体架构如图1 所示。具体流程为:①参考石油勘探开发领域的相关知识和文献研究,明确领域本体的范围,定义关键实体、属性和关系。例如,确定“油田”“油藏特征”“钻井平台”“地貌”等实体, 并定义它们之间的关系,如“油田包含多个油藏”“钻井平台位于特定地表上”。②从多源异构的语料中获取信息,对于如钻井日志、地震数据和生产数据等的结构化数据采用本体配置、知识映射、融合消歧等手段,处理如勘探报告、设备维护记录等半结构化数据, 采用人工规则抽取、包装器归纳、自动抽取等手段, 对于技术论文、项目报告和会议记录等非结构化数据, 通过一系列自然语言文本处理工具获得。③对于非结构化文本进行数据标注以及采用信息抽取模型进行训练验证和部署;④将所有处理好的数据进行知识抽取。⑤采用实体消歧、属性消歧和知识补全等手段对异构数据进行处理。⑥对经过前期过程后获得的结构化数据进行知识存储和检索,某些缺失的或者隐藏的知识通过推理手段获取,使得所构建的知识图谱更加完整。⑦将构建完成的知识图谱用于石油勘探开发下游任务中,如物探领域中的地质构造分析、钻完井领域中的钻井路径优化、测井领域的储层评价和测井数据解释、油藏工程领域中的开采优化等任务。
石油勘探开发领域,利用知识图谱技术,能够构建用于表示、组织和管理石油勘探开发相关知识的数据结构,如地质信息、油藏数据和工程技术等, 帮助勘探开发人员更好地理解和利用这些知识,从而更准确地识别潜在油气资源、评价油藏储量和优化油田开发方案,从而提高勘探开发效率和资源利用率。
2 知识图谱在石油勘探开发中的应用
基于知识图谱在石油勘探开发领域的学术研究成果和研究热点,笔者重点梳理总结了知识图谱在物探、钻完井、测井和油藏工程4 个领域的应用现状。
2.1 物探领域
物探是地球科学的重要分支,通过物理方法和仪器设备探测和研究地球内部结构、性质及地下资源。知识图谱作为一种新兴的知识表示和管理技术, 为解决物探领域的数据管理、解释和应用问题提供了新的思路和方法[17]。物探方法包括地震勘探、地电勘探、地磁勘探、重力勘探和电磁勘探等。其中, 地震勘探最为广泛,通过人工或自然地震波在地下的传播和反射,探测地下构造和岩层性质。其他方法则通过测量地球的物理场参数变化来获取地下信息。
目前,知识图谱在物探领域的应用主要集中在以下几个方面:
1)数据整合与管理。知识图谱可以帮助整合各种物探数据,包括地震数据、地磁数据和重力数据等, 构建一个统一的数据存储和管理系统。通过知识图谱技术,可以实现数据之间的语义化表示和关联,方便用户快速查找和访问数据。
2)地质信息解释。利用知识图谱技术,地质学家和地球物理学家可以将多源数据进行关联,帮助更好地理解地下地质结构和油气成藏规律,自动化地进行地质信息的解释和分析,提高准确性和效率。
3)异常检测与预测分析。结合深度学习和数据挖掘技术,知识图谱可以对物探数据进行异常检测和预测分析。通过建立物探数据的知识图谱,能够发现数据之间的潜在关联和规律,预测地下地质结构、油气资源分布等,为油气勘探和开发提供科学依据。
4)智能化决策支持。结合知识图谱技术和人工智能算法,可以构建智能化的物探数据分析和决策支持系统[18]。该系统能够根据地质条件、勘探目标和经济指标等因素,生成优化的勘探方案和工作流程, 提高勘探效率和成功率。
随着科技的不断发展,知识图谱在物探领域的应用越来越广泛。曹士炳等[19] 提出,现代石油勘探节奏加快以及高效勘探的需求对单一人工进行地震资料解释提出了严峻挑战,认为近年来人工智能在石油地震资料处理解释中已得到了广泛的应用,其中包括地震相识别、测井岩相识别、智能层位追踪与解释、地震属性提取、储层预测等方面的应用。此外,杨存等[20] 还将地质先验知识引入知识图谱,构建地下复杂沉积模式的计算机高层语义认知系统,利用知识图谱对地质先验知识的计算机表征,引导沉积微相的识别与建模,形成知识图谱引导的沉积微相智能识别技术,实验证明该技术提高了沉积微相的预测精度。
目前,知识图谱主要针对信息抽取部分,信息抽取指从自然语言文本中提取出特定领域或主题的关键信息。Zhu 等[21] 基于开放链接数据,实现从文档中提取本体并生成地质领域词汇,设计地质数据的知识图谱框架,再根据提取的本体进行实体信息抽取,建立地质文档的知识图谱;Wang 等[22] 设计了包含21 个实体标记的命名实体标注模式,建立了包含200 000 多个词的语料库和包含53 339 个词的精校语料库用于训练石油地质实体识别器,实验证明该研究对于设计实体标注模式和促进石油地质科学领域的大规模文本挖掘是有效的。
除此之外,非常规石油资源也是石油行业的热点领域,尤其是致密油的聚集场所,已突破闭圈概念[23]。面对松辽盆地北部主力甜点层空间展布规律难以刻画的问题,张婉婷等[24] 通过深度学习技术建立储层参数和地震属性及其空间结构之间的规律关系,利用人工智能储层属性预测模型,实现井间非插值高分辨率的储层预测,达到精细刻画薄互层砂体的目的。这对深度学习与知识图谱的融合,从而更好地实现油层的预测精度具有重要研究价值。
尽管知识图谱在地球物理勘探领域展现出广泛的应用前景,但在实际应用中仍然存在一些尚未解决的难点问题[25]。如物探领域涉及大量专业术语和复杂的地质概念,从自然语言文本中准确抽取这些术语和概念,以及它们之间的关系,具有较高的难度。当前的自然语言处理(Natural Language Processing, NLP)技术在处理专业领域文本时,常常面临语义理解不准确、关系抽取不全面的问题。物探不仅需要地球物理学知识,还需要结合地质学、地球化学和地理信息科学等多个领域的知识。如何将这些跨领域的知识有效集成,构建一个跨领域的知识图谱,是一个尚未解决的难题。
2.2 钻完井领域
石油工程的智能化已成为行业发展的必然趋势, 其中智能钻完井技术因其能够显著提升钻井效率和目标层钻遇率、降低施工成本,被视为石油领域的前沿热点[26]。人工智能和大数据技术在解决复杂非线性问题方面展现出强大的非线性拟合和信息挖掘能力。智能钻完井技术融合了大数据、人工智能、信息工程和控制理论等先进技术,通过将地质和工程大数据、智能装备及智能算法深度应用于钻完井场景,实现对钻完井过程的精细表征、预测、闭环控制、精准导向和智能决策,从而大幅提升钻井效率并降低成本。智能钻完井技术的研究可分为智能化理论/ 方法和智能化工具装备2 部分[27]。
智能化理论/ 方法利用机器学习和深度学习等人工智能算法,结合钻完井过程中的钻—测—录多源数据,解决诸如地质属性精细刻画、机械钻速预测等复杂非线性问题[28]。智能化工具装备则基于智能模型提供的钻完井方案,通过通信控制系统自动执行相关指令,实现自动化操作。通过这种方法,智能钻完井技术在提升钻井效率和降低成本方面具有显著优势, 为石油工程的智能化发展提供了强有力的支持[29]。
随着勘探开发逐步面向深层,面临的地质条件更加复杂,钻完井难度逐步加大。在塔里木盆地和四川盆地,地质条件更加复杂,存在诸如超高温超高压、多压力系统、盐膏层和高陡、地层坚硬及可钻性差、富含酸性流体等问题[30]。智通云联协助研究院所、油田企业围绕钻完井设计过程和具体场景,集成不同数据系统,对各类油田设计报告、标准、专题研究、科研及现场作业数据等数据资产进行集中管理和互联互通,构建钻完井知识图谱与知识库,点、线、面多维延展,从某一个名词就可以延展一条或多条完整的知识脉络,实现知识的有效管理与可视化。
知识图谱技术在智能钻完井领域展现出独特的优势,通过整合和管理钻井过程中的异构数据,提升数据利用效率,提供有力支持。如关联地质信息、钻井数据和测井数据方面,通过构建地质属性的综合图谱[31],利用机器学习和深度学习算法,精细刻画地质属性,为钻井决策提供准确的地质背景支持。如徐楷等[32] 阐述了机器学习技术在钻井工程优化设计、井下钻柱状态控制、风险监测评估以及辅助决策方面的实际应用。
在智能钻完井过程的自动化决策支持方面,通过结合人工智能算法,能够实时监控钻井参数和设备状态,并结合历史数据和经验规则,自动生成优化的钻井方案。知识图谱与人工智能的结合不仅有助于识别潜在风险、预测钻井过程中可能遇到的问题, 还能提供相应的解决方案,降低钻井风险和成本。
在钻井过程中,设备故障和异常情况时有发生。通过关联设备运行状态、历史故障数据和环境参数, 构建设备故障诊断的知识图谱,进行实时数据分析和比对,可以及时检测异常情况,并结合故障诊断规则快速定位故障原因,提供维修建议,提高设备运行的可靠性和稳定性。
知识图谱还可以将专家经验和历史钻井数据结构化存储,形成可查询、可利用的知识库。这对于新手工程师的培训和知识传承具有重要意义。通过查询知识图谱,工程师可以快速获取前人的经验和最佳实践,提高技能水平和工作效率。综合分析各类数据,知识图谱实现了钻井过程的精准导向。结合实时数据和经验规则,智能钻完井系统可以实时调整钻井参数,优化钻井路径,提高钻井效率。例如, 在复杂地层中,知识图谱可以提供最佳的钻井参数从而避免不必要的钻具损耗和停工。
尽管知识图谱在智能钻完井领域展现出显著潜力,其应用仍面临诸多挑战。钻井过程对实时性要求极高,需要分析实时数据和快速处理,及时生成优化方案和决策建议。并且,知识图谱的构建和更新较为耗时,如何在保证高效性的同时满足实时性要求是一个亟待解决的问题。此外,知识图谱的构建和优化依赖大量高质量的标注数据,但在智能钻完井领域,获取这些数据既耗时又昂贵,需大量行业专家参与。如何高效获取和生成高质量标注数据, 减少对专家知识的依赖,是另一个亟须解决的问题。
2.3 测井领域
测井是利用专门的仪器设备,在钻井过程中或钻井完成后,沿井眼进行一系列测量,以探测地层的物理特性随深度变化的技术。测井技术主要用于发现和评估地下油气藏,以及评估油气储量和产量。测井是通过将各种探测仪器下入钻井井眼中,测量地层的电磁、声波、放射性、热、力等物理参数[33]。这些测量数据反映了地层的各种物理性质,能够帮助地质学家和工程师了解地下地质构造和资源分布情况。测井技术自1927 年首次应用以来,经历了以下几个发展阶段[34] :
1)模拟测井。最早的测井方法,使用模拟信号记录地层特性。
2)数字测井。引入数字技术,记录数据更加精确和可靠。
3)数控测井。利用计算机控制和处理测井数据, 提高数据处理速度和精度。
4)成像测井。通过高分辨率成像技术,提供详细的地层图像,提升地层结构识别能力。
测井方法多种多样。如:电测井测量地层的电阻率和电导率,反映地层的含水性和孔隙度;声波测井利用声波在地层中的传播速度,探测地层密度和弹性特性;放射性测井通过测量地层中的天然放射性或注入放射性同位素,评估地层矿物组成和孔隙度;热测井测量地层温度变化,分析地层热导率和热扩散率;力测井测量地层的机械性质,如应力、应变和弹性模量。
然而,海量测井数据的复杂性给数据管理、分析和应用带来了挑战。知识图谱的应用正逐渐展现出其巨大的潜力,为测井数据的管理、分析和应用提供了新的思路和方法。
测井数据通常来自多个设备和系统,数据格式和结构各异。知识图谱通过定义实体、关系和属性, 能够将不同来源的测井数据整合在一起,实现数据的关联和互通。这不仅提高了数据的利用效率,也为后续的数据分析和挖掘奠定了基础。尚福华等[35] 进行了面向测井处理解释方面的本体构建方法研究。Zhou 等[5] 开发自动化测井解释服务系统,通过在石油勘探开发的应用,实验证明比传统机器学习方法准确率高出7.69% 以上。
知识图谱能够构建复杂的关系网络,通过图算法和机器学习,对测井数据进行智能化分析[36]。例如, 可以基于知识图谱识别测井数据中的异常值和模式, 预测地层流体性质和油气藏分布,为勘探决策提供科学依据。沈文娟[37] 基于测井相关业务流程,结合生产实际需求,以盆地、油气田、油藏为主线,对测井解释过程中的各种概念、模型进行抽象,并映射出本体关系,构建测井领域知识图谱本体模型。
在测井解释过程中,传统的解释方法往往依赖于专家的经验和知识。知识图谱可以将专家的知识和经验数字化,构建专业知识库,为解释模型提供优化依据[38]。同时,通过不断学习和更新知识图谱, 可以不断完善和优化解释模型,提高解释结果的准确性和可靠性。尚福华等[39] 研究了一种在知识库基础上,实现解释模型参数智能优选的测井数据处理方法,能够初步实现复杂储层测井处理解释从知识获取到参数和模型智能优选的全过程。
专家的知识和经验是宝贵的资源。知识图谱可以将这些知识和经验数字化,便于存储、检索和共享[40]。这不仅可以促进知识在团队内部的流通和传承,还可以为新员工提供学习和成长的平台[41]。熊文君等[42] 针对多口井的测井曲线深度校正工作量大, 工作效率低的问题,提出多智能体深度强化学习方法(Multi-Agent Deep Reinforcement Learning, MARL) 来实现多条测井曲线自动深度匹配,研究结果表明该方法可以自动完成多口井、不同测井曲线的深度校正任务,在油田实例应用中对比分析多种方法,验证了该工作能够识别和对齐测井曲线特征序列上更多的细节,有较高的深度匹配精度。
知识图谱在测井领域的应用仍然面临着数据质量、知识表示、算法效率等方面的挑战,需要不断地进行技术创新和方法改进。未来,可以通过深度学习、增强学习等技术手段,进一步提高知识图谱在测井领域的应用效果和智能化水平。
综上所述,知识图谱在测井领域的应用正处于不断探索和发展的阶段,尽管仍然面临着数据质量、知识表示、算法效率等方面的挑战,但相信随着技术的进步和应用的深入,知识图谱将为测井领域带来更多的创新和价值。
2.4 油藏工程领域
油藏工程是利用地质、工程、经济等多学科知识,对油气储集层进行开发和生产的过程,是石油勘探开发的重要组成部分,包括油藏评价、井筒设计、增产技术等多个方面,旨在实现石油资源的有效开发和利用,提高油藏的产量和采收率[43]。其核心任务是建立油藏模型,通过数值模拟和物理实验预测油藏的生产性能,制订合理的开发方案。
油藏工程的主要工作流程包括油藏描述、油藏数值模拟和油藏管理。油藏描述是通过地震资料、测井资料、岩心分析等手段,确定油藏的地质构造、储层和流体性质。油藏数值模拟是利用油藏描述结果, 建立油藏模型,通过计算机模拟油气在油藏中的流动过程,预测油藏的生产行为。油藏管理是根据数值模拟结果,制订和调整开发方案,优化生产措施, 监控油藏开发效果[44]。
知识图谱技术在油藏工程中的应用研究正逐渐兴起,目的是通过整合和管理大量异构数据,提高数据利用效率,为油藏工程提供智能决策支持。其能够将油藏工程中涉及的各种数据(如地质信息、测井数据、生产数据等)进行关联,构建全面的油藏知识图谱。知识图谱在油藏工程领域的应用包括以下几个方面。
通过整合地震资料、测井资料、岩心分析等多源数据,构建油藏的全面地质属性图谱。利用机器学习和深度学习算法,知识图谱能够对地质数据进行深入分析,精细刻画油藏的非均质性和复杂结构, 提高油藏描述的准确性。例如,通过知识图谱技术, 可以更精确地预测油藏的空间分布和储层变化,为油藏数值模拟提供可靠的地质模型。斯伦贝谢建立的Studio Manager 平台将地质学、工程和油藏模型等方面的知识进行统一管理,形成内外部数据的知识图谱集成,为其Petrel 软件系统提供支撑。
知识图谱集成油藏描述结果和生产数据,构建油藏的动态行为图谱。结合深度学习算法,知识图谱能够实时更新油藏模型,提高数值模拟的精度和效率。同时提供实时数据支持,优化数值模拟参数, 提高结果的可靠性。油藏工程师可以快速获取和整合各类数据,构建更为精确的油藏模型,预测油藏的生产行为。吴雪莹等[45] 提出在油藏地质领域可以通过构建知识图谱将地质知识结构化、有序化存储, 通过对知识库的检索实现对地质知识的高效管理和应用,为油藏地质的分析、评价和开发带来极大便利。
知识图谱技术通过关联油藏描述、数值模拟和生产数据,构建油藏开发的全流程知识图谱[46]。结合历史数据和专家经验,可以实现油藏开发的智能决策支持,实时监控油藏状态,识别潜在风险,提供优化的开发方案,实时调整生产措施,提高采收率,降低开发成本[47]。刘昕等[48] 提出面向业务决策的油藏知识图谱构建,以业务决策为切入点,定义油藏实体类别、实体间关系和实体属性,根据定义好的模式层从异构数据中进行知识抽取,自顶向下构建油藏业务知识图谱,设置服务油藏业务决策的推理规则, 更好地实现业务决策。
面对油藏工程中设备故障和异常情况,通过实时数据分析,知识图谱能够及时检测出设备异常情况,并结合故障诊断规则,快速定位故障原因,提供维修建议,提高设备运行的可靠性和稳定性。卞嘉楠等[49] 针对关键设备故障稀疏的问题和故障诊断的需求,提出基于知识图谱和多任务学习的工业生产关键设备故障诊断模型,实现对故障根因的推断, 从而达到诊断目的。
知识图谱技术在油藏工程领域展现出显著潜力, 能够整合和管理大量异构数据,提供智能决策支持。然而,其应用仍面临数据获取与处理、模型构建与更新、实时性要求、领域知识依赖、解释性和透明性、计算资源等诸多挑战。
综上所述,笔者按照物探、钻完井、测井和油藏工程4 大领域全面梳理了知识图谱在石油勘探开发中的应用(表1),包含4 大领域的应用重点、知识图谱在其中的作用、优点以及局限性。
3 挑战与未来发展方向
3.1 知识图谱在石油勘探开发中应用时面临的问题与挑战
石油勘探开发过程中产生的数据种类繁多,包括地震数据、地质数据、测井数据和生产数据等。这些数据在格式、来源、精度和语义上存在显著差异, 给数据整合带来了巨大挑战。如何高效地将这些异构数据进行整合,构建一个统一的知识图谱,是当前面临的主要难题。
石油勘探开发涉及大量复杂的专业知识,这些知识往往隐含在专业文献、报告和专家经验中。如何从这些非结构化数据中自动提取有用的知识,并以知识图谱的形式进行表示,是一项具有挑战性的任务。此外,不同领域的专家知识如何进行标准化和系统化表示,也是需要解决的问题。
知识图谱的构建依赖于高质量的数据来源,但实际数据往往存在错误、缺失和不一致等问题。如何保证知识图谱中数据的准确性和可靠性,以及如何有效地进行知识更新和维护,是应用知识图谱过程中亟须解决的挑战。
石油勘探开发中的知识图谱构建和应用需要复杂的算法支持,包括知识抽取、语义推理和关系发现等。这些算法对计算性能和效率要求较高,尤其是在处理大规模数据时,计算资源和时间成本成为制约因素。如何优化算法,提高计算效率,是知识图谱应用面临的重要挑战。
知识图谱技术需要地质学、地球物理学和计算机科学等多学科的深度协作。然而,不同学科之间存在知识体系和研究方法上的差异,如何促进跨学科的有效协作,实现知识图谱在石油勘探开发中的实际应用,是一个复杂的系统工程。
3.2 知识图谱在石油勘探开发中的应用前景
在石油勘探中,通过知识图谱技术可以构建涵盖地质特征、勘探数据和开发案例的知识库。地质工程师可以通过自然语言查询(如“某地区的油藏类型”)快速检索到相关信息,知识推荐系统可以根据用户的查询历史和行为模式,推荐相关的勘探方法、技术文章和专家信息。通过智能问答系统,用户提出问题,系统能够解析问题意图,结合知识图谱进行准确回答。
在石油勘探开发中,数据量庞大且复杂,将深度学习与知识图谱相结合,可以通过对历史钻井数据和地质模型学习,推理出新区域可能存在的油藏分布,指导钻井决策。此外,利用知识图谱中的实体和关系的语义信息,结合深度学习模型,可以通过分析油田的特征,预测新勘探区域的油田潜力,同时利用历史数据推理出最优的勘探和开发策略。
石油勘探开发涉及复杂的地质关系,知识图谱对这些关系进行建模和分析,与图神经网络(Graph Neural Networks, GNNs)技术结合,通过GNNs 对油藏特征进行高效计算和模式识别,对复杂关系深度计算,发现隐藏的模式和规律,从而提高勘探的准确率和效率,为地质分析提供新的视角。
大语言模型具备持续学习和自我更新的能力, 可以从大量文献和数据中学习知识,与知识图谱结合,可以增强知识表示的准确性和广度,实现知识库的动态更新,及时反映最新的研究成果和勘探数据, 提供更全面的知识服务。如表2 所示,针对石油勘探开发中的实例应用,大语言模型与知识图谱协同工作,实现优势互补,从而提升石油勘探开发的效率、准确性和智能化水平。
3.3 石油勘探开发大模型探索
石油勘探开发大模型融合大语言模型技术和石油行业专业知识,是一种结合石油行业专业知识和大数据分析能力的人工智能系统,旨在通过智能化的方法提升石油勘探开发的效率和质量,解决行业面临的挑战,并推动石油行业的数智化转型升级。
这种大模型重点应用于知识泛化的领域,即从海量规则、知识和经验中发现解决问题的办法。包括面对研究层面的资料阅读与整合并回答问题;面向管理决策的针对报告中关键问题的分析和决策; 面向生产管理过程中各类综合状态下的分析和研判,提供优化的方向;面向企业风险管理中的各类问题表述与企业安全制度法规的对比、分析与预测;面向组织管理过程中知识固化、教育传承和新知识创造。
油田技术服务企业中,研发了很多出色的产品, 目前典型代表如胜软科技、智通云联等企业,他们的目的不是构建某一个行业的大模型系统,而是提供一种帮助企业构建特定领域大语言模型的产品。如胜软科技的油气大模型,不仅基于多模型的语料训练、调优、场景化及部署平台,且内置图形化、可视化的低代码开发和训练模块,开发人员可以通过图形操作与配置,轻松搭建强大、边界的智能服务应用,企业基于其平台可以高效的开发专业型场景应用。
过去几年来,石油领域广泛应用深度学习解决地震处理与解释、储层识别、油藏模型模拟、采油气实时数据分析优化等具备大数据特征的问题[50]。重点应用领域包括:基于卷积神经网络的地震数据成像分析和构造及属性自动提取[51] ;基于深度学习储层参数自动提取(如浊积岩体识别);基于强化学习的钻井轨迹设计及钻井提效;采油生产优化与产量预测;基于深度网络的油藏模拟与分析的代理模型; 基于强化学习的采油注水及压裂方案设计等。
深度学习在储层地质建模和油气藏数值模拟2 个领域通过代理模型来替代传统属性算法和流体力学方程,已经取得了广泛的技术突破。张凯团队提出了一种新颖的混合递归卷积网络(Hybrid Recurrent Convolutional Network, HRCN)[52],用于油藏自动历史拟合以及不确定性量化。这种代理模型可开展油藏历史的拟合、敏感性分析和不确定性评估,帮助工程师优化油气藏的开发策略和管理决策,且相比传统流体力学模拟的优势明显。传统的油藏数值模拟通常需要大量的计算资源和时间,而代理模型仅一个神经网络,可在几秒内完成单次模拟。
此外,物理信息神经网络(Physics-Informed Neural Networks, PINN)是一种结合了深度学习和物理学知识的机器学习模型。它在传统神经网络的基础上,通过在损失函数中加入物理信息项(如物理定律或偏微分方程),使得模型在训练过程中不仅拟合数据,还遵循物理法则。这样的设计使得物理信息神经网络在数据较少或噪声较大的情况下,仍能进行有效的训练和预测,提高模型的泛化能力。物理信息神经网络通过融合物理先验和数据驱动的方法,为油气领域提供了一种新的解决方案,尤其在数据稀缺或复杂地质条件下,物理信息神经网络的应用可以显著提高油气勘探和开发的效率和准确性。严格来说, 物理信息神经网络也是代理模型的一种,但相对于纯粹深度学习模型,其泛化和稳定的难度要更大一些, 目前应用尚在发展。
Open AI 陆续推出了图像和视频领域的大模型多模态功能,这对于通用人工智能(Artificial General Intelligence, AGI)发展意义极其重大。但是这些多模态尚属于通用智能领域,与油气领域的多模态则并不相同。如在勘探开发大模型构建的业务流程中,更多是将地表和井筒的采样点数据,结合重磁、电遥及地震数据,来计算和创建一个地下的构造模型和属性模型;进而通过网格化,形成一种对于地下物理实体的数字化、抽象化的表达。地质图旨在促进油气专家能够理解这种复杂三维体的认知,而进行某一维度的层面表达。同样为图件的地质图,油气地质图虽然种类多样,但却有着非常规范的技术标准。
因此,很多团队已经从地震体、地质体和地质图件等开启了面向大模型的油气多模态扩展研究,然而由于缺乏大规模且高质量的训练数据,仍面临较大挑战。
4 结论
1)在石油勘探开发领域,知识图谱结合深度学习模型和专家经验,广泛应用于地质数据管理、信息解释、异常检测与分析、智能决策支持、故障诊断、测井数据综合分析、测井资料解释、测井曲线自动匹配、油藏描述、油藏数值模拟、油藏管理及设备故障维护,实现了提升数据质量、提高资料利用率和实时监控油藏动态等功能,有效地提高了勘探开发的效率。
2)知识图谱在石油勘探开发中面临数据多源异构、专业知识获取与表示、知识更新和维护、算力资源需求、跨学科协作与应用等挑战。面对这些挑战, 需要在技术、标准、协作机制等方面进行持续探索和创新,以充分发挥知识图谱在石油勘探开发中的潜力,推动行业进一步发展。
3)利用知识图谱技术,进行石油勘探开发中的知识搜索、知识推荐、知识共享、智能问答以及知识推理、知识计算、知识图谱与大语言模型融合,聚焦石油勘探开发大模型、基于机理模型和智能模型结合的仿真模型、多模态技术在石油大模型中的探索等方面的技术攻关,这些技术将推动行业向更加智能化、高效化和精准化的方向发展。
编 辑 陈古明
论文原载于《天然气工业》2024年第9期
基金项目:国家自然科学基金项目“CO2 咸水层封存中盖层水力破裂评价数值模拟及优化研究”(编号:42002138)、黑龙江省优秀青年教师基础研究支持计划项目“水驱油藏智能注采调控数字孪生优化模型研究”(编号:YQJH2023073)、黑龙江省自然科学基金项目“基于复杂网络的页岩多尺度裂缝表征及缝网动态扩展机制研究”(编号:LH2022F008)、黑龙江省博士后专项“基于计算智能的油藏精细注水优化模型及算法研究”(编号:LBH-Q20077)。
排版、校对:张 敏
审核:罗 强 黄 东
点击阅读原文,链接到《天然气工业》官网