王鑫泽等| 基于知识工程构建金融监管数智化框架的方法与应用研究(精编版)
文摘
财经
2024-09-27 17:43
北京
基于知识工程构建金融监管数智化框架的方法与应用研究
作者:王鑫泽,国家金融监督管理总局上海监管局;赵光南,国家金融监督管理总局上海监管局;阮伟,国家金融监督管理总局上海监管局。本文为作者的学术思考,不代表所在单位观点。作者感谢匿名审稿人的意见,文责自负。监管数字化智能化(简称数智化)转型正在中国式现代化和加快建设金融强国的使命任务下展开全新图景。数智化的核心是信息与知识,知识工程(Knowledge Engineering)以其可解释性和高透明度的优势,在金融监管领域具有不可替代的作用。作为新时代知识工程的典型代表技术,图技术(Graph Technology)和知识图谱(Knowledge Graph)通过新的知识表示和生成机制,能够处理复杂数据,深化对金融规律的理解,有望成为提升金融监管水平的关键技术。本文旨在探索构建监管数智化的系统方法和框架,全面提高监管的有效性,防范系统性风险,相关研究结果对维护我国金融安全和推进金融强国建设,具有现实意义。主要贡献如下:第一,以知识工程方法论为引导,实现金融监管的特定功能为目标,创新性地提出一套金融监管数智化框架建设的方法论,填补了该领域的空白。第二,首次提出实践中使用图技术系统地改进监管效能的证据,说明建设以知识图谱为主体的金融监管知识工程具备可行性。第三,首次提出知识工程赋能“五大监管”的知识机制,对监管数智化理念进行了前沿探索,指出实现监管数智化的全新方向,扩展了监管数智化未来应用的场景。金融监管数智化可以从技术和功能两个维度来界定。在技术维度,金融监管数智化是数字化时代通用技术向监管领域的推及。数字化、智能化有众多学说和技术流派,其典型定义中包含的“理念、价值、组织、治理、环境”等核心概念显示,数智化的技术属性必须结合具体应用场景,金融监管数智化的特殊性在其功能属性。在功能维度,金融监管数智化是金融监管从自我反思中深化认识,应用信息和数字技术提高效能的主动应对策略。信息、知识和技术是监管决策的要素,也是监管失败溯因分析和监管优化方案的重要内容。数智化为此提供了新的视角,目前相关研究有三个重点方向:一是危机和系统性风险事件驱动金融监管更加重视金融体系的复杂性;二是为金融体系复杂关联性和系统性风险寻找新的分析方法;三是推进监管科技数智化,提高应对系统性风险的监管能力。面对复杂动态系统和风险监管的挑战,全球监管者一致选择将大数据、人工智能作为数字时代的解决方案。但现有的研究不够系统和深入:一是没有研究监管数智化的方法论。金融监管需要专用性数智化方法论,其他场景的数智化架构不能满足监管功能。二是缺乏对数据与监管之间深层机制的研究。数据、信息、知识、智能这四个数智化关键概念中,知识是迈向智能的关键环节。大数据通过知识机制实现监管目标。现有研究肯定了大数据价值,但不清楚在金融监管领域如何实现其价值,也较少涉及数据在监管情境下提供必要洞察和支持有效决策的知识机制。三是没有数智技术的监管效能分析。现有研究大多局限于讨论某些场景的应用,很少涉及数智化改进监管整体效能的表现和证据,不符合数智化系统思维和系统设计的特征。针对上述问题,本文基于知识工程的原理,以实现金融监管的特定功能为目标,提出监管智能化框架建设的方法,探讨支持五大监管的知识机制,并提供了图技术在监管实践中整体提高效能的证据。
金融监管数智化是监管与数字技术相融合的系统工程,工程建设首先要考虑与组织功能属性相一致的专用技术选型,主要解决以下三个问题:为什么要选择知识工程,金融监管知识工程的特点是什么,实现金融监管知识工程的设计要件有哪些。一是金融监管数智化的技术选型。监管数智化是由众多以监管应用为中心的工具和技术组成的监管堆栈,遵从适用性原则,采用知识工程方法,契合风险为本监管模式的技治特征和防范系统性风险的目标任务。知识图谱作为新时代知识工程的典型代表技术,在收集、存储、访问处理、计算分析、可视化等主要领域具有显著的优势,并且既能自成体系,又能与数据仓库、数据集市、商业化智能分析工具(BI)、流程自动化技术(RPA)、自然语言处理技术(NLP)等联合支持监管应用,更具有相关性、实用性和互操作性的特性。二是金融监管知识工程的特点。监管机构与金融机构的数智化有不同的需求和目标,金融监管知识工程不能简单地移用金融机构的大数据架构和人工智能工具,两者间具有在知识获取、表示、推理和管理具有不同的特点:监管机构的知识获取需整合多类金融机构和政府部门的数据,强调互操作性和数据交换机制;监管机构在知识表示和推理方面更关注监管政策、法规要求,其数据模型复杂,需处理异构数据并具备高可解释性和透明度;监管机构的知识管理更注重全面性和一致性,以确保决策的准确性和公正性。三是金融监管知识工程的框架。金融监管知识工程的目标是通过使用自然语言处理、机器学习、信息抽取和实体链接、数据管理和存储等一系列技术,把来自多个部门、多个层级、多个领域,隐含在海量的交易、流水、报表中的数据信息,进行系统化、结构化表示,形成具有逻辑性和层次性的知识图谱,并与监管对象的属性和关系有机地结合起来,构造真实世界中金融关系网络的数字孪生和监管知识体系,进行推理和推断,提高监管人员的风险感知能力和数据驱动决策能力,打造一个数字化智能化的监管生态系统。整体架构上,本文基于实践经验提出构建金融监管知识图谱的逻辑架构,从最底层向上分为六个层次:一是知识存储计算,二是知识构建,三是知识挖掘,四是知识分析,五是知识服务,六是知识应用。架构的基础是金融监管数据资产体系,又分为业务层面的底座(数据的主题域设计、金融监管的知识库)和技术层面的底座(数据管理架构的选型、数据标准化)。监管数智化框架目前仍处于概念模型阶段,其应用的功能和场景设计属于逻辑推演,没有经验可循。但是,知识图谱在监管实践中表现出多种良好特性,具备成为监管数智化关键技术的现实条件。实证结果显示,图数据库具有关联数据的高效处理能力,在处理复杂关联、路径查询等方面具有优势。上海金融监管局已尝试在现有的监管流程中应用知识图谱建模技术,并在市场准入、非现场监测、现场检查、打击非法金融行为等多个领域的重要项目中取得初步成效。这说明,建设以知识图谱为主体的金融监管知识工程具备可行性。上海金融监管局运用知识图谱技术在市场准入监管中识别隐匿的股东关联关系和关联交易;非现场监管中感知企业集群与产业链风险传导,通过优化和整合跨系统数据,深度挖掘企业与企业、企业与个人的关系链路,定量判定企业之间的经济关系及其紧密程度,勾画企业集群类型和产业链形态,形成图谱可视化展示;现场检查中快速穿透资金流向,利用大规模图存储和图计算引擎对交易流水进行分类和聚合处理,识别交易关系,构成全辖资金流向图,支持一键自动可视化查询,平均时耗从传统单表逐一查询方式的“小时级”降至自动化查询的“秒级”;打击违规犯罪行为时精准定位,借助中心度、路径查找等图算法排查退保黑产、不法贷款中介,通过精准追踪、定位违法犯罪分子个人账户,协助公安部门打击了多个犯罪团伙。“五大监管”是党的二十大以来党中央对金融监管的新要求。采用知识工程的技术路线,以知识图谱为主体,加载商业化智能分析工具(BI)、语音/图像识别技术(ASR/OCR)、流程自动化技术(RPA)、自然语言处理技术(NLP)等数字化技术,可以为监管提供强大的分析、决策支持和知识管理能力,更有效地落实“五大监管”的要求。一是知识集成系统对机构监管的支持。监管人员可以一站式获取机构全面的数据,扩大风险感知视野,了解所监管机构与金融系统的关系,从机构维度加固防范系统性风险的基础。二是数据结构化对行为监管的支持。结合知识图谱和多模态识别技术,提高行为监管效率,通过分析非结构化数据如音频、视频等,提升合规判断的准确性和一致性。三是知识互操作性对功能监管的支持。知识图谱加上流程自动化技术,可以高效建立跨领域的金融机构和业务之间的关系,形成统一的工作流程知识图谱,消除传统监管模式“各管一段”的问题。四是复杂关系表现对穿透式监管的支持。知识图谱最擅长呈现复杂关系,是穿透式监管实现“实质重于形式”原则的最有力的工具,为监管机构提供更为深入的系统性风险评估和决策依据。五是动态适应能力对持续监管的支持。通过知识图谱和数据标签技术,实现监管数据资产的高效管理和持续更新,给予监管业务人员准确、及时的知识支持,动态地适应金融系统的变化。本文指出监管数智化框架完善和优化的未来方向:一是探索知识图谱更深层次的应用。二是推进知识图谱与大语言模型的交互融合。三是建立知识工程的顶层设计和数据标准。四是强化监管数据安全体系。
本文为精编版,脚注和参考文献略。全文刊发于《金融监管研究》2024年第8期,1-16页。