一文读懂知识图谱

科技   2024-05-25 08:09   北京  
当前人工智能正在从计算智能、感知智能向认知智能迈进,除了赫赫有名的大模型,知识图谱也是认知智能的重要技术。通过构建不同领域的知识图谱,机器具备了一定的认知智能能力,可以在营销、风控等多个场景中得到有效应用。
01 认识智能

人工智能有三个主要发展方向:计算智能、感知智能、认知智能,属于不同的层次,发展也是不均衡的。

一是运算智能,即快速计算和记忆存储能力。现阶段计算机比较具有优势的是运算能力和存储能力。1996年IBM的深蓝计算机战胜了当时的国际象棋冠军卡斯帕罗夫,从此,人类在这样的强运算型的比赛方面就不能战胜机器了。

二是感知智能,即视觉、听觉、触觉等感知能力。人和动物都具备,能够通过各种智能感知能力与自然界进行交互。自动驾驶汽车,就是通过激光雷达等感知设备和人工智能算法,实现这样的感知智能的。机器在感知世界方面,比人类还有优势。人类都是被动感知的,但是机器可以主动感知,如:激光雷达、微波雷达和红外雷达。不管是Big Dog这样的感知机器人,还是自动驾驶汽车,因为充分利用了DNN和大数据的成果,机器在感知智能方面已越来越接近于人类。

三是认知智能。通俗讲是“能理解会思考”。人类有语言,才有概念,才有推理,所以概念、意识、观念等都是人类认知智能的表现。在认知智能方面,机器的能力也有大幅发展。随着数据红利消耗殆尽,以深度学习为代表的感知智能遇到天花板。认知智能成为当前AI发展的热点,以chatGPT为代表的自然语言处理(NLP)技术和知识图谱技术都体现了认知智能方面的最新进展。认知智能也是释放计算智能、感知智能价值的关键一步。

02 知识图谱技术的出现

搜索引擎的发展导致了知识图谱的出现。第一代搜索引擎是文本目录方式,比如雅虎等都是这种方式。第二代搜索引擎是文本检索方式,用户输入查询词,系统比较与网页文本内容的匹配关系。第三代搜索引擎是分析和挖掘了网页链接所隐含的信息,这一阶段的典型代表就是Google所提出的PageRank链接分析技术,通过链接分析对网页重要性进行筛选,再结合文本检索阶段中的相关性,使得搜索质量有了质的飞跃。

受语义网络(Semantic network)和语义网(Semantic web)的启发,2012年,Google公司提出了知识图谱(Knowledge graph),目的是为了提高搜索引擎的智能能力,增强用户的搜索质量和体验。知识图谱是一种大规模的语义网络,知识图谱代表了全新的知识表示方式,知识工程也进入到了大数据时代,大规模自动化知识获取成为可能。同时,大数据的算力、模型、海量数据以及UGC、众包的发展也为知识图谱的出现提供了条件。

03 知识图谱的定义和示例

知识图谱(Knowledge Graph)本质上是一种大规模语义网络(Semantic Network)。

知识图谱用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关属性—值对,实体间通过关系相互联结,构成网状的知识结构。
图中的圆圈代表实体,实体和实体之间的边代表实体之间的关系,实体拥有属性,属性值用方框表示,属性是实体和属性值之间的边。

下图是一个知识图谱示例,表示口罩的产业链。


04 知识图谱研究的意义

总的来看,知识图谱成为认知智能的基石。具体来看,包括:

1.知识图谱使能机器语言认识

知识图谱有丰富的语义关系,概念,属性,关系等这些语义关系可以很好的应用到nlp相关任务上,例如分词,短语理解,文本理解等任务上。通过知识图谱可以让机器能更好的去理解自然语言,进一步的更好的理解用户的意图,文本的含义。

主要应用:

1).基础nlp任务,例如分词,文本理解;

2).对用户画像数据,对各种标签数据做数据增强。

3).搜索,问答的意图理解,推荐的用户,物品的理解;

2.知识图谱使能可解释人工智能

可解释,是强人工智能的一个重要特征。当前以深度学习模型为主的人工智能应用,虽然从结果上看效果还不错。但是模型本身就是一个黑盒的不具备可解释性,这就导致在很多需要有解释性的行业,没法使用复杂的深度学习模型。比如在司法领域、医疗诊断领域、金融领域等。

可解释性的应用也会很好的提升用户对系统的信任感,提升用户满意度。问答场景下,推荐场景下都可以加入解释功能。

应用:尤其是在司法,医疗领域

3.知识引导成为问题求解方式之一

应用:垂直领域内的深度应用,比如智能客服系统,智能外呼系统利用知识图谱可以精准的回答用户的问题,可以进行复杂问题的回答。一些垂直行业内常用的传统专家系统,通过赋予他们一定的背景知识,可以很好的提升效果。

4.知识将显著增强机器学习能力

把领域中异构的知识结构化,构建知识间关联。主要解决领域内数据分散在多个系统,数据多样、复杂,孤岛化,且单一数据价值不高的应用场景。很显然结构化的知识,天然的把领域知识做了显性化沉淀和关联。构建起来了一张图。可以利用原生图的特征,支撑数据的挖掘,分析。

主要应用:

1)做关系发展、实体探索。借助于图可视化工具发现一些信息的潜在关联。利用这些信息,来辅助决策。主要涉及的技术点:探索多个实体间的路径关系。典型的产品:天眼查

2)社团发现。发现一些相似的实体。广泛用于团伙发现,同类推荐场景。广泛用于金融行业反欺诈场景,社交推荐。主要技术点:社团搜索。

05 知识图谱的主要技术

知识图谱主要技术包括知识获取、知识表示、 知识融合、知识存储、知识推理、知识维护等六个方面,通过面向结构化、半结构化 和非结构化数据构建知识图谱为不同领域的应用提供支持。

1.知识抽取

从各种文本数据、半结构化数据、结构化数据中提取实体、属性和关系的信息。这个过程通常需要利用自然语言处理技术,例如实体识别、关系抽取等。

2.知识表示

KG Embedding主要是把实体(entities)和关系(relations)嵌入(Embed)到一个连续向量空间里面

RDF(Resource Description Framework,资源描述框架),使用三元组被用来表示实体与实体之间的关系

3.知识融合

将不同来源的知识进行融合,消除冲突和重复的信息,生成统一的实体、属性和关系。这个过程通常需要利用数据融合和数据清洗技术。

4.知识存储

将融合后的知识存储到知识库中。知识库可以采用关系型数据库或者图形数据库等存储技术。

图数据库源起欧拉和图理论(graph theory),也可称为面向/基于图的数据库,图数据库的基本含义是以“图”这种数据结构存储和查询数据。它的数据模型主要是以节点和关系(边)来体现,也可处理键值对,优点是快速解决复杂的关系问题。以下是常用图数据库的使用热度趋势图。Neo4j 是最主流、使用最为广泛的图数据库,相比其他数据库更加成熟。

5.知识推理

利用知识库中的实体、属性和关系进行推理,生成新的实体、属性和关系。这个过程通常需要利用知识表示和推理技术。

6.知识维护

不断更新和维护知识库中的实体、属性和关系。这个过程通常需要利用自动化的知识更新和知识维护技术。

06 知识图谱的应用场景

1.基于知识图谱的产业链分析

全钢子午轮胎产业链分析知识图谱

2.基于知识图谱的智能营销

知识图谱能够整合更丰富、更全面的用户信息,根据精准营销的不同角度设定不同类别的场景标签,通过知识图谱技术提供的分类标准,进行用户的标签化分类工作,建立合理的客户类型初分体系。同时结合黑白名单技术,对客户进行判断,对客户质量进行筛选与把控,并最终实现互联网金融产品推荐、客户准入、客户跟踪管理等高级营销策略。

3.基于知识图谱的银行业信贷风险评估

基于知识图谱的银行业信贷风险评估能够整合内外部数据资源,根据行业信息建立关系挖掘模型,展示每个行业的风险状况与关联程度,能够 全面准确评估信贷风险,如果某一行业发生了行业风险或高风险事件,可以及时预测未来有潜在风险的关联行业,信贷评估可对相关行业的风险做 出预判,尽早地发现并规避风险。


中国信息通信研究院《人工智能白皮书》下载方式:
1、关注本公众号“金融IT那些事儿”
2、公众号后台回复关键字:AI,即可下载

近期文章精选
最新发布:国家金融监管总局《关于银行业保险业做好金融“五篇大文章”的指导意见》解读
三一重工数字化转型之路
江苏银行数字化转型之路
平安银行数字化转型之路
招商银行数字化转型之路
兴业银行数字化转型之路
海尔集团数字化转型之路
美的集团数字化转型之路
吉利汽车数字化转型之路
吉林银行数字化转型之路
“数据资产入表”关心这四件事就够了
什么是数据要素?看这七个文件就懂了
基于大模型的智能体彻底颠覆AI应用
OpenAI Sora的优劣势和应用前景分析
Sora技术原理解析
一文读懂企业画像
团队拓扑:组织的数字化转型
沃德利地图:数字化转型战略可视化工具
什么是流程型组织?
如何构建流程型组织?
企业架构:架构原则
建设液态组织,实现组织的数字化转型

金融IT那些事儿
资深企业架构师,数字化转型专家,TOGAF企业架构鉴定级认证专家认证,《企业架构驱动数字化转型》专著作者,20年金融业、制造业企业信息化经验,分享数字化转型、企业架构、数据资产、商业模式、战略转型等内容
 最新文章