一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系！！

科技科技 2024-09-02 08:18 北京

▼最近直播超级多，预约保你有收获

—0—

背景

我们要把 AI 大模型当做人的大脑，因此调用 AI 大模型，相当于调用一个人，把 AI 大模型当人看，TA 懂人话、TA 说人话、TA 会直接给出结果，但结果不一定正确。

因此在 AI 大模型的推理基础上，通过 RAG、Agent、知识库、向量数据库、知识图谱等技术手段实现了真正的 AGI（通用人工智能）。这些技术到底有哪些区别和联系，下图作了横向对比，接下来我们详细剖析下。

—1—

大语言模型（LLM）

大语言模型（LLM）是通过深度学习方法，利用庞大的文本数据集进行训练的机器学习模型，它具备生成自然流畅的语言文本以及准确理解语言文本深层语义的能力。大语言模型广泛应用于各种自然语言处理任务，包括但不限于文本分类、智能问答以及人机交互对话等，是 AI 领域的重要支柱之一。

过去的一年中，大语言模型及其在 AI 领域的应用受到了全球科技界的广泛关注。特别值得注意的是，这些大语言模型在规模上取得了显著的增长，参数量从最初的数十亿激增到如今惊人的万亿级别。这一飞跃性的增长不仅使得大语言模型在捕捉人类语言的微妙差异上更为精准，更让它能够深入洞察人类语言的复杂本质。

随着 OpenAI GPT-4o 的发布，回顾过去的一年，大语言模型在多个方面取得了显著的进步，包括高效吸纳新知识、有效分解复杂任务以及图文精准对齐等。随着技术的不断演进和完善，大语言模型将继续拓展其应用边界，为人们带来更加智能化、个性化的服务体验，从而深刻改变我们的生活方式和生产模式。

大语言模型拥有推理能力，TA 是一切应用的基石。

—2—

检索增强生成（RAG）

RAG（Retrieval-Augmented Generation）技术是一种集成检索与生成双重能力的知识增强方案，旨在应对复杂多变的信息查询和生成挑战。在如今的大模型时代背景下，RAG 巧妙地引入外部数据源，比如：本地知识库或企业信息库，为 AI 大模型赋予了更强大的检索和生成实力，从而显著提升了信息查询和生成的品质。

RAG 技术的核心在于它将先进的向量数据库与大模型的智能问答能力进行了完美结合。知识库中的信息被精心存储在向量数据库中，当接收到用户的问题时，系统能够迅速从知识库中检索出相关的知识片段。随后，这些片段会与大模型的智慧相结合，共同孕育出精确而全面的回答。这种技术的运用极大地提高了 AI 系统在处理复杂问题时的准确性和响应速度，为用户带来了更加优质和高效的体验。

总之，RAG 技术就是给大语言模型新知识。

—3—

Fuction Calling（函数调用）

大模型要实现精确的函数调用（Function Calling）需要理解能力和逻辑能力，理解能力就是对用户的 Prompt 提示词能够识别意图，然后通过逻辑能力给出需要调用执行的函数，具体流程如下：

1、大模型何时会调用函数 API？

调用函数 API 在交互形式上有两种方式：第一是让用户直接选择调用函数，第二是大模型会推理判断要调用的函数 API。

2、大模型怎么 Function Calling 调用函数 API ？

首先把函数 API 的元信息（函数名称、函数描述、函数参数等）注册给大模型，让大模型学习函数集合，当用户查询时，大模型根据用户的 Prompt 提示词选择对应的函数 API。

3、函数 API 谁来具体执行？

大模型根据用户的 Prompt 请求确定具体的函数 API 后，由 Agent 负责具体的执行。

4、函数 API 返回的内容咋处理？

Agent 把 Function Calling 函数 API 调用返回的结果返回给大模型，大模型进一步加工处理后返回给用户最终结果。

—4—

智能体（Agent）

在 AI 大模型时代，任何具备独立思考能力并能与环境进行交互的实体，都可以被抽象地描述为智能体（Agent）。这个英文词汇在 AI 领域被普遍采纳，用以指代那些能够自主活动的软件或硬件实体。在国内，我们习惯将其译为“智能体”，尽管过去也曾出现过“代理”、“代理者”或“智能主体”等译法。

智能体构建在大语言模型的推理能力基础上，对大语言模型的 Planning 规划的方案使用工具执行（Action），并对执行的过程进行观测（Observation），保证任务的落地执行。

总之，Agent 智能体 = 大语言模型的推理能力 + 使用工具行动的能力。

—5—

知识库

对于企业而言，构建一个符合自身业务需求的知识库是至关重要的。通过RAG、微调等技术手段，我们可以将通用的大模型转变为对特定行业有着深度理解的“行业专家”，从而更好地服务于企业的具体业务需求。这样的知识库基本上适用于每个公司各行各业，包括：市场调研知识库、人力资源知识库、项目管理知识库、技术文档知识库、项目流程知识库、招标投标知识库等等。

知识库的技术架构分为两部分：

第一、离线的知识数据向量化

加载：通过文档加载器（Document Loaders）加载数据/知识库。
拆分：文本拆分器将大型文档拆分为较小的块。便于向量或和后续检索。
向量：对拆分的数据块，进行 Embedding 向量化处理。
存储：将向量化的数据块存储到向量数据库 VectorDB 中，方便进行搜索。

第二、在线的知识检索返回

检索：根据用户输入，使用检索器从存储中检索相关的 Chunk。
生成：使用包含问题和检索到的知识提示词，交给大语言模型生成答案。

总之，知识库是 AI 大模型应用的知识基础。

—6—

向量数据库

向量数据库是专注于存储和查询向量的系统，其向量源于文本、语音、图像等数据的向量化表示。

相较于传统数据库，向量数据库更擅长处理非结构化数据，比如：文本、图像和音频。在机器学习和深度学习中，数据通常以向量形式存在。

向量数据库凭借高效存储、索引和搜索高维数据点的能力，在处理比如：数值特征、文本或图像嵌入等复杂数据时表现出色。

总之，知识库的存储载体往往是向量数据库，另外在数据存储和检索上，向量数据库以向量空间模型高效存储和检索高维数据，为 AI 大模型和 Agent 智能体提供强有力的数据支持。

—7—

知识图谱

知识图谱是一种基于实体和关系的图结构数据库，旨在表示和管理知识。它采用结构化数据模型来存储、管理和显示人类语言知识。

知识图谱通过语义抽取建立人类语言知识间的关系，形成树状结构。实体如人、地点、组织等，具有特定属性和关系，这些关系连接着不同的实体。通过数据挖掘、信息处理和图形绘制，知识图谱揭示了知识领域的动态发展规律，为学科研究提供了有价值的参考。

医疗领域是知识图谱技术的一个广泛应用场景，它可以帮助临床诊疗、医疗数据的整合与利用，并通过实体识别、关系抽取和数据集训练，以图谱形式展示关键节点和它们之间的联系，从而支持更精准的医疗决策。

与此同时，在智能推荐、自然语言处理、机器学习等领域也具有广泛的应用。尤其在搜索引擎领域，它能够提高搜索的准确性，为用户提供更加精准的搜索结果。

总之，知识图谱本质上是一种叫作语义网络的知识库，即一个具有有向图结构的知识库，其中图的结点代表实体或者概念，而图的边代表实体/概念之间的各种语义关系。

—8—

AGI

AGI（通用人工智能）作为 AI 发展的终极愿景，追求的是让智能系统具备像人类一样理解和处理各种复杂情况与任务的能力。在实现这一宏伟目标的过程中，AI 大模型、Prompt Engineering、Agent 智能体、知识库、向量数据库、RAG 以及知识图谱等技术扮演着至关重要的角色。这些技术元素在多样化的形态中相互协作，共同推动 AI 技术持续向前发展，为实现 AGI 的最终目标奠定坚实基础。

为了帮助同学们彻底掌握 AI 大模型 Agent 智能体、知识库、向量数据库、 RAG、微调私有大模型的应用开发、部署、生产化，今天我会带来2场直播和同学们深度剖析，请同学们点击以下预约按钮免费预约。

—9—

领取 AI 大模型学习资料

今天给大家搞到的是一份大厂内部都在用的『AI 大模型学习资源』：

▶形式：50+场直播实战课

▶费用：原价299，本号用户0元白嫖

▶内容：大模型原理、Agent、LangChain、Spring AI、RAG、向量数据库、知识库、私有大模型、算力评估...

扫码预约报名

👇『AI 大模型学习资源』👇

堪称资源界的YYDS！

“得此资源，堪比1000G网盘资源”

👇👇👇

本期名额有限

—10—

领取《AI 大模型技能图谱》

这份业界首创知识图谱和学习路线，今天免费送了!

第一步：长按扫码以下视频号，你身边需要一个 AI 专家。

第二步：点击"关注按钮"，就可关注。

第三步：点击"客服“按钮，回复“知识图谱”即可领取。

—11—

每日精选 AI 大模型知识

—12—

加我微信

有很多不方便公开发公众号的我会直接分享在朋友圈，欢迎你扫码加我个人微信来看👇

⬇戳”阅读原文“，立即预约！

END

http://mp.weixin.qq.com/s?__biz=MzIzODIzNzE0NQ==&mid=2654451688&idx=1&sn=ed02ed519b93ddc128914d1f733d78b6

玄姐聊AGI

5年连续创业者，融资超亿元｜ AI 大模型资深应用专家｜前58集团技术委员主席｜前百度资深工程师｜大厂 MVP｜毕业浙江大学

最新文章

中秋限时特供！独家资源大放送，错过再等一年！

通俗易懂理解知识图谱+大模型

知识图谱与大模型的深度结合策略剖析

15种先进的检索增强生成（RAG）技术

2024，裁员根本停不下来！

GPT-5 训练失败的4点思考

阿里P8们全面溃败。。。

15年过去了，TA依旧还是这样？

如何利用RAG+Agent轻松解决企业复杂问题？

一台MacBook搭建商用级RAG知识库

形势越来越严峻了，到处都在降薪或延发工资...

一文剖析AI大模型技术架构的全景视图：从基础实施层、云原生层、模型层、应用技术层、能力层、到应用层

9.6K Stars！这款超实用的 AI 知识库问答系统：MaxKB

比裁员更侮辱人的事发生了。。。

一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系！！

一台MacBook搭建商用级RAG知识库

RAG 架构设计三阶段演进之路

一个人，一年 300W 美元...

57K Stars！这款轻量级Web服务器成为Nginx的理想替代者，实现自动HTTPS功能。

许多公司，已经发不出工资了！尽早做好准备吧

提升 RAG 系统的回答质量：构建高效的 Prompt

大厂今年的薪资。。。

一台MacBook搭建商用级知识库

GraphRAG + Ollama 本地部署全攻略：避坑实战指南

IntelliJ IDEA 2024.2 正式发布，内置 AI，新款默认 UI 太震撼了！

揭秘AI大模型独家福利！你绝不能错过的宝藏资源！

又是删库跑路？传疯了，知名 App 最新回应

一个更小、更快、更干净的 GraphRAG！！

大模型RAG架构落地的十大挑战

全新GPT-4o mini发布！大模型杀疯了！

基于Llama 3.1和一台MacBook搭建商用级知识库

GraphRAG 项目升级！现已支持 Ollama 本地模型接入，打造交互式 UI 体验

一个好朋友的经历，大家也做好准备吧。。。

记我的百万年薪：一竿子到底，相信时间的复利！

Transformer 动画揭秘：数据处理的四大关键技术

大佬吴恩达，yyds！！

腾讯宣布全员调薪了。。。

一文彻底理解大模型 Agent 智能体原理和案例

裁员了，很严重，大家做好准备吧。。。

7K Stars！这款文本转语音（TTS）的效果太震撼，网络上的声音评价真是不能轻信啊！！

聊聊蚂蚁开源多 Agent 框架 muAgent 的架构设计

重磅！LangChain 官方发布 Agent IDE！！

4.5K Stars！为 RAG 而生的数据工程神器！！

赔偿金额高达2N+12！裁员赔偿的新纪录再次被刷新？

RAG 的尽头是 Agent？

RAG 开发四大痛点及解决方案

基于Llama 3.1和一台MacBook搭建商用级知识库

阿里终于开源数字人技术！！

大厂今年的薪资。。。

公司裁员为何总是先从技术人员下手？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉