首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AI智能体生态圈和软件栈

科技 2024-11-29 08:00 中国香港

点击上方蓝字关注我们！

一

理解AI智能体

尽管市面上有许多关于智能体栈和市场的分类，但我们认为这些分类并不总能准确反映开发者实际使用的工具和技术。随着内存、工具使用、安全执行和部署方面的进步，我们决定分享基于我们一年多的开源AI工作和7年以上的AI研究经验的“智能体堆栈”。

2024年末的AI智能体堆栈，被组织成三个关键层：

智能体托管/服务
智能体框架
LLM模型与存储

二

从LLM到LLM智能体

2022年和2023年见证了LLM框架和SDK的兴起，以及通过API消费LLM和自部署LLM推理的平台的建立。2024年，我们看到了对AI“智能体”的兴趣急剧转变，智能体通常指被赋予输出动作（工具调用）并在自治环境中运行的LLM。

三

智能体堆栈的独特之处

智能体比基本的LLM聊天机器人是一个更复杂的工程挑战，因为它们需要状态管理（保留消息/事件历史，存储长期记忆，执行多个LLM调用在智能体循环中）和工具执行（安全执行LLM输出的动作并返回结果）。

因此，AI智能体堆栈与标准的LLM堆栈看起来非常不同。让我们从模型服务层开始，分解今天的AI智能体堆栈：

1

模型服务

LLM是AI智能体的核心，需要通过推理引擎提供服务，通常运行在付费API服务后面。OpenAI和Anthropic在封闭API模型推理提供商中领先，而Together.AI、Fireworks和Groq等提供开放权重模型服务。vLLM在本地模型推理提供商中领先。

2

存储

存储是智能体的基本构建块，智能体需要持久状态，如对话历史、记忆和外部数据源。向量数据库如Chroma、Weaviate等流行于存储智能体的“外部记忆”。Postgres通过pgvector扩展支持向量搜索。

3

工具和库

智能体与AI聊天机器人的主要区别在于智能体能够调用“工具”。LLM生成结构化输出指定要调用的函数和参数。智能体服务必须使用沙箱以确保安全执行。智能体通过OpenAI定义的JSON模式调用工具，这意味着智能体和工具可以跨不同框架兼容。

4

智能体框架

智能体框架协调LLM调用和管理智能体状态，不同框架在状态管理、上下文窗口结构、跨智能体通信和内存方法上有不同的设计。智能体框架的选择取决于应用程序的需求。

5

智能体托管和智能体服务

大多数智能体框架设计为智能体仅存在于编写的脚本或笔记本中。我们认为智能体的未来是作为服务部署到本地或云基础设施，通过REST API访问。部署智能体作为服务比部署LLM更复杂，涉及状态管理和安全工具执行。

四

总结

智能体堆栈仍处于早期阶段，我们期待看到生态系统的扩展和演变。有兴趣的读者可以查看Letta OSS项目和注册Letta Cloud的早期访问。

看了以上内容，你的看法是？欢迎评论区留言讨论！

如果你有更好的文章，欢迎投稿！

稿件接收邮箱：nami.liu@pasuntech.com

更多精彩内容请点击下方名片，关注“算力魔方^®”公众号！

扫码加入“算力魔方^®交流群”，更好的算力魔方^®期待您的意见与建议！

如果有项目合作需求，欢迎来电咨询！ ↓↓↓

联系方式

电话：17764029492（李小姐）

邮箱：xuenian.li@pasuntech.com

点分享

点收藏

点在看

点点赞

http://mp.weixin.qq.com/s?__biz=MjM5MTc4MDM1MQ==&mid=2651741990&idx=2&sn=03fe679e9400674d48fd85c750ea444d

新一代智能化应用

人工智能是一门认知科学，而新一代的智能化应用是一个系统工程。智能应用程序是人工智能驱动的应用程序，可转变用户的工作效率、自动化流程并获得见解

最新文章

UnitsNet 库简介

AI智能体生态圈和软件栈

C# 2024年Visual Studio实用插件集合

使用 BenchmarkDotNet 对 .NET 代码进行性能基准测试

AI Agent再进一步！Anthropic发布大模型上下文协议MCP：让任何资源快速变成大模型的工具，突破大模型的能力边界！

.NET 8 实现通用权限开发框架

AI 推理市场全景解析：战火从云端到边缘端

ASP.NET Core 知识速递：HTTP响应顺序，先头后尾

GTK#框架让C# Winform程序跨平台运行

Cursor v0.43 版本更新：Agent 功能重磅登场

Microsoft Fabric Data Factory 新增功能和路线图

社区发布非官方龙架构 .NET 9 SDK 发行版

一款基于.NET8开源的通用管理平台，支持模块化、WinForms 和 WPF

Cursor的最佳拍档来了，不写提示词，只要会截图就能做程序员

回顾 | .NET Talks - .NET 9 AOT 的突破

Pytorch前负责人谈AI发展新趋势，不要再卷基座模型和MAAS了

深度解读微软Speech服务：让语音识别走进现实

关于 GitOps 和数据库回滚的残酷事实

企业需要的不是大模型：基于国产算力落地企业级AI的实践与方法论

回顾 | .NET Talks - .NET 9 分布式 Web 全栈开发

DeepSeek 推理模型预览版上线：独创"深度思考"能力，性能超越openAI o1

使用Visual Studio分析.NET Dump，快速排查内存泄漏问题！

.NET9里WinForm更新了什么

一款为现代企业量身打造的开源功能强大CRM管理系统

C#开发最快的浏览器，打造极速浏览体验

LLaVA-o1：国产开源小型多模态AI模型获得超越GPT-4o-mini 大模型的性能

.NET开源实时应用监控系统：WatchDog

一个基于 WPF 和 Halcon 视觉编程实战案例

SemanticKernel系列，AI系列，SmartFill介绍视频系列

揭秘“让Claude 3.5 像 OpenAI o1 那样思考”的小孩哥神级Prompt是怎么炼成的

企业不需要大模型：基于国产算力落地企业级AI的实践与方法论

.NET 各版本贡献者列表

.NET 9 中 LINQ 新增功能实操

狙击 K8s 用户的“流氓”专利：分布式软件定义网络 (dSDN)

CNCF 宣布 Dapr 毕业

人工智能代理的崛起与未来展望

构建面向未来的数字核心：企业如何利用代理式AI引领变革

利用腾讯元器，将公众号变身为强大的.NET AI智能体

下一代 Serverless 架构 - SpinKube（Kubernetes WebAssembly 运行时解决方案）

回顾 | .NET Talks - 实战 Avalonia Headless 测试

PureML：大模型革新数据处理，能够自动进行数据清洗和特征工程

基于C#开源、功能强大、灵活的跨平台开发框架 - Uno Platform

WPF for .NET 9 中的新增功能

.NET现在可以做什么，有哪些公司在用的？

微软“虚拟小人”项目或将激发出一大批高价值生成式AI场景，打破“叫好不叫座”困境

.NET 9正式发布，亮点是.NET Aspire和AI

Qwen2.5-Coder 系列震撼发布：开源旗舰编程模型媲美 GPT-4o

相约 .NET 9！｜共同关注 .NET Conf 2024 最新发布

相约 .NET 9！｜共同关注 .NET Conf 2024 最新发布

基于.NET开源、功能强大且灵活的工作流引擎框架

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉