智能体，大模型进化下一站

科技 2024-11-29 22:26 北京

文丨海中天

突然之间，智能体成为AI领域最炙手可热的新名词。

按照字面意思，智能体（AI Agent）描述的是能够感知环境、能够执行行动、能够对环境产生影响的实体，它具备自主性和适应性，可以在复杂动态环境中做出决定，帮助人达成某种目标。

生成式AI已经给我们带来一些惊喜，它可以与人交流、可以制作图片和视频，但AI还无法为人类“做事情”。

于是乎，智能体横空出世，它想代表人类做事件。

智能体可以分为两种类型

智能体大体可以分成两类，一类是工具型智能体，人下达自然语言指令，智能体可以理解，然后就能帮助人完成任务，不需要代码。

今年10月，美国科技创业公司Anthropic发布智能体工具，它属于工具型智能体。在个人电脑上，Anthropic智能体可以将指令转化为行动，比如让智能体填充表格，让它打开浏览器。Salesforce也推出自己的智能体。

一直有传闻称，OpenAI准备在明年一月推出智能体。长久以来，OpenAI虽然风光无限，但亏损仍然严重，找到盈利点成为紧迫之事。智能体也许能帮助OpenAI获得更多收入，因为它相当于将AI落地于应用层面。

第二类是模拟智能体，你可以将它当成像人类一样行动的AI模型。最先开发出模拟智能体的是社会科学研究人员，有时他们想做一些研究，但是用人来实验成本太高、不符合伦理，或者不切实际，怎么办？那就用AI来模拟。

举个例子，斯坦福研究人员Joon Sung Park曾发表论文，谈到他所做的实验。在实验中，研究人员让1000人与AI进行会谈，时长2小时。会谈之后，研究人员很快便开发出一个模拟智能体，它可以复制参与者的价值观、理解他们的偏好，准确度极高。

智能体之所以从幕后走向前台，主要是因为AI明星企业认为它们已经很难开发出更棒的生成式AI工具，于是乎，企业开始瞄准可以帮人做事的智能体。还有，随着技术的进步，让智能体模拟人的行为、态度、个性变得容易了。

按照设想，最终工具智能体和模拟智能体将会整合，演变出可以代表人行动、模拟个人性格的AI模型。

国内企业的探索

智能体虽然是一个比较新的概念，但国内企业早就已经跟进。

11月29日，智谱召开Agent OpenDay，宣称人类与机器互动的方式正在发生转变，以前是只有对话功能的Chatbot，现在正在转变为“有手、有脑、有眼睛”的自主Agent。

顺应时势，智谱推出AutoGLM，它可以自主执行超过50步的长步骤操作，也可以跨APP执行任务。

到底AutoGLM能执行什么任务？举几个例子：

——你可以直接向AutoGLM下命令，说你想去北京，让它在天安门附近定一个酒店房间，价格不能超过500元，然后AutoGLM就会帮你执行。

——AutoGLM支持长任务的自定义短语。例如，你原本应该告诉AutoGLM：“帮我买一杯瑞幸咖啡，生椰拿铁，五道口店，大杯、热、微糖。”自定义之后只需要说：“点咖啡。”AI就会完成同样的任务，不需要说出一长串命令。

智谱已经推出三款产品，目前处于内测或者公测阶段，它们分别是清言插件、AutoGLM-安卓版本、GLM-PC版本。

GLM-PC是面向PC的，它可以帮用户预定和参与会议，发送会议总结；可以帮用户下载文档；可以帮助用户前往特定平台搜索关键词，查找内容，然后阅读并总结；可以通过手机远程发送指令，GLM-PC自动在电脑上完成操作。

当然，GLM-PC现在还不能完全替代人办公，用户输入的指令必须高度精准。

除了智谱，还有很多企业参与新游戏。例如，联想推出了百应智能体，它可以帮助企业实现目标客户意图、理解及分发，其AI服务每年收费3588元，可以以行业一半的价格实现全年IT运维无忧。

在市场上还有几款智能体备受关注，比如扣子、百度文心智能助手、司马诸葛、腾讯元宇宙工具、Kimi、讯飞友伴、百小应等。

有了千变万化的智能体，人类的工作效率将会提升，这样的未来你期待吗？也许真的可以期待一下。

智能体开发面临的风险并不低

实际上，多年来人类开发AI系统的方法大体相似，采用的框架模型也大体相似。我们今天所开发的智能体，其开发方式仍然是以过去的开发方式作为基础的。

当然，智能体与传统大语言模型也有不同，最大的不同是操作功能和框架。

传统大语言模型受到预先编程知识的限制，智能体相当于大语言模型的进化版本，它可以利用最新信息，可以做出动态决策，甚至可以咨询其它智能体、访问其它数据库。

从逻辑上讲，智能体前途光明，但谷歌Vertex AI、生成式AI、机器学习产品主管Warren Barkley参加会议时表示：“智能体是一个很酷的词汇，最终会有一些美妙的产品出现，但现在还言之过早。”

如何盈利？这是大语言模型没有回答好的问题，现在轮到智能体来回答。

美国科技界仍在疯狂投资，马斯克的xAI融资60亿美元，思科、Pure Storage投资CoreWeave，Databricks又融了10亿美元，Writer收获2亿美元，形势似乎一片大好，可惜的是AI创业公司的估值正在下降。

虽然有很多人看好智能体盈利前景，但当中的风险仍然很大，比如医疗行业，我们就能看到如下一些风险：

——成本和投资回报率：智能体采用更谨慎的开发模式，它可能会限制AI的真正潜力，导致投资回报率不高。让一些小任务实现自动化可以快速取得战果，但终究可能无法替代人力。部署AI的真正价值就是帮人完成各种任务，开始时投入大一些，追求长期目标，回报可能更大。

——准确度：智能体足够准确吗？未必。比如医疗行业，它追求高度精准，智能体能做到吗？想让AI足够精准，绝不是一朝一夕能做到的，需要不断分析现有系统，需要认真部署，需要经历严格的测试，需要不断优化，AI提供商要与医疗团队不断协作。

还有最最重要的：智能体需要解决的技术难题还有很多。

需要清除的技术障碍还有很多

开发多个智能体，让智能体彼此交流，从技术角度看绝非易事，遇到的难题还是之前没有见过的。

加州大学伯克利分校助理教授Niloufar Salehi认为：“我们开发传统数据处理系统时，目标是输出可预测的结果，但机器学习是无法预测的，环境不同，同样的算法可能会得出完全不同的结果。”

如果想打造出可信的智能体，需要解决之前没有遇到过的问题。

一般来说，数据库的数据有特定模式，你知道里面有什么类型的数据，可能是账户，可能是交易信息，但智能体面对的可能非结构性信息，它需要很长的时间慢慢适应。也就是说，智能体采用的数学算法高度随机，充满不确定。

我们不妨以Facebook动态新闻来举例，它显示的内容是根据用户的阅读偏爱不断改变的。还有Salesforce应用，今天打开时，你看到的内容与昨天完全不同。

变量如此之多，用来训练机器学习模型的参数高达几十亿，智能体还要与其它智能体交互，每个智能体都在随机算法中运行。如何面对这种不确定性？智能体需要好好考虑。

Niloufar Salehi给出自己的建议：应该创造持久的、共享的记忆，让智能体可以从过去的行为中学习。目前的AI还做不到，它所处的每个一场景都是新的，即使同样的场景它之前面对过无数次，因为没有记忆，它仍然认为是全新的。

Niloufar Salehi称：“如果智能体遇到一个问题，它会尝试用多种方法去解决。哪怕是昨天遇到过的问题，它还是会尝试一次又一次。想构建共享记忆，让多个智能体协作，从工程角度看是极其困难的。”

总之，智能体是实用的，但它的可靠性仍然不够高，想解决此问题任重而道远。告诉智能体：“帮我买一杯瑞幸咖啡，生椰拿铁，五道口店，大杯、热、微糖。”虽然能处理，但还是感觉有些机械。当然，从另一个角度看，如果AI连机械式的简单任务都处理不了，那前途的确堪忧。

如果您有什么想说的，欢迎在评论区留言讨论！

投稿或寻求报道，欢迎私信“投稿”，添加编辑微信。

如果您想要获取最新的科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会！

欢迎扫描下方二维码，添加头部科技创始人、AI头号玩家俱乐部主理人张晶晶微信！

头部科技

头部科技是技术新世界的记录者、探索者和推动者。我们致力于普及细分场景的科技解决方案，打造科技和人才创新知识图谱。无论你身处技术公司或传统行业，在这里都可以找到智能化、数字化升级的案例和伙伴。在无限的时空中，和你共同探索科技原力是我们的荣光。

最新文章

CES 2025前瞻：AI无处不在

硬碰硬开局！28家美国实体被列入管制管控名单，1600亿基金再砸硬科技！

惊呆网友！微软论文意外“泄密”OpenAI模型参数引热议，GPT-4o mini仅8B？

WAIC创投生态 | 2025 Future Tech项目路演1月9日名单出炉！

一年亏10亿股价反涨406.45%！国产AI芯片的春天要来了？

OpenAI彻底蜕变！摆脱“非营利”标签束缚或为IPO铺路

2025中关村智能网联汽车创新发展论坛震撼来袭

国产之光刷屏AI圈！DeepSeek-V3成当前最强开源大模型

传ChatGPT将拥有全新“无限”记忆功能？！OpenAI的一篇帖子引热议

2025中关村智能网联汽车创新发展论坛即将开幕！

三分之二产品在用中国芯？美国又针对中国传统芯片下手了

3年半亏损2.5亿，“协作机器人第一股”难当第一

红杉：AI为赚钱发愁搜索成为热点

人才流失！OpenAI资深研究员、初代GPT缔造者Alec Radford离职

涉及20+实验室，打磨2年！华人小伙儿领衔的开源生成式物理引擎Genesis令人惊叹！

国家电网发布国内首个千亿级多模态电力行业大模型

量子计算哪家强？潘建伟、朱晓波等科学家公布“祖冲之3.0”处理器进展对阵谷歌Willow

不服就干！谷歌重磅新品三连发反击OpenAI玩ChatGPT搜索

月付2000美元！OpenAI CFO称博士级AI要来了，能“替代”人类雇员

新能源+数智化浪潮下，信息通信创新如何改变电力行业？

OpenAI长文爆料反击马斯克诉讼：“你不能通过诉讼获得AGI”

不甘示弱！微软祭出小型语言模型Phi-4，在数学竞赛上超过GPT-4o和Gemini1.5

12月20日，上海见｜梧桐荟 “产·投·研”沙龙第6期——芯片级散热技术发展应用与投资机会

Sora试用报告：错误不少，一起找茬

黄仁勋：扫过最多厕所的CEO

“Open AI 12天”上新第4弹：Canvas协作工具正式开放，但实际并没想象中那么好？

刚刚，OpenAI Sora来啦！AI视频新纪元已开启

杨植麟响应仲裁风波，起底人性月之暗面

每月200美金订阅，OpenAI 「十二夜」圈钱忙

大厂小厂肉搏，中国大模型进入淘汰赛

NeurIPS 2024最佳论文！

一图一世界，一飞一菩提

ChatGPT问世2年，我们的世界哪里变了

智能体，大模型进化下一站

从Neuralink开始美国脑机接口研究迎来春天

绿色氢能，零碳飞行

亚马逊向英伟达芯片发起冲锋

AI将进化超级智能，还是逐步崩坏？

为什么能源需要AI？ | 2024能源人工智能创新发展大会圆满举办

AI广告，正在不完美中开创新时代

北京今年最大一笔融资诞生，国产半导体乘风而起

储能沙龙 | 新质生产力与储能行业协同发展及投资机遇沙龙成功举办

蘑菇车联新突破：路侧数据上车，赋能多品牌车辆

具身大模型，国内最大融资诞生

Scaling Law遇阻，AI 性能或难再有大提升

共谋AI未来发展，2024 AI创新应用发展交流会成功举办

AI的尽头，是能源

活动预告 | 梧桐荟 “产·投·研”沙龙第5期——储能产业专场

120亿独角兽，自主工业品牌变身

电力领域出了一个国际级领先技术

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉