智能体,大模型进化下一站

科技   2024-11-29 22:26   北京  

文丨海中天
突然之间,智能体成为AI领域最炙手可热的新名词。
按照字面意思,智能体(AI Agent)描述的是能够感知环境、能够执行行动、能够对环境产生影响的实体,它具备自主性和适应性,可以在复杂动态环境中做出决定,帮助人达成某种目标。
生成式AI已经给我们带来一些惊喜,它可以与人交流、可以制作图片和视频,但AI还无法为人类“做事情”。
于是乎,智能体横空出世,它想代表人类做事件。
智能体可以分为两种类型

智能体大体可以分成两类,一类是工具型智能体,人下达自然语言指令,智能体可以理解,然后就能帮助人完成任务,不需要代码。
今年10月,美国科技创业公司Anthropic发布智能体工具,它属于工具型智能体。在个人电脑上,Anthropic智能体可以将指令转化为行动,比如让智能体填充表格,让它打开浏览器。Salesforce也推出自己的智能体。
一直有传闻称,OpenAI准备在明年一月推出智能体。长久以来,OpenAI虽然风光无限,但亏损仍然严重,找到盈利点成为紧迫之事。智能体也许能帮助OpenAI获得更多收入,因为它相当于将AI落地于应用层面。
第二类是模拟智能体,你可以将它当成像人类一样行动的AI模型。最先开发出模拟智能体的是社会科学研究人员,有时他们想做一些研究,但是用人来实验成本太高、不符合伦理,或者不切实际,怎么办?那就用AI来模拟。
举个例子,斯坦福研究人员Joon Sung Park曾发表论文,谈到他所做的实验。在实验中,研究人员让1000人与AI进行会谈,时长2小时。会谈之后,研究人员很快便开发出一个模拟智能体,它可以复制参与者的价值观、理解他们的偏好,准确度极高。
智能体之所以从幕后走向前台,主要是因为AI明星企业认为它们已经很难开发出更棒的生成式AI工具,于是乎,企业开始瞄准可以帮人做事的智能体。还有,随着技术的进步,让智能体模拟人的行为、态度、个性变得容易了。
按照设想,最终工具智能体和模拟智能体将会整合,演变出可以代表人行动、模拟个人性格的AI模型。
国内企业的探索

智能体虽然是一个比较新的概念,但国内企业早就已经跟进。
11月29日,智谱召开Agent OpenDay,宣称人类与机器互动的方式正在发生转变,以前是只有对话功能的Chatbot,现在正在转变为“有手、有脑、有眼睛”的自主Agent。
顺应时势,智谱推出AutoGLM,它可以自主执行超过50步的长步骤操作,也可以跨APP执行任务。
到底AutoGLM能执行什么任务?举几个例子:
——你可以直接向AutoGLM下命令,说你想去北京,让它在天安门附近定一个酒店房间,价格不能超过500元,然后AutoGLM就会帮你执行。
——AutoGLM支持长任务的自定义短语。例如,你原本应该告诉AutoGLM:“帮我买一杯瑞幸咖啡,生椰拿铁,五道口店,大杯、热、微糖。”自定义之后只需要说:“点咖啡。”AI就会完成同样的任务,不需要说出一长串命令。
智谱已经推出三款产品,目前处于内测或者公测阶段,它们分别是清言插件、AutoGLM-安卓版本、GLM-PC版本。
GLM-PC是面向PC的,它可以帮用户预定和参与会议,发送会议总结;可以帮用户下载文档;可以帮助用户前往特定平台搜索关键词,查找内容,然后阅读并总结;可以通过手机远程发送指令,GLM-PC自动在电脑上完成操作。
当然,GLM-PC现在还不能完全替代人办公,用户输入的指令必须高度精准。
除了智谱,还有很多企业参与新游戏。例如,联想推出了百应智能体,它可以帮助企业实现目标客户意图、理解及分发,其AI服务每年收费3588元,可以以行业一半的价格实现全年IT运维无忧。
在市场上还有几款智能体备受关注,比如扣子、百度文心智能助手、司马诸葛、腾讯元宇宙工具、Kimi、讯飞友伴、百小应等。
有了千变万化的智能体,人类的工作效率将会提升,这样的未来你期待吗?也许真的可以期待一下。
智能体开发面临的风险并不低

实际上,多年来人类开发AI系统的方法大体相似,采用的框架模型也大体相似。我们今天所开发的智能体,其开发方式仍然是以过去的开发方式作为基础的。
当然,智能体与传统大语言模型也有不同,最大的不同是操作功能和框架。
传统大语言模型受到预先编程知识的限制,智能体相当于大语言模型的进化版本,它可以利用最新信息,可以做出动态决策,甚至可以咨询其它智能体、访问其它数据库。
从逻辑上讲,智能体前途光明,但谷歌Vertex AI、生成式AI、机器学习产品主管Warren Barkley参加会议时表示:“智能体是一个很酷的词汇,最终会有一些美妙的产品出现,但现在还言之过早。
如何盈利?这是大语言模型没有回答好的问题,现在轮到智能体来回答。
美国科技界仍在疯狂投资,马斯克的xAI融资60亿美元,思科、Pure Storage投资CoreWeave,Databricks又融了10亿美元,Writer收获2亿美元,形势似乎一片大好,可惜的是AI创业公司的估值正在下降。
虽然有很多人看好智能体盈利前景,但当中的风险仍然很大,比如医疗行业,我们就能看到如下一些风险:
——成本和投资回报率:智能体采用更谨慎的开发模式,它可能会限制AI的真正潜力,导致投资回报率不高。让一些小任务实现自动化可以快速取得战果,但终究可能无法替代人力。部署AI的真正价值就是帮人完成各种任务,开始时投入大一些,追求长期目标,回报可能更大。
——准确度:智能体足够准确吗?未必。比如医疗行业,它追求高度精准,智能体能做到吗?想让AI足够精准,绝不是一朝一夕能做到的,需要不断分析现有系统,需要认真部署,需要经历严格的测试,需要不断优化,AI提供商要与医疗团队不断协作。
还有最最重要的:智能体需要解决的技术难题还有很多。
需要清除的技术障碍还有很多

开发多个智能体,让智能体彼此交流,从技术角度看绝非易事,遇到的难题还是之前没有见过的。
加州大学伯克利分校助理教授Niloufar Salehi认为:“我们开发传统数据处理系统时,目标是输出可预测的结果,但机器学习是无法预测的,环境不同,同样的算法可能会得出完全不同的结果。”
如果想打造出可信的智能体,需要解决之前没有遇到过的问题。
一般来说,数据库的数据有特定模式,你知道里面有什么类型的数据,可能是账户,可能是交易信息,但智能体面对的可能非结构性信息,它需要很长的时间慢慢适应。也就是说,智能体采用的数学算法高度随机,充满不确定。
我们不妨以Facebook动态新闻来举例,它显示的内容是根据用户的阅读偏爱不断改变的。还有Salesforce应用,今天打开时,你看到的内容与昨天完全不同。
变量如此之多,用来训练机器学习模型的参数高达几十亿,智能体还要与其它智能体交互,每个智能体都在随机算法中运行。如何面对这种不确定性?智能体需要好好考虑。
Niloufar Salehi给出自己的建议:应该创造持久的、共享的记忆,让智能体可以从过去的行为中学习。目前的AI还做不到,它所处的每个一场景都是新的,即使同样的场景它之前面对过无数次,因为没有记忆,它仍然认为是全新的。
Niloufar Salehi称:“如果智能体遇到一个问题,它会尝试用多种方法去解决。哪怕是昨天遇到过的问题,它还是会尝试一次又一次。想构建共享记忆,让多个智能体协作,从工程角度看是极其困难的。
总之,智能体是实用的,但它的可靠性仍然不够高,想解决此问题任重而道远。告诉智能体:“帮我买一杯瑞幸咖啡,生椰拿铁,五道口店,大杯、热、微糖。”虽然能处理,但还是感觉有些机械。当然,从另一个角度看,如果AI连机械式的简单任务都处理不了,那前途的确堪忧。
如果您有什么想说的,欢迎在评论区留言讨论!
投稿或寻求报道,欢迎私信“投稿”,添加编辑微信
如果您想要获取最新的科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会!
欢迎扫描下方二维码,加头部科技创始人、AI头号玩家俱乐部主理人张晶晶微信!

头部科技
头部科技是技术新世界的记录者、探索者和推动者。我们致力于普及细分场景的科技解决方案,打造科技和人才创新知识图谱。无论你身处技术公司或传统行业,在这里都可以找到智能化、数字化升级的案例和伙伴。在无限的时空中,和你共同探索科技原力是我们的荣光。
 最新文章