AI助理,能否变成现实

财富   2024-11-30 13:31   北京  

迭代后的AutoGLM支持自主执行超过50步的长步骤操作,也可以跨APP执行任务。

作者 | 李明明 宋子乔

如果说在 2023 年,人工智能行业更多还是聚焦在大模型本身,那到了 2024 年,国内外都在明显加快了AI助理智能体落地的步伐。

这意味着,钢铁侠的AI助理贾维斯正在走进现实。

11月29日,智谱举办OpenDay ,宣布升级AutoGLM并开放内测,并将尽快上线成为面向C端用户的产品。

AutoGLM便是智谱此前出圈的AI助理(AI Agent)。仅过去一个月,智谱宣布升级AI助理。据介绍,迭代后的AutoGLM支持自主执行超过50步的长步骤操作,也可以跨APP执行任务,手机、PC、网页端均有相应版本。

《科创板日报》记者从知情人士处获悉,智谱AutoGLM去年10月就已立项。

去年,大模型厂商还鲜少提到Agent的概念,为何今年智谱重注进入该领域?智谱CEO张鹏告诉《科创板日报》记者,首先,关于去年讨论较少的问题,主要是模型能力还不足,效果并不理想。现在,随着技术进步和关注度的提高,同时软件、硬件厂商也越来越多地参与适配。因此,这两个条件的满足,也让Agent更有落地可行性。

三句话让现场观众领到2万红包

张鹏在现场秀了一波操作,三句话便让现场观众领到2万红包:在对手机说出“帮我创建一个面对面群聊,数字为1129,并将群聊名字改成智谱开放日;帮我在智谱开放日的群聊里发个一万的红包,数量为一百个,名字为‘AI给你发的第一个红包‘;是帮我在支付宝发八百八十八个,总额为一万的口令红包”后,张鹏成功让AutoGLM给现场和线上的观众发了两个大红包。

同时,他还让AutoGLM成功群发文件、给微博点赞。

智谱CEO张鹏让AutoGLM面对面建群

智谱放出的演示视频显示,新一代AutoGLM可以比价、可以跨APP操作,较上一代更为高效。

下达指令:帮我看看哪个外卖APP上附近的肯德基超级全家桶最便宜并帮我下单

下达指令:帮我在小红书上查下火锅都需要哪些食材,去小象超市全部采购回来

此外,AutoGLM还支持快捷短口令和“开盲盒”。对于经常提的要求,例如“在最近的店铺点一杯瑞幸橙C冰美式”,将其设置为“每日咖啡”这四个字即可;在“开盲盒”模式下,AI会随机咖啡品牌和种类,直到关键的付款界面才需要用户来操作。

升级版AutoGLM、AutoGLM-Web、GLM-PC分别对应手机、浏览器、电脑:

AutoGLM:移动端(暂时向Android开放),可自主执行超50步的长步骤操作,适用于比价、导航、超话打卡等复杂操作。
GLM-PC:PC端(暂时向Mac系统开放)。

PC擅长处理办公场景,可以在微信、飞书、钉钉、腾讯会议等平台执行多样性任务,比如发送信息、预定和参与会议。同时支持浏览器网页搜索以及网页内容的阅读总结、翻译,还能进行多种文档处理,包括下载、发送和总结。

AutoGLM-Web :智谱清言插件上线 AutoGLM 功能,支持搜索、微博、知乎、Github 等数十个网站的无人驾驶。在现场demo里,清言插件自动完成了“在百度搜索芒果tv,打开小巷人家,播放最新一集,发弹幕结局打卡”。全程没有人的干预。

发布会现场,智谱表示,要对十个亿级App进行免费Auto升级。荣耀、华硕、小鹏汽车等大厂,高通、英特尔等硬件、芯片厂商也纷纷站台,介绍了与智谱的合作。

记者实测:半分钟内成功下单肯德基外卖

《科创板日报》记者根据智谱提供的下载包,对AutoGLM进行了内测。

本次公测/内测的三个产品的落地页:

1.清言插件:

https://new-front.chatglm.cn/webagent/landing/index.html?channel=ads_news_openday

2.autoglm-安卓:

https://agent.aminer.cn/

3.glm-pc:

https://www.wjx.top/vm/mOs9cHw.aspx

目前,AutoGLM适用范围较为有限,需要根据手机下载的APP来提供服务,比如点外卖、微信发消息、商品选购、导航和路线规划、定机票和车票等,使用前提是需要下载微信、导航app、美团外卖、淘宝、小红书等。

(AutoGLM适用范围)

当《科创板日报》记者在AutoGLM输入“点一份肯德基外卖”指令后,AutoGLM较为流畅的打开了美团外卖并搜索最近的肯德基门店并完成下单任务,时间不到半分钟,同样,记者输入“导航去三里屯”后,该软件较为迅速的打开相关导航地图APP,并规划了路线图。

但是,当《科创板日报》记者输入“订购北京到上海高铁票”后,AutoGLM自动打开了 12306软件,并显示“北京有多个出发地可以选择,想从哪里上车?”后,如果不发出指令,那么软件迟迟没有回应,显而易见,该软件细节上还需要进一步完善。

《科创板日报》记者从上述演示中感受到AI 手机助手的神奇与实用,其部分流畅性实现了解放双手,同时设定的都是人们常用的生活场景,而AutoGLM还在持续完善中,在不太远的未来,可以预见到该软件作为人类生活助理的便利和高效。

过往技术中,想要完成一个复杂的工作流需要调动很多数据和应用程序,但是很多网站和APP的API 并不统一、不标准化,这导致没有足够的接口可以调用。

对此,智谱AutoGLM技术负责人刘潇告诉《科创板日报》记者,AutoGLM本质上是用户图形化交互界面为主,和API调用有根本差别。其实际上是模拟人类在操作,而不是用传统的API。

“以前用API的时候,比如昨天我们打通了应用,但过一周上了新版本,就很容易失效了。但是通过用户重新化交互界面,其实就规避了这个问题。因为只要这个界面依然是人类可以理解的、是用户真正能用的软件界面,就可以适用。”

刘潇进一步对《科创板日报》记者提到, AutoGLM 目前还处在内测状态,还在为全面开放做准备,目前更多是向大家去展示大模型接下来的方向是什么、以及它未来可能有什么样的能力。

“一方面,AutoGLM能力上当然还有很大的提高空间。另外一方面,尽早把相关内容构建好,是未来发展的必然趋势,我们提前做好准备是在技术上比较重要的一个点。”

那么,智谱是想打造钢铁侠贾维斯这样的智能助理?智谱COO张帆告诉《科创板日报》记者,“贾维斯的能力相当丰富,AutoGLM要达到贾维斯的程度还是比较遥远的,而我们的最终目标是AGI,让机器像人一样思考。”

AI助理变为现实?

在硬件厂商言必称AI的时代,AI助理或成为终端智能化的突破口。

就在智谱举办OpenDay的同一天(11月29日),华为也举办了主题为“AI如何重构应用”的沙龙,探讨Al Agent开发者创新应用实践。

另外,微软、谷歌等科技巨头同样致力于开发AI助理(AI助理),让AI能自主操作手机、像人一样完成复杂的推理任务——

11月19日,在“Microsoft ignite 2024”全球开发者大会上,围绕AI助理,微软更新了多款AI产品。

谷歌宣布全力推广商用AI助理,已发布全球为数不多的商用AI助理市场,类似苹果的Store,AI助理市场(Space)则是谷歌推广计划中非常重磅的一个产品,才刚刚上线几天;

AI助理不仅仅是提供答案,而是为提高工作效率并代理用户完成多步骤、复杂的任务而构建的智能体,目前AI助理正加速企业智能化。

英伟达CEO黄仁勋近期表示SaaS企业正坐拥金矿,将诞生数百万AI智能体推动企业在特定任务上实现更高效的智能化管理;北美著名创投公司Y Combinator也在探讨垂直AI助理对现有的SaaS公司的意义;Servicenow、Salesforce、Shopify、Workday等众多北美SAAS公司正在利用AI助理驱动企业业务进一步智能化升级。

德邦证券最新研报表示,AI助理可以实现员工与数字生产力的协作,直接带来企业价值。随着底层大模型沿着推理端不断迭代,AI助理迎来良好的产业发展基础,美股AI助理已在B端例如广告营销、数据分析、办公应用、教育等多个领域取得显著进展,成为业绩增长的驱动力。未来,随着用户对AI应用关注度和使用粘性提高,在垂类场景具备行业know-how的厂商有望率先受益。

华泰证券表示,AI助理是通往AGI的核心基础,AI助理落地带来多个层次的产业机遇,其中,Agent+终端有望推动人机交互变革,除了在终端销售量价方面的变化外,可能对终端应用的商业模式产生更加深远的影响。

人工智能与量化交易算法知识库
黄含驰的人工智能、优化与量化交易算法知识库,干货满满,不容错过!
 最新文章