首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

智谱Openday：打工人的私人助理上线，人机交互范式走向新的阶段！

科技 2024-11-29 11:21 中国

生成式AI与多模态带来的便利已经无法忽视，下一阶段的原生AI时代是否即将来临？

里

作为最早探索 Agent 的大模型企业之一，11月29日，智谱Openday带来了多个新进展：

AutoGLM 自主执行超过 50 步的长步骤操作，可以跨 app 执行任务

AutoGLM开启「全自动」上网新体验，支持等数十个网站的无人驾驶

像人一样操作计算机的 GLM-PC 启动内测，手机也可以远程操作电脑

Agent OpenDay 现场，智谱的CEO张鹏现场示范了AutoGLM的交互！

只下达了简单的语音指令，AutoGLM便自己操作建立了微信群，发送「一个来自 AI 的微信红包」；以及用AutoGLM发送支付宝口令红包。

这些原本对于机器而言非常复杂的操作，今天完全由智谱产品化的Agent完成了。

AutoGLM 新升级：挑战更复杂

这次AutoGLM的进一步优化，也带来了新的惊喜，新升级的 AutoGLM已经可以挑战完成复杂任务，帮助用户从复杂的生活琐事中解脱出来，逐步拥有一个私有助理。

超长任务：理解超长指令，执行超长任务。例如，在采购火锅食材的例子中，AutoGLM 自主执行了 54步无打断操作。并且，在这种多步、循环任务中，AutoGLM 的速度表现超过人手动操作。

跨 app ：AutoGLM 支持跨 App 来执行任务。用户将习惯于 AI 自动处理，而不是在多个 APP 间来回切换。由于目前 AutoGLM 形态更像是用户和应用间的APP执行的调度层，因此跨 App 能力是里面非常关键的一步。

短口令：AutoGLM 能够支持长任务的自定义短语。今天，你不用再给AutoGLM说：“帮我买一杯瑞幸咖啡，生椰拿铁，五道口店，大杯、热、微糖” 这类超长指令，只需要说“点咖啡”。

随便模式：我们都会陷入选择恐惧，AutoGLM 今天可以主动帮你做出决策。随便模式下所有步骤都让 AI 决策，带来有抽盲盒式的惊喜。想不想尝尝AI为你点的咖啡口味？

同时 AutoGLM 启动大规模内测，并将尽快上线成为面向 C 端用户的产品。AutoGLM 同时宣布启动「10个亿级 APP 免费 Auto 升级」的计划，邀请 App 伙伴联合探索自己的 Auto 新场景。

支持核心场景和核心应用的 AutoGLM 标品 API，会在两周内上线到智谱maas开放平台（bigmodel.cn）试用。

Web 端开启「全自动」上网新体验

即日起智谱清言插件上线 AutoGLM 功能，支持搜索、微博、知乎、Github 等数十个网站的无人驾驶。

在现场demo里，智谱清言插件自动完成了“搜索芒果tv，打开小巷人家，播放最新一集，发弹幕结局打卡”。全程没有人的干预。

GLM-PC 邀测-面向「无人驾驶」电脑的一次技术探索

不只是基于手机和浏览器，今天智谱还带来基于 PC 的自主Agent。GLM-PC 是 GLM 团队面向「无人驾驶」PC的一次技术探索，基于智谱的多模态模型 CogAgent。

目前开放第一阶段的内测场景，包括：

远程和定时操作：远程手机发指令，GLM-PC 可以自主完成电脑操作；设定一个未来时间，在开机状态下定时执行任务。

隐形屏幕：在用户工作时，GLM-PC 可以在隐形屏幕上自主完成工作。

会议替身：帮用户预定和参与会议，发送会议总结。

文档处理：支持文档下载、文档发送、理解和总结文档。

网页搜索与总结：在指定平台（如微信公众号、知乎、小红书等）搜索指定关键词，完成阅读、总结。

人用电脑的过程——用眼看图形及文字，用脑规划，再用手执行单击双击、输入等操作。

GLM-PC 用电脑的方式几乎完全和人一样。也正因如此，理论上只要是为人类设计的应用，在GLM-PC学习之后它都能够执行。这是一种系统级、跨平台的能力，不依赖于 HTML、API，具备更高的能力上限。

不过，由于 PC 的复杂程度，以及大家在 PC 完成的几乎都是复杂任务，坦率的说，今天大模型的能力距离真正代替大家办公还有一定距离。

在 GLM-PC 的内测体验中，用户仍需要非常精准的输入指令。

GLM-PC「邀请体验」已开启。

智谱表示也会继续努力，在产品完善后尽快上线供所有用户使用，同时也希望和更多厂商联合共创共同探索。

AutoGLM 和 GLM-PC 的技术原理在于实现 AI 操作系统。

它们的出现源于智谱在大语言模型、多模态模型、逻辑推理和工具使用等方面的技术积累。从23年4月的AgentBench开始，到8月的CogAgent模型，智谱针对AutoGLM，和GLM-PC的模型CogAgent的研发工作进行了一年半的时间。

与 OpenAI 有所不同，智谱定义了大模型发展的五个阶段：L1 语言能力、L2 逻辑能力（多模态能力）、L3 使用工具的能力、 L4 自我学习能力、 L5 探究科学规律。

发展至今，大模型已经初步具备了人类与现实物理世界互动的部分能力。“Agent 将极大地提升 L3 使用工具能力，同时开启对 L4 自我学习能力的探索。” 张鹏说。

张鹏表示，未来 GLM 团队将继续加速 agent 模型产品的研发，期待着一句话操作电脑和手机的范式尽快到来。

大模型从 Chat 走向 Act

在大模型技术之前，没有任何方法能智能地实现人和机器交互。

如今，大模型技术正在改变机器和人的互动方式，基于理解需求、规划与决策、执行行动和自我反思，Agent 将带来符合直觉的人机交互——从人适应机器，到让机器适应人。

苹果（Apple Intelligence）、Anthropic（Computer Use）、谷歌（Jarvis）和 OpenAI（Operator）等企业也已经把 Agent 作为 2025 年的主要关注点。

业内普遍认为，2025 年将是 Agent 爆发之年。Gartner 近期将 agentic AI 列为 2025 年十大技术趋势之一，并预测 2028 年至少有 15% 的日常工作决策将由 agentic AI 自主完成，而这一数字在 2024 年为 0。

与 GenAI 不同，Agent 是目标驱动型的，能够完全执行工作流程，适应、学习、迭代、与其他系统和人类协作，并端到端地完成任务。

在张鹏看来，Agent 可以看作是大模型通用操作系统 LLM-OS 的雏形。

“现阶段，AutoGLM 相当于在人与应用之间添加一个执行的调度层，很大程度上改变人机的交互形式。

更重要的是，智谱看到了 LLM-OS 的可能，基于大模型智能能力（从 L1 到 L4 乃至更高），未来有机会实现原生的人机交互。将人机交互范式带向新的阶段。”

AI 时代智能设备新范式

AI原生设备争先涌现

随着大模型能力的不断进化，慢慢看到AI长出了自己的脑、眼和手。不仅仅是智能在持续增强，感知能力和交互带宽也在不断丰富和拓展，还有现在的 Agent 带来了执行力的加速提升。

智谱 COO 张帆表示，智能设备在大模型的加持下，将会焕发出新的机会。手机+AI 会变成随身个人智能助理，PC+AI 将会成为全新生产力工具，汽车+AI 将会让车成为人们的智能第三生活空间。

当然，大模型不仅仅会为手机、PC 和汽车带来机会，而是会惠及各种各样的智能设备。大模型的不断进化已经为 Agent 变革人车交互体验奠定了强大的基础。

随着端侧性能及算力持续提升、为AI原生设备适配的模型和端云同源的协同架构出现，Agent 不仅在操作系统 OS 和应用上实现用户体验变革，还能将其推广到各类智能设备上，从手机到电脑，再到汽车、眼镜、家居和各种 edge side 设备，各种 AI 原生设备正在争相涌现。

荣耀 AI 技术总监王作建、华硕 AIPC 智能生态负责人钟怀圣、小鹏汽车座舱智能语音/智能化业务负责人廉磊、高通 AI 产品技术中国区负责人万卫星、英特尔中国区技术部总经理高宇，作为智谱的客户及合作伙伴，分别从不同的场景出发，分享了他们对智能终端的实践及展望。

大模型和 Agent 的发展不仅为用户带来了AI时代智能设备的新范式，更意味着大模型技术更广阔的落地空间。

从智能设备走向智能网络，在不久的将来，我们将看到AI原生设备的互联互通和无限可能。

在这个过程中，智谱也将提供一系列的产品和能力，帮助智能设备们拥抱大模型，加速迈向 AI 原生设备新时代。

推荐阅读

END

http://mp.weixin.qq.com/s?__biz=MzA5NTI1MDEyNA==&mid=2652719236&idx=1&sn=ab7732a246db5f9f2ec895e58aef7ce5

科技与产业创新服务平台

最新文章

立足长远，拼多多放缓脚步，将视野投向长期价值

直击美团三季报：营收936亿元，核心本地商业增长20%，新业务亏损收窄

外卖鼻祖，一折卖了

鹿明机器人获天使轮融资，创始人曾任追觅科技高管

智谱Openday：打工人的私人助理上线，人机交互范式走向新的阶段！

揭秘：马斯克与OpenAI的恩怨始末！

谷子经济爆火：不结婚的年轻人，在毛绒世界里过家家

打工人，年年买不起羽绒服？

刚刚： OpenAI白嫖惹众怒，转身又宣布了 15 亿美金的融资！

你的Kimi在做数学题，新一代数学推理模型k0-math正式发布！

挑战3C霸主？电纸书还挤不上主流“牌桌”

你买的鞋呢？卖了！钱呢？又买鞋了。那鞋呢？又卖了！钱呢......

AI眼镜，这次真撕掉了“电子垃圾”的标签？

新一轮裁员10%、明星业务下滑，Keep再遇寒冬

首款全彩双目光波导分体式AI+AR眼镜正式问世！

日进180亿元，“三桶油”线下抢桩

净利率暴跌，金融IT海外求生？神州信息VS长亮科技财报解析

杨歌Gary：特朗普胜选后的格局剧变

智能戒指Oura获投7500万美金，扎克伯格也是用户

亲民且开源！阿里推理模型Marco-o1震撼发布！

重磅！单做AI搜索不够，OpenAI要开发浏览器！！趁机火拼谷歌！

拼多多发布Q3财报：营收994亿元，同比增44%；净利润250亿元，同比增长61%

AI搜索：技术与商业的“双面棋局”，要革小红书的命？

百度Q3财报：净利润增17%超预期，文心大模型日调用量增30倍达15亿

WIM2024创新者年会榜单征集评选开始了！

钟睒睒把自己“逼”到了企业家直播的对立面

AI界的拼多多又来整活！deepseek全新上线R1-Lite预览版！

英伟达发布最新Q3财报，净利润同比增长109%！但股价却跌了？

快手发布2024年Q3炸裂成绩单：利润31.19亿元，同比大增41.1%，电商GMV达3342亿元

钟首富，初遇滑铁卢

60岁掌门人重返一线，过气奶茶香飘飘陷入迷途

女首富宗馥莉，搞不定“无糖”，如何续写自己的新故事？

“减肥神药”暴利生意经：马斯克“代言”，两巨头今年已赚1196亿元

中国年轻人不爱保时捷了

过气网红，夜店再就业

苹果减产、华为“难产”，平替者强势入局，头显真凉了？

拥挤的智能AR眼镜赛道，行业老炮Rokid再战产业新兵

“AIGC第一股”跌成“最惨AI股”，出门问问投资者巨亏数千万

银河通用获5亿元战略轮融资，探索多场景商业化落地

真的假的？马斯克大模型搞定黎曼猜想？

阿里巴巴2025财年Q2财报出炉：营收2365亿元，净利润增长63%，淘天集团营收989.9亿元

联想业绩暴增背后，ISG业务仍拖后腿，亏损超5亿元

京东发布2024年Q3财报：营收2604亿元，经营利润120亿元，启动50亿美元新回购计划

80后Keras之父从谷歌正式离职！谷歌两位重量级VP联名感谢！

大佬喊话，AI寒冬已来？

灵宝CASBOT首款人形机器人产品—CASBOT 01发布，通用类脑智能机器人瞄准多场景落地

双十一，那个消费狂欢时代结束了

具身智能“投资热”仍在持续，高瓴创投、蓝驰创投领投具身智能创企

百度世界大会，李彦宏甩不出“王炸”！

赛程近尾声，谈谈第16个“双十一”的三大看点

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉