首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

首发体验| AI学会发红包了！国产Agent一句话控制手机电脑，我看到了「摸鱼自由」的未来

科技 2024-11-29 13:05 广东

2024 年，AI 圈最火的关键词非 Agent 莫属。

从 GPTs 到能够自主行动的 computer use，再到最近 AI 初创公司 /dev/agents 凭借 Agent 操作系统估值 5 亿美元，厂商们都在寻找 AI 下一个明确的落地方向。

而在国内，上个月智谱 AI 也带来了自己的答案——AutoGLM。

如果掏出手机、打开应用、点击搜索、输入关键词...完成这些操作往往要经过四五步，而有了 AI，这些操作真就变成了一句话的事儿。

到了今天，智谱 AI 在北京也推出了一系列囊括多终端的 Agent 产品。

用户只需输入指令，GLM 即可理解指令，规划任务，然后识别界面中的窗口、图形、文字等，并且实现自动操作。

在 Agent OpenDay 现场，智谱 AI CEO 张鹏更是利用 AutoGLM 面对面建群，给数百位与会者发送了微信红包，以及线上的口令红包。

AutoGLM：移动端（暂时向 Android 开放），可自主执行超 50 步的长步骤操作，适用于比价、导航、超话打卡等复杂操作

GLM-PC：PC 端（暂时向 Mac 系统开放），适用于解放打工人双手的生产力工具，手机也能远程操作电脑

AutoGLM-Web：网页端，支持百度搜索、知乎、Github 等数十个网站的无人驾驶

AI 无处不在， Agent 同样也无处不在。换言之，从替我们思考替我们做事，Agent 正在重新定义智能设备。

附上体验跳转链接：

AutoGLM：https://agent.aminer.cn/

GLM-PC：https://cogagent.aminer.cn/home

AutoGLM-Web：https://new-front.chatglm.cn/webagent/landing/index.html?channel=ads\_news\_openday

别人家的 AI 都在聊天，这些 AI 却能帮我摸鱼

在之前的文章中，我们已经体验过智谱 AutoGLM 是如何接管我们的手机。

全自动发微信、逛淘宝……以往我们要自己动手的事情，现在都被 AutoGLM 包圆。并且，这位 AI 打工人今天还升级了，本事妥妥地见长。

我们也提前体验上了这些最新的 AI 工具。

我们的消费观是可以买贵的，但不能买贵了。

比如说，前不久，《人类简史》的作者尤瓦尔·赫拉利出版了《智人之上》，那为什么不让 AI 帮我在拼多多和淘宝上逛逛，看看哪家划算。

我只需要动动嘴，AI 就帮我跑断腿，不过如果仔细看，把书名弄混还是有点小瑕疵的。

不用担心你在嘈杂环境下不方便说话。

AutoGLM 还配了个「静音模式」，打字也能发号施令。而且在执行任务之前，AutoGLM 也给用户留了 3 秒后悔时间，让你随时能喊停，并调整执行任务。

追星族有个好消息，全新升级的 AutoGLM 连超话签到打卡都能搞懂。

以给李行亮的超话打卡为例，只需对着 AutoGLM 悬浮窗输入我的指令，AI 就会全程代劳，而我只需要遇到敏感信息时「露个面」就行，一键告别错过打卡的焦虑。

对了，这些日常任务还能设置快捷指令，一键搞定。

可不要小看这个功能，作为天选打工人，下午定时点的咖啡堪称「续命神器」，不需要每天反复设置，只需要保留下单咖啡的指令，妥妥省去不少功夫。

选择随便模式，所有步骤则是让 AI 为你决策，开启咖啡盲盒，但当涉及到发送，下单付款等重要操作时，AutoGLM 会主动将选择权重新交回给你。

跨应用协作是本次升级的重大亮点。

苹果牌 AI 已经向我们展示了系统级 AI 打通应用墙的重要性，而现在借助 AutoGLM，我们同样能够实现类似的效果。

比如我让 AI 去小红书搜个蒜蓉菜心的教程，接着成功转发朋友圈。

新增的 AI 导航功能也很实用。

想去广州塔？轻轻和 AutoGLM 说一声，AI 就把你安排得明明白白。

比较遗憾的是，AutoGLM 仅支持 Android 系统。但智谱即日起也将放开 AutoGLM 的用户内测名额，预计尽快面向广大用户开放。

智谱清言的插件 AutoGLM-Web 即日也同样起新上线 AutoGLM 功能。支持百度搜索、微博、知乎、Github 等数十个网站的无人驾驶。

在官方演示 demo 中，没有任何人干预，AutoGLM-Web 自动完成了「在百度搜索芒果 TV，打开再见爱人，播放最新一集，发弹幕」等一连串任务。

给王心凌微博点赞

从手机到电脑，让 AI 替我当打工人

与 AutoGLM 相比，GLM-PC 则在电脑端提供了更多面向职场场景的功能体验。

GLM-PC 当前专为搭载 M 系列芯片的 Mac 电脑打造，其中以 M1 和 M3 系列设备最为推荐。在对话框中输入你想进行的操作，GLM-PC 就会评估工具并决定操作计划。

当然，遇到敏感操作时，GLM-PC 就会自动暂停，等待用户操作或者进行确认。

想了解 B 站热门内容？GLM-PC 三下五除二就帮你找到「入站必刷」第一条，帮你省去不少漫无目的的划水时间。

要约张三开会？发条微信的事儿，交给 AI。甚至在有页面的遮挡的情况下，也能精准定位到微信的搜索框里。

它还能帮你预定腾讯会议，顺带把会议邀请发给参会人。建议完事后，把这套「操作秘籍」收藏起来，通过流程化来提升工作效率。

作为编辑，我个人最爱的功能是让它帮我梳理海外的 AI 新闻。发出指令后，AI 就会打开浏览器，输入网址，然后一份清晰的新闻总结就能到手。

对了，如果你是刚从 Win 转到 Mac 系统的新人，你多少会因为系统的变化弄到手忙脚乱。

现在 GLM-PC 就是你的「救命稻草」，无论是调整显示模式，还是其他设置，将你的诉求通通交给它。把麻烦的事情甩给 AI，把快乐留给自己，这才是人生赢家的正确打开方式。

GLM-PC 还有一个堪称「王炸」的功能。

先在 GLM-PC 设置中打开「挂起模式」，然后在手机上通过验证码登陆「https://cogagent.aminer.cn/m」，你的手机甚至可以远程遥控电脑。

具体来说，你可以远程给 GLM-PC 发指令消息，让 GLM-PC 进行电脑操作。GLM-PC 每执行一步就会返回操作时的屏幕截图，而如果有敏感操作，则会等用户进行确认后再操作。

在现场的演示中，张鹏也通过手机上 GLM-PC 网页对 cogagent 发布指令，成功通过电脑端的微信发送文件。

可以说，从 Chat 走向 Act，当 AI 真正开始解决日常琐事，它就从玩具变成了生产力工具。而这或许才是 AI 技术最该有的样子。

Phone Use 时刻

在这两个月手机圈密集发布了多款新品，其中有一个趋势值得留意。

虽然 AI 手机还没得到消费者的广泛认同，系统级 AI 成了各家厂商 OS 主打的亮点，其实这也是一种 Agent 落地普及的前兆。

无论是 vivo 的蓝心小 V 和发布会展示可以 AI 订餐的「Phone GPT」，华为鸿蒙的小艺和意图框架，还是荣耀的 YOYO 智能体，都和智谱今天发布的 Agent 的本质一样：

让 AI 模仿人类的 Plan-Do-Check-Act（计划-执行-检查-行动）循环，从而像人类那样去操作设备。

就像智谱 AI CEO 张鹏今天的发布会提到，目前的 Agent 能力更像是在用户和应用之间，增加一个智能的调度层，链接所有应用甚至是所有设备。

这可以看做是大模型通用操作系统 LLM-OS的一种雏形，智谱也将这套 Agent 交互称为 GLM-OS 的构建，将对人机交互形式产生极大的影响。

OpenAI 创始成员、AI 技术大牛 Andrej Karpathy 也曾多次谈到大语言模型操作系统（LLM OS）。

他认为大模型某种程度来说就是一种新的计算机和操作系统，它可以连接各种软件和硬件，以及所有模态信息组成的外设，并通过函数调用执行各种任务。

传统操作系统中，你需要围绕 CPU 构建一堆外设，比如鼠标和键盘、磁盘存储、以及缓存空间等。

而在 LLM OS 中，大模型本身就是中央处理器。I/O 外设也不再是鼠标和键盘，因为 LLM 可以兼容更多模态的数据输入和输出。同时大模型调用的外部工具也将从传统软件升级为智能体工具。

其中跨应用的操作是非常关键的一环，这意味着 Agent 能实现更加复杂的自主连贯操作，也可能走向真正的商业化落地。

关注 AI 第一新媒体，率先获取 AI 前沿资讯和洞察

我们在年初曾判断大模型将成为智能手机新的操作系统，自然用户界面（Natural user interface， NUI ）将逐步替代现有的图形用户界面（GUI）。

至于各家互联网公司提供的服务能否打通，可能是未来实现这种交互最大的障碍。但无论是智能手机还是应用，都终将是人类发展史上一个阶段性产物。

目前的 Agent 交互还在早期阶段，在行业内 Scaling Law 遭遇瓶颈的背景下， Agent 要怎么能成为真正的生产力工具，承担更高比例的工作决策？

智谱 AutoGLM 技术负责人刘潇在接受 APPSO 采访时表示，预训练肯定还要继续，但对于算法和数据的训练会有一套新的逻辑。

智谱 AI CEO 张鹏也告诉 APPSO，团队对于 Scaling Laws 的空间相对乐观，希望在新的范式和生态下去探索更多可能性。

实际上，今年很多厂商不约而同用自动驾驶来形容 AI 终端的智能程度， OpenAI也将 AI 划分为 L1-L5 五个等级。

与 OpenAI 有所不同，智谱将大模型发展的五个阶段定义为：L1 语言能力、L2 逻辑能力（多模态能力）、L3 使用工具的能力、 L4 自我学习能力、 L5 探究科学规律。

张鹏认为，大模型已经初步具备了人类与现实物理世界互动的部分能力。「Agent 将极大地提升 L3 使用工具能力，同时开启对 L4 自我学习能力的探索」。

从 Phone Use、Computer Use、Car Use 到 All Device Use，大模型的思考能力和 Agent 交互逐步影响我们使用智能设备的方式。

让 AI 发微信和点赞现在看起来实用意义有限。但如同 AlphaGo 无论下棋多强都不会对社会带来多少影响，Google DeepMind 的 AlphaFold 可以预测几乎所有蛋白质结构，帮助大量疾病的治疗和研究。

背后的范式改变才是撬动人类生活方式更新的杠杆，Agent 让大模型从 Chat 走向 Act，所谓 AI 终端的形态才逐渐浮现，而非只是一个命名的改变。

http://mp.weixin.qq.com/s?__biz=MjM5MjAyNDUyMA==&mid=2651031554&idx=1&sn=be44291bc69def946bcab656f150db95

AI 第一新媒体，「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative AI

最新文章

首发体验| AI学会发红包了！国产Agent一句话控制手机电脑，我看到了「摸鱼自由」的未来

字节跳动起诉前实习生并索赔 800 万/华为百万级轿车 48 小时预订量达 2108 台/支付宝上线「AI 帮找工作」功能

Sora 泄露事件背后，艺术家为什么要集体反抗 OpenAI？

AI 视频巨头重磅更新！提示词都不用费劲写了，从未有过这样的视频创作方式

OpenAI 再获软银 15 亿美元投资 / 比亚迪回应要求供应商降价:非强制要求/《王者荣耀》卫冕 10 月全球手游收入冠军

Sora 遭遇严重泄露！艺术家愤怒「复仇」OpenAI，测试渠道全网疯传

史上最薄 iPhone 或全面取消实体SIM卡/预售价百万起，华为发布尊界S800/英伟达展示AI语音模型

Mate 70 发布！华为最强 AI 手机来了，余承东高呼对得起「那四个字」

网易云音乐怒斥 QQ 音乐「剽窃式创新」/华为Mate70系列支持 AI 手势隔空传送/库克来华：没中国就没苹果今天的成就

国行 iPhone 16 实现 AI 自由，三步就够了

微信内测原图原视频 14 天自动清理功能/iPhone17系列仅Pro机型搭载5倍光学变焦/AI助力，陶哲轩宣布等式理论计划成功

AI 聊天机器人让用户去死，大学生吓到崩溃，官方紧急道歉

AI或成华为Mate70最大卖点/苹果Siri大升级，2026年拟超ChatGPT/可口可乐AI广告翻车|Hunt Good周报

刚刚，黄仁勋获港科大荣誉博士，演讲大秀中文，称 AI 可能是人类历史上最重要的技术

你画 AI 猜，这个开源 AI 图像神器，在玩一种很新的 P 图

小米将承担 SU7 自动泊车异常维修费用/麦当劳和支付宝力推「碰一下点餐」/OpenAI 正考虑推出自研浏览器

国产大模型黑马的首个推理模型来了，和 o1 PK后，我发现了AI深度思考的大问题

《黑神话：悟空》获金摇杆奖年度游戏/胖东来回应「员工结婚不许要彩礼」/OpenAI 薪酬曝光，奥特曼年薪仅 55 万

农夫山泉钟睒睒炮轰张一鸣，要求道歉/马斯克：AGI最晚2026年实现，人形机器人超100亿/曝华为鸿蒙智行销售车型明年翻倍

初代星舰最后一飞！首次在太空点燃猛禽发动机，马斯克、特朗普现场观看

iPhone 17 Air 厚度曝光，将是苹果最薄手机/余承东展示华为Mate70 细节/阿里通义千问发布新开源 AI 模型

马斯克与 OpenAI 决裂内幕全曝光！这封邮件让他破防，怒斥「我受够了」

从 GPT-2 开始玩 AI 的博士生，把论文做成了上线 Steam 的独立游戏｜AI 新职人

华为Mate70系列开启预售，预约人数超200万/《黑神话：悟空》获TGA年度游戏提名/英伟达AI芯片被曝存在过热问题，交付推迟

马斯克新 AI 破解千年难题却被紧急喊停？这个「玩笑」怎么让 AI 圈一夜未眠

首发 | Kimi 首个多模态功能体验，AI 一键为音乐生成 MV，月之暗面不再只卷长文本

华为 Mate 70 定档海报提前曝光/AI 疑似证明黎曼猜想，已被叫停/vivo X200 系列更新改善炫光

看着这个 AI 奶奶把骗子耍得团团转，可把我高兴坏了

马斯克再谈约架扎克伯格：随时奉陪/传满血版 o1 下月推出/苹果或将推出 AI 智能家居中控屏 | Hunt Good 周报

Kimi 发布新模型对标 OpenAI o1！月之暗面创始人回应近期争议

给马斯克上了瑞士卷大考后，我终于拿捏这个国产 AI 视频模型的最强新功能

17 岁高中生写了个神级 Prompt，直接把 Claude 强化成了满血 o1

余承东曝Mate70将在本月26日发布/美团哈啰单车在郑州停运，哈啰已恢复/OpenAI 拟打造AI 经济区与中国竞争

AI 最可怕的不是取代人类，是已经让我们不相信看到的是真照片

iPhone 15成Q3全球销量最高智能手机/OpenAICEO辟谣AI发展「撞墙」论/B站上市后首次单季度盈利

OpenAI 最新产品全曝光！奥特曼驳斥 AI 发展撞墙，Ilya 认错，秘密寻找下一个重大突破

苹果广告又翻车，给 AI 产品做创意怎么就不能 Think different

OpenAI 下一代模型遭遇重大瓶颈，前首席科学家透露新技术路线

曝小米AI眼镜将于明年发布，雷军预期出货30万台/马斯克新职务官宣，狗狗币大涨/苹果或将推出 AI 智能家居中控屏

黄仁勋最新演讲：每家公司都将成为 AI 制造商 | 万字实录

OpenAI 总裁宣布回归！结束「最长假期」，将专注重大技术挑战

2025 放假安排公布，增加两天假期 / 李子柒恢复更新，播放量破亿 / 百度发布首款 AI 眼镜

百度发布首款 AI 眼镜！比 Meta 爆款更卷，苹果也在押注的智能眼镜正在爆发

支付宝崩了上热搜，官方致歉/字节豆包发布新模型，AI 一句话 P 图/罗永浩发文怒喷餐厅卖预制菜

人类智力锁死在了 2021，OpenAI CEO 预言 AGI 可在 5 年内实现 | 万字专访实录

独家首测：全新 Mac mini 的 Type-C 接口能供电了？实测后，我们发现了苹果的秘密

OpenAICEO ：AGI将于2025年到来 / iPhone 部分旧款机型降至半价 / 开封夜骑爆火，官方喊话夜骑大学生

黄仁勋两万字访谈实录：希望英伟达拥有 5 万名员工和 1 亿个 AI 助手

传 Sora 两周内推出/OpenAI 元老、北大校友翁荔宣布离职/Google 版「贾维斯」泄露 | Hunt Good 周报

打败 Midjourney，匿名屠榜的 AI 生图黑马，让人人都能设计海报

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉