离谱,AI可以操控手机回复女朋友了!

职场   2024-10-28 13:21   广东  

大家好,我是小北。

AI 进化的速度真是太太太令我惊讶了!

上周 Claude 才发布了重磅的“computer use” ,AI 能够像人一样阅读电脑屏幕、点击、滑动、操纵电脑,打工人开始慌了!

没想到,这两天智谱又来搞活了,智谱在CNCC 发布了 AutoGLM!

他们还发了一个 AGI 的进程图:



这个灵感来自于《银河系漫游指南》里面那个终极答案42,而这个 AGI 进程图其实就是对标的人脑,而AutoGLM,就是AI,使用工具的能力。

所以简单来说 AutoGLM 就是 phone use能力,它能读懂屏幕、理解上面的内容,也能操作手机,只需要简单的语音或者文字指令,理论上就可以代替我们做一些日常手机操作。

那这不就是现在的手机助手?或者是加个 RPA?

no no no,就目前的 Siri 来说基本上估计大家都还停留在问问天气、定个闹钟、讲个故事这一层吧?

即便是国内最智能的某爱同学,我让它帮我点杯咖啡,也只能是打开美团就作罢,其余的操作都得自己来。

因为即便是手机厂商,它们拥有整个手机最底层、最高的权限,没有理解屏幕内容这一能力,很多操作也是无能为力的。

RPA(机器人自动化流程)就差得更远了,需要自己提起预设好操作路径,很难应对各种 APP 复杂多变的页面和各种弹窗。

话不多说,先上个视频大家感受一下:

看完发布会,迫不及待的申请了 AutoGLM 内测,想第一时间体验了一下这到底是真人工智能还是“人工智障”。

比如先来个最简单的

“打车去前海万象”

不得不说,它和人的操作路径完全一致,根据我的指令,明显看得到执行了下面几步:

  • 打开打车 APP
  • 唤起输入框,输入目的地
  • 从多个目的地选一个

但是目前第三步对于多个相似地点,AutoGLM 会询问你是哪一个。

从这里也能看得出,AutoGLM 是理解了屏幕上面的目的地内容的,而不是靠机械的预设一些指令。

这应该是我第一次用 AI 成功的打车!

那再稍微上点强度?

点杯咖啡吧,点外卖看起来和打车一样,实际会更复杂一些,外卖是非标品,有各种规格需要选择。

“帮我在最近的瑞幸咖啡点一杯美式”

AutoGLM 根据我的指令,打开了美团,搜索瑞幸咖啡,并且读懂了我的最近,直接按距离排序了店铺,然后进入店铺搜索美式

当然咖啡有加冰量、糖量等等各种定制化选择,它没法替我决定,所以遇到这种问题还得是问人,要么就需要在指令中提前说好规格。

AutoGLM 能做得远远不止这些,它甚至能替代我进行文章阅读、回复消息敷衍女朋友(逃)、朋友圈互动等等。

它能理解微信里的联系人、视频号、公众号、朋友圈、群,也能读懂里面的聊天内容,还能根据聊天内容进行回复。

比如我让它:

打开微信公众号找到人民日报关注他并且看看他最近一篇文章写的什么 然后点赞这篇文章


它真的打开微信,并且在我有多个微信的情况下(加的粉丝),它还会让我选择用哪个。

然后在输入框搜到人民日报,给它点了个关注,然后阅读了最新的文章,总结成摘要的形式,甚至还默默给文章点了个赞。

要说关注/取关公众号,RPA 能做到批量化,公众号文章摘要,微信公众号文首自带的 AI 也能做到。

但是像人一样打开微信去搜索一个公众号关注,然后浏览下最新的几篇文章,并且总结摘要,还要点赞。。。。

这可能只能是像人的 Agent 才行!

因为我有一万个好友,所以经常刷漏小神仙朋友圈,需要不定时的主动点进小神仙朋友圈,去进行彩虹屁🌈💨回复,现在完全可以交给AI 了。
比如中午约了个朋友吃饭,给小神仙说下午饭不回去吃了,再看看最新发了啥朋友圈互动一下嘿嘿

"打开微信找到小神仙姐姐 给他说我中午不回家吃饭了 然后看看她朋友圈最新发了啥,给她评论个有意义的回复 再点个赞"

看完这个,我想到 AutoGLM 最大的用处了!

背锅!

下次再有谁发一些不雅观的内容到群里,完全可以甩锅给 AutoGLM ,再也不用说被盗号了哈哈哈。

AutoGLM 不止能干这些,还能帮你逛小红书,阅读帖子做旅游攻略、订机票、火车票,在外吃饭帮你自动打卡好评领餐厅的福利等等

当然,现阶段 AutoGLM 也是有局限的,出于安全考虑,允许操作的 APP 还有局限,支付、下单等敏感操作也是受限制的,需要你的二次确认:

所以完全不用担心,它把你微信上的钱转给智谱了哈哈。

由于太好玩了,我几乎把它支持的能力测试了一遍,还触发到了单日上限:

总体来说,它目前能执行的任务还是比较明确的,对于需要融合多个 APP的操作还需要进化。

比如它可以打开公众号阅读文章,但是我想让它把阅读文章的摘要,邮件发给我,或者是记到备忘录上就G了。

2022年底,GPT3.0的出现让我首次感受到 AI 并非是人工“智障”。

2023年,GPT4.0的出现使我坚信 AGI 时代已经拉开序幕。

而 Cursor 则打破了我对AI只能执行独立、简单编程任务的固有观念。

AutoGLM则向我展示了真正意义上的智能助理。

也许,不久就要向 Siri 为代表的语音助手说再见了👋

如果说「computer use」开启了人机交互的新范式,那么「phone use」则更进一步,解锁更多应用的可能性,让 AI 真正惠及每一个人。

我再想未来到底什么是不能被 AI 替代的呢?


编程指北
大厂开发, 分享计算机、编程、科班学习经验和计算机基础知识,CS系统学习网站: csguide.cn
 最新文章