MobA:让AI 真正学会使用手机!

旅行   2024-11-12 00:24   北京  

手机变身「聪明」的二重大脑!

移动设备助手一直以来都在和复杂任务较劲,直到MobA这个「双脑系统」。

这个系统像人类大脑一样,分成了两个层次:一个负责「思考」,一个负责「动手」。

双重大脑架构

MobA的「大脑」分工明确:

全局代理(Global Agent)就像是一个「总指挥」:

  • 理解用户的指令

  • 规划整体任务

  • 管理历史记录

本地代理(Local Agent)则像是一个「执行官」:

  • 按部就班地执行具体动作

  • 完成每个小任务

这两个「大脑」通过四个关键模块协同工作:

  • 计划模块:把复杂任务拆解成简单步骤

  • 动作模块:生成并执行具体操作

  • 反思模块:检查任务是否完成

  • 记忆模块:提供上下文信息

突破性表现

在MobBench测试集上,MobA展现出了惊人的实力:

  • 完成率高达66.2%,比第二名高出了整整17%

  • 更高效地处理复杂任务

  • 大幅减少无效操作

这意味着什么?

简单来说,MobA不仅能理解你想做什么,还能像人类一样,把复杂的任务分解成一个个小步骤,然后一步步完成。

最厉害的是,它还会「反思」——通过双重反思机制,即使面对从未见过的任务,也能从容应对。

MobA的出现,让我们离真正智能的移动助手又近了一步。它不仅能理解我们的需求,还能像人类助手一样,灵活地完成各种复杂任务。

论文地址:https://arxiv.org/abs/2410.13757


👇

👇

👇

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

  • 每天约监控6000 条消息,可节省约800+ 小时的阅读成本;

  • 每天挖掘出10+ 热门的/新的 github 开源 AI 项目;

  • 每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)

  • 一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;

  • 二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。

欢迎你的加入!

AGI Hunt
关注AGI 的沿途风景!
 最新文章