手机变身「聪明」的二重大脑!
移动设备助手一直以来都在和复杂任务较劲,直到MobA这个「双脑系统」。
这个系统像人类大脑一样,分成了两个层次:一个负责「思考」,一个负责「动手」。
双重大脑架构
MobA的「大脑」分工明确:
全局代理(Global Agent)就像是一个「总指挥」:
理解用户的指令
规划整体任务
管理历史记录
本地代理(Local Agent)则像是一个「执行官」:
按部就班地执行具体动作
完成每个小任务
这两个「大脑」通过四个关键模块协同工作:
计划模块:把复杂任务拆解成简单步骤
动作模块:生成并执行具体操作
反思模块:检查任务是否完成
记忆模块:提供上下文信息
突破性表现
在MobBench测试集上,MobA展现出了惊人的实力:
完成率高达66.2%,比第二名高出了整整17%
更高效地处理复杂任务
大幅减少无效操作
这意味着什么?
简单来说,MobA不仅能理解你想做什么,还能像人类一样,把复杂的任务分解成一个个小步骤,然后一步步完成。
最厉害的是,它还会「反思」——通过双重反思机制,即使面对从未见过的任务,也能从容应对。
MobA的出现,让我们离真正智能的移动助手又近了一步。它不仅能理解我们的需求,还能像人类助手一样,灵活地完成各种复杂任务。
论文地址:https://arxiv.org/abs/2410.13757
👇
👇
👇
👇
本文同步自知识星球《AGI Hunt》
星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。
每天约监控6000 条消息,可节省约800+ 小时的阅读成本;
每天挖掘出10+ 热门的/新的 github 开源 AI 项目;
每天转译、点评 10+ 热门 arxiv AI 前沿论文。
星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)
一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;
二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。
欢迎你的加入!