AI也能像人一样玩手机？智谱AI推出自主智能体AutoGLM

情感 2024-10-28 17:42 重庆

或许，智谱AI将为当下AI时代书写具有划时代意义的一笔。

近日，智谱AI团队推出了基于GLM技术团队研究的创新智能体产品——AutoGLM。它仅需简单文字或语音指令即可在手机上实现操作，智谱AI将其称为“phone use 能力”。该款智能体的问世，意味着未来人们只需通过简洁的指令，AI就可能完成任何指令要求的内容。

如果说 “computer use” 开启了人机交互的崭新范式，那么 “phone use” 则更进一步，将解锁更多应用可能性。

从智谱AI此前发布的视频来看，AutoGLM能够执行网购、线上订餐、朋友圈点赞评论、整理社交媒体内容等任务。目前，AutoGLM已适配多款知名应用，涵盖了日常生活的多个方面。

智谱AI表示，理论上AutoGLM可以完成人类在电子设备上可以做的任何事，它不受限于简单的任务场景或API调用，也不需要用户手动搭建复杂繁琐的工作流，操作逻辑与人类类似。

相较于此前发布的功能产品，AutoGLM极大地拓宽了AI的应用边界，这得益于智谱AI对手机界面的深刻理解和强大的学习能力。

AutoGLM基于智谱AI自研的“基础智能体解耦合中间界面”和“自进化在线课程强化学习框架”。其中的核心技术WebRL，克服了大模型智能体任务规划和动作执行存在的能力拮抗、训练任务和数据稀缺、反馈信号稀少和策略分布漂移等智能体研究和应用难题，加之自适应学习策略，能够在迭代过程中不断改进、持续稳定地提高自身性能。

换言之，AutoGLM真正做到了像人类一样，通过学习和实践不断进步。它不仅能学习新技能，还能自我纠正和改进，确保在实际应用中更好满足用户需求。

值得一提的是，AutoGLM在Phone Use和Web Browser Use上都取得了显著的性能提升。

从智谱AI发布的内容，在AndroidLab评测基准上，AutoGLM显著超越了GPT-4o和Claude-3.5-Sonnet的表现。在 WebArena-Lite评测基准中，AutoGLM 更是相对GPT-4o取得了约200%的性能提升，大大缩小了人类和大模型智能体在GUI操控上的成功率差距。

对于大众普遍关心的隐私安全问题，智谱AI表示AutoGLM不会主动获取用户的个人隐私信息，如果需要执行授权范围之外的任务，AutoGLM会主动提示以获取用户同意。即使用户向AutoGLM授权，也不意味着AutoGLM永久拥有相关权限，每次后台启动AutoGLM，都会重新向用户申请无障碍权限。

目前，AutoGLM Web已经对外发布，手机端AutoGLM则只开启内测，暂时仅支持安卓系统。

除了AutoGLM，智谱AI此次还开源了GLM-4-Voice端到端情感语音模型，这也是智谱AI首个开源的端到端多模态模型。

与传统的ASR+LLM+TTS的级联方案相比，GLM-4-Voice端到端模型以音频token的形式直接建模语音，在一个模型里面同时完成语音的理解和生成，避免了级联方案的信息损失。

使用体感上，相较于两个月前发布的视频通话技术里机械呆板的回复，此次的GLM-4-Voice有了显著的进步，不仅声音有不同的情感和细腻的变化，还可以随时打断并要求改变语速，方言沟通也十分顺畅。

目前该功能已在“智谱清言”APP上线，可直接调用。

作为AI大模型公司里的头部企业，智谱AI一直致力于朝着人工通用智能（AGI）的目标迈进。AutoGLM等功能的发布，为AI智能体在C端的应用普及注入了新动力，即将成为行业落地AI新范式。

END

商界BIZTECH

http://mp.weixin.qq.com/s?__biz=MjM5MTg5ODAyMQ==&mid=2652152209&idx=1&sn=655e1fd852ca35fefab2c9ceb4625759

商界BIZTECH

打造新科创第一媒体做AI场景应用领航者

最新文章

拿下国内第一！这家初创大模型公司终于不再低调

AI超级应用第二战场：陪伴型产品的潜力与边界

最全！这些国内eVTOL亮相第十五届中国航展

最复杂多智能体发布！百度推出“秒哒”和文心iRAG

资本涌入、基金成立，低空经济成2024年最大黑马

跨界涌入人形机器人？做充电宝的、空调的都来了

具身智能中场思考：人形机器人要多像人？

仅重25KG，国内首台超轻量级人形机器人问世！

AI也能像人一样玩手机？智谱AI推出自主智能体AutoGLM

商业航空风口来临！太空旅行船票首次公开售卖

对话|久尺网络胡建强：长期看算力应与终端分离，未来更宜放云上

强联智创®完成亿元D+轮融资，加速推动医药健康产业高质量发展

对话|帕西尼许晋诚：未来的人形机器人也会疼

百亿基金成立！AI融资热度不减，国内外持续加码

“筷子夹火箭” ，SpaceX星舰首次回收成功

AI再夺诺奖！2024年诺贝尔化学奖也颁给人工智能

2024年诺贝尔物理学奖揭晓！AI教父获奖

填补空白！我国首次成功点亮硅基芯片内部激光光源

对话|星海图高继扬：打造“一脑多形”的具身智能机器人

对话|蓝驰创投曹巍：机器人公司要做有一技之长的“六边形战士”

AI＋家用、商用清洁机器人，下一个蓝海市场！

专访钛虎易港：人形机器人商用元年即将来临！

见证历史！人类首次商业太空行走

专访李青阳：“人工智能＋”时代，数智化赋能产业升级

首个AI大模型供应链安全国际标准发布，蚂蚁、谷歌、百度参与编制

飞行汽车、人形机器人、……这些AI产品亮相外滩大会！

英伟达被美国司法部反垄断调查？最新回应来了！

研学| 抓住“新”制造风口，跑出行业“加速度”

AI＋教育，重塑有教无类范式

大咖云集！机器人创投论坛观点集锦来啦！附中国最具投资潜力机器人公司TOP20名单

一文了解：这些机器人亮相2024年世界机器人大会

反AI产品GPT Zero火了，6个月狂涨300万用户

2024世界机器人大会，倒计时5天开幕！

Open AI官宣GPT-4o上热搜，透露草莓计划进度

AI机器人下单MONA？小鹏官宣机器人最新进展

盘点医疗领域AI大模型：百度、百川智能、讯飞、商汤科技押宝

一笔生成运动轨迹！阿里版“Sore”视频生成框架Tora开源

360与15家AI搜索公司大联合！掰腕GPT-4o

京东云力推8大AI产品，打通大模型最后一公里

蔚来加码AI！5nm芯片、整车全域操作系统赋能智驾

智谱AI推出视频生成模型CogVideoX，30秒即可生成6秒视频

强联智创携AI医疗创新成果亮相2024中关村论坛

新质生产力按下“快进键”，半导体产业发展该走向何方？

商界科创 | 资讯简报

签约！商界科创又与两家重要伙伴牵手

【今日直播预告】2024英伟达GTC见闻与趋势漫谈

【直播预告】2024英伟达GTC见闻与趋势漫谈

商界科创助力强联智创® 赋能科创AI传播新动力

首个面向科创企业的AI传播应用解决方案发布 | 商界科创2024新知TALK昨在上海圆满举行

D轮融资达近亿元，强联智创®为何频获资本青睐?

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉