事件:智谱Openday发布AutoGLM新进展、AutoGLM-Web、GLM-PC、以及全球首个UI Agent视觉基座模型,展示AI Agent在手机、网页、电脑端的新交互方式,进一步推动国内端侧AI Agent落地。
1、较内测版的变化:
1)新增GLM-PC对标Antropic Computer Use具备电脑操作能力,可完成网页浏览、微信文件发送、会议总结等工作,并支持用手机完成电脑远程操作。
2)AutoGLM支撑更多主流APP,包括抖音、微博、饿了么、京东、拼多多等,支持跨终端APP操作和更复杂任务流程,现场展示50步超长任务应用。
3)AutoGLM-Web同步支持跨网站复杂流程操作,任务稳定性提升。
1)模型具备自主规划、决策、感知、执行能力,新一代模型支撑下有望出色完成多步骤、跨场景的应用。
2)跨APP操作意味着用户可以通过一个统一的界面控制和链接多个APP,极大地提升了用户体验和操作效率。
3)配合各种智能终端的升级,Agent可速扩展终端带来新的市场机会。荣耀、华硕、小鹏、高通、英特尔等AI业务负责人作为智谱合作伙伴均到场并从不同场景做了分享,可见各厂商的重视。
3、AutoGLM、GLM-PC启示:
大模型强调推理后的能力水平,或足够支撑部分应用涌现:
1) 复杂行为规划能力大幅提升下,大模型已经初步具备模仿人类使用端侧设备的能力;
2)当前仍处于Agent早期阶段,产品最终形态远未达到;
3)2025预计是AI Agent元年,预期将催生更多AI应用;
4)Agent 和推理本质上服从着同一套Scaling Law,而先行者可以通过不断的技术创新和数据积累,形成竞争优势。
4、AI仍然是科技领域的最强叙事:
1)从产业发展逻辑来说,①AI模型及应用都在加速落地,而硬件公司也会加速这种趋势,应用的爆发才能为硬件带来新的需求;②随着B卡部署、推理优化、模型优化,推理成本会大幅降低,各种形式的AI应用爆发将逐渐具备条件;③AI应用的商业模式已得到认证,收入覆盖token cost是产业愿意尝试投入的前提,也是AI应用繁荣的前提条件。
2)美股软件股的未来备受期待,近期股性远超Semi/硬件,AppLovin、Shopify、Duolingo、Palantir、CRM、Adobe等年内都录得不错的涨幅,AI软件的逻辑被AI驱动的业绩成功演绎。映射到A股,AI营销、AI电商、AI音频、AI视频、AI Agent等AI应用主题,以及AI耳机、AI眼镜等软硬件结合的趋势,将会为25年带来巨大的投资机会。
3)AI产业的演绎是政府支持、符合国策的。工信部近期表示,加快人工智能技术研发和应用推广,是我国赢得全球科技竞争主动权的重要战略抓手。10月21日,工信部领衔会议提出“中关村倡议”:一是跨区域合作,各大高新区将发挥各自特色,联合打造人工智能产业集群。不同地区的人工智能产业资源也将开放共享,形成强大的创新协同效应。二是AI赋能千行百业,从制造业到服务业,AI的场景应用会越来越丰富,推动实体经济的智能化升级,为千行百业带来新的发展机会。三是打造全球AI“风向标”。四是守护安全底线。
5、关于AI应用映射:
一句话总结,业绩超预期是核心,同时AI Agent在客户侧确有明显加速。展开来看:
1)几乎所有大涨的公司,都是Q3业绩超预期(“业绩超预期说什么都可以相信”)。
2)三家公司明显受益于AI,包括决策分析(Palantir)、销售支持(Salesforce、Hubspot)。
3)关于中国落地情况,根据近期产业调研,客户侧应用渗透率较慢。我们认为,这与中国企业软件付费意识,当下经营策略(降本增效)较相关。
4)周三Salesforce发财报很重要,这一波美股Agent的起点就是从Salesforce招1000个销售推销AgentForce开始的,关注Q3业绩与现金流;
5)AI语音演绎超预期:上周五Soundhound与Cerence分别大涨18%与10%,AI语音的叙事,从简单的个人助理,拓展到餐厅汽车金融医疗等各个场景
6)AI游戏值得关注:马斯克发文,宣布xAI将成立一家AI游戏工作室。前期恺英投资者活动EVE有新预告,演示亮眼。
6、近期Agent催化:
国内:国产AI超预期:智谱AutoGLM和各端侧厂商的合作;华为Mate 70预计推出AI端侧。
海外:谷歌基于Gemini2.0的AI Agent Javis;OpenAI内部已有Agent雏形,名为“Operator”的AI Agent(AI代理、AI智能体)计划于明年1月发布,Sora预计近期发布;苹果预计2025发布跨APP屏幕识别能力。
7、关于端侧AI:
巨头对入口的争夺成为关键,节奏看12月到明年Q1,巨头产品迭代预计显著加快无论是华为Mate 70(小艺)还是苹果(Siri AI化),亦或是字节豆包生态的加速。
1)AI Agent为释放LLM潜力关键媒介,扮演着LLM与AGI之间的桥梁,为LLM核心算法注入强大执行能力。作为一种基于输入输出的响应系统,LLM的输出严格依赖于输入的质量和相关性。与LLM相比,AI Agent提供了更为全面的功能范围。AI Agent的能力可以定义为“大模型+记忆+主动规划+函数调用”的综合体。基于LLM构建的AI Agent由三个主要部分组成:感知端、控制端和行动端。控制端作为核心,其大脑模块负责记忆、思考和决策制定等基础功能,而感知模块则负责接收和处理来自外部环境的多样化信息输入,如声音、文本、图像和位置数据。行动模块则通过生成文本、API调用、工具使用等方式执行任务并影响外部环境。这种结构化的分工使得AI Agent能够以高度自动化和智能化的方式响应复杂的任务和环境变化。在底层模型升级+工程化方法改进的共同推进下AI Agent的性能有望持续提升。
2)端侧落地百花齐放,眼镜+多模态AI为个人AI Agent最好形式之一。AI眼镜在信息输入输出的即时性方面具有显著优势。基于其硬件设计,能够支持用户长时间佩戴,从而为其提供持续的服务能力。相较于其他智能终端,由于AI眼镜与用户的面部接近,更易获取接近人类感官单元的信息,实现“看人所看”、“听人所听”的功能,收集更多的用户行为数据以供学习。此外,AI眼镜的交互性要求其能够通过摄像头感知外部世界,通过语音与用户进行交流,并将信息直接显示在眼镜上,只有具备交互性的多模态大型模型才能满足AI眼镜的应用需求。根据VR陀螺,预计2024年Q4至2025年Q2将有大量AI眼镜产品上市,目前已公开、被披露进入AI眼镜领域的厂商高达36家(包括海外厂商),产品数量预计超过50款。智谱也在发布会释放出AutoGLM和眼镜厂商的合作。
投资机会主要在两个层面:
1)数据是端侧AI Agent微调的关键,海天下游需求从二季度明显加速(某全球智能终端绝对龙头),且不只是语音数据。
2)无论哪个端侧AI终端品牌爆发,都离不开芯片的支持。以我们熟悉的3C终端设备为例,是0-1如AI眼镜,是渗透率再提升如AI耳机,还有单价提升。最核心的环节仍然是芯片:(1200-2000元的眼镜,其中高通芯片400元)
- 恒玄:替代高通的AR系列芯片马上出来,手机双WiFi已量产上机,产品布局领先一个身位;
- 蓝讯:AI耳机需要唤醒词,1元的芯片做不了,需要6元的讯龙3;
- 炬芯:布局细分专业市场,强调存算一体。
- 普冉:端侧AI驱动NOR用量提升,凭借自身sonos工艺优势在消费领域具备较强竞争力,目前已供货三星、豆包等AI耳机领先厂商。