生成式AI
一、 微软发明全新「LLM语言」Droidspeak,智能体交互效率翻倍!
1. 微软提出“Droidspeak”语言,通过直接复用模型中间计算结果,替代自然语言,使AI智能体间通信速度提升2.78倍,同时保持性能不损失;
2. 方法通过优化复用KV缓存和E缓存,减少预填充延迟,同时在GPU内存与计算开销间平衡;
3. DroidSpeak采用离线配置分析与在线动态缓存传递,显著降低延迟,提升生成效率且保持高精度。
https://mp.weixin.qq.com/s/suIXm71AoVXgLWtFX3wJwA
二、 「Agent OpenDay」活动中,智谱展示AutoGLM等多项进展
1. AutoGLM通过任务调度和多模态技术,将大模型从对话功能升级为自主执行复杂多步骤任务的智能体,推动大模型向目标驱动型Agent发展;
2. GLM-PC探索PC端“无人驾驶”,通过模仿人类操作实现复杂任务跨平台执行,克服传统API限制并支持动态任务调度;
3. 大模型从“Chat”走向“Act”,以理解、预测和行动为核心,希望推动AI技术进入以LLM-OS为基础的通用智能体操作系统阶段,拓展人机交互场景。
https://mp.weixin.qq.com/s/ryLrUnaC6HBx1-21cSZ1wQ
三、 让AI眼里有活主动干!清华&面壁等开源主动交互Agent新范式
1. 清华与面壁团队提出主动Agent范式,使AI具备主动观察环境、推断用户需求并自主完成任务的能力,从被动工具转变为主动协作者;
2. 基于ProactiveBench数据集与奖励模型,主动Agent能准确识别用户需求,降低误报率,同时在多任务预测与反馈机制下显著提升性能;
3. 主动Agent广泛适用于个性化助理、文件管理、智能家居等场景,推动人机交互从指令执行进化为双向协作的新模式。
https://mp.weixin.qq.com/s/ZjeYqrak63zz3bbc4q0yQw
四、 腾讯混元文生视频模型曝光!与Sora同提示词PK,你来投票
1. 腾讯推出混元文生视频模型,支持多镜头生成、复杂场景呈现和游戏画面风格,可生成符合物理细节的逼真效果;
2. 腾讯模型与Sora对比测试中,在动物追逐、玻璃球禅园和动画怪物场景生成等复杂提示词下展现竞品水平,细节表现出色;
3. 国内视频生成领域竞争激烈,腾讯、字节、快手等大厂均已入局,技术成熟度和场景应用能力成为核心竞争力。
https://mp.weixin.qq.com/s/IavezGAtoIgayzMe7MliMQ
五、 马斯克申请对OpenAI的禁令,阻止OpenAI转变为营利性
1. 马斯克申请禁令,指控OpenAI从非营利性转为营利性,涉嫌反竞争行为并利用微软关系排斥竞争者,包括xAI;
2. 禁令内容包括阻止OpenAI向投资者提出限制竞争的资金条件,并指控微软与OpenAI共享敏感信息,损害市场公平;
3. 马斯克强调,OpenAI的营利化破坏其初创非营利使命,对公众利益和竞争环境造成潜在损害。
https://mp.weixin.qq.com/s/iVPVTYyxMi8KQERDCzGZDg
六、 腾讯文档3.9.0版本上线,全面升级AI文档助手能力大提升!
1. 腾讯文档3.9.0版本升级AI文档助手,增强了文档总结、深度阅读、智能配图等功能,提升用户阅读与创作效率;
2. 新增PPT生成、长文创作支持,用户可快速生成大纲并创建专业内容,简化工作流程;
3. 强化内容搜索功能,优化腾讯文库和互联网上的信息检索,提供更广泛的资源与创作支持。
https://mp.weixin.qq.com/s/4XbjIn3r4SBMWz5R-jEvBw
前沿科技
七、 特斯拉机器人新动态:半年前承诺的22个自由度灵巧手来了
1. 特斯拉Optimus机器人推出22自由度灵巧手,提升机器人的精细操作能力;
2. 新手部设计相比上一代增加了自由度,支持更复杂动作如弹钢琴、吉他等;
3. 灵巧手成为人形机器人核心零部件,多个公司积极研发,推动机器人技术向高集成度和智能化发展。
https://mp.weixin.qq.com/s/BWJrPzkE63e2TgN5t9B0Mw
报告观点
八、 「AI 教父」预判未来十年:一场比工业革命更伟大的智力解放
1. 人工智能将逐步释放人类智力,类似工业革命释放体力,但也带来人类智力被机器超越的风险;
2. AI在医疗、教育、行业应用等领域将极大提升效率,但也可能导致大量工作岗位被替代;
3. AI发展面临安全挑战,包括自主致命武器的出现与滥用,政府需加强监管和推动安全研究。
https://mp.weixin.qq.com/s/RvHqVxCHrnayWNogkup1-A
九、 Andrej Karpathy:AI 没有魔法,只是模仿,离真强化学习还远
1. Karpathy认为AI本质是统计数据模型,并非超越人类的智慧,主要通过模仿数据标注员来生成答案;
2. AI存在局限性,包括随机性、非推理性和数据偏差,无法进行复杂推理和理解问题;
3. Karpathy认为RLHF虽然提升AI性能,但仍处于初期阶段,尚未实现真正的强化学习。
https://mp.weixin.qq.com/s/NXjtT8TfMfuYE7dDpwY3Xw
十、 LeCun与奥特曼共识:承认AGI 5到10年降临;但不是LLM
1. LeCun宣布AGI将在5到10年内实现,远比先前预测的10到20年更快;
2. 他坚持认为现有的大语言模型(LLM)无法成为通向AGI的路径,LLM是“死路一条”;
3. LeCun提倡新架构,如JEPA架构,主张通过新的系统2思维和目标驱动的人工智能学习世界规律,超越传统LLM的局限。
https://mp.weixin.qq.com/s/1AtBIAskKtLFY7dLpkTtBQ
👇订阅下方合集,获取每日推送