腾讯研究院AI速递 20241202

学术   2024-12-02 00:01   广东  

生成式AI

一、  微软发明全新「LLM语言」Droidspeak,智能体交互效率翻倍!

1. 微软提出“Droidspeak”语言,通过直接复用模型中间计算结果,替代自然语言,使AI智能体间通信速度提升2.78倍,同时保持性能不损失;

2. 方法通过优化复用KV缓存和E缓存,减少预填充延迟,同时在GPU内存与计算开销间平衡;

3. DroidSpeak采用离线配置分析与在线动态缓存传递,显著降低延迟,提升生成效率且保持高精度。

https://mp.weixin.qq.com/s/suIXm71AoVXgLWtFX3wJwA

二、  「Agent OpenDay」活动中,智谱展示AutoGLM等多项进展

1. AutoGLM通过任务调度和多模态技术,将大模型从对话功能升级为自主执行复杂多步骤任务的智能体,推动大模型向目标驱动型Agent发展;

2. GLM-PC探索PC端“无人驾驶”,通过模仿人类操作实现复杂任务跨平台执行,克服传统API限制并支持动态任务调度;

3. 大模型从“Chat”走向“Act”,以理解、预测和行动为核心,希望推动AI技术进入以LLM-OS为基础的通用智能体操作系统阶段,拓展人机交互场景。

https://mp.weixin.qq.com/s/ryLrUnaC6HBx1-21cSZ1wQ

三、  让AI眼里有活主动干!清华&面壁等开源主动交互Agent新范式

1. 清华与面壁团队提出主动Agent范式,使AI具备主动观察环境、推断用户需求并自主完成任务的能力,从被动工具转变为主动协作者;

2. 基于ProactiveBench数据集与奖励模型,主动Agent能准确识别用户需求,降低误报率,同时在多任务预测与反馈机制下显著提升性能;

3. 主动Agent广泛适用于个性化助理、文件管理、智能家居等场景,推动人机交互从指令执行进化为双向协作的新模式。

https://mp.weixin.qq.com/s/ZjeYqrak63zz3bbc4q0yQw

四、  腾讯混元文生视频模型曝光!与Sora同提示词PK,你来投票

1. 腾讯推出混元文生视频模型,支持多镜头生成、复杂场景呈现和游戏画面风格,可生成符合物理细节的逼真效果;

2. 腾讯模型与Sora对比测试中,在动物追逐、玻璃球禅园和动画怪物场景生成等复杂提示词下展现竞品水平,细节表现出色;

3. 国内视频生成领域竞争激烈,腾讯、字节、快手等大厂均已入局,技术成熟度和场景应用能力成为核心竞争力。

https://mp.weixin.qq.com/s/IavezGAtoIgayzMe7MliMQ

五、  马斯克申请对OpenAI的禁令,阻止OpenAI转变为营利性

1. 马斯克申请禁令,指控OpenAI从非营利性转为营利性,涉嫌反竞争行为并利用微软关系排斥竞争者,包括xAI;

2. 禁令内容包括阻止OpenAI向投资者提出限制竞争的资金条件,并指控微软与OpenAI共享敏感信息,损害市场公平;

3. 马斯克强调,OpenAI的营利化破坏其初创非营利使命,对公众利益和竞争环境造成潜在损害。

https://mp.weixin.qq.com/s/iVPVTYyxMi8KQERDCzGZDg

六、  腾讯文档3.9.0版本上线,全面升级AI文档助手能力大提升!

1. 腾讯文档3.9.0版本升级AI文档助手,增强了文档总结、深度阅读、智能配图等功能,提升用户阅读与创作效率;

2. 新增PPT生成、长文创作支持,用户可快速生成大纲并创建专业内容,简化工作流程;

3. 强化内容搜索功能,优化腾讯文库和互联网上的信息检索,提供更广泛的资源与创作支持。

https://mp.weixin.qq.com/s/4XbjIn3r4SBMWz5R-jEvBw

前沿科技

七、  特斯拉机器人新动态:半年前承诺的22个自由度灵巧手来了

1. 特斯拉Optimus机器人推出22自由度灵巧手,提升机器人的精细操作能力;

2. 新手部设计相比上一代增加了自由度,支持更复杂动作如弹钢琴、吉他等;

3. 灵巧手成为人形机器人核心零部件,多个公司积极研发,推动机器人技术向高集成度和智能化发展。

https://mp.weixin.qq.com/s/BWJrPzkE63e2TgN5t9B0Mw

报告观点

八、  「AI 教父」预判未来十年:一场比工业革命更伟大的智力解放

1. 人工智能将逐步释放人类智力,类似工业革命释放体力,但也带来人类智力被机器超越的风险;

2. AI在医疗、教育、行业应用等领域将极大提升效率,但也可能导致大量工作岗位被替代;

3. AI发展面临安全挑战,包括自主致命武器的出现与滥用,政府需加强监管和推动安全研究。

https://mp.weixin.qq.com/s/RvHqVxCHrnayWNogkup1-A

九、  Andrej Karpathy:AI 没有魔法,只是模仿,离真强化学习还远

1. Karpathy认为AI本质是统计数据模型,并非超越人类的智慧,主要通过模仿数据标注员来生成答案;

2. AI存在局限性,包括随机性、非推理性和数据偏差,无法进行复杂推理和理解问题;

3. Karpathy认为RLHF虽然提升AI性能,但仍处于初期阶段,尚未实现真正的强化学习。

https://mp.weixin.qq.com/s/NXjtT8TfMfuYE7dDpwY3Xw

十、  LeCun与奥特曼共识:承认AGI 5到10年降临;但不是LLM

1. LeCun宣布AGI将在5到10年内实现,远比先前预测的10到20年更快;

2. 他坚持认为现有的大语言模型(LLM)无法成为通向AGI的路径,LLM是“死路一条”;

3. LeCun提倡新架构,如JEPA架构,主张通过新的系统2思维和目标驱动的人工智能学习世界规律,超越传统LLM的局限。

https://mp.weixin.qq.com/s/1AtBIAskKtLFY7dLpkTtBQ

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章