腾讯研究院AI速递 20250116

学术   2025-01-16 00:02   广东  

生成式AI

一、  ChatGPT的全新功能「Tasks」上线,AGI跨入L3级智能体

1. ChatGPT新功能"Tasks"支持用户设置定时任务,可自动执行一次性或周期性任务,将向ChatGPT Plus、Team和Pro用户推送;

2. 用户可通过"GPT-4o with scheduled tasks"模型设置最多10个活跃任务,支持Web、iOS、Android、MacOS平台,支持通知推送;

3. OpenAI联创表示2025年将是"Agents"爆发年,此次更新是向L3级智能体迈进的重要一步,更强大的"Operator"功能已在开发中。

https://mp.weixin.qq.com/s/S_Gq_955eUvjiEBKyJm1Gg

二、  MiniMax开源大更新,4560亿参数,支持400万长上下文

1. MiniMax开源4560亿参数基础语言模型MiniMax-Text-01,首创Lightning Attention机制,支持400万token超长上下文;

2. 新模型表现对标GPT-4o、Claude 3.5,在HumanEval、GPQA Diamond等多个测试集上超越主流开源和闭源模型;

3. 同步推出视觉多模态模型MiniMax-VL-01,团队正研发无限上下文窗口技术,希望为AI Agent应用发展打基础。

https://mp.weixin.qq.com/s/O7xaTDWmuZfzMUMTBWOhBw

三、  MiniCPM-o 更新2.6版本,视觉语音和多模态流式能力增强

1. MiniCPM-o 2.6使用端到端全模态架构连接不同模态编解码模块,总参数量8B,多模态能力对标GPT-4o水平;

2. 支持配置化的中英双语语音对话,具备声音克隆、情感控制等高级功能,并优化了OCR等视觉能力;

3. 创新设计时分复用的全模态流式处理机制,可在iPad等终端设备实现实时多模态交互。

https://mp.weixin.qq.com/s/8_ZDFANECB1i7ntAM_mO_Q

四、  Vidu 2.0发布 ,100镜实测,一致性新玩法再次称霸2D动画界

1. Vidu 2.0版本生成速度提升至10秒内,较前代提速3倍,且提供闲时不限量免费生成模式;

2. 强化多主体一致性,支持人物表情迁移和精准的镜头景别控制,首尾帧转场更加流畅自然;

3. 能稳定保持水墨、扁平等多种艺术风格,单价0.258元/秒,在AI动画领域具有优势。

https://mp.weixin.qq.com/s/kxMk86R_qIeZQTFexWagDQ

五、  科大讯飞基于国产算力的推理大模型X1,率先落地教育、医疗

1. 科大讯飞发布全由国产算力驱动的讯飞星火X1大模型,中文数学能力居国内首位,已在教育和医疗场景落地应用;

2. 升级星火4.0 Turbo,图文识别准确率提升40%,具备混域知识搜索功能,长文本错误率降低40%;

3. 推出其首个端到端语音同传大模型,最低时延5秒,将于2025年推出商务套装。

https://mp.weixin.qq.com/s/mCc-zaj0y8wDc0kYjZtPbA

六、  Sakana AI的Transformer²,「活」AI模型,动态调整权重

1. Sakana AI提出Transformer²自适应模型架构,能像生物一样动态调整权重适应任务,支持终生学习;

2. 引入奇异值微调(SVF)技术,与传统LoRA相比显著减少参数量,降低过拟合风险,提升模型组合性;

3. 在数学、编程、视觉理解等任务上性能显著提升,实验显示随测试条件增加效果越好。

https://mp.weixin.qq.com/s/_vdA_KygkFWqFE5Xm6CDRg

七、  微软宣布开源AI Agent AutoGen 发布0.4版本,多层级架构

1. 微软AutoGen 0.4版本全面重构,引入异步消息机制,增强代码稳定性、通用性和可扩展性;

2. 新增模块化设计、跨语言支持和可视化拖拽界面,内置指标跟踪和调试工具,支持社区扩展;

3. 集成Magentic-One多层级架构,包含5个专业Agent,通过Orchestrator协调实现异步事件驱动和高度模块化。

https://mp.weixin.qq.com/s/TlGdQt86yhWI-asBpy9lRw

八、  英伟达投资中国台湾初创公司MetAI,打造AI+3D数字孪生平台

1. 英伟达首次投资中国台湾AI公司MetAI,参与400万美元种子轮融资,助力数字孪生平台发展;

2. MetAI技术可将CAD文件快速转换为仿真环境,将仓库数字孪生仿真时间从数千小时缩短至3分钟;

3. MetAI计划2025年将总部迁至美国,专注物理AI训练和自动化系统实施,预计单个项目可带来300万美元收入。

https://mp.weixin.qq.com/s/oQzvyALBq2HJgmyP4K--qg

前沿

九、  交大O1的医疗探索:延长AI思考时间,解锁复杂推理诊断

1. 上海交大通过延长AI思考时间,仅需500个样本训练即可提升医疗诊断准确率6%-11%;

2. 采用LongStep和LongMonolog两种长思维链数据训练方法,让AI模仿医生诊断思维模式;

3. 研究发现复杂医疗问题方面,需更长推理链,大参数模型从推理时间扩展中获益。

https://mp.weixin.qq.com/s/-e3V9TwToGK71530icTeQg

报告观点

十、  「全球第一商学院」教授谈AGI:应如何看待AI实验室的预言?

1. 沃顿商学院教授Mollick对AI实验室AGI预测持怀疑态度,需谨慎看待,且人类采用和适应AI技术的速度可能被高估;

2. OpenAI的o3模型在GPQA、FrontierMath等基准测试中超越人类表现,显示AI能力突破性进展;

3. AI狭域Agent已具实用价值,如谷歌Gemini的Deep Research能在短时间完成复杂研究报告。

https://mp.weixin.qq.com/s/evyvfW7EJUNHdQ6rSZOeag

AI50节选

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章