资料来源:腾讯研究院
获取方式:文末附下载链接
更多资料:10W+份报告、干货分享
付费推广:推广报告(付费推广,欢迎洽谈)
( 每日分享最新重磅报告,与投资人、企业高管、创业者、行业研究员等群成员大咖互动交流,实现拓展人脉、资源对接、项目合作等 )
二、实验过程
基于研究员对AI领域的跟踪理解,划分大模型技术和应用的八大方向:基础模型、图像处理、视频生成、3D生成、编程助手、Agent、端侧智能和具身智能。
邀请跟进各方向的研究员基于AGI数据库中该方向2024进展数据,精心筛选出各领域约30个关键词,再经过多人讨论确认6-8个最具代表性的关键词。
借鉴人类和大模型都拥有的“快思考”与“慢思考”两种思维特征,对每一个精选出来的关键词进行两个维度的分析,并“监督”和“指导”AI绘制了50张AI关键词卡片。
三、关键词详解
1. 图像处理
Transformer扩展:Transformer架构在自然语言处理领域大放异彩,如今正将这一辉煌延续到图像处理领域。 DiT架构革新:DiT架构结合了扩散模型和Transformer的优势,提升了图像的空间关系理解能力,增强了对复杂提示的处理能力,使得生成的图像细节更加丰富、真实度更高。 图像控制进化:图像生成的控制方式正在从文本描述走向精确控制。ControlNet等技术的出现,使得AI能够根据精确的条件控制生成图像,极大地提升了创作的灵活性和精度。
2. 视频生成
视频生成挑战:视频生成的难度提升了百倍,不仅需要处理大量连续的帧,还要保证时序连贯性和主体一致性。 技术路线探索:目前,视频生成技术主要出自回归与扩散两大路线。
3. 3D生成
几何形态还原:技术创新提升了3D生成的生产效率与应用范围,但面临数据等挑战。 AI元宇宙:重构内容生产等范式,推动3D生成在虚拟现实和增强现实中的应用。
4. 编程助手
全栈生成:改变开发模式,提升开发效率。 画布工坊:推动开发环境向智能化协作演进。
5. Agent
社会模拟:面临技术与伦理双重挑战,智能体协作架构走向专业分工。 长期记忆与自我进化:智能体的长期记忆与自我进化能力正在发展。
6. 端侧智能
极限压缩:注重极限压缩等技术,提升端侧智能的效率。 AI芯片架构创新:提升推理速度,推动端侧智能的发展。 端云协同:端云协同成为必然趋势,隐私计算保护数据隐私。
7. 具身智能
具身大小脑和本体的协同进化:2025年的具身智能将继续从本体扩展到具身脑的叙事主线。 工业场景应用:部分人形机器人迎来量产,更多工业场景下的具身智能应用将出现。
8. 基础模型
多模态大模型:从训练之初就打通多模态数据,实现端到端输入和输出的原生多模态技术路线成为多模态大模型进化的重要方向。 Scaling Law扩展:基于Scaling Law推动基础模型性能提升的训练模式“性价比”持续下降,后训练与特定场景的Scaling law不断被探索。
四、总结
【完整版获取见文末】
受篇幅限制,仅列举部分资料
报告全文下载链接
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
7天有效,过期请在后台回复“8”,按步骤免费获取!
识别二维码,快速获取更多最新重磅报告
2025年资料包,每周更新700,全年4W+
更新日期:2025.1.1-2025.12.31
关于报告达人
报告达人是一家分享国内外各类研究报告、热点专题报告、统计年鉴、发展规划、统计公报、白皮书、蓝皮书等各类研究型内容的知识共享平台。我们通过搜集公开的券商研究报告、统计年鉴、统计公报、各类行业研究报告、各类热点专题报告、各类冠名报告,然后对搜集过来的报告按细分行业、热点题材等进行分类归纳和整理,再通过报告达人微信公众号平台分享给各类报告使用者。
免责声明:以上报告均系报告达人通过公开、合法渠道获得,报告版权归原撰写/发布机构所有,如涉侵权,请联系删除(18675593305),如对报告内容存疑,请与撰写/发布机构联系。
关注我们 ,获取更多报告
点击阅读原文,查看数十万份研报、干货