2025年十大AI技术趋势,开启智能新时代!(免费下载)

学术   2025-01-26 19:50   广东  
站在2025年的门槛上,我们仿佛站在了新旧交替的十字路口,回望过去,一系列前所未见的技术浪潮正在重塑机器智能的定义,引发着深层次的变革,预示着更新、更美好的智能图景。大模型的持续进化,如同蝴蝶振翅,颠覆了我们对人工智能的传统理解。从初次尝试新架构到发现新的普适定律,从能力泛化到模态无缝融合,这些突破性进展正在不断刷新机器智能的边界。大模型逐步拥抱文本、视觉、音频、乃至3D数据,实现了感知与认知能力的全面升级,机器具备了更加细腻丰富的理解能力,人机交互焕发了全新的活力。与此同时,人工智能正在向另一个关键维度挺进——对真实物理世界的模拟与适应。在这一主题下,机器不仅能够自主感知和推理复杂场景,更能够主动规划行动、做出决策。而具身智能的加速落地,又进一步塑造了机器的物理形态。从感知到决策再到控制执行,端到端的智能系统正在崛起,机器的适应性和灵活性持续突破。

令人振奋的是,这些趋势正互为助力、相得益彰。基座模型能力迭代,为世界模拟和具身智能注入了更精准的感知与认知基础,应用落地数据又反哺着基座模型的成长;大模型的惊人能量,撬动着基础科学的浩瀚宇宙,大模型本身又作为科研对象,静候研究者揭晓它更深的奥秘。在这些力量的驱动下,Agentic AI与新时代的超级应用应运而生,悄然渗入每个人的工作和生活中,春风化雨般改变着人机交互的形态。

然而,光明总是与黑暗共存。技术和应用正在高歌猛进,重塑人类社会的方方面面,而安全隐患在暗处滋生。我们必须建立起与日益智能的机器系统相称的安全技术框架,探索具备最大共识的治理之道,才能最大限度地释放人工智能的无穷潜能,让技术以负责任的方式造福人类社会。

趋势一:AI4S驱动科学研究范式变革

2024年度的诺贝尔物理学奖、化学奖均颁发给了AI领域科学家。大模型引领下的AI4S,已成为推动科学研究范式变革的关键力量。科学研究的范式带有其所处时代的认知水平、价值取向、工具先进性、科研资源等因素的深刻烙印。自人类开始记录自然现象以来,科学研究经历了经验观察、理论建构、仿真模拟、数据驱动的科学发现四个阶段。大模型时代,AI4S展现出的赋能效果与小模型时期大相径庭。传统人工智能在科学研究中多聚焦于特定任务的优化,但其模型规模与泛化能力有限,难以解决复杂问题。而大模型以海量数据训练,具备强大的跨领域知识整合能力;模型架构赋予其多层次的学习和处理能力,能够捕获高维数据中的复杂结构和模式,并对复杂科学问题进行整体理解与全局综合分析。大模型还能通过生成式能力提出创新性假设,为科学研究开辟新方向。高性能算力的支持下,大模型正以前所未有的广度与深度重型科学研究格局,成为推动科研突破、解决实际问题的强劲动力。

趋势二:具身智能元年:具身大小脑和本体的协同进化

2024年,全球范围内的具身智能竞争日渐白热化。从融资规模、产品发布等多维度来看,中美两国在该领域执牛耳。以国内为例,截至2024年底,国内已发布或在研人形机器人接近100家,融资规模超100亿元,称之为百机大战并不为过。从厂商类型来看,专注本体/零部件、具身脑、具身脑和本体并重等三类厂商主导具身智能行业。相较于整体成熟、更注重细节创新的本体,大模型目前在具身大脑应用较多。在具身小脑方向,大模型的应用尝试刚刚起步。本体方面,作为一个相对成熟的领域,在本轮具身智能热度中,更倾向于在细分领域有所创新。比如灵巧手为代表的末端执行器、触觉传感器为代表的传感器、面向具身专门设计的感知芯片等细分领域,在2025年均可能迎来更新迭代。至于具身大模型,目前已形成两条主流技术路线:端到端模型和分层决策模型。分层模型方面,LLMVLM等已成为具身大脑的主流范式,而小脑侧仍以传统控制方法为主,端到端模型,作为近两年的研究热点,覆盖感知-决策控制全流程,理论上可获取的信息量最为丰富,端到端的输出效果最优。就模型效果来看,具身大模型已在感知决策端实现了较好的多任务迁移和处理,但控制执行侧的泛化仍需要技术路径的持续迭代和模型规模的Scaling up,这或可成为2025年的突破方向。

趋势三:下一个Token预测:统一的多模态大模型实现更高效AI

2023年以来的大模型热度肇始于LLM在多任务中的涌现,但受限于LLM所学习的模态单一,模型能力很难向高维的真实世界拓展。而人工智能的本质在于对人的思维的信息过程的模拟,人类对于信息的交互和处理,总是呈现多模态、跨模态的输入输出状态。当前的语言大模型、拼接式的多模态大模型,在对人类思维过程的模拟上存在天然的局限性。以传统多模态大模型为例,Diffusion TransformerDiT)和LLM+CLIP是当前主流的多模态构建路线,但这两条路径中数据的后融合方式会造成多模态信息的损失,各模态信息表征本质上是相互独立的,大模型对多种模态数据理解的不充分会导致多种模态生成的割裂和误差增大。因此,从训练之初就打通多模态数据,实现端到端输入和输出的原生多模态技术路线给出了多模态发展的新可能。基于此,训练阶段即对齐视觉、音频、3D等模态的数据,实现多模态的统一,构建原生多模态大模型成为多模态大模型进化的重要方向。

趋势四:Scaling Law扩展:RL+LLMs,模型泛化从预训练向后训练、推理迁移

Scaling Law(规模定律)作为大模型领域的第一性原理,主要强调模型性能与模型参数量、数据量和计算量的正相关关系,在GPT-4Claude 3.5等基础模型训练中发挥了不可或缺的指引作用。时至2024年末,通过基于ChinchillaOpenAI Scaling Law,扩大模型参数量和数据量带来的模型性能提升已有所放缓。尽管根据EpochAI对电力、芯片、数据获取及处理能力等预训练关键要素的增长空间测算,预训练Scaling Law仍在生效,海外头部厂商也仍在大力投入超大规模集群的建设,我们还可期待在2025年看到下一代基础模型的到来。但不得不承认的是,由于预训练Scaling Law亚线性的幂律关系客观存在,通过预训练实现模型性能提升的门槛在不断加高,距离GPT-4发布已过去近两年时间。以OpenAIo1o3的发布为标志,Scaling Law扩展到后训练、推理等其他阶段。大模型训练的共识逐渐从资源获取转向资源分配,计算力和数据从预训练向包括微调、对齐在内的后训练以及推理阶段倾斜。在Scaling Law迎来扩展的过程中,强化学习在其中所起的重要作用格外凸显。比如:OpenAI发布的o1o3正是通过利用强化学习在训练和推理时的规模定律,提高找到最佳推理路径的可能性和效果。在该趋势的推动下,国内如Moonshot将强化学习技术应用于搜索场景,并发布以逻辑思考和深度推理为核心功能的数学模型KO-MathDeepSeek,使用强化学习训练,充分挖掘和激活模型潜力,发布DeepSeekR1模型,探索释放长思维链潜力,蚂蚁技术研究院设立了强化学习实验室,也围绕该方向展开探索。整体来说,在即将到来的2025年,我们会看到Scaling Law作为大模型训练的黄金经验法则,往模型训练推理的全流程、往特定的行业场景的不断被再次发现。在这过程中,强化学习作为发现后训练、推理阶段的Scaling Law的关键技术,也将会得到更多的应用和创新使用。

趋势五:世界模型加速发布,有望成为多模态大模型的下一阶段

通过构建对外部世界的模拟,AI系统能够完成对世界的内部表征,在复杂多变的环境中实现更为精准的决策与预测。作为赋予AI更高级别的认知、适应和决策能力的技术,世界模型不仅能推动AI在自动驾驶、机器人控制及智能制造等前沿领域的深度应用,更有望突破传统的任务边界,探索人机交互的新可能。至于世界模型的范式演变,目前仍处于早期阶段。一方面,随着SoraGenie的发布,大模型显露出其蕴含常识的潜力,从语言、图像,到视频、3D数据,刻画世界的数据角度越全面,离世界纷整的运行法则就越近;另一方面,JEPA对信息的高度抽象,又直指每个事物的核心特征,暗合了客观规律的简洁性。与此同时,多模态大模型的推理能力延展到三维空间以来,空间智能与其发生交汇,激发了机器智能对真实世界里更复杂场景的理解与交互的新灵感。关于如何构建世界模型的路线之争无疑将在2025年持续,或许随着不同路线的性能泛化程度在新的一年出现分野,我们会看到世界模型技术路线的收效。

趋势六:合成数据将成为大模型迭代与应用落地的重要催化剂

高质量数据将成为大模型进一步Scaling up的发展阻碍。合成数据已经成为基础模型厂商补充数据的首选。根据EpochAI报告,在2026年以前,AI训练将用尽互联网上包含音视频在内的高质量数据,而现存真实世界数据集或将在2030年至2060年之间耗尽。合成数据已经成为基础模型厂商补充数据的首选。在大模型训练方面,合成数据可以降低人工治理和标注的成本,缓解对真实数据的依赖,不再涉及数据隐私问题;同时,合成数据可以提升数据的多样性,有助于提高模型处理长文本和复杂问题的能力。在大模型产业化方面,合成数据可以缓解通用数据被大厂垒断,专有数据存在获取成本等问题,促进大模型的应用落地。随着真实数据的耗尽,合成数据在模型训练的占比将持续提高,成为大模型性能迭代与应用落地的重要催化剂。

趋势七:推理优化迭代加速,成为AI Native应用落地的必要条件

随着大模型在各类生成任务上的表现愈发突出,其应用外延持续扩展,催生出各类人工智能应用。大模型硬件载体也从云端向手机、PC等端侧硬件渗透,在这些资源受限(AI算力、内存等)的设备上,大模型的落地应用会面临较大的推理侧的开销限制,对部署资源、用户体验、经济成本等均带来巨大挑战。在此背景下,模型推理优化技术日益成为产研侧关注重点。对该领域的研究大致可分为算法加速和硬件优化两个方向。前者多集中在数据层、模型层和系统层三个维度,通过对输入提示词、输出内容的优化,模型结构及压缩技术的设计,推理引擎和服务系统的升级,来降低模型推理过程中的计算开销、访存开销、存储开销。目前,以模型量化、知识蒸馏、模型稀疏等为代表的技术已大量应用,并初步取得成效。后续如何继续在保障输出序列长度和输出质量的基础上,降低推理开销成为持续提升的关键方向;后者则关注硬件端加速,针对大模型在推理过程中自回归的序列生成方式,专门设计芯片方案,带来显著的推理速度收益。当前国内外厂商围绕长文本、复杂交互、边缘部署等应用场景,持续推动推理优化技术迭代,以在成本开销与终端用户体验侧寻求最佳平衡点。

趋势八:重塑产品应用形态,Agentic AI成为产品落地的重要模式

2025年,更通用、更自主的智能体将重塑产品应用形态,进一步深入工作与生活场景,成为大模型产品落地的重要应用形态。从ChatbotCopilotAI AgentAgentic AI2023年以来行业对AI应用形态的理解越发深入。从更强调产品概念的Agent,到更强调应用智能化程度更高、对业务流程理解更深的多智能体系。2024年,OpenAIAnthropic等头部模型厂商积极布局智能体产品与技术:全球已出现300多家智能体初创公司。研究表明,近70%的财富500强企业员工已开始使用AI工具处理繁琐任务,如筛选电子邮件、记录会议纪要等。在理论发展方面,202312月,OpenAI提出了在有限直接监督下,长时间自主行动以实现计划目标的系统,“Agentic AI Systems”,并提出了评估该系统“Agenticness”程度的四个指标:20243月,吴恩达在红杉资本(Sequoia Capital)的人工智能峰会(AI Ascent)上进一步阐释了“Agentic”是对智能体智能程度的描述。20246月,吴恩达进一步提出“Agentic workflow”是构建适应性更强智能体的重要方法,健全了构建智能体的理论体系。至此,业内对智能体的术语使用,更多地从AI Agent迁移到Agentic AI,其背后标志着从判断产品是否属于Agent,到探求产品的智能化程度这一更有落地意义的转变。

趋势九:AI应用热度渐起,SuperApp花落谁家犹未可知

过去一年时间,生成式模型在图像、视频侧的处理能力得到大幅提升,叠加推理优化带来的降本,Agent/RAG框架、应用编排工具等技术的持续发展,为AI超级应用的落地积基树本。大模型应用从功能点升级,渗透到AI原生的应用构建及AIOS的生态重塑。尽管从用户规模、交互频次、停留时长等维度来看,CAI应用仍未出现爆发式增长,但超级应用的可能形态或已初现端倪:终端设备厂商基于硬件设备重构AIOS生态,基础模型及垂直应用赛道厂商深度结合大模型能力打造AIAPPAlos方面,苹果在10月正式发布Apple Intelligence,从系统层级对手机应用进行重构,覆盖AI写作、照片处理及语音助手等功能,得益于其软硬生态的强耦合,有望深度整合系统级体验,带来交互形态的再升级。AIAPP方面,以ChatBot、生活服务为代表的AI应用经过1年多时间的业务验证,已有大量产品落地。Chat类如OpenAI发布的ChatGPT,月活接近6亿,年预估收入约37亿美元;国内方面字节跳动的人工智能应用豆包处于头部,达到了7116万月度活跃用户数(截至202412月,数据来自AI产品榜)百度发布的文小言,Moonshot发布的Kimi分列其后。生活服务类如蚂蚁集团发布的系列个人管家产品,包括生活管家支小宝、金融管家蚂小财、AI健康管家等,可根据用户习惯和使用场景,智能推荐专属服务。在移动互联网时代,出现了许多用户量达数亿甚至十亿的超级应用,然而在AI时代,这样的超级应用尚未出现。无论是在美国、欧洲还是中国,都在探索能够发挥生成式AI能力、且能吸引数十亿人使用的应用形态。虽然SuperAPP花落谁家尚未尘埃落定,但从用户规模、交互频次、停留时长等维度来看,AI应用热度持续等升,已到应用爆发的黎明前夕。

趋势十:模型能力提升与风险预防并重,AI安全治理体系持续完善

作为复杂系统,大模型的Scaling带来了涌现,但复杂系统特有的通现结果不可预测、循环反馈等特有属性也对传统工程的安全防护机制带来了挑战。基础模型在自主决策上的持续进步带来了潜在的失控风险,如何引入新的技术监管方法,如何在人工监管上平衡行业发展和风险管控?这对参与AI的各方来说,都是一个值得持续探讨的议题。与此同时,在信息传播速度日益加快的当下,由AI系统引发的偏见,深度伪造、隐私泄露、版权争议问题丛生,社会对AI安全的关注度急剧上升。近年来,各个国家、组织在AI安全上持续投入,并进行了技术研究、治理框架、国际合作等多种形式的探索,后续有望构建起与智能水平相匹配、合乎伦理、可靠、可控和尊重知识产权的AI安全治理体系。

......

在水木人工智能学堂公众号对话框回复关键词ai10035,可获取完整报告下载链接。


水木AI知识荟2025.1.25日最新AI报告更新


往期回顾


🔥【精选报告】清华大学2024年AIGC发展研究报告3.0版(附下载,181页)

🔥【精选报告】重磅:2024年全球AIGC产业全景报告(附下载,58页)

🔥【精选报告】斯坦福李飞飞最新巨著《AI agent综述》Agent AI开启多模态交互新纪元(附下载,中英版)

🔥【精选报告】生成式AI如何重塑未来,吴恩达等AI领袖的独家观点不容错过!(附下载,160页)

🔥【精选报告】重磅:2024年全球人工智能全景现状最新报告(212页,中英文版,附下载)

🔥【精选报告】华为&清华大学--2024年AI终端白皮书:AI与人协作、服务于人(附下载)

🔥【精选报告】清华大学-大模型工具学习(附下载)

🔥【精选报告】海外权威报告:生成式人工智能(114页,附下载)

🔥【精选报告】腾讯研究院:向AI而行, 共筑新质生产力--行业大模型调研报告(85页,附下载)

🔥【精选报告】国际先进人工智能安全科学报告中期报告(132页,附下载)

🔥【精选报告】2024大模型应用实践报告--爱分析(35页,附下载)

🔥【精选报告】AIGC实践案例集锦:对话先行者,洞见新未来(附下载)

版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。
“阅读原文”下载报告。

水木人工智能学堂
水木人工智能学堂专注分享和普及AI知识,由清华大学、天津大学、深圳大学等AI团队创建,内容涵盖机器学习、深度学习、图像分析、语音及语义分析、AI求职及职业规划、行业报告等,汇集云知声、奥比中光、极视角等AI专家分享干货,欢迎关注。
 最新文章