在多任务场景中表现更加灵活高效:高达6710亿参数的混合专家架构,激活参数370亿,拥有256个专家节点,通过动态选择最相关的8个专家参与计算,显著提升了模型在复杂场景下的处理能力。 超大规模预训练和长文本处理:在14.8万亿token的语料上进行预训练,并充分挖掘了多语言、多领域数据的潜力,而且上下文窗口提升至128K,为长文本生成和推理提供了技术保障; 算法与工程优化成绩显著:生成速度提升,从20TPS跃升至60TPS,实现了三倍增长,而且采用无辅助损失的负载均衡策略和多令牌预测目标,进一步增强了生成质量和模型稳定性。 训练和推理成本低:大模型训练成本仅为557.6万美元,大概是GPT-4的二十分之一,而且被誉为“AI界拼多多”,价格是同类大模型服务价格最低一档,以较低成本实现高性能的策略,使得中小企业也能够以较低成本享受到顶尖AI技术。
AI 编程的发展快速发展,让很多人认为 AI 取代人工编程是个迟早的事情。AI编程工具新星——Lovable 在大型代码库上表现良好,能够可靠地构建用于实际应用场景的真实软件,其创始人Anton Osika 透露,5周时间其服务订阅收入已突破了 530 万美金。在后端集成了 Supabase 后,使 Lovable 成为世界上第一个 AI 全栈工程师。
( 从软件原型构建开始,通过不断迭代&验证、修正缺陷,完成软件构建)
(不用写代码就可以构建高质量的软件,效率提升20倍)
智能需求工程:大模型将超越对需求的简单自然语言处理,积极参与需求的采集、整理、分析和验证。这包括识别需求规格中的模糊性、不一致性和不完整性。之前在《软件工程3.0实践之路(三)》、《软件工程3.0实践之路(五)》等文章中有讨论,只是在2025年,应用更深入,而且有相应的平台或工具被开发出来,更好地支持LLM在需求工程上的应用,使应用更丝滑、输出结果更准确。
智能设计:大模型可以通过建议设计模式、识别潜在设计缺陷以及根据需求生成初步设计文档来协助架构设计,这可能涉及生成UML图或其他软件架构的视觉表示。也可以根据用户的意图生成用户界面、根据原始的业务数据分析生成数据字典等,可以参考《软件工程3.0实践之路(四)》、《软件工程3.0实践之路(五)》等文章。
代码生成与重构:代码生成、评审和优化在2024年有广泛的应用,但在2025年,LLM在开发方面的能力会显著提升,例如生成更复杂的代码结构、重构能力得到改善、无缝处理多种编程语言,并更有效地与现有代码库集成;在质量、效率上页得到显著提升,例如,代码采纳率会从2024年平均20-30%的水平提升到50-60%的水平,到年底绝大部分的开发人员会乐意使用AI编程工具,而不是像2024年不少开发人员往往被动使用。可以参考《软件工程3.0实践之路(六)》、《面向开发人员的 12款 强大的 AI 工具》等文章。
智能测试:大模型在自动生成测试用例方面的应用正在被深入研究,测试计划、测试用例和测试脚本的自动生成,参与测试需求分析、测试结果分析,测试报告生成,并能显著提高软件测试的覆盖率和效率,例如生成涵盖所有可能执行路径和边界情况的综合测试用例集,LLM帮助我们实现精准测试等。可以参考《软件工程3.0实践之路(七)》、《从自动化软件测试到自主测试,还差几步?》等文章。
智能部署与DevOps:大模型可以协助自动化部署流程、生成配置文件和监控系统性能。与DevOps管道的集成将变得更为顺畅,支持自动化测试、部署和回滚程序。
AI(LLM)原生工具越来越多、越好用:可以参考:《2024年,大模型驱动的智能软件研发有哪些进展?》、《推荐一款强大的开源编程助手Cursor》
还建议你再看一遍《大模型时代的软件研发:正确的打开方式》、《软件工程3.0实践之路(十):总结与展望》。
马斯克:2025 年 AI 智力或将反超单个人类;
英伟达高级研究科学家 Jim Fan:我们的孩子将作为「机器人原住民」长大;
AI 教父 Geoffrey Hinton:未来人类与强大 AI 相比,就像 3 岁孩童;
Google AI Studio 负责人 Logan Kilpatrick:智能体全面爆发还要再等一年;
微软 AI 负责人 Mustafa Suleyman:具备永久记忆的 AI 将让你拥有一个第二大脑;
Hugging Face CEO Clément Delangue:巨头崩塌、中国领跑、生物突破;
《金融时报》Richard Waters:2025 年不会出现真正的「杀手级应用」。
AGI
agents
4o升级变得更好
更好的记忆力
更长上下文
成熟模式
深入研究功能
更好的sora
更多个性化设置