展望2025年智能软件工程

科技   2025-01-03 07:49   上海  

2024年底有两条消息预示着2025年技术及其应用趋势。
一条是:DeepSeek-V3的技术突破:
  • 在多任务场景中表现更加灵活高效:高达6710亿参数的混合专家架构,激活参数370亿,拥有256个专家节点,通过动态选择最相关的8个专家参与计算,显著提升了模型在复杂场景下的处理能力。
  • 超大规模预训练和长文本处理:在14.8万亿token的语料上进行预训练,并充分挖掘了多语言、多领域数据的潜力,而且上下文窗口提升至128K,为长文本生成和推理提供了技术保障;
  • 算法与工程优化成绩显著:生成速度提升,从20TPS跃升至60TPS,实现了三倍增长,而且采用无辅助损失的负载均衡策略和多令牌预测目标,进一步增强了生成质量和模型稳定性。
  • 训练和推理成本低:大模型训练成本仅为557.6万美元,大概是GPT-4的二十分之一,而且被誉为“AI界拼多多”,价格是同类大模型服务价格最低一档,以较低成本实现高性能的策略,使得中小企业也能够以较低成本享受到顶尖AI技术。

另一条是:Lovable成为世界上第一个 AI 全栈工程师

AI 编程的发展快速发展,让很多人认为 AI 取代人工编程是个迟早的事情。AI编程工具新星——Lovable 在大型代码库上表现良好,能够可靠地构建用于实际应用场景的真实软件,其创始人Anton Osika 透露,5周时间其服务订阅收入已突破了 530 万美金。在后端集成了 Supabase 后,使 Lovable 成为世界上第一个 AI 全栈工程师。

( 从软件原型构建开始,通过不断迭代&验证、修正缺陷,完成软件构建)

(不用写代码就可以构建高质量的软件,效率提升20倍)

从上面两条消息,我们可以看出,一方面大模型的架构在优化、其性能越来越强,适应多任务场景,能够处理长文本,但同时其训练和使用成本都在快速下降;另一方面,大模型在软件研发的应用将扩展到软件研发全生命周期,从我们一个想法开始,在人类不写一行代码情况下,我们可以将想法付诸于软件的实现。
回到“展望2025年智能软件工程”主题,虽然很难,其实也不难了。
1. 大模型的能力提升加快
在上一篇 2024年,大模型驱动的智能软件研发有哪些进展?,已经展示了过去一年大模型的快速发展,从单模态大模型向多模态、有慢思考能力的模型发展,以及上下文窗口快速提升、混合专家架构引入、多智能体协同、RAG技术等全方位的进步,再经过2025年的进一步发展(发展速度也是越来越快),大模型的能力(性能、稳定性、准确性、泛化能力等)最终能够满足软件研发的需求。
2. 行业垂直化与模块化
未来大模型将更多地针对特定行业(如金融、医疗、汽车等)和场景进行混合预训练、微调以及规模化知识库、AI应用的开发,从而在这些行业应用软件开发中发挥更好的作用。同时,通过可插拔的模块化设计,企业可以灵活地在基座大模型上集成自有数据和功能,满足个性化需求,如业务分析、需求文档生成、项目计划评审、测试结果分析等。
3. 多智能体协作与自动化流程
多智能体(Agent)协同工作会得到普遍的深入应用,从需求开始,贯穿编程、测试等各项任务,我们将开发、定制或设置不同的专用智能体,和我们之前的CI/CD流水线集成起来,专用智能体会处理软件开发生命周期(SDLC)不同的环节或任务,从而形成软件研发的高度自动化流水线。
4. 大模型在SDLC中深化应用
  • 智能需求工程:大模型将超越对需求的简单自然语言处理,积极参与需求的采集、整理、分析和验证。这包括识别需求规格中的模糊性、不一致性和不完整性。之前在《软件工程3.0实践之路(三)》、《软件工程3.0实践之路(五)》等文章中有讨论,只是在2025年,应用更深入,而且有相应的平台或工具被开发出来,更好地支持LLM在需求工程上的应用,使应用更丝滑、输出结果更准确。

  • 智能设计:大模型可以通过建议设计模式、识别潜在设计缺陷以及根据需求生成初步设计文档来协助架构设计,这可能涉及生成UML图或其他软件架构的视觉表示。也可以根据用户的意图生成用户界面、根据原始的业务数据分析生成数据字典等,可以参考《软件工程3.0实践之路(四)》、软件工程3.0实践之路(五)》等文章。

  • 代码生成与重构:代码生成、评审和优化在2024年有广泛的应用,但在2025年,LLM在开发方面的能力会显著提升,例如生成更复杂的代码结构、重构能力得到改善、无缝处理多种编程语言,并更有效地与现有代码库集成;在质量、效率上页得到显著提升,例如,代码采纳率会从2024年平均20-30%的水平提升到50-60%的水平,到年底绝大部分的开发人员会乐意使用AI编程工具,而不是像2024年不少开发人员往往被动使用。可以参考《软件工程3.0实践之路(六)》、《面向开发人员的 12款 强大的 AI 工具》等文章。

  • 智能测试大模型在自动生成测试用例方面的应用正在被深入研究,测试计划、测试用例和测试脚本的自动生成,参与测试需求分析、测试结果分析,测试报告生成,并能显著提高软件测试的覆盖率和效率,例如生成涵盖所有可能执行路径和边界情况的综合测试用例集,LLM帮助我们实现精准测试等可以参考《软件工程3.0实践之路(七)》、《从自动化软件测试到自主测试,还差几步?》等文章

  • 智能部署与DevOps:大模型可以协助自动化部署流程、生成配置文件和监控系统性能。与DevOps管道的集成将变得更为顺畅,支持自动化测试、部署和回滚程序。

  • AI(LLM)原生工具越来越多、越好用:可以参考:《2024年,大模型驱动的智能软件研发有哪些进展?》、《推荐一款强大的开源编程助手Cursor

  • 还建议你再看一遍《大模型时代的软件研发:正确的打开方式》、《软件工程3.0实践之路(十):总结与展望》。


5. 可信、绿色和伦理考量
大模型在各领域的应用将进一步深入,相关的隐私保护、内容安全、知识产权等问题的监管将更加严格。企业在开发和应用大模型时,需要更加重视数据来源合法性、推理结果可靠性,以及模型透明度和模型的可解释性
随着大模型规模的不断增长,降低计算资源消耗和能耗将成为重点。2025年将有更多技术手段如量化、蒸馏等来优化模型体积和推理效率,配合硬件加速和负载均衡策略,实现"高性能+低能耗"的可持续发展。

人们也关注大模型在软件开发应用中关于偏见、公平性、安全性和知识产权等伦理问题,2025年将更加强调通过负责任的AI实践和监管框架来解决这些问题。
附录1:一些新的预测
  • 马斯克:2025 年 AI 智力或将反超单个人类;

  • 英伟达高级研究科学家 Jim Fan:我们的孩子将作为「机器人原住民」长大;

  • AI 教父 Geoffrey Hinton:未来人类与强大 AI 相比,就像 3 岁孩童;

  • Google AI Studio 负责人 Logan Kilpatrick:智能体全面爆发还要再等一年;

  • 微软 AI 负责人 Mustafa Suleyman:具备永久记忆的 AI 将让你拥有一个第二大脑;

  • Hugging Face CEO Clément Delangue:巨头崩塌、中国领跑、生物突破;

  • 《金融时报》Richard Waters:2025 年不会出现真正的「杀手级应用」。


附录2: OpenAI新年目标公布了,9大主题:
  1. AGI

  2. agents

  3. 4o升级变得更好

  4. 更好的记忆力

  5. 更长上下文

  6. 成熟模式

  7. 深入研究功能

  8. 更好的sora

  9. 更多个性化设置

软件工程3.0时代
由于大模型(LLM)正在改变着千行百业,软件工程(SE)更是首当其冲,迎来软件工程3.0新时代:模型驱动研发、模型驱动运维。本公众号将致力于研究SE3.0时代的软件研发新范式、理论与方法,介绍SE3.0时代的工具与实践。
 最新文章