中国信通院秦思思等:浅析大模型对软件领域带来的影响

科技   2024-12-13 17:31   北京  

2024年《政府工作报告》首次提出“人工智能+”战略行动,旨在推动人工智能赋能千行百业。以大模型为代表的新一代人工智能技术成为软件领域智能化转型的核心驱动力,大模型为传统软件注入新智力,为软件及其形态带来新能力新变革,同时大模型也为软件研发范式带来新转变,为提升软件研发生产力和加速创新带来新思路,并推动软件产业结构性变化。


一、大模型为软件领域带来的价值分析

(一)提升生产效率,降低项目风险

基于大模型的智能开发和智能测试等工具的应用,为软件生产过程提供了更自动化更高效的方法。例如,通过代码生成、代码补全和问答等能力,软件开发人员能够更迅速地编写高质量代码,显著减少手动调试和错误修复时间。同时,该类工具的使用可降低项目对开发人员的依赖,基于工具的学习和记忆能力,不仅可以辅助新的开发人员快速开发出符合项目需求和规范的代码,还可以帮助开发人员快速学习新的编程语言,从而减少人员流动带来的项目风险。根据CSDN 2024年调查数据显示,AI技术已成为我国软件开发者工作中不可或缺的一部分,有69%的开发者表示正在使用AI工具,38%的开发者认为AI编码辅助工具可以减少20%至40%的工作量。


(二)改善软件质量,提高产品稳定性

通过智能化代码检查和智能单元测试等能力,开发人员能够快速进行代码验证和测试,及时发现并修复潜在问题和漏洞,如代码缺陷、代码异常、代码安全风险等,从而帮助开发人员编写出更高质量的代码,降低软件发布后的故障率,提升软件的稳定性和性能。根据GitHub调研数据显示,Copilot可帮助开发人员在编码过程中解决超过三分之二的漏洞。另一方面,通过测试用例及测试数据的生成与补全可提升系统测试覆盖度,从而提升测试质量减少软件缺陷。大模型可作为软件研发人员的得力助手,为研发各环节提供理解和生成等智能化能力,助力降本增效。


(三)加速软件创新迭代,增强企业竞争力

通过提升开发效率和改善软件产品质量,企业能够更快地推出创新产品,抢占市场先机,从而在激烈的市场竞争中脱颖而出。一方面,智能化的研发流程使软件生产周期缩短,企业能够更灵活地适应市场变化,加快产品迭代速率;另一方面,智能研发工具的辅助使得开发人员能够从重复性的繁琐的低端编码工作中释放出来,从而拥有更多时间投入创新相关工作,提升企业创新能力。例如,2023年5月GitHub首席执行官在全球网络峰会(Web Summit)上,演示Copilot X实现简单的贪吃蛇小游戏用时为18分钟,而今年通过真实操作,使用多款国内头部的智能开发助手均仅需2分钟左右,开发时长大幅减少,开发人员将有更多时间思考软件产品的创新。


二、大模型对软件产品形态的影响

(一)推动软件能力更加智能化

大模型从多模态输入输出、智能识别、数据处理、决策实施等维度,全面提高软件的智能化程度。多模态能力的增强,使软件支持文本、图像、语音等多种模态的信息处理,并建立不同模态的数据关联,为用户提供更加全面且灵活的交互体验。理解与生成能力的提升,使软件不再局限于传统规则式及专家式处理方式,而是能够更广泛地理解输入信息,并在跨领域场景实现知识理解和应用,并显著提升复杂信息处理和生成能力。决策能力的加强,使软件可自主学习、规划和调用相关工具,并基于执行结果及用户行为和反馈实时调整,强化决策实施能力。


(二)推动软件技术层面的变革

传统软件技术将在大模型推动下被重新定义。从软件实现层面,大模型将以多种方式与传统软件深入融合,或通过嵌入式方式,或通过知识库及RAG方式,或采用单智能体或多智能体的方式等,提升软件的理解、生成、决策等维度的能力。从软件设计层面,基于大模型能力更多软件将朝着AI原生方向发展,传统软件以流程或数据为牵引,未来AI原生软件将以事件为驱动,为软件应用带来全新用户体验,使软件功能更加便捷、高效、灵活。同时大模型将成为智能软件的技术底座,未来大模型服务(MaaS服务)提供方将为更多企业供给更多、更快、更灵活、更稳定、更高质量的模型服务,拉动软件智能化的规模效应。


(三)推动软件与行业场景更深度融合

大模型提升了软件的定制化能力,尤其是各行业大模型在行业专有数据集上进行了训练和学习,使得赋能后的软件能够更有效地理解场景需求,更高效地运用行业知识,更灵活地处理场景问题,并且催生更多应用场景。以制造行业为例,相较于传统自动化软件仅能执行预设程序,应用大型模型后的软件可实时分析业务需求并动态调整生产流程,显著提高了生产效率和产品质量,推动制造业的智能化升级。


(四)为工业软件的发展注入新动力

国产工业软件在面临技术封锁的背景下,存在诸多挑战,尤其在研发设计类软件(如CAD、EDA、CAE等)领域,国产化率较低,竞争力较弱。而大模型技术的发展为国产工业软件的自主创新和竞争力的提升提供了新的可能性,一是加速关键领域的技术突破,二是助力工业软件技术能力的提升和智能化升级。


三、大模型对软件研发范式的影响

(一)智能化时代推动研发范式改变

大模型技术深度融合到软件生命周期的各个阶段,从需求分析到设计、编码、测试再到软件部署与维护,以及用户反馈等,智能化能力的注入显著提升了研发质效,同时使得软件研发范式逐步转变。一方面,大模型将从当前的辅助开发人员完成任务,到帮助开发人员独立完成更复杂的研发任务,再到未来替代开发人员真正实现严格意义的智能开发,从而推动副驾驶(Copilot)到驾驶员(Pilot)的逐步演进。另一方面,组织结构将从团队作战模式演变为单兵作战模式,以往的研发团队角色分工明确,团队成员少至几人多至上百人,未来一个或少数几个研发人员将基于大模型及多个研发智能体承担全部研发任务。


(二)软件研发将更加低门槛与平民化

软件研发技术门槛大幅降低,通过智能研发助手、智能测试助手等工具的逐步应用,软件研发对开发和测试等角色人员的技术依赖将越来越低,使非专业的工程师也能进行软件研发。如OpenAI发布的Canvas支持Python代码在线编辑、优化、调试和运行,并与ChatGPT深度集成,使得一般的Python代码编写基本零门槛。同时,使用大模型助力软件研发的成本将越来越低,如截至2024年8月,DeepSeek调用成本已降至 0.1元每百万Tokens。技术门槛和成本门槛的进一步降低,促进了软件研发更加平民化,推动“人人都是开发者”的时代到来。


(三)软件研发团队将逐步重塑

通过使用智能化工具将逐步减少研发过程中重复性工作,初级程序员的数量将逐步减少,擅长架构设计的高级程序员比重将上升。软件研发团队将更加精简,一人身兼多职的现象将更加普遍,数据标注师、提示词工程师和算法工程师的角色将融入研发团队,使大模型更好地赋能研发过程。因此传统的程序员、测试人员、系统运维人员等研发角色,应拥抱变化,增强多元化技术能力,通过重塑以应对时代变革。


四、大模型对软件产业的影响

(一)推动软件从业者转型

技能更新,随着AI技术的发展,软件行业从业者需要不断学习新的技能和工具,以适应不断变化的技术环境。例如,程序员可能需要学习如何与大模型协作,甚至微调属于自己的AI大模型。职业角色转变,AI的广泛应用可能会导致某些职位的需求减少,同时也会创造出新的职位,从业者需要适应这些变化。例如,程序员将部分转型为数据标注师或提示词工程师等。工作流程变革,AI技术可以自动化许多传统的软件开发任务,这要求从业者适应新的工作流程,同时也需要他们更多地关注创新和策略性任务要求。


(二)推动软件企业转型

未来软件企业将面临转型压力,一方面,将有更多企业转型提供大模型落地相关服务,这类企业需持续提升能力以应对大模型服务供应商角色的加持,从而扩大软件服务范围。另一方面,企业将面临商业模式的转变,由于软件开发和定制将更加平民化和普惠化,软件企业通过提供开发测试等服务而获得收入的方式可能不具备持续竞争力,转而提供订阅或按需付费的商业模式成为可能。同时行业内将出现更多几人或者十几人的小型软件公司,该类公司基于大模型等新兴技术的加持可能具有较强竞争力,而传统软件企业该如何转型以应对更激烈的竞争将面临考验。


(三)推动软件产业结构变化

一是大模型将成为软件产业链的核心内容,为产业注入新的活力和创新动力,构筑软件智能化转型的重要底座。二是软件外包服务需求有可能持续降低,数据标注、提示工程等需求将逐渐增多,这将导致软件外包服务商的减少,大模型服务和应用供应商的增多。三是用以软件生产的工具链将面临重塑,如DevOps工具链等,在生成式AI强大能力的冲击下或将成为历史。


五、软件领域在大模型时代面临的挑战

(一)缺乏高质量数据集的挑战

代码等软件相关数据受限于隐私和安全法规、开闭源协议等约束,导致数据获取成本高且复杂多样。截至2024年9月,根据TIOBE指数统计,当前编程语言数量已超过200种。这使得行业缺乏大量用于模型训练的数据集,尤其是在工业领域的嵌入式代码等场景数据集更为缺乏。另外高质量数据集的生产过程不够标准化,如将代码、测试用例等数据收集、整理并处理成大模型所需的高质量数据,过程复杂且成本较高。


(二)数据、模型和工具的安全性挑战

生成式内容(如代码等)可能会带来更多不可控的风险,因此企业应从数据、模型和工具多维度构筑风险防线,以应对安全挑战。第一道数据防线,面向模型训练和调优阶段所需的代码等数据集,可能面临敏感代码数据的泄露、未经许可代码的训练、非法代码的推理等问题;第二道模型防线,面向大模型在推理和管理阶段,可能面临暴力攻击、非法套取、非法提问、敏感内容推理、被恶意使用生成恶意软件代码或攻击脚本等问题;第三道工具防线,对智能开发等工具的输入输出进行检查和处理,并关注关联代码库、第三方软件开发工具的数据传输和集成安全,构筑最后一层安全围栏减少应用风险。


(三)文化认知与人才结构调整的挑战

智能化转型面临着文化重塑、认知提升和人才结构优化等维度的挑战。一是组织文化的重塑,其落地要求组织具备开放合作、持续学习和创新的文化氛围,促进跨部门沟通与协作,打破信息孤岛;二是全员认知水平的提升,自上而下每位员工都应深刻理解智能化的潜力与挑战,客观且正确地了解大模型等人工智能技术及其作用;三是人才结构的调整与补充,由于数据治理及模型训练调优等过程需要专业技术人员参与,因此补充人才,或调整或融合AI团队和软件工程团队的结构,方能匹配能力建设和应用需求。


六、结束语

未来的软件及其生产过程将更加智能化,包括交互形式的智能化和多元化,研发范式的自主化和低门槛化,AI应用将无处不在,软件开发也将无处不在。处于时代浪潮的我们,一要拥抱AI拥抱大模型,探索新技术的落地可能,以创新思维引领软件行业在智能化轨道上加速前行;二要脚踏实地不忘初心,深入探索软件工程深层次问题,合理布局提质降本增效目标,推动软件产业的可持续繁荣发展。



作者简介

秦思思,中国信息通信研究院人工智能研究所高级工程师,中国人工智能产业发展联盟(AIIA)智能化软件工程(AI4SE)工作组组长。主要研究方向为智能化软件工程、大模型工程化、MLOps、MaaS等,牵头系列标准的编制、评测、咨询等工作。

联系方式:

13488684897

qinsisi@caict.ac.cn


闫东伟,中国信息通信研究院人工智能研究所工程师。主要研究领域涵盖人工智能政策、标准、产业及生态研究,重点关注大模型技术对软件工程的智能化进程推动和实际应用效果提升,深入钻研AI4SE的最新进展动态,负责系列标准编制、评测、咨询等工作。

联系方式:

13041008356

yandongwei@caict.ac.cn


曹峰,中国信息通信研究院人工智能研究所平台与工程化部主任,中国通信标准化协会TC1WG1(互联网应用总体及人工智能工作组)组长,人工智能关键技术和应用评测工业和信息化部重点实验室副主任。目前主要牵头可信AI人工智能评测标准体系和能力建设,牵头工程化能力等相关评估规范制定与评测等。

联系方式:

13811659138

caofeng@caict.ac.cn


齐可心,中国信息通信研究院人工智能研究所助理工程师。主要研究方向为MLOps、智能化软件工程,参与系列标准编制、评测、咨询及多篇人工智能相关研究报告编制等工作。 

联系方式:

18686962307

qikexin@caict.ac.cn






校  审 | 谨  言、珊  珊

编  辑 | 凌  霄


推荐阅读

中国信通院董晓飞等:智能体推动大模型应用普惠向实
专家谈



中国信通院CAICT
中国信息通信研究院是工业和信息化部直属科研事业单位,以“国家高端专业智库 产业创新发展平台”为发展定位,在信息通信行业重大战略、规划、政策、标准和测试认证等方面发挥了有力支撑作用。
 最新文章