本文作者
覃宇:Thoughtworks 资深技术教练/咨询师
冯英睿:Thoughtworks 中国区技术总监
ChatGPT 的横空出世让我们看到了实现通用人工智能的可能性,我们在一开始就判断它将对软件研发这类脑力工作者产生巨大影响。这些影响不仅仅体现在技术和工具上,同时也会对业务、流程、方法、组织产生巨大影响。
目前这些变革才刚刚开始,对于 AI 带来的真正价值仍存在很多质疑。但可以肯定的是,体验过软件研发人员已经离不开 AI 了。
经过 Thoughtworks 的内部实践,评估 Github Copilot 和 ChatGPT 这些工具对软件交付周期的生产效率能否产生积极的影响。初步的结果和外部的调查报告类似,对于软件交付中个体的活动效率而言,都能够得到提升。这对于一项新技术而言是非常了不起的。以下是我们统计的提效数据。
但我们仍然发现应用 ChatGPT 和 Copilot 对软件交付端到端的提效仍然存在诸多限制。例如:
软件研发人员的水平和知识,对 AI 生成的结果的有效性至关重要。例如通过提示工程可以提高 AI 生成结果的质量,但这意味着输出依赖个人的提示工程能力。
大语言模型的代码生成依赖上下文知识,研发人员需要维护知识并在交互中输入知识,这在项目层面增加了知识工程的成本。
在软件研发全流程中,简单、重复的任务的交付效率将获得极大的提升,但复杂任务收益不多。
个人工作中用于实际产出的时间仅占工作总时长中的很小一部分。软件研发活动中大量的时间消耗在信息检索、认知负载/任务切换、质量反馈环滞后、运营协作摩擦以及开发者体验等问题上。
未来 AI 辅助研发提效的发展需要着眼于软件研发的全流程。不仅从技术视角,更要综合组织、流程、人才和数据等视角,来探索 AI2.0 时代的数智化软件研发。
在 AI2.0 时代,我们把“坚持以人为本、深化AI应用、加速价值交付、迈向高质量发展”作为指导方针来打造 AI 使能的数智化软件研发体系。同时我们将处于一个以更快的速度发展的环境,所以我们建议增加对效能、价值和竞争力的度量的关注。
为了更好地打造 AI 使能的数智化软件研发体系,而软件研发体系的核心支柱应该包括组织、流程、技术、人才各个方面。我们经过多方的交流和探讨,设定了以下五大支柱:
基于人与 AI 协调的流程实践,关注人与流程的变化
模型增强的一体化工具平台,关注流程、技术、方法、实践的落地承载
研发数据资产和知识管理,关注数据使能的软件研发体系
数据隐私保护和 AI 安全合规,关注新形势下的软件工程面对的安全与合规的挑战
专业能力和组织分工演进,关注人才和组织的成长与管理
个人研发体验和效率可以通过各种 Copilot 来提升,但还存在降低运营的摩擦,加速反馈闭环等问题。虽然目前超级个体的打造和全栈人才是讨论的热点,我们对此保持谨慎的乐观。因为个人的认知边界永远存在,只有结合个人能力增强和全流程系统优化才能最终的解决问题。
无论是个人的实践还是流程的演进,都需要通过工具承载才可以更好的复制和规模化推广。当前的软件研发工具链已经形成了研发生命周期的闭环,再增加模型和 AI 能力的强化之后,无论是在协作还是知识的流转上都可以降低负载,提升效率。
当前很多团队的研发数据资产散落在各应用,可以借鉴数据平台的建设思路,通过全链路工具的打通,获取各个环节的数据并提炼出其中的知识,全方位地为个体成长学思践悟的过程提供知识的支撑,提高个体获取知识的效率并降低认知负载,同时为全面协同的数据驱动的决策提供支撑。
在 AI2.0 时代,我们将面临更严峻的安全和隐私保护挑战,未来的攻击面和攻击手段会愈演愈烈。数据成为了最重要的资产之一,需要了解来源、整合和使用方式。我们还需要了解模型是如何做出决策的,并能够解释其结果和推理过程,还需要在算法偏见、隐私保护、人类参与等方面进行审查和监管。
AI2.0 时代的研发能力模型必然会扩展到 AI 相关领域,而与 AI 协同需要研发各种专业能力完成升级。新加入研发团队的 AI “角色” 也会促进研发组织阵型的演进。这都需要我们关注 AI 人才能力以及赋能体系的建设。
随着模型能力的增强,算力价格的持续下降,以及AI Agent开发方式的成熟。软件研发人员将通过AI Agent快速改进软件产品的交互并提升智能化水平,同时也会用于改变自己的工作方法。我们预测接下来的一年里,将会发生以下变化:
从 Copilot 到 AI Agent:GPT-4发布 function call 功能;ChatGLM等相关模型厂商和企业也都表示 AI Agent 是未来重要方向
从赋能个体到赋能团队:单个角色的工具不断推陈出新,BA Copilot,SRE Copilot等应接不暇,与跨角色全流程的一体化平台结合成为重要趋势
模型能力快速增强:众多开源模型持续刷榜,上下文大小增长迅速(现已增至192K),MoE 模型效果显著,多模态模型进展显著
算力价格持续下降:OpenAI GPT API 价格减半,华为、寒武纪、AMD 纷纷发布新的芯片产品
规模化应用前景明朗:落地生成式AI到业务场景的案例越来越多。AI Agent和LLM应用开发框架不断出现,开发 AI 应用和服务的过程越来越简单
我们也观察到领先科技企业已经验证个人提效的场景,提效正在向 AI Agent、平台化、赋能团队、规模化发展。
Thoughtworks 内部各个团队,各个角色也都在积极地探索软件研发生命周期中的各项工作如何更好地使用生成式 AI 技术进行提效。我们提出各种研发场景下生成式 AI 提效效果的假设,利用低成本的生成式 AI 工具快速验证假设,然后再将经过验证的有效实践包装成工具进行推广。几乎每一种提效场景都需要运用 AI 应用开发技术实现为简单的 AI 工具。
我们结合业界 AI 辅助效能提升工具整体的发展趋势,总结出了一些 AI 辅助效能研发的固定模式,例如利用领域知识进行 RAG 增强的聊天机器人/ Copilot 助手。这类机器人/助手应用的架构设计趋同,而需要根据具体场景去调整的是提示词、知识库和大模型。
趋同的架构能力可以被提炼成可复用的开发框架或能力服务,进而加速更多 AI 提效应用的探索和实施。开发框架或能力服务能够充分利用大模型资源,也能够进行集中的安全管控,还可以进一步封装成一种类似 GPTs 的可配置的 AI Agent 平台,供非技术背景团队使用。这些应用、框架、服务、平台等构建块最终拼接在一起,形成了 AI 辅助软件研发乃至业务提效的全景图。
场景应用:各种 AI 工具,以页面、应用、插件的方式集成到现有的工具当中,最常见的就是各种领域的对话机器人。
开发框架:主流编程语言封装的模式(如 RAG、AI Agent 等)、工具(上下文提取、IDE 集成)、实践(调试、微调)。
模型适配:开源模型的运维、商业模型的封装以及合规控制,通过 API 提供模型服务,方便上层应用按需使用模型能力。
AI Agent 平台:低代码或者无代码平台,只需要简单配置提示词或者知识库就可以快速实现特性业务领域的对话机器人。
这样一副全景图可以作为研发组织使用 AI 提效以及进一步为业务提效的参考解决方案。但各家研发组织在制定实施策略和举措时还需要考虑生成式 AI 的特点以及自身的约束。
生成式 AI 以语言为交互方式,而软件研发的整个生命周期需要沟通交流 的场景随处可见,似乎每一种场景都可以利用 AI 来提效。生成式 AI 背后的开源大语言模型发展迅速,已经大大降低了推理成本,但仍然是云原生资源成本数十甚至数百倍,何况云原生基础设施的成本都受到了质疑。爆发的需求场景和不算便宜的实施成本形成了矛盾,让研发组织在切入场景和平台建设上举棋不定。
我们总结了一套 ROI 估算方法来帮助大家选择切入的场景。选定研发场景能够帮助我们具象地理解场景涉及的团队、人员或是系统,场景发生的频率,场景中待提效的操作需要花费的精力。而 AI 辅助该场景的提效回报可以简单计算范围、频率以及节省的精力之积。实施该场景的提效需要开发和运营相应的 AI 工具,这两部分成本都应计算在投资之内。不同的 AI 工具开发涉及不同的技术工作,包括:应用开发/工具集成、提示工程、数据清理、现有工具对接改造。实施成本依据技术可行性分解,将相应技术工作实施人力成本换算为资金投入,相加作为估算。而 AI 工具运营的成本投入在模型服务上。如果是采购的商业模型服务,对每次提效操作消耗的 Token 数量作估算,就可以算出投入成本。如果是自行部署的的开源模型,计算算力的硬件投入或是云计算租赁费用即可。
我们得到了各个场景的回报和投资估算的具体金额,可以换算成相对的等级评分(如 1 至 5 分),简单利用加权计算就可以对各个场景的实施优先级进行排序。各个研发组织可以根据自己的需要增加一些加权因子(同样是相对等级评分),如实施迫切程度。有了 ROI 的优先级,研发组织就找到了适合自己的 AI 提效的独特路径。
在决策平台建设的举措时,研发组织需要要考虑的是组织规模和安全约束。严格的安全合规是强制要求,除了建设自己的平台之外别无他法。组织的规模是 ROI 的杠杆,组织的规模越大,AI 惠及的范围(包括研发和业务)就越大,平台建设的成本也就摊得更薄。我们观察到,在平台建设举措上,研发组织的策略可以分为三类:
小型(研发人员 100 人左右)非强监管:这类研发组织大多采购商业研发工具或是使用开源工具平台,因此需要选择成本最低的公有(商业)大模型,采购或者使用开源 AI 工具即可。
中型(研发人员 1000 人以下)非强监管:这类研发组织会在商业或者开源研发工具上构建自己的一站式开发平台,因此需要结合使用公有(商业)大模型和部署开源模型,还需要开发 AI 工具并集成。
大型(研发人员 1000 人以上)或强监管:这类研发组织技术和资金雄厚,会自研研发工具平台,因此需要构建包括模型微调在内的服务、框架、应用、平台的 AI 架构,最终实现自己的 AI Agent 平台。
研发组织可以根据自身的规模和约束参考上述平台建设的选择建议,在监管安全能力、大模型运维能力和 AI 应用开发能力三个方面对现有工具平台进行扩充,同时结合场景切入的优先级,加速 AI 提效验证、实施、推广的闭环,尽力扩大提效惠及的范围,力争早日达到平台建设成本投入的“盈利”拐点。
结合对 AI 技术发展趋势和领先科技企业的举措趋势的观察,我们建议下一步的研发提效应当聚焦在经过验证的速赢场景和高价值的关键场景。我们认为 2024 年软件研发使用 AI 提效的重点场景如下。
中大型研发组织需要制定未来一到两年 AI 软件研发的战略和整体规划,而对于小型研发组织来说,采购商业模型和工具或是使用经过验证的开源工具是最稳妥的策略。不同的研发组织需要结合 ROI 估算、自身规模及监管约束决定研发提效场景实施的优先级,实施重点应当放在聚焦经过验证、高价值的速赢和关键研发场景,真正做出实效。所有研发组织都需要持续关注一站式工具平台和 AI Agent 平台建设,为赋能业务和研发加上 AI 杠杆。