大模型在自动化测试的突破：蚂蚁、华为等头部企业应用实践

文摘科技 2024-11-05 07:30 浙江

作者｜沙丘智库研究团队

来源｜沙丘社区（www.shaqiu.cn）

随着软件系统的复杂性不断增加，软件测试的重要性越来越高，测试活动将影响开发人员的工作效率，产品的可靠性、稳定性和合规性，以及最终产品的运营效率。

在大模型出现之前，软件测试领域一直在探索“智能测试”，例如精准测试、通过各种传统算法生成用例、UI自动化测试等。大模型出现后，智能测试层次不断提升，真正进入了“智能测试”新时代。

根据沙丘智库发布的《大模型应用跟踪月报（2024年10月）》，从场景上看，相较于2024年上半年常见的知识助手、编码助手、智能客服等场景，大模型在销售赋能、软件测试、智能运维等场景的应用上升明显。

在软件测试领域，自动化测试脚本正在成为继测试用例生成以外，又一个显著赋能企业质量和测试活动的重要场景。

从测试端到端工作量分布来看，测试自动化工作量占比较大，随着测试业务量的持续增大，对测试自动化的及时性和自动化率提出了更高要求，同时测试自动化程度高也会降低测试执行部分的工作量。

对于大部分测试人员来说，自动化测试脚本生成是一个耗时耗力的工作，且不同经验能力的测试人员撰写的脚本质量参差不齐。

大模型为自动化测试脚本生成带来了新的解决方案，大模型可以编写自动化测试脚本，用于单元、API和UI的功能性和非功能性检查及评估，但是可能需要其他平台或工具执行自动化测试脚本。

沙丘智库长期跟踪调研大模型技术的发展，旨在帮助企业快速了解大模型最新、最全面的落地情况。沙丘智库通过研究蚂蚁集团、中国邮储银行、科大讯飞、华为等4家企业自动化测试领域大模型应用实践，旨在为其他企业提供参考。

▎案例1：支付宝小程序基于AI大模型的自动化测试实践

支付宝小程序在质量检测中面临不同行业场景的挑战，传统监控无法有效识别业务问题。蚂蚁集团利用AI大模型技术，开发智能异常检测和链路测试算法，实现自动化测试。

通过自然语言处理和多模态大模型，提升了识别业务异常和深度链路问题的准确性。该实践不仅提高了检测效率，还通过智能动线预测模块，增强了用户体验。

完整内容：支付宝小程序基于AI大模型的自动化测试实践

▎案例2：中国邮储银行基于大模型的自动化测试脚本智能生成

传统的自动化测试脚本编写需要测试人员具备一定的编程能力，且耗时耗力，导致脚本编写人力成本大，质量参差不齐。

邮储银行金牛座自动化测试系统引入大模型技术，结合知识库、录制、报文解析、图像识别等技术，针对不同场景提供脚本智能生成功能：

· 单接口脚本批量生成：主要用于单接口测试，提供了单接口脚本批量生成功能，有效解决了单接口测试脚本编写量级较大的问题；

· 多接口组合场景脚本智能生成：主要用于测试业务流程，针对组合场景脚本，采用录制+智能分析+辅助编写的方案智能生成脚本；

· UI测试脚本智能生成：借助大模型技术，可以根据简单的用例描述，直接自动生成测试脚本。

案例选自：沙丘智库《大模型应用跟踪月报（2024年10月）》

▎案例3：科大讯飞基于大模型的自动化测试实践

在接口测试脚本生成场景，科大讯飞将接口测试平台融合大模型能力，提供智能用例生成服务，当前平台主要针对HTTP协议进行接口的智能化测试。当新增接口用例或将接口定义导入时，会调用智能用例生成服务自动生成接口自动化用例；

在UI自动化测试脚本生成场景，科大讯飞采用用例生成脚本模式，通过用例文本输入的引导，结合其他输入数据，生成UI自动化脚本。经业务验证，在用例编写规范的情况下，UI自动化脚本生成的采纳率可以达到50%以上。

完整内容：科大讯飞基于大模型的自动化测试实践

▎案例4：华为基于LLM的测试自动化代码生成实践

华为选择大模型辅助测试自动化代码生成作为大模型在智能测试领域应用的突破点，首先使用SFT调优方案，落地场景为老特性防护网补齐，但存在时间间隔导致无法写新特性；然后，使用RAG方案实现分钟级新特性编写；再次，进一步实现无需写样例脚本，直接通过AW生成。从整个方案迭代方向看，AI自动生成的比例越来越大。

截止2024年6月底，大模型辅助测试自动化代码生成的应用人数为近3k人，覆盖60+产品，测试自动化生成的代码量40+万行。

完整内容：华为基于LLM的测试自动化代码生成实践

更多研究：

...

*更多生成式AI研究可前往“沙丘智库”小程序查阅

*有任何需求可咨询客服微信：zimu738

http://mp.weixin.qq.com/s?__biz=MzkyMzM0NzEwNg==&mid=2247487689&idx=1&sn=c2f59dfd46ffa0e5a2a5e39f5eb6f13c