不要让负载测试误导你，获得准确负载测试结果的三个建议

文摘 2024-11-04 12:03 重庆

编译整理｜TesterHome社区

作者｜Roger Durham

概括：虽然传统的“封闭系统”模型可能看起来很熟悉，但它们忽略了真实用户到达的不可预测性。本文重点介绍了模拟真实用户行为的开放系统模型如何暴露高负载下的性能瓶颈，而封闭模型无法捕捉到这些瓶颈。请记住，到达率，而不是虚拟用户数量，才是获得准确负载测试结果的关键。

以下为作者观点：

负载测试是质量保证过程的一部分，旨在帮助预测计算机系统在生产中的表现或帮助预测拟议的更改的性能影响。

这需要让被测系统承受合成的、可预测的负载，然后测量其性能。此负载应合理模拟系统在生产中将遇到的工作。负载几乎总是由自动化测试脚本生成，旨在模拟一组人员执行一项或多项特定任务。

在执行负载测试时，我们会按计划向系统提交这些任务。描述和实施该计划是本文的重点。

许多负载测试工具都基于“封闭系统模型”。这种系统的一个思维模型是工厂，当哨声响起时，固定数量的工人就会开始工作。工人的到来由一些外部事件同步，并受到用户数量的限制。

另一种思维模型是“开放系统模型”，其中每个用户独立决定何时开始一项任务。这种时间表是我们在实际系统中看到的最常见的到达分布，可以通过所谓的“泊松到达过程”进行统计建模。泊松开放系统模型的优点在于它会产生一个易于衡量且与业务目标明确相关的简单数字。这个数字就是到达率：单位时间内到达的平均人数。

到达时间的不规则性对系统性能有重要影响。为了说明这一点，我将展示一系列模拟负载测试，并列比较基于开放系统模型和封闭系统模型的测试。这些是单个服务请求（例如，单个网页加载）的模拟，服务时间来自随机分布。我将展示在两种模型下增加负载的非常不同的效果。

对于开放系统模型测试，我将使用一个时间表，该时间表通过从均匀随机数生成器中抽取所需的到达时间数来创建，以便时间轴中的每个时刻都有同等的可能性被选中。这很容易实现，保证了测试期间到达次数的可预测性，并且是泊松过程的良好近似值。我将这些模拟标记为“到达率”。

对于封闭系统模型测试，我将使用固定数量的虚拟用户，每个用户重复执行任务，直到测试结束。我将调整虚拟用户的数量，以获得与配对开放模型测试大致相同的任务数量。我将这些模拟标记为“VU”（虚拟用户）。

每个模拟结果将以包含一对图表的图形呈现（见下图）。在主图中，横轴是模拟时间（以秒为单位），而左侧纵轴（蓝色）是观察到的并发度（任何时间点系统中处于活动状态的任务数）。右侧纵轴是每个任务所消耗的时间，包括等待时间和活动服务时间，每个已完成的作业都有一个标记（红色）。

每个图中较小的图表是所有任务的任务时间分布，其中斑点的宽度与花费该时间的任务数量成正比。我在任务时间的最小值、平均值和（黑色）第 95 个百分位数处添加了线。我强调第 95 个百分位数，因为它是绩效衡量中最常见和最有用的汇总数字。

我将展示，当我们模拟的负载水平低于测试系统的容量时，模型之间的差异很小，但当我们接近并超过系统容量时，差异就会变得很大。封闭模型 VU 测试可能会错过灾难性的系统过载，而开放模型测试可以准确预测。

轻负载

当模拟负载远低于系统容量时，预测的任务时间不会有太大差别。

图1

图 2

并发性（系统中任何时刻的任务数量）的变化明显更大，这导致任务时间略有增加。在到达率测试中，有时并发性大于系统容量，导致短暂的减速；这不会发生在基于 VU 的测试中，因为并发性受 VU 数量的限制。

满负荷

当系统满负荷工作时，我们看到系统模型的选择对负载测试结果有很大的影响。

图 3

图 4

在达到（或接近）满负荷时，测试的服务器在处理随机峰值工作负载时会遇到麻烦；开放系统模型测试表明，服务器有时会落后，导致并发任务数量级联增加。该测试预测平均值会增加，尤其是任务时间的变化；第 95 个百分位数是配对 VU 测试的两倍多。

在封闭系统模型测试中，这些工作负载峰值会被从测试中剔除，因此系统似乎可以顺利运行，预测性能与轻负载系统非常相似。查看基于 VU 的负载测试结果会误导我们认为在这种负载水平下一切都很好。事实上，系统处于故障边缘，性能低于标准。

超载

图 5

这项到达率测试表明系统明显超出容量。未完成任务的数量不断增加，并且会持续增加，直到出现故障。随着测试的进行，任务时间越来越长。

图 6

与之前的图表相比，VU 测试显示任务时间有所增加，因为任务正在等待服务。你可以在图表中看到任务在测试开始时堆积起来，然后按照与之前的 VU 测试相同的模式执行。但是，系统实际上从未陷入过载。由于每个虚拟用户都等待前一个任务完成后再开始下一个任务，因此负载测试已将自身限制在系统容量范围内。由于这种自动限制行为，使用 VU 系统进行系统过载的实际测试非常困难。

上述结果显示了使用封闭系统模型构建负载测试的一些危险。我们知道大多数现实世界的系统更适合开放系统模型，因此除非有充分的理由相信你处于封闭系统环境中，否则我们建议使用开放系统模型进行负载测试。

我们的第一个建议是从到达率的角度来讨论工作负载。如果实际工作负载最好用开放系统模型来表示，那么最好使用到达率来描述工作负载。不要使用虚拟用户数量，因为这可能会产生误导。

我们的第二个建议是，对任何基于 VU 的负载测试的结果都要非常谨慎。这样的测试可能会导致过于乐观的性能预测，并可能错过更好的测试会预测到的故障。

我们的第三个建议是使用基于到达率的工具（如 Tsung 或 Gatling）进行负载测试，或者采用 VU 系统进行到达率模拟。如果使用的是流行的 JMeter 工具，该工具从本质上讲是基于 VU 的，则可以使用插件（Precise Throughput Timer 和 Open Model Thread Group）有效地将其转换为基于速率的工具。如果使用的是基于 VU 的系统，但缺少基于速率的调度选项，则可以通过根据基于速率的调度延迟每个任务的启动来获得到达率调度的效果。（原文链接：https://www.stickyminds.com/article/don-t-let-load-testing-lead-you-astray）

1.为什么探索性测试不适合敏捷项目？

2.原生鸿蒙，真正独立！部分应用只有基础功能，原因是必须进行大量稳定性测试？

3.招聘｜美团--高级测试开发工程师(客户端&服务端方向)，base北京

4.当测试被推迟时该如何处理

5.招聘｜蚂蚁集团 -- 多个岗位招聘测试开发、测试开发专家（急招）

6.MTSC2024上海大会，现场录播视频

http://mp.weixin.qq.com/s?__biz=MzkxMDM1NDQ0OA==&mid=2247517543&idx=1&sn=f15a6bf9bdfb13160a952376e2fdb0b5

TesterHome社区

测试之家（TesterHome）由一线测试工程师发起和运营的测试技术社区，社区主旨是公益、开源、分享、落地，紧跟前沿技术趋势，致力于推进软件质量保障与安全，是软件质量保障领域的风向标。我们的理念:Coding Share Show Cool

最新文章

如何使用Playwright、Shell脚本和K6在负载测试中自动进行身份验证

敏捷开发中的领导力，如何引导团队应对持续变革

招聘｜OPPO--招聘多名高级测试开发工程师，base广东东莞

招聘｜湖南长沙--招聘集中式存储测试专家

长文总结｜DevOps面试116个热门问题及答案

测试Kubernetes集群：实用指南

货拉拉营销自动化框架Mutation演变与升级之路

软件风险管理的有效策略

开源工具｜自动化巡检系统，基于Testng+Playwright+SpringBoot+Vue+Ant-Design

使用静态代码分析工具进行软件测试的好处

不要让负载测试误导你，获得准确负载测试结果的三个建议

职言｜这些挑战不应再成为质量保证团队的难题

为什么探索性测试不适合敏捷项目？

自动化带来角色重组？对智能测试的一些看法

职业经验｜测试老鸟，38岁裸辞读书4个月，转战新西兰的经历！

测试框架｜Playwright Fixture夹具有效利用的建议指南

如何设计一个测试自动化框架？

借助Nextjs框架来更清晰展示对比测试结果

招聘｜美团--高级测试开发工程师(客户端&服务端方向)，base北京

当测试被推迟时该如何处理

招聘｜蚂蚁集团 -- 多个岗位招聘测试开发、测试开发专家（急招）

转转自建devops平台建设历程之静态代码扫描实践

招聘｜小米汽车--急招系统稳定性测试开发工程师

招聘｜郑州及想回郑州的同学看过来--数字马力招聘测试开发工程师

招聘｜深圳蓝色起源，招聘测试/测试开发

测试灵魂三问及解决方案

招聘｜蚂蚁数科 -- 高级测试工程师或者专家，HC增加到5名

招聘｜base南京，江苏源驶科技招聘两名测试工程师

原生鸿蒙，真正独立！部分应用只有基础功能，原因是必须进行大量稳定性测试？

鸿蒙应用怎么测试？这个工具包请收藏！

实践分享｜QA工程师如何利用生成式AI提高QA任务的生产力

中国移动业务系统突发异常，紧急排查后已修复故障

利用Cypress建立自动化项目：重复任务系统案例研究

使用开发模式一年：一位工程经理的10条经验教训

测试基础｜汽车软件测试术语解释

动态可追溯性方法：彻底改变软件测试

阿里云开源AI应用开发框架Spring AI Alibaba，帮助开发者快速构建AI应用

国内首个测试行业大模型及工具TestAgent开源，附简单评估！

使用Pytest进行单元测试的初学者指南

印度媒体称，到2027年80%的软件工程师必须提升技能才能保住工作

性能测试工具｜如何有效度量前端性能

渗透测试｜提高软件安全性，需要注意以下几点

全球首个！解读《汽车软件质量安全标准》

华为发布鸿蒙原生应用开发者激励计划，最高可获百万现金

10个AI驱动的软件测试自动化工具，你尝试过吗？

AI测试｜从业测试12年，何须迷茫？

测试用例小锦囊——基于思维导图的测试用例生成和维护

接口测试｜从0不到1的心路历程

A股牛市？盘点软件测试领域的上市公司

一个QA工程师眼中的测试自动化工具

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉