万亿狂奔背后的券商IT:重度量、做提效、稳扎稳打不要飘

科技   2024-10-15 19:30   北京  

思码逸

专业的软件研发

效能度量平台


读完需要

10
分钟

速读仅需 4 分钟

近日,A 股市场如同一头狂奔的野牛,成交额屡次突破万亿大关,多次刷新历史纪录。这场持续多日的交易狂潮不仅让投资者血脉偾张,更让券商的 IT 系统面临前所未有的挑战。面对如此巨大的高并发压力,部分券商的 IT 系统不堪重负,不时出现卡顿甚至"宕机"的情况,导致用户无法进行基本的银转证操作。在这个毫秒必争的时间段,宕机便是实打实的损失,稳定、高效才能压倒一切,而这对于用户规模庞大的券商系统并不容易。

券商的业务规模和用户体量决定了它有着极为复杂的系统架构和数据呈现,叠加市场波动带来的不定期高并发以及大量存在的外包环节,这些因素共同对券商的 IT 治理提出了更高的要求。唯有将功夫下在日常,展开持续、细致的监测评估,有效度量团队的交付水平,才更有可能抵御不时出现的“黑天鹅”事件。

基于上述背景,国内某顶级券商自 2023 年起与思码逸展开了合作,开始对其数百人的研发团队进行科学合理的研发度量和精细化管理。

1

   

定义指标,找到数据大厦的“承重墙”

对于拥有海量敏感信息的券商而言,数据的重要性不言而喻,这不仅体现在业务层面。全面、高价值、结构化的数据应用对于内部管理同样是一把利刃,特别是对于研发这一极为数据驱动的工种。

长期以来,该券商在研发管理中一直面临"数据丰富,洞察贫乏"的困境,大量数据分散在各个团队和个人手中,既无法准确反映研发过程,也难以明确改进方向。这就很容易让团队管理者陷入尴尬境地——看似什么数据都有,但无论想在什么场合用,都无从下手。特别是想对团队进行效能评估时,管理者往往需要花费大量的时间来寻找其中的高价值信息——哪些能组合应用?哪些能精准匹配到团队目标?哪些最能体现当下遇到的问题?

在一锅粥的混沌里,数据越全越迷茫,由于缺乏体系化和北极星指引,管理者颇有一种“拔剑四顾心茫然”的无奈。基于此,在深入了解该券商的数据现状后,思码逸凭借深厚的行业经验帮助该券商构建了一套北极星指标体系。相比于过去的简单堆砌所有可用数据,思码逸更侧重挖掘、筛选最能反映研发团队效能的关键指标。如交付速度、代码质量和资源使用效率等,帮助管理者找到真正该看的重点。在协助筛选并设计这些指标的基础上,思码逸还根据不同管理场景将其整合到了直观的可视化看板中,帮助管理者在日常进行多维度的便捷使用。

1.1

   

组织效能看板:

依据“多、快、好、省”几个维度,从决策者视角帮助管理者梳理出代表组织效能的核心指标,及时了解组织效能波动变化,为后续的排兵布阵提供可靠数据参考。

1.2

   

项目效能看板:

主要从“进度、效率、质量、资源使用”几个维度进行指标选取,帮助项目管理者实时跟踪各项目的交付情况,及时发现效能卡点和质量风险,确保项目能按时交付,项目资源得到充分发挥。

在此之后,这套指标体系成为团队管理的有力抓手和驱动引擎。

  • 在项目会议上,管理者能够基于客观数据掌握当前研发的水平,并且在讨论进度和质量问题有数可依,借此做出更加合理的决策。

  • 向上级汇报工作时,研发团队主管能用这些数据有力地支持自己的观点和请求。

  • 而团队成员也在这个过程中“越干越有劲”,因为方向明确,大家指哪打哪,能够更加专注于提升真正重要的指标,减少了无意义的盲目尝试,做事效率也自然高了起来。

2

   

降本增效,化“成本大头”为“动力工厂”

在北极星指标体系的指引下,该券商对团队效率和资源使用情况有了更深入的理解,能够清晰地看到每个团队和个人的贡献,以及资源分配的效果。随后,管理者开始将注意力转向更具挑战性的目标:降本增效。

提到降本增效,大多数人的第一反应往往是裁员。裁掉一部分,让剩下的人干更多的活,这样的操作在最近几年屡见不鲜。诚然,作为成本大头,人力总是第一个被优化的。但在“裁员裁到大动脉”的新闻频频出现后,企业也逐渐意识到,贸然操作很可能会带来意想不到的后果,而这些后果一旦出现,其成本会远高于削减下来的费用,可谓是鸡飞蛋打、赔了夫人又折兵。

那么更聪明的做法是什么呢?——是不裁员,但是干更多的活。

准确地说,是在保持现有团队基础上更聪明地干活,减少工作中的冗余浪费,通过合理的度量管理,帮助团队进入提效的正向循环,进而优化企业的资源配置,达到降本提效的根本目的。

在合作过程中,该券商管理层逐渐认识到,借助精细化管理和数据驱动的决策,可以在不影响团队士气和业务发展的情况下,实现更高效的运营。

而要达到上述目标,管理者需要对团队内的每位成员进行客观度量,明确每个人的工作产出与代码质量,为进一步优化调整提供支撑。就像该券商效能负责人提到的:

“一个团队里,班都是一起加的,活都是一起干的,没有谁比谁更轻松。总不能说谁提交的代码多谁就更努力,尽管我心里大概有数,但凡事不能口说无凭,分梯队也得分地有理有据。”


而要做到有理有据,第一要保障的就是“客观”。在思码逸的帮助下,券商引入了代码当量这一指标作为衡量开发人员生产效率的核心指标,借此实现多维度的人效评估。

2.1

   

通过贡献均衡度判断团队资源利用是否充分合理

对于管理者而言,研发团队的主要资源是人,核心交付物是代码。在优化资源管理过程中,首先关注的是团队当前资源的使用情况:

  • 头尾部成员当量产出是否符合角色定位与预期

  • 腰部成员是否呈现断崖式分布出现长尾现象

  • 整体贡献度相较行业基线(40%人贡献 80%当量)是否偏低,有无人力依赖风险

以此为参考对任务分配及管理规划做进一步优化调整。


2.2

   

通过活动热力图了解成员工作是否过度饱和或空置

由于该券商项目开发具有周期性,不同团队忙闲情况不一。为了提高资源利用率,解决因人员空置导致贡献分布不均衡的问题,思码逸为其设计了开发者活动热力图以识别开发者不同阶段的忙闲情况。

热力图以公司人均当量产出为参考,按照颜色区分繁忙情况,当识别到部分资源长期处于闲置状态,则由项目经理对资源进行抽调,协助活跃期的项目进行协同开发,充分发挥资源价值,提高流动率。


2.3

   

通过效率与稳定性预警识别效能薄弱群体

为了进一步了解团队成员的工作特征,以高稳高效为目标提升成员的综合能力。思码逸提取了效率(每步长平均产出当量)与稳定性(离散系数)作为关键指标,效率平均值与离散系数参考值作为基准划分了四个象限。从各象限人数比例分布找出提效方向:从高稳高效成员中提取最佳工作实践推广,从低稳低效成员中了解原因,制定培训提效策略。


2.4

   

通过观测 ROI 变化验证资源投入是否有效

在进行了以上资源管理方面的优化之后,为了验证提效措施是否有效以及是否真正起到效能提升的效果,使用累计当量产出/投入人力进行了 ROI 测算,用于跟踪资源投入后的效能变化情况,根据 ROI 反馈及时调整策略,提升整体效能表现并用于季度汇报、高层汇报等多个场景。


这样一来,研发团队负责人不仅能评估团队的整体效率,还可以深入到个人层面,确保每个团队成员的工作量和质量都符合预期,进而为资源的合理配置和团队整体效率的提升提供数据支持。至此,团队中谁看似忙碌却毫无产出、谁默默无闻却承担了最重要的职责一目了然,大家也都心服口服。

这种方式使得在不裁员的情况下实现了成本的降低,提升了整体资源利用率。值得一提的是,当功劳苦劳都被看到,团队并没有因为“被度量”而草木皆兵,反倒是进入了各出其力、各尽其才的良性运转。

3

   

合理分配,好钢用在刀刃上

从古至今,“资源”都是兵家必争之地,在现代企业中依然如此。对于管理者而言,如何分配需求、让资源被充分合理地利用,是一个重要课题,为此管理者不得不反复面对并回答一个核心问题:当我们谈需求的时候,我们究竟在谈什么?我们该如何准确定义和衡量"需求"?

3.1

   

当固定资源遇到浮动需求

在很多情况下,需求由业务提出、IT 承接,二者之间不仅存在上下文的偏差,在语境上也不完全统一,这就常常出现需求和供应的不对等。当需求超过接受范围,IT 部门便不得不加班加点保证功能上线,长此以往便会积聚许多怨气,造成业务和技术之间的沟通障碍。为避免这一问题,许多企业开始启用“业技融合”策略,由执行部门自己上报需求,但这仍然难以避免需求之间的水分和参差。

以两个开发团队为例:团队 A 一个月完成 500 个需求,团队 B 仅完成 200 个。表面上看,团队 A 似乎更高效。然而,深入分析可能发现,团队 A 处理的是小粒度、低复杂度的任务,而团队 B 则完成了更具挑战性、价值更高的任务。

这种"需求语言"的不统一导致了严重的管理困境。在实际合作中,该券商 CIO 也不止一次向思码逸表达过类似的苦恼:

"我们有六七百人的研发团队,几十个项目组,还有外包团队,每个团队的工作内容、管理方式和评估标准都不一样,很难拿到一起去比较。平时还好,大家各管各的能平稳推进进行。一到资源分配的时候就非常麻烦,每个团队都说自己人手不足、时间紧迫,但其实工作粒度差异很大,我也没法到每个项目上实地考察。"


不难看出这其中存在几个关键的挑战点。首先,参差不齐的需求颗粒度使得团队间的交付能力难以直接比较,管理层无法准确评估工作负载和效率。与此同时,需求复杂度的高低差异也容易让一些代码开发外的工作被忽视(如技术调研或文档类工作)。这种混乱在外包团队的管理中体现得更为明显,由于缺乏对外包团队过往数据的真实参考,管理者很难准确预估应当投入的外包资源。

3.2

   

统一语言,用“工作量”说话

在与思码逸合作之前,该券商季度复盘会主要依靠需求交付个数结算工作量同时作为下一季度资源分配的主要依据,但由于各团队需求拆分力度不一致导致需求颗粒度差异较大,导致需求个数统计结果与实际情况偏差甚远,甚至出现为了争取资源故意把需求拆小的现象。上述问题的出现,主要在于缺乏客观的衡量标准,没有统一标尺,大家就有了“自由发挥”的空间。因此当务之急是优化需求的资源分配机制,去除需求填报的水分。

第一阶段:校准需求颗粒度

为了解决这一问题,思码逸在合作中采取的第一个动作是建立代码与需求之间的关联关系。在 Devinsight(思码逸提供的研发效能度量平台)中,通过计算各业务团队需求颗粒度分布情况及平均每需求当量,为团队负责人提供拆分经验校准,同时高层管理者在分配资源时也可结合各业务团队需求颗粒度大小进行综合考量。


第二阶段:建立需求复杂度评估模型

需求颗粒度试行一段时间后,资源分配情况得到了明显好转。但有团队负责人提出部分需求虽然代码量小,但可能涉及多个系统和接口的前期评估、调研、设计、测试的工作量,仅从代码体现不完全。为了进一步完善工作量评估机制,思码逸协助对内部需求进行了统一盘点,从中选择了代码当量、涉及系统数/接口数、测试用例数等作为关键因子构建需求复杂度评估模型,同时为了保持评估结果的客观性,代码当量的比重设置为了 1/3,其余指标均分剩余权重。


第三阶段:需求复杂度助力研发资源分配

在计算复杂度时,每个指标取值区间定为【0,1】,根据该项因子在所有需求的排位进行分数计算,最后乘上因子权重计算需求复杂度最终得分。为了方便划分需求复杂度区间,将最终得分等比扩大 10 倍,取值区间为【0,10】。最终根据各团队需求复杂度总分进行排名,作为工作量结算主要依据。

(点击图片可放大查看)

当前需求复杂度仍主要应用于汇报场景和作为管理者的资源分配参考,逐渐替换了之前的需求交付个数。在内部推广一段时间后,该券商也计划将该模型用于外包成本结算、内部财务统计等多个领域,为各层级角色提供关键管理抓手。

至此,该券商的项目结算进入了新轨道,不仅从源头上改进了需求的拆分和分配方式,也能够在事后及时、科学地展开复盘,回溯当初的分配是否合理。

时至今日,基于代码当量的需求管理方式已经成为资源分配的重要依据和 CIO 的必看数据。各级管理者不再需要依靠主观判断在多方利益间反复权衡,而是能够在数据和指标的指引下进行快速而有效的判断,最终合理、充分地分配有限的资源。

4

   

立足度量,着眼提效

时至今日,思码逸已经为该券商提供了近两年的效能度量服务,深入参与建设来该券商的效能体系,思码逸高级咨询师魏俊华表示:

“有了全面可用的数据后,研发效能提升将成为企业降本增效的重要抓手。通过何种手段、从哪里突破、如何评估等都是企业面临的关键问题。而已落地 AI 应用场景的企业相比未使用或未充分使用 AI 的企业,在效率和质量上总体显示出优势”。


接下来,思码逸将着眼于 AI 落地企业和研发效能度量分析面临的挑战和难点,在合作中引入质量保障编程助手 DevChat,减轻开发人员在编码和项目管理上的负担,实现更高效、更优质的软件研发。

点击左下角「阅读原文」即可申请试用,开启研发效能度量新征程!

思码逸研发效能
为企业研发团队提供专业的研发效能度量分析平台及配套解决方案
 最新文章