02 像菜鸟一样会开会 - 可靠的数据

文摘   2024-11-11 21:44   韩国  

在我加入菜鸟之前,关于会议就已经设置了一个最初的目标:人均会议时长降至 xx分钟。然而,在与多个团队探讨具体数据解读的过程中,大家对“人均会议时长”的这一目标的理解出现了诸多差异,以至于可以观察到对同一目标的认知分歧。

  • 例如,若人均会议时长指的是在线会议的总时长,那么频繁参与会议的管理者是否应当排除,以避免其频繁会议造成的偏差?

  • 另外,若定义为所有人每日会议的平均时间,这是否包括线下会议,还是仅限于线上?

  • 还有人提出,人均会议时长应基于特定的时间周期,但这个周期是按周、按月,还是按季度来计算?


在线会议时长这一目标因为上述种种解读和定义的问题,基准值波动较大,缺乏一致性。此外,数据的收集口径和标准的解释不清,也使数据的解读更加复杂。

此外在菜鸟和阿里生态内,数据资源非常丰富,主要来自钉钉和阿里郎(一款内部OA工具,集成了在线会议功能)。通过API,这些数据已成功导入会议报表前端,集中展示了各个团队的在线会议时长。这样做的目的是实现“通晒”机制,以便引导各团队逐步实现合理的在线会议时长。

然而,丰富的数据既是机遇也是挑战。好的一面丰富的数据提供了更多解读和行动的可能,但现状是数据的消费维度较为单一,这在一定程度上限制了数据指导具体管理措施的效果。

事实上,我并非数据专业人士,但我一直认为,如果用来消费和分析的数据本身不可靠,那无疑是对资源的浪费。在任何领域中,确保数据的可靠性和一致性始终是首要任务。无论是用于制定战略决策,还是进行日常运营管理,数据都是支撑决策的重要基础。如果数据不准确、缺乏一致性,那么基于这些数据做出的任何判断和行动都可能误导决策者,导致资源浪费、效率低下甚至错误的方向。

数据的可靠性不仅关乎其准确性,还包括数据的完整性、时效性和一致性。只有当数据来源清晰、收集标准统一、计算方式一致时,才能为分析和决策提供有力支持。因此,在数据分析的每一个环节中,从数据收集、处理到呈现,始终要保持对数据质量的高度重视,避免任何潜在的不确定性和偏差。

然而在实际操作中,这一问题常常被忽视。常见的问题其实并非和过程有关,而关乎人性本身:例如只要生成的某个或某几个数据结果与预期较为接近(无论这一结果是积极还是消极),往往会倾向于停止对数据质量的进一步探究和追问,而直接接受这些结果。如此一来,真正的问题还未被揭露,答案却已被草率地产出。这一现象也反映了人性的一面: 人们往往倾向于接受那些看似合理、易于解释的答案,而忽视了数据背后可能存在的深层问题。  

对于目标阶段发散的问题,教员早在1957年《关于正确处理人员内部矛盾的问题》中就有提出:统一思想是解决实际问题、推动工作的重要前提。

那么对于会议治理而言,解决目标认知的一致性缺乏和数据可靠性一致性问题,首要要解决的问题是关于目标的解读和定义。

在多方讨论和对数据进行较为深入的挖掘后,对人均会议时长的定义如下:

人均会议时长定义:在一个指定的时间段内,该组织中的有效人员平均参加会议的时长。

基础定义:人均会议时长 = 总会议时长 ÷ 总人数;

  • 数据来源:可以收集到的钉钉(电话会议,钉闪会等),阿里郎等多种形式的在线会议;限定为在线会议,不含线下无法进行数字化采集的会议;

  • 指定的时间段:可以按天|周|月|季度|年等时间周期来计算;

  • 有效人员:根据角色和组织范围对有效人员进行了明确的圈选;

  • 去除异常值:包括是否包括在日历上的重复会议带来的重复计数,以及是否包括未能发生但未取消等多种异常情况;

这个过程实际上是对整个现有的在线会议时长数据标准化过程的再定义,涉及对数据收集入口、API导入的完整性和口径规则进行严格的审查与校验。首先,需要确保数据的收集标准一致,避免因数据口径不统一造成的偏差。同时,必须对数据中的错误、重复项和缺失值进行清洗,确保后续分析基于干净的数据,避免“脏数据”影响结果的准确性。

在完成基础的数据清洗后,接下来的关键步骤是对一段时间内的x万量级的数据进行快速的审核。这个环节的好处在于,通过对数据的敏锐感知和对前序逻辑的构建和理解,你可以迅速识别出不合理的数据。可以将其比作一本书,里面有一百页红色的纸张,如果夹着一页不同颜色的纸张,它就会立刻引起你的注意,从而帮助你快速发现潜在的问题。这种方法依赖于建立一套清晰的逻辑框架,使得每一项数据都可以与之对照,从而识别出不符合规则的部分。

具体检查的方式可以包括以下几种:

  • 规则和逻辑校验:确保数据符合预设的业务规则与逻辑关系。例如,会议时长是否合理、人员参与情况是否符合预期等。

  • 数据样本抽查:对数据样本进行抽查,寻找可能存在的偏差和异常情况。通过随机抽取部分数据并进行手动核对,检查是否有错误或不符合逻辑的记录。

  • 数据口径校验:检查数据收集和计算口径是否统一,确保在不同系统之间传递的数据格式和含义一致,避免因口径不一致导致的数据误差。

  • 时间和范围检查:验证数据的时间范围是否符合预期,尤其是数据同步的时间是否精确。如果数据的时间点不一致或超出合理范围,会导致分析结果的不准确。

  • 人员范围检查:确保参与会议的人员范围正确。比如,是否有不在目标群体中的人员被错误地包含在内,或者频繁参与会议的管理者是否应该从统计中排除。

这些铺垫工作在前期都是不可见的,但这部分工作为后续的会议治理的数字化,产品化打下了可靠的基础的基础。

像菜鸟一样会开会(01)

拾初Wain
真实直白,深度思考