数据处理必备:PowerQuery 动态分组实战教程

科技   2025-01-07 19:02   江苏  
欢迎关注【BI佐罗数据分析】,今日精华包括:视频案例,技巧干货。

↓ 预约直播,更多干货,不要错过 ↓

 

在数据分析的过程中,有效的数据分组是提高分析效率和深入洞察数据的关键步骤。Power Query 作为 Excel 和 Power BI 的一个强大组件,提供了灵活的数据处理功能,其中分组操作是其核心功能之一。本文将详细介绍如何在 Power Query 中进行分组操作,并通过实例演示如何应用这些技术来优化数据处理流程。

什么是 Power Query 分组操作?

Power Query 允许用户通过一种称为“分组”的方法来整理数据。分组操作可以将数据集按一个或多个列的值进行分类汇总,支持对分类后的数据进行各种聚合运算,如求和、计算平均值、最大值、最小值等,也支持保留所有行而不进行聚合运算。

如何在 Power Query 中创建分组?

  1. 1. 选择分组列: 首先,你需要确定根据哪些列的值进行分组。可以是一个列,也可以是多个列。

  2. 2. 应用聚合函数: 在确定分组列后,选择需要进行的聚合运算,如求和、计数、平均等。

步骤

在编辑器中选中列后才可以进行分组操作,点击主页选项卡下的分组依据。

选择分组依据,默认为点击分组依据时选中的列,也可以点击高级重新选择列。

还可以在高级中选择添加分组,这样会根据你选择的多列进行分组,比如这里我们选择根据客户ID 和产品ID 进行分组。

在操作选项中可以选择操作方式,有七种聚合选项和一种保留所有行的操作,聚合列也可以添加多个。

添加数量的求和列和用户第一次购买产品的日期两列。

点击确定,我们一起来看一下结果,只有分组依据列和操作列被保留了下来。

聚合分组操作适合对数据进行聚合操作,可以有效地降低模型的大小和复杂性,缩小数据的颗粒度。

我们还可以进行非聚合操作,保留所有行。

选中一个值,我们可以看到列中的值是一个表,这有什么用呢?

假设我们要进行一个分组排序,每一个组内的值会有对应的一个序号。

这种操作要在 Power Query 中实现的话,就需要先进行分组,然后每一行对应一个 table,再添加序号,最后再合并表即可。

具体操作为在分组操作的表达式中将 each 后面的“_”更换为添加索引的操作,这样每一个分组后的表都会添加一个组内序号。

最后使用 Table.Combine 函数合并这三个表即可。

在本文中,我们深入探讨了 Power Query 中的动态分组操作,展示了如何通过灵活的分组策略来优化数据处理流程。这些技巧不仅能帮助您应对数据结构的变化,还能有效提高数据分析的效率和精度。希望您能将这些知识应用于实际工作中,发挥 Power Query 的强大功能,以获得更深入的数据洞察。

对企业数据分析有问题?点击下方预约直播,还可现场连麦咨询哦。 

 

更专业的数据分析师训练营



🚀【经典课程】系统化学习 Power BI 经典视频课程。

📈【高级课程】业务人(管理、销售、财务、供应链)彻底解决企业数据分析。

🔍【企业咨询】十大行业,十大领域,企业案例,咨询,培训,实施。

🔗 如何获取更多信息?扫描下方二维码具体咨询。

BI佐罗数据分析 - 更专业更系统的企业数据分析

点击“阅读原文”获取更多资源

BI佐罗讲数据分析
多年PowerBI MVP带你学习更专业更系统的企业数据分析。
 最新文章