在数据分析的过程中,有效的数据分组是提高分析效率和深入洞察数据的关键步骤。Power Query 作为 Excel 和 Power BI 的一个强大组件,提供了灵活的数据处理功能,其中分组操作是其核心功能之一。本文将详细介绍如何在 Power Query 中进行分组操作,并通过实例演示如何应用这些技术来优化数据处理流程。
什么是 Power Query 分组操作?
Power Query 允许用户通过一种称为“分组”的方法来整理数据。分组操作可以将数据集按一个或多个列的值进行分类汇总,支持对分类后的数据进行各种聚合运算,如求和、计算平均值、最大值、最小值等,也支持保留所有行而不进行聚合运算。
如何在 Power Query 中创建分组?
1. 选择分组列: 首先,你需要确定根据哪些列的值进行分组。可以是一个列,也可以是多个列。
2. 应用聚合函数: 在确定分组列后,选择需要进行的聚合运算,如求和、计数、平均等。
步骤
在编辑器中选中列后才可以进行分组操作,点击主页选项卡下的分组依据。
选择分组依据,默认为点击分组依据时选中的列,也可以点击高级重新选择列。
还可以在高级中选择添加分组,这样会根据你选择的多列进行分组,比如这里我们选择根据客户ID 和产品ID 进行分组。
在操作选项中可以选择操作方式,有七种聚合选项和一种保留所有行的操作,聚合列也可以添加多个。
添加数量的求和列和用户第一次购买产品的日期两列。
点击确定,我们一起来看一下结果,只有分组依据列和操作列被保留了下来。
聚合分组操作适合对数据进行聚合操作,可以有效地降低模型的大小和复杂性,缩小数据的颗粒度。
我们还可以进行非聚合操作,保留所有行。
选中一个值,我们可以看到列中的值是一个表,这有什么用呢?
假设我们要进行一个分组排序,每一个组内的值会有对应的一个序号。
这种操作要在 Power Query 中实现的话,就需要先进行分组,然后每一行对应一个 table,再添加序号,最后再合并表即可。
具体操作为在分组操作的表达式中将 each 后面的“_”更换为添加索引的操作,这样每一个分组后的表都会添加一个组内序号。
最后使用 Table.Combine 函数合并这三个表即可。
对企业数据分析有问题?点击下方预约直播,还可现场连麦咨询哦。
一更专业的数据分析师训练营一
📈【高级课程】:业务人(管理、销售、财务、供应链)彻底解决企业数据分析。
🔍【企业咨询】:十大行业,十大领域,企业案例,咨询,培训,实施。
🔗 如何获取更多信息?扫描下方二维码具体咨询。
点击“阅读原文”获取更多资源