一文带你理解Power BI数据模型

文摘   职场   2024-10-27 21:45   广东  

    PBI数据模型概念PBI里面的数据模型可以简单理解为是一个表或者多个通过关系连接起来的表构成的数据模型,主要理论来自维度建模。认识数据建模前,我们可以通过一个日常工作中常见的场景来引入这个概念。我们工作经常会使用到数据透视表,从分析的角度而言,我们已经创建了一个数据模型,只是这个数据模型是单表模型,我们可以把这个单表分为两个部分:维度与度量:

  • 维度:简单来说,就是你要按照什么视角来看数据。比如,地区的维度,产品的维度,客户的维度等等;
  • 度量:管理学上有一句话,如果一项业务你不能度量它,你就无法增长它。这里的度量实际上就是量化,也就是我们说的能够被计算的值。所以,总结一句话,能够被计算成为值的就是度量值。比如,销售额,订单数量,利润等等
    回归到我们之前的话题,Excel的单表也是一个简单的数据模型,尽管它只是单表。数据模型是指通过关系相互连接的一组表,因为Excel表格的行数的限制,它最多只能存储100w行左右的数据,显然数据透视表不是我们做数据模型的选择。Power Pivot是微软推出在Excel中能够进行模型搭建的功能,通过与数据库等数据源连接后导入千万级甚至亿级数据进行模型的搭建和数据分析。当然,Power BI和AAS/SSAS等也是可以实现一样的功能,本质上,Power Pivot/SSAS/AAS/Power BI都是使用的表格模型(Tabular Model)采用的是一样的语义模型(Smantic Model),意味着创建关系,编写DAX都是适用于以上产品。
    上面我们提到,Excel数据透视表的数据源通常源自一张单独的表,所有的信息都在一张表里面的时候,这个表会变得非常的冗余,比如过多的维度信息会占用非常多的列导致模型非常沉重,因此,我们会使用成熟的建模方法,将单表拆分成为多张表,通过共同字段来创建多表关系,也就是我们搭建数据模型。
Power BI中常用的模型有2种:

1. 星型模型:

星型模型中,有一张事实表被若干维度表包围,每个维度使用一张表,有主键关联事实表中的外键,不同的维度表之间没有关联。下面就是非常典型的星型模型,多个维度表围绕着事实表。

2. 雪花模型:

雪花模型是基于星型模型的拓展而来,每一个维度可以拓展出更多的维度,根据维度的层级拆分成为颗粒度不同的多张表。虽然多个维度表可能没有直接连接到事实表上,但是,它可以通过其他维度表来传递筛选到事实表,看上去就是雪花一样连接在一起。



虽然很多指南里面推崇星型模型是Power BI的最佳实践,但是,实际工作中如何选择模型,完全基于项目的实际需求,也有可能雪花模型更适合所处的项目场景,不需要非常教条的参照。




  • 免费课程:免费教学视频目录大全(2023年全集)
  • 免费课程绝大部分都是录制视频讲解,针对典型案例进行讲解,大家可以当做是一个字典,需要时候来找一找。免费课程不系统,有些基础内容小编默认你是知道,所以没有详细讲解,需要系统学习推荐看看小编的付费系统课程。
  • 付费课程:Power BI会员课程更新(202310)
  • 付费课程从零基础开始讲解,上手平滑,深入浅出,结合实际案例针对性强。具体可以参考介绍,课程内容持续更新,永久学习!(付费后,小编后面开发推出的所有课程和资源免费获取,无需再付费!)
  • 交流答疑群:本群为付费制(49/一位),仅作为学习交流Power BI/Excel/Tableau/SQL等数据分析、数据处理工具用,有问题可以描述清楚你的问题,附上案例数据求助。除此外,不讨论任何无关事情,违者立刻剔除。啊?不是吧?加群还要付费?嗯,是的,所以,加群后请谨言慎行!群里会不定期分享各类模板、学习书籍等资讯,确认以上条件都能接受再添加小编私信!


PowerBI Home
分享PowerBI、Tableau、Excel(函数公式、数据透视表、VBA)、Python、SQL等技巧。
 最新文章