数据可视化图表辞典:72 个经典图表详解

科技   2025-01-08 17:41   江苏  
欢迎关注【BI佐罗数据分析】,今日精华包括:视频案例,技巧干货。

↓ 预约直播,更多干货,不要错过 ↓

 

数据可视化是一门结合设计与数据的艺术。在展示数据时,选择合适的图表至关重要,因为不同的图表类型适合展示不同的数据关系。以下是一份《金融时报》发布的可视化图表辞典,为大家提供指导如何挑选适合的数据可视化形式。

数据可视化图表被分为了九类,分别是离差、相关性、排序、分布、随时间的变化、规模、部分与整体的关系、地理空间和流向。

离差(Deviation)

离差图表用于强调数据相对于某个参考值(如零或目标值)的变化。这类图表适合展示盈亏变化、态度倾向等。

常用图表包括:

  • • 分向条形图(Diverging bar):一种简单、标准化的条形图,能同时处理正、 负数值。适合展示正负变化,例如盈亏对比。

  • • 分向堆叠条形图(Diverging stacked bar):最适合用来展现牵涉到态度(正向/中立负面)的调查结果,用于展示多类别下的正负变化。

  • • 成对条形图(Spine):将单一数值分成两组对比的组成(例如男性/女性)。用于细化正负变化的对比。

  • • 盈余/赤字填充线图(Surplus/deficit filled line):阴影部分能展示出一种平衡关系,或者是相对于某个基准线,或者是两组数据之间,展现数据相对于基准线的盈亏动态。

相关性(Correlation)

相关性图表用于展示两个或多个变量之间的关系。要注意的是,除非你特别说明,许多读者会认为你所展示的两个变量之间存在因果关系(例如一个变量导致另一个变量变化)。

常用图表包括:

  • • 散点图(Scatterplot):用来展现两个连续变量 关系的标准方式。每一 个变量有自己的轴线。

  • • 折线图 + 柱状图(Line + Column):能展示一个数量(柱状图)和一个比率(折线图)的关系,适合展示两个变量的趋势对比。

  • • 链接散点图(Connected scatterplot):通常用来展示两个变量的关系如何随着时间而变化。

  • • 泡泡图(Bubble):与散点图类似,但会根据第三项变量来决定泡泡的大小,从而增加更多细节。

  • • XY 热图(XY heatmap):适合展示两组不同类别数据之间的规律,但不适合展示数据的细微差异,利用色阶展示变量间的相关性。

排序(Ranking)

排序图表强调项目在列表中的位置而非具体数值。这类图表适合用于排名分析。

常用图表包括:

  • • 排序条形图(Ordered bar):依照顺序排列时,标准条形图更容易显示数值的排序。

  • • 排序柱状图(Ordered column):同上。

  • • 排序比例符号图(Ordered proportional symbol):当展示有巨大差异的数值时,或者无需表现数据之间的细微差异时, 使用这类图表。

  • • 点状条纹图 (Dot strip plot):圆点依序在线条上排列 ,能有效使用空间,展现出多重类别的排序。

  • • 坡度图(Slope):最适合用来展示排序经过一段时间之后的变化 ,或在不同类别间的变化。

  • • 棒棒糖图(Lollipop):棒棒糖图比标准的条形或柱状图更能吸引人们注意到数值,也能有效表示数据的排序和大小 。

  • • 凹凸线图(Bump):可以很好地展示排名在多个日期间的变化,对于大的数据集,可考虑用颜色将线条分组。

分布(Distribution)

分布图表显示数据集中的数值及其出现的频率。分布的形状(或偏离程度)是突出数据的不一致或不平均的方便记忆的方式。

常用图表包括:

  • • 直方图(Histogram):统计分布的标准呈现方式。要缩小每一个柱状之间的间隙,以凸显数据呈现出的“形状”。

  • • 箱线图(Boxplot):通过中位数(中值)、 数据范围的呈现,来概括多个数据分布。

  • • 小提琴图(Violin plot):类似于箱线图,但可以更有效地呈现复杂的分布(当数据无法用简单的平均数来概括)。

  • • 人口金字塔(Population pyramid):展示人口年龄和性别分布的标准方式。实际上是背对背的直方图。

  • • 点状条纹图(Dot strip plot):用来呈现分布中个别数值的好方法。如果太多圆点拥有相同大小的值则不宜用。

  • • 点状图(Dot plot):呈现不同类别数据的变化或范围(最小值/最大值)。

  • • 二维条码图(Barcode plot):如同点状条纹图,适合在一张图中呈现所有数 据。这样的图表最适合用来凸显个别数值。

  • • 累积曲线图(Cumulative curve):呈现数据分布不均等的好方法:Y 轴永远是累积频率,X 轴永远是标志值。

  • • 频率多边图 (Frequency polygons):能同时呈现多个数据分布。类似于普通的折线图,最好一次只展现 3 ~4 组数据。

随时间变化(Change over Time)

随时间变化图表强调趋势的变化。有可能是短期( 一日内)波动或长到数十年或数百年的改变。为了向读者提供适当的背景信息,选择正确的时间段很重要。

常用图表包括:

  • • 折线图(Line chart):用来显示时间序列变化趋势的标准方式。如果数据不规则,可以考虑用记号来表示数据点。

  • • 柱状图(Column):适合用来展示随时间变化的趋势,但通常最好一次只呈现一个数列。

  • • 折线图 + 柱状图(Line column):适合用来呈现数值(柱状图)和比率(折线)随时间的关系变化。

  • • 股价图(Stock price):通常着重于数据的每日动向,能呈现每日的开盘、收盘价,以及高点和低点。

  • • 坡度图(Slope):只要数据能简化为 2 到 3 个点而不损失关键信息 ,此图便很适合用来展现数据的变化。

  • • 区域图(Area chart):要小心使用。适合展示整体的变迁,但很难看出组成部分的变化。

  • • 扇形图(预测)(Fan chart (projections)):用来呈现未来预测值的不确定性。通常预测越远不确定性越大。

  • • 链接散点图(Connected scatterplot):适合展示两个变量的数据变化,只要数据有相对明确的规律。

  • • 日历式热图(Calendar heatmap):适合用来呈现时间规律 (每日、每周、每月) ,但会牺牲数据精确性的展示。

  • • 普利斯特利时间轴(Priestley timeline):适用于日期和时间长度是数据中的关键因素。

  • • 圆圈时间轴(Circle timeline):适合展示不同类别数据的不连续数值。

  • • 垂直时间轴(Vertical timeline):以 Y 轴表示时间。在移动设备上滚动图表时特别能呈现出详细的时间序列。

  • • 震波图(Seismogram):圆圈时间轴的替代选择 ,适合展示数据大幅变动的数列。

规模(Magnitude)

规模图表用来比较数据的规模。有可能是比较相对规模(显示出哪一个比较大 ),有可能是比较绝对规模(需要显示出精确的差异)。通常用来比较数量(例如桶、人、金额),而不是经过计算后的比率或百分比。

常用图表包括:

  • • 柱状图(Column):用来比较规模的标准图表。轴线的起始值必须为 0。

  • • 条形图(Bar):同上。适用于不是时间序列的数据,以及类别名称很长的数据。

  • • 成对柱状图(Paired column):类似于一般柱状图,但能同时呈现多重数列。当数列超过两组以上, 阅读图表会较为吃力。

  • • 成对条形图(Paired bar):同上。

  • • 比例堆叠条形图(Marimekko):适合用来同时呈现数据的大小与占比,只要数据不是太复杂。

  • • 比例符号图(Proportional symbol):当展示有巨大差异的数值时,或者无需表现数据之间的细微差异时, 使用这类图表。

  • • 象形符号图(Isotype (pictogram)):特别适用于某些案例, 但只能用于整数值(象形符号进行部分填充不太适合)。

  • • 棒棒糖图(Lollipop):比标准的条形或柱状图更能吸引人们注意数值 。起始值不需要为 0, 但最好为 0。

  • • 雷达图(Radar):呈现多变量的一个节省空间的方式,但务必使变量的排列对读者而言有一定的逻辑。

  • • 平行坐标图(Parallel coordinates):雷达图的替代选择,同样,变量的排列很重要 。突出特定数值会帮助图表理解。

  • • 子弹图(Bullet):适合以目标值或区间值为背景展示变量。

  • • 分组符号图(Grouped symbol):柱状图/条形图的替代选择,特别是当数据能计数或者需要突出个别要素。

部分和整体的关系(Part-to-whole)

部分与整体图表用于展示一个整体如何被分解成不同的组成部分。适合展示预算分配、选举结果、市场份额等数据。当重点在于个别部分的大小而非整体关系时,可以考虑使用规模类图表。

常用图表包括:

  • • 堆叠柱状图(Stacked column):展示部分与整体关系的简单方式,将多个部分堆叠在一起,但当组成部分过多时会影响可读性。

  • • 比例堆叠条形图(Marimekko):适合用来同时呈现数据的大小与占比,只要数据不是太复杂。

  • • 饼图(Pie):用来呈现部分和整体关系的常见方式,但要注意的是,这类图很难去精确比较不同组成的大小。

  • • 甜甜圈图(Donut):类似于饼图,但中间的空间能放入更多信息( 例如总数大小)。

  • • 树状图(Treemap):用来呈现有阶层关系的部分与整体的图表。但如果组成太细微,会使得图表难以理解。

  • • 沃罗诺伊图(Voronoi):把点转换成区域的图表 。每个区域的任何一点 ,其距离本区域的中心点会比距离其他区域的中心点更近。

  • • 拱形图(Arc):通过半圆或弧形展示部分与整体关系,常用于政治选举或预算分配的可视化。

  • • 网格图(Gridplot):适合用来呈现百分比数据,最适合以多重网格的形式呈现整数。

  • • 文氏图(Venn):通常只用于简化的数据呈现。

  • • 瀑布图(Waterfall):展示整体被分解为多个部分的过程,当某些组成部分为负值时,适合用瀑布图呈现部分和整体的关系。

地理空间(Spatial)

地理空间图表用于展示数据的地理分布特征,适合当地理位置和分布规律对读者来说比其他信息更重要的场景,如人口密度、资源分布、自然灾害影响等。

常用图表包括:

  • • 基础地理分布图(比率/比值)(Basic choropleth):把数据放到地图上展示的标准方法。应该呈现的是比值而不是绝对数值,同时要使用一个合理的基础地图。

  • • 比例符号地图(数量/规模)(Proportional symbol):通过符号的大小展示地理区域中的数量或规模,适合展示绝对值数据,如城市人口或矿产储量。

  • • 流向地图(Flow map):展示地理位置之间的数据流动方向和强度,例如移民流动、物流运输路径等。

  • • 等高线地图(Contour map):在地图上展示有相同数值的区域。能使用离散色阶来显示出正、负数值。

  • • 均等化示意地图(Equalised cartogram):把地图上的单位区域转化为相同大小的规则图形,适合以相等的数值代表投票选区。

  • • 缩放统计地图(数值)(Scaled cartogram):放大或缩小地图,使得每一个区域根据数值决定大小。

  • • 点状密度地图(Dot density):用来展示单一事件的地点,记得标注读者应该注意的规律。

  • • 热图(Heatmap):通过强烈的色阶展示地理区域的分布数据,适合呈现热点或密度。

流向(Flow)

流向图表用于展示两个或多个状态、情境之间的数据流动量或流动强度。这些状态或情境可以是逻辑关系、地理位置或其他分类。适合分析资金流动、贸易方向、移民路径、信息流等。

常用图表包括:

  • • 桑基图(Sankey):通过宽度不同的流动带展示数据从一个状态到另一个状态的流动路径和流量大小,适合追踪复杂过程的最终结果,典型应用包括预算分配或能源流动分析。

  • • 瀑布图(Waterfall):通过流动过程来展示数据的顺序变化,最典型的是展示预算流动,可以包含正或负的组成部分。

  • • 和弦图(Chord):通过环状布局展示多个变量之间的相互流动及关联强度。适合分析复杂的双向关系,例如贸易伙伴之间的进出口额。

  • • 网络图(Network):通过节点和连线展示对象之间的关系强度和流动路径。适用于社交网络分析、物流网络、信息流动等。

总结

数据可视化是将数据转化为直观信息的重要工具,而选择合适的图表形式是数据讲故事的关键一步。本文详细解释了《金融时报》图表辞典,全面总结了常见的数据可视化图表类型及其应用场景,从离差到流向,从地理空间到部分与整体,帮助读者快速找到适合的图表形式。

在实际应用中,记得结合数据特点、受众需求以及可视化目标,灵活选择图表类型,以提升数据传递的效率和影响力。希望本指南能够为您的数据分析和可视化设计提供有力支持,让数据更加生动、有说服力!

想要领取辞典文件,扫描下方二维码添加老师微信领取。

 

对企业数据分析有问题?点击下方预约直播,还可现场连麦咨询哦。 

更专业的数据分析师训练营



🚀【经典课程】系统化学习 Power BI 经典视频课程。

📈【高级课程】业务人(管理、销售、财务、供应链)彻底解决企业数据分析。

🔍【企业咨询】十大行业,十大领域,企业案例,咨询,培训,实施。

🔗 如何获取更多信息?扫描下方二维码具体咨询。

BI佐罗数据分析 - 更专业更系统的企业数据分析

点击“阅读原文”获取更多资源

BI佐罗讲数据分析
多年PowerBI MVP带你学习更专业更系统的企业数据分析。
 最新文章