我最近在看《更好的数据可视化指南》一书,深刻地理解了这句话:
如何呈现数据与数据本身同样重要
当然,这句话也是书中的原话。
绘图谁不会?但能画得好、画得得体、画得让人印象深刻可真不容易,好像图要素太少不行、太多也不行,这其中要拿捏得分寸还是挺考验人的。
本文就来梳理一下可视化的一些要点。
什么是数据可视化
先谈谈什么是数据可视化。
数据可视化是将原本枯燥的、难以理解的大量数据转化为人们更容易感知和理解的图形化表现形式。
通过图表、图形、地图等方式,数据可视化帮助人们发现数据中的模式、趋势和异常点,使复杂的信息更为直观。
数据可视化的主要目的是:传递信息、揭示趋势、发现异常以及支持决策。
无论是商业分析、科学研究还是政策制定,数据可视化都极为关键。
有效的数据可视化原则
要使数据可视化真正发挥其价值,必须遵循一些基本的原则。以下是几条关键的原则。
1. 简洁明了
图表的目的是传递信息,而不是让人困惑。因此,数据可视化应尽量简洁,避免不必要的装饰元素。过多的颜色、文字和图形元素会分散注意力,降低信息的传递效果。
好的数据可视化应该让人一眼就能抓住核心信息。
左图就有些过度装饰了,右图相对简洁明了。
有时人们会选择不合适的图表类型来呈现数据,导致信息传达出现偏差。例如,在比较多个类别的大小时,使用饼图往往不如柱状图直观,因为人眼不擅长比较多个扇形的大小。又比如,在展示数据趋势时,使用柱状图不如折线图清晰。
2. 选择合适的图表类型
不同的图表类型适用于不同的数据特征。例如,折线图适用于显示数据的趋势,柱状图适合比较不同类别的数据,饼图可以用来展示数据的组成部分占比,而散点图则用于显示数据之间的相关性。选择合适的图表类型是有效传达信息的前提。
当需要比较多个类别的大小时,使用柱状图比饼图更直观,因为人眼更容易比较柱子的高度而非扇形的面积。
在展示数据的趋势变化时,折线图比柱状图更能清晰地体现数据的上升和下降趋势。
3. 注重数据的准确性和完整性
在可视化过程中,数据的准确性是基础。任何人为的误导或错误的呈现方式都会导致错误的解读和决策。例如,故意修改坐标轴的比例,夸大或缩小数据的变化幅度,都会误导受众。因此,在制作数据可视化时,务必保持数据的真实性和完整性。
左图Y轴范围被人为缩小,仅包含数据的最小值和最大值(50到56),看起来数据的增长趋势非常显著,实际上数值变化较小。而右图相对准确传达了数据的实际变化,保持了数据的真实性。
真实、准确地呈现数据是数据可视化的基本要求。
4. 避免信息过载
虽然数据可视化可以呈现大量信息,但过多的信息反而会让受众难以理解。图表中的元素应控制在合理的范围内,确保每一项信息都有存在的必要性。如果一张图无法清晰呈现所有信息,可以考虑拆分为多张图表来展示。
在一张图表中塞入过多的信息,常常会使观者不知所措。比如,将多种不同类型的数据全部放入一张图中,或是使用过多的颜色和标记,都会让人难以理解图表所传达的信息。因此,在制作图表时,应注意信息的层次和重点,避免信息过载。
信息过载的图表一般有如下特点:
过多的数据系列:同时展示了5个数据系列。 复杂的线型和标记:使用了不同的线型、标记和颜色。 过多的图例:图例项目过多,占用了图表空间。 过多的注释:每个数据点都添加了文本注释,文字过多且倾斜,增加了阅读难度。 网格线:添加了网格线,增加了视觉元素的数量。
5. 加入数据注释
适当的注释可以帮助观者更好地理解数据。例如,在图表中标注重要的数据点、趋势变化的原因、异常值等,有助于引导受众抓住重点信息,从而更好地理解数据的意义。
左图未添加数据注释的图表:
图表仅展示了销售额的变化趋势,但没有对关键数据点进行任何说明。 观者需要自己去发现数据中的重要信息,可能会忽略关键点。
右图添加数据注释的图表:
对最高点、最低点和销售激增点进行了明确的标注。 通过箭头和文本的方式,引导观者关注重要的信息。 帮助观者快速理解数据的意义,例如在哪一天销售额达到最高,在哪一天出现了异常增长。
6. 合理使用颜色
颜色在数据可视化中起着重要的作用,能够帮助区分不同的数据类别和突出关键信息。然而,过度使用颜色或选择不当的配色方案可能会导致混淆和误解。
避免使用过多的颜色,一般来说,5种以内的颜色足以区分主要类别。
要选择与数据内容相关的颜色,例如,红色表示降低或危险,绿色表示增长或安全。
也要考虑色盲和视觉障碍:大约8%的男性和0.5%的女性存在色觉缺陷。为了确保所有观众都能正确解读图表,避免依赖颜色作为唯一的区分手段,可以结合形状、纹理或标签。
左图使用了7种不同的颜色,每个类别一种颜色,颜色过多,可能导致观者混淆。也没有考虑色盲人士的识别能力。
右图通过不同的填充纹理(hatch)来区分不同的类别,避免依赖颜色。添加了图例,并在图例中展示了不同的纹理对应的类别。
7. 保持一致性
一致的设计风格可以增强数据可视化的专业性和可读性。在创建多个图表或报告时,应注意以下方面的一致性:
字体和字号:使用统一的字体和字号,确保文字清晰可读。 颜色和符号:相同的类别在不同的图表中应使用相同的颜色和符号。 坐标轴和比例:保持相同的尺度和单位,方便比较和理解。
一致性的设计有助于观众专注于数据本身,而不是花时间适应不同的视觉风格。
左图视觉风格混乱:字体、字号、颜色、线型、符号等多种元素缺乏一致性,观者需要花费更多时间去理解图表。而且不便于比较:两个产品的数据在不同的Y轴上,比例不同,难以直观比较。
右图则展示了一致的设计风格,观者可以专注于数据本身,快速理解图表内容。
8. 关注目标受众
在设计数据可视化时,应考虑目标受众的背景和需求。不同的受众可能具有不同的专业知识和兴趣点.
比如技术专家可能更关注详细的数据和复杂的图表,而非专业人士可能需要更简洁直观的呈现方式。也要考虑文化差异:颜色和符号在不同文化中可能具有不同的含义,需要谨慎选择。
要明确受众最关心的问题,突出展示相关的信息。
通过了解受众,可以定制数据可视化,使其更具针对性和有效性。
左侧子图:面向技术专家,细节丰富但信息过载,非专业人士可能难以理解。右侧子图:面向非专业人士,简洁明了,突出关键信息,便于快速理解。
9. 强调数据故事
数据可视化不仅仅是展示数字,更是讲述数据背后的故事。有效的可视化应当引导观众理解数据的意义和趋势。
突出关键数据点:使用注释、标记或颜色强调重要的变化或异常。 提供背景信息:添加参考线、目标值或历史数据,帮助观众理解当前数据的位置。 注意逻辑结构:按照故事发展的顺序组织图表,使观众逐步深入了解。
例如,在展示销售业绩时,不仅要显示数字,还可以标注影响销售的事件,如市场活动或政策变化,帮助观众理解数据的波动原因。
左图仅展示了销售数据,没有任何额外的解释,缺乏数据故事。右图突出关键数据点,添加了参考线和背景信息,引导观者理解数据背后的故事。
数据可视化是连接数据和人类认知的桥梁。通过遵循有效的可视化原则,选择合适的图表类型和设计方法,我们可以将复杂的数据转化为清晰、有意义的信息,帮助人们更好地理解世界。(作者:王海华)
无论是在商业分析、科学研究还是日常生活中,掌握数据可视化技能都将带来巨大的价值。希望本文的梳理能为您在数据可视化的实践中提供有益的指导。下面这本书《更好的数据可视化指南》也推荐给大家。