多变量数据这样作图就对了!

文摘   教育   2024-11-17 13:42   北京  

我们平时作图的时候都是按照数据类型决定图的类型的。例如:当有X和Y数据,我们首先想到的是二维的折线图;当有XYZ数据时,可以在二维折线图上加图例说明(Z仅作分类)(如下图),也可以画三维柱状图(Z为数据值)。

于是,我们得到一个结论,一个n维度的图像最多承受n+1维数据

但是这样的图无法表达出同类数据间的关系(Z1,Z2,Z3的关系无法直观表达)。可能现在我们还不太明确“关系”的概念。

这里列举一组数据。

Cell mass
Cell number
h1h2h3
0.00011000
97.83%
97.53%
93.92%
0.0005
200
91.05%
88.74%
72.92%
0.001
10084.64%
79.40%
54.03%
0.002
50
74.66%
65.63%
31.74%
0.005
20
55.29%
42.72%
10.49%
Cell mass
Cell number
h1
h2h3
0.001
100
84.64%
79.4%
54.03%
200
91.02%
88.76%
72.95%
300
93.73%
92.22%
81.04%
0.002
50
74.66%
65.63%31.74%
100
84.51%
79.69%
54.20%
150
88.61%
85.55%
65.81%

表中,单元胞质量和元胞数量是两个自变量,h1-h3是三个因变量,这个表主要表达,在总质量一定的情况下(Cell mass × Cell number = 定值),系统的三阶耗散功率是怎样的。

这时候不同的元胞质量之间存在一个轻重的关系,不同的元胞数量存在一个多少的关系,这样我们用普通的二维折线图无法表达出这层意思,尤其是无法表达总质量一定的情况。

第二个表主要想表达在单位质量一定的情况下,元胞数量对耗散功率的影响,表1和表2存在数据交叉
这时候就要在二维平面加入另外一个二维元素,组成多维度数据图。这是一个重要的构图思路。下面先看成品。

这是一个合二为一的图。起先我是先画了第一个表的数据的,但是左下角留白太多,这样导致的图像色彩和内容不平衡,所以需要在左下角加入其它内容,于是表2的内容便加入了进来。

我采用了这种气泡散点图的方式,主要想利用气泡的大小直观地表达出每组之间存在的“轻重”和“多少”关系,同时也不妨碍表达数据量之间的趋势关系,这就是在二维平面加入另外一个二维元素表达多维数据的方式。

下面简单说一下教程。

01
Matlab程序

我在画这个图的时候是直接在Visio里面画的,利用直线量的距离,不会Matlab的同学可以这么做。其实利用Matlab也不难,主要的代码就是利用bubblechart命令,x和y是控制气泡的位置,z是控制气泡的大小,考虑到气泡图要在visio中后处理,所以这里将它们的大小随意设置了。

x=1:1:15;y=[97.83 97.53 93.92 91.05 88.74 72.92 84.64 79.4 54.03 74.66 65.63 31.74 55.29 42.72 10.49];z=[1 1 1 1.1 1.1 1.1 1.2 1.2 1.2 1.3 1.3 1.3 1.4 1.4 1.4];bubblechart(x,y,z)
运行结果如下。

02
Visio编辑

我们将这个图片导入到visio中,取消组合。 我们只保留主要的气泡图,其余部分通过手绘重新编辑。绘制一个矩形,填充为淡灰色,调整气泡的大小和位置置矩形中,按照气泡大小分为不同的颜色,颜色均采用中性色。

在矩形周围加入刻度线和文字说明。

03
构图思路

这里的思路就比较重要了,希望大家能有这个意识。我们发现这这个图的左下角和右上角是比较空旷的,在我们的视觉里,颜色分配是不平衡的,给人一种不平衡和不饱满的感觉

为了消除这种感觉,我们需要尽可能地在这两个地方填补内容,因为表2的内容与表1类似,且数据有交叉的部分,所以我觉得把表2做成一个子图。形式尽量不与图1类似,这样形式饱满。这里,我以渐变色表达出了不同的元胞数量,因为它们的质量是一样的

将图组合在一起。尽量重合元素,这样能省去额外的横纵坐标标注。

接下来我们在图的其他部分插入元胞质量和元胞数量。如下图

我们可以看到,插入这些文字以后,整个图变得丰满了。在考虑右侧圆球排列顺序的时候,有两种方式,从小球到大球的依次排列和从大球到小球的依次排列,按照小球在图中先表示的顺序,右边应该是先排列小球的,但是我发现图的右下角占的颜色比重已经很大了,如果还将大气泡放在下面,会显得不协调,可以对比下图和上图

04
总结

上文介绍了一种多变量数据图的做法,美观简单。同时绘图过程穿插了很多的绘图思路,包括怎样分析数据之间的关系,用什么样的颜色,什么样的大小,除了这些基本的,我们还要注意我们的标注一定是在变化的,因为我们无法保证每次的气泡分布都是这种形式。

我们要学会感知图形色彩和内容的失重不平衡,通过调配使之达到平衡、协调、美观,这也是作图最应该学的核心。



往期内容:

论文被拒?那是因为你不会包装数据

基于Matlab实现三维随机曲面建模

Visio实例(二)| 物体坐标系的高级画法

关于积累的那些科研作图经验分享

关注小时光年,了解更多科研知识!


博硕科研绘图
在读博士的科研经历,专注分享论文写作和科研画图的相关知识。
 最新文章