埃德蒙·哈雷 (Edmond Halley,1656–1742)
埃德蒙·哈雷是一位英国天文学家、地球物理学家、数学家、气象学家和物理学家,他因计算哈雷彗星的轨道而最为人所知。
哈雷开发了在地图上使用等值线的方法——在地图上绘制了等磁偏线,这可能是第一张基于数据变量的等值线地图。
图中显示的是大西洋的地图。曲线是等磁偏线,每条线上都标有磁偏的度数。粗线是无变化的等磁偏线,即指南针读数准确的线;虚线和船只显示的是哈雷第二次航行的轨迹。
威廉·普莱费尔 (William Playfair,1759–1823)
威廉·普莱费尔被认为是统计图形之父,他发明了我们今天经常使用的线图、条形图以及面积图和饼图等。
普莱费尔是一位苏格兰工程师和政治经济学家,他在1786年出版了《商业和政治地图集》。 这本书包含了多种图表,在下面这个著名的例子中,他比较了1700年到1780年从英格兰出口与从丹麦和挪威进口到英格兰的商品。
查尔斯·德·福克罗瓦 (1766–1824)
查尔斯·德·福克罗瓦是一位法国数学家和学者,在一本出版于1782年关于工程和民用建筑的专著中,使用图表列出了1740年至1780年桥梁和道路的建筑工程师的成就,以及对城市区域增长的相关分析。这种树状图现在被广泛用于显示层次数据。
现代树状图(treemap)的应用,关注财经和股市的读者应该熟悉这种图:
弗洛伦斯·南丁格尔 (Florence Nightingale,1820–1910)
弗洛伦斯·南丁格尔通常被和红十字联系起来,以她在克里米亚战争期间的护士工作而闻名,被认为开创了护士这个职业。实际上她也是一位数据记录者,是英国皇家统计协会会员,开创了现代卫生统计。
她意识到士兵们死于恶劣的卫生条件和营养不良,因此她对医院的死亡人数进行了详细的记录,并将数据进行了可视化。 她的 “玫瑰”或称“鸡冠花”图表帮助她争取到更好的医院条件,挽救了无数生命:
约翰·斯诺 (John Snow,1813–1858)
1854年,一场霍乱疫情迅速席卷了伦敦的苏豪区。宽街(Broad street)区域有超过600人死亡,幸存的居民和企业主大多逃离了这场可怕的疾病。 医生约翰·斯诺在地图上绘制了霍乱死亡病例的位置。他工作的留下了地图显示了一种统计死亡人数的方法:以与街道平行的线条形式,在相应的地址上绘制。
斯诺的研究发现了一个模式:围绕宽街水泵的病例明显集中,这有助于找到感染的原因。
查尔斯·约瑟夫·米纳德 (Charles Joseph Minard 1781–1870)
查尔斯·约瑟夫·米纳德是一位法国土木工程师,他以在地图上展现数据而知名。
最著名的作品是1812年拿破仑远征俄罗斯的数据图,这幅图绘制于1869年,被认为是有史以来最好的统计图表。
下面米纳德的图表使用一个浅褐色条形图来说明拿破仑前进军队的规模:随着军队向莫斯科进发,条形图的宽稳步下降。下面黑色的条形图显示了军队从莫斯科撤退时人数减少。图表底部的折线显示了气温,这对军队的规模造成了极大的破坏。在图表中间,当一个早期脱离的侧翼部队(浅色)重新加入主力时,黑色条形图短暂地变大。然而,当条形图移动到图表上绘制的一条河流时,它变得更小——证明了冰冷河水减员影响。
路易吉·佩罗佐 (Luigi Perozzo,1856–1916)
路易吉·佩罗佐是一位意大利数学家和统计学家,他发表了最早的三维数据展现,展示了18世纪至19世纪瑞典人口的年龄组别。人口普查年份从左到右,年龄从前(老)到后(年轻)显示,而坡面的高低,代表那个年龄段的人数。
约翰·图基(John Wilder Tukey,1915—2000)
美国数学家和统计学家,以开发快速傅里叶变换算法和箱形图而知名。他还因创造“比特”(bit)一词和首次公开使用“软件”(software)一词而受到赞誉。
箱形图于1977年由图基发明。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。
雅克·贝尔坦(Jacques Bertin,1918– 2010)
是一位法国地图学家和理论家,以他1967年出版的著作《图形符号学》(Sémiolique Graphique,即Semiology of Graphics)而闻名,是最有影响的信息可视化的理论基础著作,他提出了一套视觉变量,用来构建地图符号和其他信息可视化的图形技术。
爱德华·罗尔夫·塔夫特(Edward Tufte,1942 -)
塔夫特是当前在世最有名的信息可视化大师,有时被称为"ET",他是一位美国统计学家,耶鲁大学政治科学、统计学和计算机科学的荣休教授。他出版了一系列关于信息设计的著作,树立了当代信息可视化和数据可视化的理论。
塔夫特提出了“信息设计”和“可视化素养”等领域,用可视化来传达信息。他创造了“图表垃圾”这个词,指的是数据可视化中无用的、无信息的或信息模糊的元素,其他关键概念包还有谎言因子、数据-墨水比率和图形的数据密度等。塔夫特还以批评Powerpoint闻名。
例如,迷你图 (Sparkline) 是塔夫特创造的一个术语。指的是描述数据内容的小图,将迷你图(如线条,箱线图或直方图)添加到任何包含数值数据的工作表的列标签行中。
又例如小型序列图( Small Multiple Chart),或称小多图、面板图,通过组合多个小图讲述数据背后的故事,也是塔夫特提出的概念,目前主流BI软件都提供了这样的功能,下图是美国各州过去三十年的月度失业率:
欢迎本周四来广州,听我布道关于数据分析的技术发展: