报道美国大选开票,当地媒体运用了哪些可视化技术?

文摘   2024-11-07 07:42   加拿大  

这是OnHERWAY的第288篇原创文章


🇺🇸总统大选结果出炉。作为too big to ignore主题的又一个分支,这篇想聊聊美国媒体在跟踪开票时所运用的可视化报道。我试图回答三个问题:


1. 都有哪些可视化效果;

2. 为何不同媒体在报道开票过程中的数据更新不同;

3. 可能用到的可视化工具/技术


美东时间11月5日傍晚开始,各家媒体(无论平面,还是电视)都开始动态更新最新计票情况。电视台方面,基本上主持人可以用手挥舞不同方块,做各种沙盘推演,放大点击某个州令其变为蓝色或者红色,票仓的状态随即更新。总体效果挺酷炫的,比如NBC News的界面如下 (我偷懒,就没做动图了)


而在移动/网页端,美国主要媒体基本都运用实时更新的可交互界面,用户只要鼠标/手指悬停就可以看到最新的出票结果。例如为很多媒体提供数据的美联社(Associated Press, AP)界面如下:


这些数据既包括总统选举的选举人团(electoral college)得票情况,也有普选票(popular vote)的总票数,还包括参众两院和州长的实时计票情况。


我(未经证实)的判断是纽约时报(New York Times, NYT)使用的是AP的数据,因为他们的更新间隙基本在前后15秒之内。点击进入每一个州,可以细分到州里每个郡的红蓝票仓情况。


从下面几张图里不难发现,此役红营获胜的关键就是“农村包围城市”。集中看几个摇摆州:密歇根就是底特律等几个大城市为蓝色,其他郡县基本都翻红;


同理,宾州的费城和匹兹堡为蓝色,其他大部分地方为红色;佐治亚就是以亚特兰大为核心的区域为蓝色,剩余地方大多被红色占领;内华达基本只有拉斯维加斯为蓝色,等等(注:圆圈越大代表越是人口众多的大城市)⬇️





在AP数据源的基础上,NYT显然又进一步订制化了,比如——
1)集中检测摇摆州选情的互动图表:


2)根据开票情况实时预测选战结果(于11月6日美东时间5点45分停止更新预测,因为红营已超过270票并宣布胜选)

3)以及,这张“毛茸茸”有点密集恐惧症的图耐人寻味——这张体现出哪些地方出现了集中的倒戈,也就是跟4年前相比,纷纷转投“敌营”了。



这里需要岔开解释一下,为什么各家媒体在开票过程中的阶段性结果很不一样。例如,在美东时间5日晚上10点左右,NBC显示的结果是“红对蓝”为“201票对91票”,但同一时间段,AP的结果显示的却是198票对109票。这里可能有几个原因,且互相作用——



第一,数据来源不同。

AP通常直接从地方选举办公室同步较新数据,并会依靠自己的记者网络核实,这种方式有时可能略慢,但是精准度较高。而电视台可能会依赖多个数据来源,包括民调和第三方数据汇总,在某些情况下希望更快地做出预测。


第二,决策团队的模型和标准不同。

一般而言,AP以保守做法著称,往往会等待更高比例的开票数据再宣布该州的获胜者,而某些电视台可能会根据历史投票情况、选民人口特征和早期的投票趋势等综合来做预判。如果早期的计票结果大幅偏向某位候选人,并且这些地区的投票模式可以代表整个州的趋势,他们就可能提前预测结果,把票数全部加到某一阵营。比如昨天加州才刚刚开始计票,大部分媒体就立刻把它划为蓝色。这样做有风险吗?理论上确实是有翻盘的可能性,但总体概率较低。例如,昨天我观察到传统的红州德州在开票初期竟然是浅蓝的,吃了一惊,不过没一会儿就翻红了。


第三,报道风格不同。

AP作为世界级新闻通讯社,承载着为多家媒体提供原始数据的责任,因此更注重数据精准性,遵从更保守的报道时间表。而NBC作为电视网络,会更想争取观众注意力,因此在某些情况下可能会有“抢跑”的压力,以保持观众的关注度。



接下来以NYT为例简单梳理几个实现这些酷炫效果的可能技术/工具(注,这是从一个非技术出身的观察者视角总结出的不完全清单,如下可能有更新,有叠加使用,也可能有已经被边缘化的,但万变不离其宗)


1. R语言

R语言本质上一种用于统计分析和图形可视化的编程语言。它用于:

1)数据清洗、统计分析和基本数据。往往适合在项目的初始阶段使用,尤其是当数据需要进行复杂的分析和处理时。R 可以轻松读取各种格式的数据文件,如 CSV、Excel、数据库。

2)内置了各种专业的统计包。

3)数据可视化的工具,也可以实现交互式可视化。还有机器学习和预测的功能。


2. Datawrapper

Datawrapper是一款容易上手的的在线工具,用于制作互动图表和地图。这个工具的最大特点是,无需掌握深奥的编程知识就能上手。其官网显示,纽约时报是主要客户之一。


Datawrapper主要可以呈现三大类的可视化形式,而这些在选举开票报道中都已经看到了——

1)图表

有20多种交互式响应图表类型,从简单的条形图和线条图到箭头图、范围图和散点图。

2)地图

有三种交互式响应式地图类型,可创建从定位器地图到专题分级统计图和符号地图的各种内容。

3) 表格

响应式数据表提供多种样式选项,包含条形图、柱形图、折线图、热力图、搜索栏和分页等。


操作起来也相对便捷,只需要三步:

1)复制黏贴数据

2)编辑图表

3)嵌入或下载


3. 数据可视化工具:D3.js

D3.js 是一个用于构建高度定制化和动态可视化的 JavaScript库,适合创建复杂的、互动性强的数据图表。


相比Datawrapper, D3.js 基于 JavaScript 开发者可以精确控制图表的每个元素,适用于复杂的交互和动态数据展示。因此在需要高度自定义定制化、复杂数据可视化方面更具优势。


事实上很多年之前NYTimes的图像制作组就开始使用D3了,我考古发现了一期2013年的播客节目(!),当时的负责人回顾了它的前世今生,有兴趣的可以去听听——

https://datastori.es/data-stories-22-nyt-graphics-and-d3-with-mike-bostock-and-shan-carter/


 4. Mapbox

Mapbox是一款用于地理空间数据可视化的工具,能够生成互动式地图。几个特点:

1) Mapbox GL JS (可以理解为一个开源客户端库,用于渲染 Web 端的可交互地图)和 Geocoding API (把地址转换为经纬度坐标以及地点 ID,或者将经纬度坐标或地点 ID 转换为地址)能提供精准的地图定位,提升数据可视化的可靠性。

2),矢量瓦片和栅格瓦片技术,保证了数据可视化体验流畅和直观。


*注:

矢量瓦片(vector tiles):将地图数据(如道路、建筑)分割成小块并以矢量形式(如线条和多边形)呈现。矢量瓦片具有缩放灵活、细节清晰的特点,能在不同缩放级别保持高分辨率,同时消耗更少的网络资源。因此用户在查看地图时可以流畅地放大、缩小地图而不失真。


用在本次选举报道时,矢量瓦片就可用于动态展示各州、县或投票区的边界和实时开票数据。例如,用户可以在地图上缩放查看某一州的具体县级区域时,矢量瓦片会显示每个县的边界线、候选人支持率和实时票数。


栅格瓦片(raster tiles):将地图信息以像素图(类似照片的形式)分割成小块,适合展示静态的地理信息或背景图。这类瓦片不像矢量瓦片那样灵活缩放,但适合快速加载较大的地图区域,应用在不需要复杂交互的场景中。


用在本次选举报道时,栅格瓦片可用于在地图的背景层展示不需要频繁更新的信息,例如人口密度、历史选举结果的热力图或地形背景。


以上这些都是data journalism的一部分,而可视化在整个数据分析里的链路里面也只是靠后的阶段(前期还有数据收集、准备、清理、分析等,才轮到可视化,也会用到Python, SQL, Tableau等工具,而如今GenAI已经可以大大简化某些前期步骤了)。要实现酷炫效果其实不难,但得有一个关键的前提,那就是数据本身的公开,透明,可及,规范。




OnHERWAY
前英语媒体记者-现市场传播人-认证翻译; 关注语言|传播|文化
 最新文章