点击文末 “阅读原文” 下载全文程梦琴, 周葆华, 陈思明
引用本文: 程梦琴, 周葆华, 陈思明. 数据新闻可视化研究: 理论与实践[J]. 计算机辅助设计与图形学学报, 2024, 36(6): 915-927. DOI: 10.3724/SP.J.1089.2024.19916
Citation: Cheng Mengqin, Zhou Baohua, Chen Siming. A Survey of Visualization in Data Journalism: Theory and Practice[J]. Journal of Computer-Aided Design & Computer Graphics, 2024, 36(6): 915-927. DOI: 10.3724/SP.J.1089.2024.19916
进入大数据时代, 信息更迭迅速的新闻业中出现了越来越多数据可视化的元素, 可视化技术在新闻领域中占有越来越重要的位置. “数据新闻”这个术语由Simon Rogers在The Guard-ian的一篇内部博客中提出, 数据新闻更多的是利用网络数据获取手段采集数据, 并更多地采用交互式、动态化的图片(表)和视频呈现数据处理和分析的结果, 本文认为, 数据新闻是指基于对数据的分析、处理和挖掘的新闻报道方式, 通常包括采用可视化的形式呈现新闻要素和事实.数据新闻到达用户需要经历生产、传播和理解3个阶段, 其中, 传播指数据新闻通过何种媒介进行传播, 本文关注数据新闻的生产和理解这2个阶段中的可视化, 探讨可视化在其中的地位和作用. 本文围绕着数据新闻中, “人—技术—过程与结果”的逻辑总结整体框架, 并梳理其生产和理解中的问题. 在新闻生产中, 关心不同的制作者(人), 根据不同的数据类型决定使用相应的可视化技术(技术), 并且利用可视化生成的技术, 形成了一套创作数据新闻流程(流程); 在新闻理解中, 关心不同的读者(人), 可以使用不同的互动模式(技术)对不同类型数据新闻进行探索, 并且关注数据新闻如何影响用户(结果). 通过在多个相关学术搜索引擎中搜索“data journalism” “data visualization” “understanding”(或者相应中文)等关键词组合的多种形式, 本文在IEEE, ACM, Journalism practice, Digital Journal-ism,Journalism等可视化或新闻相关领域的期刊或论文集中收集并整理了与数据新闻和可视化相关的工作, 重点关注以数据新闻为分析案例的可视化文献. 另外, 本文整理了50个有代表性的数据新闻项目, 覆盖来自多家中外知名媒体, 包括多种可视化形式. 为了方便阅读和整理, 在搜集过程中排除了其他语言, 只选取了中文和英文的实践案例; 对50个数据新闻项目进行分类, 除了总人数为计数外, 在其他的分类中将其具有的特征记为1(1表示有, 0表示无). 对相关工作与案例进行整理, 得出案例分类和流程框架, 两者互相迭代, 相应案例的总结如表1所示; 同时, 提出如图1所示的对数据新闻、可视化相关文献和实践工作的分类框架. 最后讨论未来可视化在数据新闻中的发展方向, 给予数据新闻从业者建议并讨论相应的问题与挑战.从数据新闻实践的角色分工、可视化类型和在不同新闻流程中使用的生产技术3个层面, 讨论数据新闻中的可视化的生产和实践过程.对数据新闻生产中的“人”进行深入探讨与分析, 讨论数据新闻中的新闻编辑这一传统参与者, 以及可视化技术人员、设计师和数据师这3个新角色. 在收集的50个数据新闻项目中, 对其中的4类参与者进行分析, 探讨其总人数及分工协作的情况, 如表1所示. 在标注了参与人员的45个项目中, 从总人数可以看出, 数据新闻实践中仍以小型协作为主(5人及以下的项目占62%); 同时, 也因为数据新闻项目的复杂性, 有少部分的项目超过10人协作(10人及以上的项目有6个). 另一方面, 分工越发精细化, 在标注了参与人员且列出具体分工的31个项目中, 出现了负责可视化、设计、处理数据等细分工作的专业人员; 同时, 传统的新闻编辑仍是最重要的组成部分, 一个数据故事的构成不仅需要可视化进行直观的数据展示, 还需要文本内容来构建整个数据故事的叙事; 此外, 还发现有3个数据新闻项目仅由一人负责, 承担了新闻编辑和数据可视化的双重角色, 2个不同的角色进行了融合.根据数据新闻是否有动画或支持人机交互, 将其中的可视化分为静态信息图、动态可视化和交互式可视化. 静态信息图对信息和事实进行解释, 就像一个快照, 将一个故事冻结在一个固定的时刻; 动态可视化则使用动效的可视化形式, 通过多媒体和多模态动画(音乐、声音、短片等)来讲述一个故事; 交互式可视化可以通过不断地改变一些参数, 支持用户进行交互和探索. 在对50个数据新闻项目的可视化类型进行归类分析后发现, 数据记者偏好有交互功能的可视化设计, 是否能够交互成为一个越来越重要的可视化设计元素, 但静态信息图表和动态可视化仍是重要的辅助工具. 动态可视化可以按照数据记者的既定思路展示数据的动态变化趋势, 如将数据视频配上音乐和声音, 可以增加数据故事的可读性; 数据动图通常少于15 s且自动重复播放, 与数据视频相比, 数据动图是一种传达信息更加简单、短小的可视化形式.
根据生产技术帮助生成数据新闻的自动化程度, 数据新闻的生产分为自动化生成和交互式生成. 在自动化生成中, 人只完成初始程序的设定, 其余的都由机器来完成; 而在交互式生成中, 在自动化生成的基础上, 人还能继续对数据故事进行修改, 加入自己的见解. 运用于新闻追踪、信息抓取、可视化生成和新闻编写4个新闻生产流程的可视化生产技术如表2所示. 在可视化生成中, 根据不同的复杂程度, 可以支持生成单个、多个和复杂的可视化元素, 或是支持生成完整的数据故事, 帮助完成整个数据新闻的生产.数据新闻的特点影响着用户的理解, 根据用户与数据新闻互动的程度, 用户与新闻的互动交互模式分为被动阅读和交互式阅读, 不同的互动方式也会产生不同的认知效果.新闻的基本定义和要求是真实, 新闻价值包括时新性、重要性、显著性、接近性和趣味性5个要素. 考察“真实”这一特点, 通过对50个新闻案例的归纳总结, 对案例的专业性(是否有方法论, 数据来源说明)和公开性(来自公开数据, 公开代码)进行评估; 并因为可视化作品与传统新闻作品不同, 会更好地具有娱乐等功能, 所以加入趣味性(卡通画)这一新闻价值要素进行讨论. 对50个新闻项目在数据新闻理解中的总结结果如表3所示.
随着可视化越来越多地运用于数据新闻, 研究者开发了越来越多的生产技术, 更多的问题被提出并被用于新闻实践中.
在数据新闻的生产中, 除了可视化的相关部分, 传统数据新闻中的文本与可视化的关系也值得探讨. 在传统新闻实践中, 文本是新闻最重要的组成内容, 也是评价新闻记者的重要标准. 随着可视化更多地运用到新闻实践中, 出现了以可视化为主、文本为辅的新闻项目; 在数据故事中, 除了可视化和文本, 还有图片、视频和音频等构成元素, 它们仍然是重要的辅助内容.
在人员分工中, 生产图片的摄影师仍然是非常重要的生产者, 可视化也可以基于真实的图片进行分析. 例如, 有的新闻案例是基于某地真实的场景图片进行可视分析, 增强了新闻叙事的沉浸感和真实感; 出现了一些复合型人才, 他们既进行新闻编写, 还承担了数据分析和可视化的工作. 在对50个新闻项目进行分析时, 发现有事实核查这一分类的专业人员只有1例, 这是因为在一般的新闻实践中, 新闻编辑本身就承担了这一职责, 在大型的数据新闻项目中, 因数据量大且来源繁杂, 催生了事实核查这一专业人员的出现. 数据新闻的生产者不仅要具备传统的新闻编写的能力, 还要掌握运用数据进行分析和表达的能力. 如果只掌握其中一种技能, 就需要与其他的专业人员保持良好的沟通, 一个优秀数据新闻项目的核心是生产者对自己的身份认知是记者.
新闻实践中出现了越来越多的自动生成数据新闻和可视化的案例. 例如, 公众号“中国地震台网”会发布模板相似的地震速报, 包括地震的震情、震中地形以及历史地震分布等. 正是因为内容高度重复, 使得大批量的自动生成数据新闻及其可视化内容能够投入实践. 自动生成技术不仅让新闻记者减轻技术负担, 同时能够减少人力成本和人为的错误等; 但它也为数据记者这一职业带来挑战, 对数据记者的专业能力提出了更多的要求, 未来发展方向也会随着技术的成熟不断变化.
本文讨论数据新闻可视化中的生产与理解, 还可以对数据新闻实践开展更多的实证工作. 例如, 寻找专业人员的意见或通过阅读、点赞、评论和转发等数据支持讨论数据新闻的传播效果; 还可以探究在不同的传播媒介, 如手机端与电脑端上, 呈现出的不同传播特点. 新闻已从通过传统纸质媒介传播演变为现在的网络传播为主, 未来期待会有更多样的交互模式, 如通过虚拟现实或增强现实与可视化进行交互, 或是在元宇宙中进行数据新闻的生产、传播与理解.
对于在数据新闻可视化中的交互类型, 点击查看与悬停查看是较为基础的操作, 支持用户查看细节; 文本查询输入和调整参数都能直接改变所呈现的数据故事的数据范围选择; 而平移与缩放、滚动式阅读则常常一起出现在基于地理空间的数据故事中, 这是因为地理空间天然带有时空属性, 数据记者会使用地图作为叙事的载体, 在切换不同的地理空间时使用平移与缩放, 整个地理数据故事本身就是一个基于同一背景的滚动式阅读. 数据新闻的交互未必是越复杂越好, 数据记者可以倾向于在与人们的实际生活相关的社会民生、时政等数据新闻实践中设置交互.
程梦琴: 硕士研究生, 主要研究方向为故事叙述与数据新闻.
周葆华: 博士, 教授, 博士生导师, 主要研究方向为新媒体传播、用户与传播效果、舆论研究、计算与智能传播等.
陈思明: 博士, 青年研究员, 博士生导师, CCF会员, 论文通信作者, 主要研究方向为大数据可视化与可视分析、混合人机智能.
— END —
还没关注?点击下方“卡片”关注,获取第一时间资讯