Data Formulator：使用prompt就能轻松完成数据可视化

科技 2024-09-26 17:03 北京

（本文阅读时间：8分钟）

编者按：在使用 AI 驱动的数据可视化工具时，你是否遇到过这些难题？比如，当你想要设计图表时，需要一次性描述你的可视化需求，既冗杂又繁琐；再比如，当你想要更改图表设计时，又需要从头重新输入一遍你的文本提示，AI 可能还会出错。现在，微软雷德蒙研究院深度学习组推出了 Data Formulator 工具。结合图形化用户界面和自然语言输入，该工具可以更加智能地完成你的数据可视化需求，它不仅支持通过简便地拖拽来生成图表，还能自发生成原来没有的数据概念，而且，可以通过 prompt 轻松完成各阶段的图表迭代。

Data Formulator 现已开源，欢迎大家试用，完成一次方便简易的数据可视化创作！

数据可视化是分析数据、激发灵感的重要手段。在将数据转化为图表的过程中，通常会先利用数据处理工具对数据进行预处理，再通过可视化工具将数据映射为图形，并根据图表效果进行必要的调整或进一步设计。随着大语言模型的进步，AI 驱动的数据可视化工具使创作过程变得更加简便。例如，通过自然语言描述可视化设计，大模型便能自动生成代码完成任务，大大节省了数据转换和可视化的工作量。

然而，如何有效利用 AI 更好地辅助数据分析师进行可视化创作，仍面临诸多挑战。特别是在可视化创作的迭代过程（iterative process）中，我们往往无法一蹴而就。每次更新设计都需要重新处理数据和绘制图表。当前 AI 可视化工具大多要求创作者通过文本提示（prompt）一次性描述完整的可视化需求，这不仅使得描述过程冗长繁琐，而且难以精确传达丰富的视觉信息。此外，当需要不断迭代更新设计时，每次也都要从头描述设计需求，既耗时又费力，且 AI 可能也无法一次性准确完成任务。

Data Formulator：结合图形界面操作与自然语言描述，让用户更好地与AI交流可视化设计

为了解决可视化迭代设计的难题，来自微软雷德蒙研究院的研究员们在 GitHub 上发布了一款 AI 驱动的开源可视化工具 Data Formulator。结合图形化用户界面（graphic user interface）和自然语言输入，Data Formulator 能够极大提升用户向 AI 传达迭代过程中可视化设计的能力，使得 AI 能够根据用户的指令逐步完成复杂可视化作品的创作与更新。

Data Formulator

GitHub 链接：

https://github.com/microsoft/data-formulator

试用链接：

https://github.com/microsoft/data-formulator/blob/main/CODESPACES.md

论文链接：

https://arxiv.org/abs/2408.16119

如图1所示，Data Formulator 的交互界面设计巧妙。用户在构思可视化设计时，可首先通过右侧的 Concept Encoding Shelf 来描述设计目标。在迭代过程中，用户则可通过左侧的 Data Threads 回顾之前的可视化作品，选择合适的路径进行跟进，进而描述新的可视化目标或进行微调。

图1：Data Formulator 的用户交互界面

• 使用 Concept Encoding Shelf 描述可视化设计

Concept Encoding Shelf 的设计结合了传统图形化可视化工具中的“数据放置交互界面”（shelf configuration UI）与 AI 工具的自然语言输入功能，使用户能够更直观地描述可视化目标。用户在选定可视化类型（如柱状图、线性图）后，可通过拖拽数据列至相应的视觉通道（如 x 轴、y 轴、颜色等）来直接映射数据至图形。这种方法相比冗长的文字描述，更能直观且精确地传达图表的设计意图。

此外，Data Formulator 的独特之处在于，它允许用户通过自然语言添加原始数据中不存在的数据概念（data concept）到可视化映射中，从而打破现有数据格式的限制，实现更加深入和丰富的可视化设计。

如图2所示，用户可以在 y 轴上添加“可持续能源百分比”这一数据概念（尽管原始数据仅包含各种能源的消耗值而非百分比），Data Formulator 将自动决定如何转换原始数据，计算出所需的数据栏以完成这一可视化。同样地，若用户希望查看不同国家的可持续能源百分比排名，则可以在 y 轴上添加“排名”数据栏，并通过额外的自然语言描述“计算不同国家的排名”，以指导 Data Formulator 完成相应的可视化过程。

图2：Data Formulator 允许用户添加不存在的数据概念，自行完成转换

• 借助 Data Threads 迭代可视化

当需要在现有图表基础上进行迭代时，用户可以直接在 Concept Encoding Shelf 上使用自然语言来传达迭代指令（或修改之前的数据映射）。例如，输入“仅展示前五名国家的可持续能源百分比”，Data Formulator 便能据此进一步处理数据，实现迭代，无需用户重新描述整个流程。这种方法显著减轻了用户的输入负担。

图3：Data Formulator 支持在现有图表基础上，通过自然语言指令进行迭代

若需追溯至先前的可视化作品进行重新分析，用户则可以利用 Data Threads 功能浏览之前的可视化历程，并选择合适的节点继续研究。例如，用户若想绘制一个柱状图来展示所有国家从2000年至2020年的排名变化，可以返回至“可持续能源百分比排名”的图表，并通过自然语言指令“比较不同国家2000至2020年间的排名变化”来指引 Data Formulator 基于历史数据进行深入分析，并生成所需的图表。

图4：Data Formulator 支持在过往图表基础上，通过自然语言指令进行迭代

大模型代码生成连接可视化与数据转化模块

Data Formulator 的设计策略是将数据转换与可视化过程分离开来，以提高大模型执行任务的准确度，并通过模型的代码生成能力将这两个阶段衔接。如图5所示，用户设定可视化目标后，Data Formulator 首先会根据图形界面中的输入实例化图形模板，并生成一段 Vega-Lite 代码。由于用户输入中包含了新的数据概念，Data Formulator 需要对数据进行转换以创建可视化。为此，它会将用户的输入转换为大模型的提示词，指导模型生成 Python 代码以转换数据，满足 Vega-Lite 代码的需求。

图5：Data Formulator 架构示意图

数据转换完成后，Data Formulator 会将处理后的数据与可视化代码结合，实现最终的可视化效果。在用户选择基于先前可视化进行迭代时，Data Formulator 则会利用原有代码生成新代码，从而减少代码生成过程中的不确定性，更有效地完成用户任务。

在 Data Formulator 的研究中，研究员们致力于融合图形化操作与 AI 的自然语言输入，希望帮助用户更有效地表达他们的可视化目标。但随着大模型的不断进步，如何使用户以简洁而精确的方式传达任务意图变得尤为关键，这也是研究员们未来探索的方向之一。

欢迎大家来 GitHub Codespaces 中试用 Data Formulator 创作可视化！

链接：

https://github.com/microsoft/data-formulator/blob/main/CODESPACES.md

开发者们可以在 Data Formulator 代码库的基础上开发新的功能。

Data Formulator 代码库：

https://github.com/microsoft/data-formulator

想要了解更多 Data Formulator 背后的设计理念，请查看论文：https://arxiv.org/abs/2408.16119

你也许还想看：

http://mp.weixin.qq.com/s?__biz=MzAwMTA3MzM4Nw==&mid=2649501969&idx=1&sn=55b4df2da47b559231c4790393c0538b

微软亚洲研究院

微软亚洲研究院，专注科研26年，盛产黑科技

最新文章

Rust自动形式化证明、LLMs图模式理解、机械臂动作模仿

科学匠人 | 对话松下康之：以具身智能突破人工智能与物理世界的边界

对话《Nature》论文作者，揭秘AI2BMD背后的故事

近实时的全球碳预算，揭示2023年陆地碳汇能力锐减

AI2BMD登上Nature，以量子级精度推进蛋白质动力学

MarS：生成式基座模型时代的通用金融市场模拟引擎

明天直播 | ECCV 2024精选论文分享

如何泛化AI的深度推理能力？

简单而强大：DIFF Transformer降噪式学习，开启模型架构新思路

科学匠人 | 刘海广：发挥“生物多样性”法则的力量，寻找科学的新答案

VIS 2024最佳论文 | VisEval：推动自然语言生成可视化的全新评估框架

从预测风暴到设计分子：人工智能基础模型如何加速科学发现

ECCV上新 | 精选计算机视觉领域6篇前沿论文

Data Formulator：使用prompt就能轻松完成数据可视化

为什么你的LLMs玩不转外部知识？RAG分类学助你诊断！

守护记忆：多模态大模型为认知障碍患者带来全新的训练方法

科研上新 | 金融模型、LLMs结构化剪枝、多模态对齐、AI芯片深度学习编译器

开源工具RD-Agent：让研究与开发过程更智能

VALL-E 2，大幅提升语音大模型的稳健性与自然度

微软亚洲研究院2025校园招聘正式开启！

跨越模态边界，探索原生多模态大语言模型

明天直播 | ACL 2024精选5篇论文直播分享

代码摘要、生成、翻译、修复全覆盖... WaveCoder开启代码智能新篇章

集成大语言模型与产业数据智能，迈向“产业基础模型”

Microsoft Research Forum第四期来了！一起来看多模态模型的最新技术进展与应用

星跃计划 | 微软亚洲研究院北京+温哥华联合科研项目上新，聚焦大语言模型！

开启因果发现新范式！解密复杂系统的核心机制

微软亚洲研究院多项创新技术，弥合大模型低比特量化与终端部署间鸿沟

顶尖高校优秀学子齐聚微软亚洲研究院新星科技节，论道科研！

如何理解和探索大模型的多语言能力？

执业医师转型人工智能研究员，王子龙说“跨”才是关键

ACL上新 | 6篇精选论文带你看最新LLMs进展

周二直播 | AI for Science最新论文分享

USENIX ATC 2024最佳论文 | 微软如何提升云AI基础设施的可靠性

图像解码器；多头混合专家网络；视觉模型美学对齐；医学视觉任务适应基准

大语言模型应用如何实现端到端优化？

LSR-MP：突破分子模拟瓶颈，探索知识引导的AI范式

明天直播 | ICML 2024精选论文分享

nnScaler：重塑深度学习并行策略，大幅提升训练效率

ICML 2024 | 微软亚洲研究院邀你共聚机器学习领域盛会

完全激活稀疏大模型，Q-Sparse突破LLM推理效能

数据驱动模型提升电动汽车电池退化预测准确率

ProbTS：时间序列预测的统一评测框架

你应该知道的10个AI术语

实习 | 微软亚洲研究院“明日之星”开放岗位

脑启发设计：人工智能的进化之路

以智能化为舵手，引领现代计算机系统架构新航向

构建负责任且大规模的生成式人工智能的七个启示

AI赋能天气：微软研究院发布首个大规模大气基础模型Aurora

CVPR上新 | 从新视角合成、视频编解码器、人体姿态估计，到文本布局分析，微软亚洲研究院精选论文

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉