国际数字人文年会(Digital Humanities conference)是数字人文领域的重要学术会议。DH 2024 于2024年8月6日到9日在美国华盛顿特区郊区的乔治梅森大学,弗吉尼亚州阿灵顿校区举行。实验室博士生邵汉宁参与了会议,并做口头论文报告,介绍了实验室近期的工作:文生标注地图:一种基于文本自动生成标注地图的方法框架(Text2MapAnnotations: An Automatic Framework of Generating Map Annotations from Textual Descriptions)。
地图除了作为地理空间信息的载体之外,也被广泛应用于日常的表达中。除了专家学者之外,普通用户也常常使用标注地图来展现个人经历、情感以及观点等。通过在地图上添加不同的图案、文字等标注内容,标注地图进一步获得了叙述数据故事的能力。
邵汉宁在会议上做口头论文报告
为了进一步降低普通用户构建标注地图的门槛,同时又能够保留数据与地图元素之间的关联性,Text2MapAnnotations 项目提出了一种能够自动根据文本信息构建标注地图的框架。该框架深入分析了构建标注地图所需的各项要素,并将他们拆分为地理元素、结构化信息、标注模板以及标注实例四个部分,通过探索解构每一部分的设计空间以及不同部分之间的相互关系,提出了如下图所示的构建标注地图的框架流程。
标注地图构建框架
通过将结构化信息中文本所描述的对象与地理元素做对齐,可以建立需要表述的内容与地图元素之间的数据绑定。进一步将结构化信息映射到标注模板中包含的可视化元素与视觉通道上,即可完成标注地图的构建。在这个框架中,标注模板可以自由替换,以达到轻松修改最终的标注地图风格的需求。地理元素、标注信息以及视觉元素及通道的映射关系可以通过结构化文件保存和传播,从而支持方便的复用或再创作需求。
自动文生标注地图原型系统演示
该工作进一步借助大语言模型在文本理解上的出色表现,构建了文生标注地图的原型系统。通过将大语言模型融入框架流程,系统能够自动根据提供的文本信息在地图底图上构建标注元素。为了弥补自动化方法可能出现的错误,并允许用户更加自由地调整标注地图结果,原型系统还提供了编辑功能。用户通过简单的交互即可纠正自动化算法中的错误,并按需添加或移除标注元素。
该工作探索将可视化和人工智能技术扩展应用到人文领域研究过程中,并在自动化构建地图方面做出了初步尝试。在 DH 2024 会议期间,与来自世界各国与地区的数字人文背景的学者展开交流活动,帮助我们更好地探索可视化与数字人文领域交叉与学科合作的道路,充分扩展视野,收获丰富。
工作受到国家自然科学基金项目 NSFC 62272012 支持。