近日,北京大学智能学院可视化团队在可视化领域旗舰期刊IEEE Transactions on Visualization and Computer Graphics (CCF-A类期刊)发表多项科研成果,内容涉及对古籍目录的智能交互整理,文生图过程中提示词编辑过程的可视化,以及基于地图隐喻的高维数据子空间分析。
古籍目录的智能交互整理
CataAnno: An Ancient Catalog Annotator to Uphold Annotation Unification by Relevant Recommendation
智能古籍目录标注系统CataAnno
CataAnno结合深度学习方法和可视化方法,优化了古籍目录标注的工作流程,将传统上低效的,需要反复迭代的标注过程尽可能地转化为高效的线性标注流程,大大提高了领域专家对于相关数据的清理和处理工作效率。课题组将进一步扩展已经取得的成果,探索更为高效的古籍目录数据智能标注方法,并开发相应的标注工具。该工作展现了将可视化和人工智能技术扩展应用到人文领域研究过程中的无限可能,为之后更加深入的跨学科合作提供参考与经验。该工作被IEEE VIS 2025接受,将同时发表于IEEE TVCG. 该成果以实验室博士生邵汉宁为第一作者,袁晓如为通讯作者。工作得到国家自然科学基金NSFC 62272012的支持。
提示词编辑过程可视化
PrompTHis: Visualizing the Process and Influence of Prompt Editing during Text-to-Image Creation
文生图创作提示词编辑过程与影响可视分析系统PrompThis
文生图模型允许用户通过文本提示创建吸引人的图像,近年来这种模型的普及率急剧上升。然而,大多数用户对此类模型的工作原理了解有限,往往要依靠反复试验才能获得满意的结果。提示历史包含大量信息,可以让用户深入了解已探索的内容以及提示变化对输出图像的影响。课题组提出 “图像变体图”(Image Variant Graph)这一新颖的可视化表示方法,旨在为比较提示-图像对和探索编辑历史提供支持。图像变体图将提示差异建模为对应图像之间的边,并通过投影来呈现图像之间的距离。基于该图,课题组与艺术家共同设计开发了PrompTHis系统。基于对提示历史的回顾和分析,用户可以更好地理解提示变化的影响,并更有效地控制图像生成。该成果以实验室一年级博士生郭宇涵为第一作者,袁晓如研究员为通讯作者。该工作为IEEE PacificVis 2024 期刊轨 Fast Track论文,日前被IEEE TVCG 正式录用。
子空间地图
Subspace-Map: Interactive Visual Analysis for Subspace Data with a Map Metaphor
借助地图隐喻开展高维数据子空间交互式探索方法Subspace-Map
子空间指高维空间中的任意低维空间。在分析高维数据时,选择合适的子空间有助于建立对数据更全面的认知。面对子空间探索空间巨大、维度对数据关系的影响复杂、用户对子空间的探索常常缺乏方向等问题,工作提出Subspace-Map,通过地图隐喻这一空间利用率高且大众熟知的方式来开展子空间分析。在Subspace-Map中,每个六边形表示一个子空间,对应一个城市。我们计算两层子空间聚类,对应地图中的国家和省份。每个聚类会提取代表性子空间作为首都和省会。我们还设置两种交通模式:陆地模式和飞行模式,分别用于分析代表性子空间之间平滑的模式转换以及观察任意两个子空间的模式变化。通过分析各种模式和模式转换,用户可以获取主导维度、稳定的数据模式等多方面的见解。该成果以实验室博士李金城和前成员赖楚凡为共同第一作者,袁晓如为通讯作者。该论文日前被IEEE TVCG 正式录用。
以上工作得到国家自然科学基金NSFC 62272012的支持。北京大学可视化研究团队由智能学院袁晓如领导,近年来在可视化理论、方法和应用,特别是与人文紧密结合探索分析复杂问题方面开展了卓有成效的工作。欢迎各界开展合作。联系方法:pkuvis[at]pku.edu.cn 。