2024 北大可视化暑期学校设计作品 3 – 宋诗袭用唐诗可视化

文摘   2024-08-20 18:18   山西  

引言

沿袭唐诗是宋代诗学中的经典问题,但具体的沿袭模式与沿袭关系细节尚不明确。数字人文领域有学者使用自然语言处理工具将《全唐诗》与《全宋诗》进行交叉比对,筛选出高被引的唐代诗人与高引用的宋代诗人,意图从量化角度研究宋人如何学唐。但简单的描述性统计仅为管中窥豹,无法探究复杂沿袭问题中的全貌,需要一个可视分析系统将诗歌、诗人、沿袭诗句三者有机结合起来。

暑期学校小组从宋代诗学理念发展的脉络,即从西昆体盛行到梅尧臣和黄庭坚对“以故为新”的发扬出发,尝试对“以故为新”这一学术假设进行量化,可视化了宋诗和唐诗诗句的相似关系,试图帮助古典文学研究者探究宋人与唐人诗歌中千丝万缕的联系。

数据收集与整理

由于时间限制,暑期学校数据收集中,小组成员仅关注了前人文献中提及的前三十位高被引的唐代诗人,以及前三十位高引用的宋代诗人及其诗歌信息,所有数据均来自搜韵(网址:https://www.sou-yun.cn/)。

在诗人层面,数据包括:唐宋最高引用诗人的姓名、生卒年、所处时代、诗歌总数、涉及引用的诗歌数、涉及引用的句子数、引用占比、每位诗人的影响力系数、每两位诗人之间引用次数。

在诗歌层面,数据包括:标题、内容、作者、写作时间,格律体裁类型,包含句子数量。

在句子层面,数据包括:每句的总字数、涉及引用的字数、引用类型、引用风格、句子相似度。

可视化目标

我们希望能够呈现一个“诗人-诗歌-句子”的三层次探索系统,将远读和近读结合,领域专家可以在三个层级间切换与探索。一方面,能够看到袭用的总体面貌,比如宋代诗人引用了多少唐代诗人的诗,他们最喜欢哪位唐代诗人?另一方面,希望能够可视化唐宋诗人间复杂的网络关系,洞袭用模式的相似与不同,比如同一诗派的诗人也许会在袭用的审美上偏向同一位或同一风格的诗人,但是即使袭用了同一首诗,在具体袭用的方式与风格上也可能存在不同。

另外,最终的可视化系统还可以在近读层面做史料验证之用,不同阶段宋人学唐人的学法,比如西昆体对李商隐的追崇,到梅尧臣主张平淡,诗风学习韩愈、孟郊、还有庐仝,五言律诗受了王维、孟浩然的启发,到道学家受邵雍、徐积之流的影响。为史料做清晰的数据验证。

可视化与交互设计

整体的可视化设计包括三个部分:

可视化系统界面

左上角是唐宋诗人视图,上方是唐代诗人,下方是宋代诗人,横轴按影响力由高到低排列前三十名的诗人,纵轴编码时间。塔型柱状图描述了每个诗人的一生,包括其在不同年代写作、被引的诗歌,年代不详的诗歌以圆形表示,放在卒年上方。

唐宋诗人视图

当选择一位唐代诗人时,其对应塔型柱状图会被高亮,下面引用过他的宋代诗人也会被高亮。进一步选择宋代诗人,则可以筛选两位诗人存在袭用关系的诗歌。选择塔型柱状图的某一条柱形,则可以筛选该年份的诗歌,与该诗歌存在袭用关系诗歌也会被高亮出来。

唐宋诗人视图交互细节

右上角的袭用关系网络视图描述了以一位唐代诗人位焦点,与之相关的宋代诗人,唐代诗人用矩形表示,宋代诗人用圆形表示。圆的大小代表宋代诗人与该唐代诗人的关系紧密程度(有多少句诗袭用了该唐代诗人),连线上的数字代表该宋代诗人有多少首诗袭用自该唐代诗人。

袭用关系网络视图

中间和右下角为袭用诗列表视图。中间为诗名列表,右下角为具体诗歌列表。当选中某一诗人或某一时间段,被筛选的诗歌和诗句相应式地按年份排列。焦点的唐诗被引用的句子被高亮出来,引用该句诗句的所有宋诗与之并置并支持向右滚动。通过高亮,可以很清晰地看出宋人在哪一句引用了该诗句,是完全引用还是部分袭用。

袭用诗列表视图

结语

沿袭唐诗是宋代诗学中的经典问题,从西昆体的盛行到梅尧臣和黄庭坚对“以故为新”的发扬,这样的沿袭脉络往往幽微而隐秘。在本系统中,我们可视化了宋诗和唐诗诗句的相似关系,以探索宋人与唐人诗歌中千丝万缕的联系。项目时间有限,难免会存在一些疏漏,还希望各位读者专家不吝指正。


小组成员:陈昕悦 北京大学、曾艺馨 中央美术学院、王耕雨 中央美术学院、张琳越 清华大学

指导老师:袁晓如 北京大学、陈慰平 中央美术学院、徐瑞鸽 雪城大学

特别致谢:陈逸云、唐宸

暑期学校优秀课程设计将陆续收录在可视化看中国网页:

https://vis.pku.edu.cn/vis4china

暑期学校网页:

https://chinavis.org/s24

撰稿:陈昕悦

排版:陈昕悦

可视分析
数据可视化与可视分析
 最新文章