当JSTOR年度荐书遇上AI与数字人文

文摘   2024-12-28 12:22   瑞士  
每逢岁末,JSTOR Daily都会推出一份年度荐书榜单,这份榜单汇集了 JSTOR Daily编辑团队的个人心头好,涵盖了小说、传记、回忆录等多种类型,为读者提供了丰富的精神食粮。作为“智能数字人文”公众号的运营者,我每年都会关注这份榜单,今天我们从2024年的书榜单上挑选出几本,从数字人文和大模型研究相关的角度,分享我的思考。如果有您觉得不对的地方敬请批评指正;如果您觉得还有点儿价值,也请您多多关注!
JSTOR是一个著名的电子学术资源数据库,收录了大量的期刊、图书、会议论文等学术资料,覆盖人文社科、自然科学等多个领域。JSTOR Daily则是JSTOR推出的一个面向公众的平台,用通俗易懂的语言解读学术研究,将学术与现实生活联系起来。而JSTOR的年度荐书活动,我感觉很好体现了这个平台的人文关怀和对阅读的推崇,已经成为了一个具有品牌效应的传统活动。
1. 跨越时空的历史对话:《The Years of Lyndon Johnson》
Robert Caro撰写的美国前总统林登·约翰逊传记《The Years of Lyndon Johnson》无疑是一部史诗级的巨著,已经出版了四卷,总页数超过3000页,未来会有第五卷。这部作品不仅以其翔实的史料和细腻的笔触还原了约翰逊复杂而充满争议的一生,更将约翰逊置于美国20世纪政治和社会变迁的大背景下进行考察,对理解美国历史、政治和社会具有重要的参考价值。
数字人文视角这部传记为数字人文研究提供了绝佳的素材。不妨从数字人文的角度尝试一下:(1)我们可以利用主题建模(Topic Modeling) 技术,识别出传记中反复出现的主题,例如“权力运作”、“民权运动”、“越南战争”等,并分析这些主题在约翰逊执政生涯不同阶段的演变。(2)我们可以运用情感分析(Sentiment Analysis),探究作者 Caro 对约翰逊本人以及相关历史事件的态度倾向。(3)通过命名实体识别(Named Entity Recognition),我们可以提取出传记中涉及的关键人物、地点、机构等实体,构建出一个庞大的知识图谱,进而利用网络分析(Network Analysis)技术,深入挖掘约翰逊与其政治盟友、竞争对手乃至整个美国政治生态之间的复杂关系。
大模型应用:我们可以基于这部传记训练一个专属的“约翰逊”大模型。这个模型不仅可以模仿Caro的写作风格,生成类似风格的历史评论,还可以作为一个智能问答系统,回答关于约翰逊生平、政策以及那个时代背景的各种问题。甚至,我们可以尝试让这个“约翰逊”大模型与基于其他历史人物传记训练的模型进行“对话”,例如“肯尼迪”模型或“尼克松”模型,模拟不同历史人物之间的思想碰撞,这将为我们理解历史提供一个全新的视角。
2. 走进“她”的埃及学:《Women in the Valley of the Kings》
Kathleen Sheppard 的《Women in the Valley of the Kings》则将目光投向了 19 世纪末 20 世纪初的埃及学研究领域。这本书打破了传统上男性主导的历史叙事,讲述了11位杰出女性埃及学家的故事。她们在埃及学的草创时期,不仅资助和组织了重要的考古发掘,还在文物保护、博物馆管理、学术研究等方面做出了不可磨灭的贡献。
数字人文视角:Sheppard的研究本身就带有浓厚的数字人文色彩。她通过对大量历史文献的梳理和分析,将被埋没在历史尘埃中的女性学者的贡献重新发掘出来。而利用数字人文工具,我们可以更进一步。例如,我们可以构建一个女性埃及学家关系网络,分析她们之间的合作模式、师承关系以及学术影响。同时,结合当时的报纸、期刊、信件等资料,利用文本挖掘技术,我们可以量化分析这些女性学者在学术界的地位和影响力,并与同时代的男性学者进行对比。此外,利用自然语言处理技术,我们还可以分析当时的学术文献中是否存在对女性的性别偏见。
大模型应用:我们可以尝试利用大模型“复活”这些女性埃及学家。基于 Sheppard书中的描述以及相关的历史资料,我们可以训练一个能够模拟这些女性学者说话风格和思维方式的大模型,让用户可以与她们进行“对话”,了解她们的学术观点、人生经历以及对埃及文明的独特见解。此外,我们还可以利用大模型进行反事实历史推演例如,如果这些女性没有受到当时的性别歧视,埃及学的发展会有怎样的不同?这将激发我们对历史的更多思考。
3. 人工智能时代的哲学思辨:《A Psalm for the Wild-Built》及其续作《A Prayer for the Crown-Shy》
Becky Chambers 的科幻小说《A Psalm for the Wild-Built》及其续作《A Prayer for the Crown-Shy》构建了一个充满温情和哲思的未来世界。在这个世界里,人类与自然和谐共处,机器人获得了自由意志并隐居荒野。小说通过茶僧侣Dex和机器人Mosscap的旅程,探讨了生命的意义、人与自然的关系以及人工智能的未来等深刻的议题。
数字人文视角: 这部小说为我们理解人工智能时代的人类处境提供了丰富的想象空间。利用数字人文方法, 我们可以对小说中的世界观设定进行深入分析, 例如Panga星球的社会结构、科技水平、生态环境等, 并与其他科幻作品进行对比。进一步, 可以探讨其中蕴含的乌托邦/反乌托邦元素, 分析作者对未来社会的美好愿景和潜在忧虑。此外,还可以提取小说中关于“存在”、“意义”、“人与技术关系”等哲学探讨, 并与相关哲学流派的观点进行对照。
大模型应用:这部小说尤其适合与大模型技术相结合。我们可以训练一个基于 Dex 和 Mosscap 对话的大模型,模拟他们之间的对话风格,并就“生命的意义”、“人工智能的未来”等话题展开深入讨论。这不仅可以作为一种有趣的互动体验,也可以作为一种激发思考的工具。此外,我们可以利用大模型续写Dex和Mosscap的故事,探索他们在 Panga 星球上的更多冒险经历,或者基于小说的设定,生成关于 Panga 星球的更多细节,例如它的历史、文化、物种等,构建一个更加完整的科幻世界。这将为科幻创作提供新的可能性。
4. 重写经典, 解构种族主义: 《James》
Percival Everett 的小说《James》对马克·吐温的经典之作《哈克贝利·费恩历险记》进行了大胆的重写。Everett 将叙事视角从白人男孩哈克转向了黑奴吉姆, 赋予了 Jim 完整的内心世界和主体性, 使其不再是原作中略显刻板的配角。通过 Jim 的眼睛, 小说深刻地揭露了美国奴隶制和种族主义的残酷本质。
数字人文视角: 《James》为比较文学和计算文本分析提供了绝佳的案例。通过对《James》和《哈克贝利·费恩历险记》进行文本对比分析, 我们可以运用文体学、主题模型等方法, 量化研究二者在叙事视角、语言风格、主题表达等方面的差异这将有助于我们深入理解 Everett 的改写策略, 以及这种改写如何颠覆了原作中的权力关系和意识形态。此外, 结合 19 世纪美国历史语境, 分析《James》对奴隶制、种族关系等的描写, 以及这些描写与当代社会议题的关联, 可以揭示文学经典的当代意义
大模型应用: 我们可以训练一个能够学习 Everett 写作风格的大模型, 并尝试将《哈克贝利·费恩历险记》或其他经典文本转换成 Everett 的风格。观察转换后的文本在叙事、语言等方面会发生怎样的变化, 可以帮助我们更好地理解 Everett 的文学创新。此外, 还可以利用文本到图像的生成模型(如 DALL-E、Stable Diffusion), 根据《James》中的场景描写生成相应的插图, 实现文学作品的多模态呈现, 增强读者的阅读体验。
写在最后
JSTOR Daily的年度荐书榜单,不仅为我们提供了阅读的指引,也能够为我们进行数字人文研究提供丰富的素材。而大模型等人工智能技术的兴起,则为我们理解和研究这些作品提供了新的工具和视角。有理由相信,在未来的日子里,数字人文和大模型将在文学研究、历史研究、文化研究等领域发挥越来越重要的作用,为我们带来更多的惊喜和启示。

智能数字人文
人工智能与数字人文