从数字人文到AI人文:人文研究范式的变革
题记:近年来,生成式人工智能(artificial intelligence,以下简称“AI”)正逐渐成为推动各个行业与学科领域实现智能化转型的关键力量。以ChatGPT和文心大模型为代表的生成式AI技术不断成熟,不仅促进了跨行业的技术应用,也为学术研究、新文科建设开辟了新的可能性。人文研究的数字人文(digital humanities)范式正在向AI人文(AI humanities)转型。
近年来,生成式人工智能(artificial intelligence,以下简称“AI”)正逐渐成为推动各个行业与学科领域实现智能化转型的关键力量。以ChatGPT和文心大模型为代表的生成式AI技术不断成熟,不仅促进了跨行业的技术应用,也为学术研究、新文科建设开辟了新的可能性。人文研究的数字人文(digital humanities)范式正在向AI人文(AI humanities)转型。
从数字人文到AI人文的技术演进逻辑
作为一门融合了信息技术与人文学科的跨学科研究领域,数字人文的基本特点就是运用先进的数字技术与计算方法,对人类文化与历史进行深入的探索和分析。该领域的起源可追溯到20世纪中叶的人文计算(humanities computing)。其中具有里程碑意义的,是意大利学者罗伯托·布萨(Roberto Busa)自1949年起与科技公司IBM合作,致力于编纂《托马斯著作索引》。21世纪初,同是意大利学者的弗兰克·莫莱蒂(Franco Moretti)提出“远读”(distant reading)理念,并在其《对世界文学的猜想》中进行了深入应用。2001年,“数字人文”。正式替代了“人文计算”,并在学术界得到了广泛认可和应用。
数字人文的技术演进经历了从最早的文本数字化和计算机辅助研究到最近的与AI技术结合的发展阶段。就一般状况而言,数字人文的研究方法论涵盖以下四个关键环节:首先是数据采集阶段,研究者系统收集并整理大量数据,为分析工作打下坚实基础。其次是数据处理阶段,利用算法、机器学习、数据挖掘等技术对数据进行清洗、分类与整理,以期准确揭示数据背后的深层含义。再次是数据分析阶段,研究者对海量数据进行深入分析,挖掘隐藏的信息与规律,提供新的研究视角与思路。最后是可视化展示阶段,通过图表、图像、动画等形式直观展现分析结果。在生成式AI兴起之前,数字人文的技术处理流程相对烦琐,涉及广泛的数据处理与分析任务,对研究者提出了较高的技术门槛。
技术门槛和人力烦琐问题使得数字人文技术的更新与发展在过去的一段时间内表现得相对迟缓。这反映出数字人文技术的数字化、自动化和智能化水平的提升往往伴随着对人工劳动的相应需求,尤其是对专业技能和人力资源的依赖。当然,数字人文在发展历程中也涌现了一批专用工具与平台,这些工具促进了该领域的研究效率与深度。自动化数据收集工具,如网络爬虫、应用程序编程接口(APIs)、文本挖掘工具和社交媒体分析工具等,均能有效减轻研究者在数据收集与处理方面的工作负担。预训练模型的发展则在某种程度上简化了人工标注和算法编写的烦琐流程。其中,作为基于Transformer架构的预训练语言模型,BERT模型通过掩码语言模型任务学习深层次的双向文本表示,已在各类自然语言处理任务中展现出卓越的性能。在此基础上,针对特定语料训练的模型如“SikuBERT”和“SikuRoBERTa”,将《四库全书》作为训练数据,为古文的自然语言处理任务如自动分词、断句标点、词性标注等,提供了有力的支持。数据分析和可视化工具如Gephi适用于创建网络图表,Tableau允许用户创建交互式和可共享的仪表板,而Voyant则允许用户上传文本并快速生成多种可视化工具,辅助探索文本的模式和结构。
近年来,生成式AI的迅猛发展使得数字人文的技术能级获得极大的提升。比如,利用生成对抗网络(GAN)技术,艺术家可以生成艺术作品,并将传统中国画转换为逼真图像;利用深度卷积生成对抗网络(DCGAN)技术,研究者可以识别图像的损坏部分并填充缺失部分,修复文化遗产;利用语音生成技术,研究者可以探索古代语言和音乐的声音,促进跨文化沟通与理解。以ChatGPT、文心大模型这类大语言模型为代表的生成式AI获得突破性进展之后,数字人文获得了更强的AI赋能。
生成式AI技术所获得的重大突破,将人文研究提升了一个大台阶。如果说数字人文实现了人文文献处理的数字化和数据化,那么随着生成式AI技术的快速发展,AI人文将进一步实现对人文信息分析的自动化和智能化。与数字人文侧重于数据的收集、整理、分析和可视化,强调人的研究主体性和对数据的深入解读不同的是,AI人文的核心在于利用AI的模式识别、数据重组、预测推断和语言生成等能力,处理和分析大规模的文本、图像和声音数据,从而揭示深层次的模式与关联。如果说数字人文在技术应用上更多依赖于人工操作和传统计算工具,那么AI人文则利用深度学习和自然语言处理等AI技术。尽管AI技术在数字人文中的应用标志着该领域技术发展的新阶段,但AI人文所代表的技术变革与以往数字人文所使用的技术有显著不同——生成式AI技术具有“第四次工业革命”的重要意义,预示着技术发展的一个重要转折点。在研究方法上,数字人文侧重定性分析和文献研究,AI人文则更多通过定量分析和算法模型来提供新的研究视角。随着算力、算法能力的增强,AI人文的智能化水平已能够凭借生成式AI的技术来模拟人类的认知过程,为理解人类的精神文化现象提供全新方式。正因如此,若我们仍局限在已发展了近80年的数字人文的框架下来讨论生成式AI技术在人文领域中的应用问题,将会严重低估AI之于人文研究知识生产的革命性意义。
人类经验的向量化:AI人文的知识生产潜能
当前的生成式AI实现了显著的技术突破,这一变革的核心在于生成式AI实现了人类经验的向量化。所谓“人类经验的向量化”,即将复杂多变的人类经验转化为数学向量表示,以便机器学习模型进行处理。尽管生成式AI的预训练模型在执行时仍依赖于向量算法,但这些向量空间实际上是人类社会历史文化的经验图式的反映。算法本身也是为了解决特定任务而设计的步骤和环节,它们在一定程度上模仿了人类行为。因此,生成式AI所依赖的数据和算法并非简单的数字、符号或公式,而是对人类世界及其行为方式的一种模拟。
生成式AI实现的这一变革使得这种模拟更加自动化和智能化,这种向量化的预训练模型不仅增强了生成式AI对数据的理解能力,而且为其生成新知识提供了可能性。预训练模型通过学习大量的文本数据,能够捕捉到语言的深层结构和语义关系,从而在没有明确编程指令的情况下,生成连贯且具有逻辑性的内容(文本、图像、视频、代码等)。自Transformer架构的预训练模型问世以来,人工智能在处理语言和知识方面的能力获得了显著提升。通过监督学习、无监督学习、半监督学习、强化学习以及深度学习等多种学习和优化策略,生成式AI不仅能够模拟人类的思维模式,还能够进行更为复杂的创造性思考。作为一种全新的知识生产方式,这些AI工具正逐步改变着我们对知识获取和创造的认知。
首先,生成式AI凭借先进的模式识别技术,能够从庞大的数据集中提炼出有价值的信息。通过训练模型来识别和理解人类语言的复杂结构与语义关系,生成式AI能够生成高质量的文本内容。这不仅仅是简单地模仿人类语言,而且能够深入理解语言的内涵和逻辑,从而生成更加准确、流畅的文本。值得一提的是,生成式AI在提升生成内容质量的同时,可以实现所生成内容形式与风格的多样性和创新性。如采取“风格迁移”技术,能够实现将某个类型的风格特征迁移到另一幅作品当中;或者通过学习某位知名作家的创作风格来创造新的作品。
其次,生成式AI拥有较强的信息重组能力,通过整合与重组来自不同源头、具备不同结构的信息,能够产生独特且全新的文本内容,生成式AI构建了一个相互交织、相互影响的文本网络。借助其预训练模型,我们能够洞察不同作家、作品及文学现象间的深层关联,并从多种视角激发“互文性”关系,从而实现对作家、作品或文学现象的全新理解。生成式AI还可以通过向量化方式,将人类经验转化为可计算的数据形式,帮助研究者建立不同作家、作品或文学现象之间的关联。进而,研究者可以通过选择不同角度来“激发”这些关联,以获得对问题的全新理解。
最后,生成式AI还有预测推断及语言生成能力。无论是“文生文”还是“文生图”,或是“文生代码”“文生视频”,生成式AI的多模态理解及相互转换生成的能力成为制胜的法宝。生成式AI的这种预测推断及内容生成能力正在被应用于文化创意产业实践,显现出其知识创新潜能。如早在2006年,网飞就设立了一项电影推荐系统大赛,并在3年后成功奖励了一套准确率被提升了10%的算法。随后,网飞发展出“有3300万个不同版本的Netflix”的实时机器学习的个性化推荐系统。2023年,网飞开始招募AI产品经理,以AI打造优质内容。
在生成式AI获得重大突破之后,AI赋能科学研究从事知识生产的问题已被提上议事日程。目前,“AI for Science”(人工智能驱动的科学研究)正在致力于AI工具提升科学研究的效能。其一,从学术研究最基础的环节“文献综述”来看,生成式AI正在变革科研人员的文献阅读方式,使他们能够自动化地处理和理解海量的科学文献,快速提取关键信息与知识点。其二,生成式AI在数据分析实验方面展现出明显的优势。它能够提升软件的信噪比,优化探针的选择性,从而使实验数据的分析更加精确和高效。其三,生成式AI在改进实验方式方面展现出巨大的潜力,不仅能够提供新的实验设计,还能提供更为精确和高效的实验表征算法,甚至推动科学软件开发方式的发展和新型实验设备的研发。从AI for Science到AI for Social Science(人工智能驱动的社会科学研究),再到AI for Humanities(人工智能驱动的人文学科)的提出,AI人文作为一种全新工具和方法,越来越多地应用于人文研究领域,其潜能正在被不断地激发。
人机互动:“需要人的AI”与“拥有AI的人文”
尽管生成式AI已能够实现对人类知识生产能力的模拟,甚至是部分环节的替代,但这里有三个非常重要的判断需要被谨慎提出。其一,生成式AI所产生的文本、图像、视频及代码,虽已具备人类知识的基本形态,但生成式AI所生成的内容尚未获得“确证”,也未必能成为“真信念”。其二,生成式AI的内容生成虽然强大,但仍然无法涵盖人类知识的全部形式。深层次的理解和洞察、道德与价值判断、经验性知识、默会知识等,目前仍是生成式AI无法企及的领域。最重要的是其三,生成式AI尚不具有真正的批判性思维能力。虽然生成式AI可以分析信息、识别模式、生成假设和推论,但无法对自己的思考过程进行反思和评估,因此也就无法像人类一样进行主观体验,无法适应不同的情境。
正因为当前生成式AI尚不具备独立从事知识生产的能力,才真正需要人类发挥主观能力和创新创造能力。因而,探讨“需要人的AI”和“拥有AI的人文”以及两者之间的关联,已不仅局限于科技领域,更成为一个值得深入探讨的文化议题。“需要人的AI”是指无论AI的自动化程度、智能化水平有多高,都无法产生自我意识,因而也缺乏像人类一样的主观能动性。而“拥有AI的人文”是指,面对知识爆炸的信息革命,人类仅依靠个人头脑之学习、记忆和思考能力已经远远不够用了。在AI这类数字技术赋能之前,个人只能通过读万卷书、行万里路来获取“新知”。在AI赋能之后,人类可以以任何方式调用已有知识,通过模拟仿真技术反复演练、作出预测,以提供决策的参考。
AI人文的核心在于人机互动,探索AI在人文领域的深度应用。尽管AI技术日新月异、发展迅速,但AI人文并非简单的AI自动生成,而是需要人类的积极参与、精心指导和严密监督,以实现自动化和智能化的过程。在AI人文领域,“人”依然居于核心地位并发挥支配作用。尽管我们可以通过大数据、海量数据,甚至是“人类经验的向量化”的方式算出其“均值”,求出其“最优解”,但都无法彻底实现对某一特定的人物、作品或历史事件的最终解释。正因为如此,“说不尽的莎士比亚”的观点才是人文研究意义阐释生生不息的真实写照。与自然科学研究所追求的实验的可重复性、可验证性不同,人文研究往往没有固定的研究方法和步骤,而是需要根据具体的研究对象和问题灵活调整研究策略,甚至存在依靠人的经验、直觉以及灵感来实现的方式。这也使得人文研究具有了某种超常规性的特点,要求研究者在面对某些问题时要敢于突破常规思维模式,进行创新性思考。因此,在未来的AI人文研究中,我们应更加注重人的作用和价值,发挥人的主观能动性,推动人文研究深入发展。
结语
随着AI技术的升级迭代,算法黑箱、算法偏见、AI幻觉(hallucination),以及可能的AI自我意识的觉醒等问题逐渐浮现。所谓算法黑箱,是指算法系统在使用过程中出现的无法公开或无法深度了解其内部逻辑和计算过程的现象。算法偏见描述的是算法在处理和分析数据过程中,因各种因素引发的非客观和非公正偏向。而AI幻觉则是指在AI生成文本或其他类型输出时,出现与现实世界事实相悖、与用户输入不符或无法通过现有信息验证的内容。这些经由AI技术的出现而产生的问题,需要在人类的主导下逐步获得解决。所有这些也内在于AI人文之中,成为其技术不断升级迭代的强大动力。
总之,AI人文是一个充满挑战和机遇的领域。作为人文学科研究的前沿领域之一,AI人文将见证更高级的自然语言处理能力、更精细的情感分析技术,以及更复杂的机器学习模型。而且,AI人文将面临更复杂的伦理、社会和技术方面的挑战。所有这一切,正是值得人文社会科学研究学者密切关注并且积极实践的领域。
作者:曾军,上海大学文学院教授
来源:《社会科学文摘》2024年第11期
编发:三束光部落
现代大学网
在这里,读懂大学
westudying.com
iuniversity@qq.com
版权说明
为著作权人的作品提供网络推广服务,以提升其价值影响力。部分信息选录自相关书刊或网站,如有异议请发电邮洽商处理。▲