2024年11月26日,人文学院数字人文赋能课程第二讲在东九楼D202教室顺利举行。本次讲座邀请学院刘根辉教授作为主讲嘉宾,他围绕“数字人文与大语言模型”相关内容,带领在场的师生进入计算机辅助语言研究的世界。人文学院党委副书记叶智、辅导员王勇及2024级全体本科生参与本次讲座。辅导员宋海佩担任讲座主持人。
刘根辉教授以“计算机人工智能与语言研究”为核心议题,从计算机技术与计算机辅助研究、古代诗文用韵研究、古代类书研究、数据库建设与运营、AI九思语言模型建设等方面,为大家介绍了计算机在语言研究上的具体运用,汇报了我校所在建设中的多项数字人文项目。
刘根辉教授简明扼要地阐述了我校的数字语言研究之起源,强调了我校作为理工科学校打造学科交叉运用的开拓性和先进性。凭借着书生意气和满腔热血,在国内普遍使用“卡片法”进行诗韵研究时,我校借助计算机程序展开语言研究数字化的开发,申请到多个诸如“隋唐五代汉语语音史研究”的国家级人文研究项目,是国内信息化时代汉语研究的领头者。在这一过程中,尉迟治平教授和学生们付出了巨大努力,负责多个重大项目的建设,做出了卓越贡献。
在回顾研究历史后,刘根辉教授向师生们介绍自己及学生们的研究项目,其中包括古代诗文的用韵研究、韵文数据库建设、古代类书《册府元龟》引文的研究等。同时,刘根辉教授在课堂上现场演示了与学生们共同完成的数据库的运行和操作过程,向大家进一步介绍数字人文的强大和魅力所在。同时,刘根辉教授以此为例,鼓励同学们积极学习计算机技术,把计算机技术和语言研究深度结合,不畏难,大胆做,勿将人文与科技割裂开来,融会贯通,提升研究效率,做到敢为人先。
紧跟时代,刘根辉教授也谈到了生成式AI的强大所在和未来发展前景。他指出,生成式AI作为一种新出现的AI模式,的确为人文的学习提供了便利。但也正因如此,他借“本科生答辩用AI帮写论文之事”强调底线意识和自主研究的重要性,同时指出目前 AI的缺憾,包括模型错误、生成系错误、搜索引擎不够灵敏等,进一步帮助同学们深刻认识AI,强化自主研究精神与意识。
最后,刘根辉教授向大家介绍了课题组最新的AI九思项目。正在开发中的AI九思语言大模型,利用大量的文本数据来学习语言的统计特征,进而生成具有相似统计特征的新文本。他介绍到,这种技术可以为用户提供古汉语问题的专业回答,还可以更好指导模型处理古汉语文白话翻译、句读标点、实体识别等任务,进一步为学院的人文研究助力,以期成为古代汉语大语言模型发展的试金之石、引玉之砖。
在互动交流环节,刘根辉教授耐心回复了同学们提出的问题,他以专业性的介绍进一步讲明了古代汉语与人文的关系,特别是在学科交叉融合的困境上该如何解决,再次鼓励大家努力学习计算机技术。
人文学院党委副书记叶智进行总结发言。他认为,计算机是现代语言文字研究必不可少的要素,同时再次强调数字和人文的结合与发展,鼓励师生去了解接触此类数字运用项目,赋人文以科技,使人文学科在新时代焕发新生机。
随着刘根辉教授的精彩讲座圆满结束,人文学院数字人文赋能课程也翻开了崭新的一页。数字人文赋能课程让大家看到了科技与人文的深度融合,感受到了数字技术在文科研究领域的巨大潜力和二者结合后的实践成效。相信在不久的将来,数字人文将会迎来更加广阔的发展前景,人文学子也将在推动汉语言现代化发展的道路上笃行不怠!
华中科技大学人文学院
图片 / 任媛媛
文字 / 刘铭轩
编辑 / 文钰灵
审核 / 叶智 王勇