2024年10月17-18日,“语言计量与数字人文”暨第七届计量语言学学术研讨会在南京成功召开,会议由南京师范大学文学院、南京农业大学信息管理学院、北京语言大学语言科学院计量语言学研究中心联合举办,南京师范大学文学院承办。本次会议吸引了来自全国各地的众多学者参与,包括语言学、计算语言学、信息科学和数字人文等多个领域的专家,共同探讨计量语言学与数字人文的跨学科融合与前沿研究。会议共进行了7场特邀报告和16个口头报告,以及100个海报展示,共有约180名师生参加了本次会议。
会议开幕式由南京师范大学文学院教授梁丹丹主持,南京师范大学党委常委、副校长张连红教授,北京语言大学计量语言学研究中心主任于水源教授、南京师范大学文学院副院长孙道功教授分别致欢迎辞,对各位参会来宾的到来表示感谢,并预祝大会圆满成功。
南京师范大学副校长张连红教授
张连红校长对参会专家的到来表示衷心感谢,强调交叉学科在当今人才评价和培养中的重要性和迫切性,鼓励同学们积极投身新兴交叉领域学习,并预祝本次大会圆满成功。
南京师范大学文学院梁丹丹教授
北京语言大学计量语言学研究中心主任于水源教授
南京师范大学文学院副院长孙道功教授
著名计算语言学家、新疆大学冯志伟教授在线上进行了题为《大数据时代的语言文字资源规划》的主题报告。语言规划是指政府或社会团体为了解决在语言交际中出现的问题有计划有组织地对语言文字进行的各种工作和活动的统称,冯教授认为语言规划是对现代语言学描写主义的一个必要补充,并指出语言规划具有权威性、交际目的性、长期性、实践性等特征,提出在大数据和大语言模型时代,语言数据在统计机器翻译、神经机器翻译、大语言模型等领域中都具有重要作用,并对大数据时代语言文字资源规划提出了几点建议。
新疆大学冯志伟教授(线上)
内蒙古大学副校长达胡白乙拉教授围绕《关于蒙古语数字人文研究的几点思考》这一主题,从数字化与蒙古语研究、数字化与蒙古文学的研究、数字化与蒙医药的研究和对蒙古语研究的现状与未来展望这四个方面做了精彩汇报,认为面对数字人文这个跨学科、跨领域研究的迅猛发展,蒙古语数字化研究亦需紧跟时代步伐,促进数字人文各领域的深度发展。
内蒙古大学副校长达胡白乙拉教授
复旦大学外文学院副院长郑咏滟教授汇报了《21世纪以来语言与文学领域数字人文研究文本计量分析》,指出学科之间具有不可分割性,学者们需要认识到“超学科”这一转向的必然性,并指出我们在研究中不仅仅要把文学作品数字化,还需要努力使已经数字化的文本让其从细读向远观转化,用技术的手段解决文学本身的问题,这也体现出数字人文技术加速了不同学科之间的融合进程。
复旦大学外文学院副院长郑咏滟教授
南京农业大学信息管理学院王东波教授在线上作了《中国古代典籍跨语言语料库构建》的特邀报告。他指出,由于古籍文本的语言特点与现代汉语有显著差异,且受到古代汉语文献获取、标注难度的限制,现有的古代汉语语料库的规模和标注深度都较为有限,所以由南京农业大学、南京师范大学等院校组成的研究团队进行了以二十四史以及对应的现代汉语翻译文本为基础的跨语言词性标注语料库的构建,并介绍了其构建的过程和方法,这一研究旨在为古代汉语数字人文下的探究提供相应的数据支撑,促进古籍智能信息处理,弘扬优秀传统文化。
南京师范大学文学院李斌教授报告了《人工智能时代的语言研究》,提出在人工智能时代,语言研究迎来了前所未有的机遇与挑战,而人工智能技术,特别是自然语言处理(NLP)、机器学习和深度学习的应用能够显著提升语言研究的效率和准确性。信息量对于语言理解和生成两大过程的建模,以及大语言模型技术对于语言学理论创新具有很大的启示意义。然后依次介绍了南师大团队在古汉语资源建设、计量研究和计算应用方面的成果,特别是汉-古-英三语检索的古汉语词义检索平台的开发情况。
南京师范大学文学院李斌教授
国防科技大学外国语学院李德俊教授报告了《谈人文知识智能计算的面向》这一议题,认为对于当前基于预训练的生成式人工智能来说,虽对语言意义的理解取得了显著进步,也即“真”,但对“善”(作者的意义)和“美”(诠释者的意义)亟待完善,所以如何基于文本进行适合时代或读者需求的诠释对人工智能算法来说也同样重要。
国防科技大学外国语学院李德俊教授
会议发起人浙江大学求是特聘教授、教育部长江学者刘海涛教授,做了题为《从语言数据到语言智能——数智时代对语言研究者的挑战》的特邀报告。他指出,基于“数据智能或数基智能”,目前的大模型只是采用了非传统的方式快速复制了人获得知识的过程,这为我们研究提供了新的思路,并指出在“数据→模式→知识→网络→智能”链条中,语言研究的重点可放在模式和网络这两个环节上。
浙江大学外国语学院刘海涛教授
本次会议还安排了海报张贴两个场次,会议录用的约100篇海报在文学院前庭进行展示,专家学者和海报讲者进行了100分钟的深入交流和探讨。
海报现场拍摄合集
南京师范大学冯敏萱副教授
本次会议的四组口头汇报分别由语言文字应用编辑常文斐老师、华侨大学华文教育研究院郝瑜鑫教授、大连大学外国语学院副院长刘江教授、温州商学院国际学院院长王琳教授主持。分别由16位讲者报告:浙江大学杨牧博士、中国社会科学院语言研究所薛嗣媛助理研究员,华中科技大学唐旭日教授、温州商学院王琳教授、南京师范大学冯敏萱副教授、华东师范大学柏晓鹏副教授、浙江大学外国语学院“百人计划”研究员阎建玮老师、国防科技大学原伟副教授、复旦大学秦文娟副教授、贵州大学陈蕊娜教授、南京农业大学刘浏副教授、华侨大学华文教育研究院郝瑜鑫教授、复旦大学黄河副研究员,上海财经大学外国语学院李文平副教授、南京师范大学许超副教授。报告异彩纷呈,包括:《QuantLing:计量语言学工具包的开发》、《大语言模型在汉语写作智能反馈的应用研究》、《现代汉语动词搭配构式的自动构建和应用》、《汉英语码转换中汉语动词概率配价的句法差异研究》、《古汉语分级阅读研究》、《现代汉语分级阅读研究》、《The complexity trade-off between morphological richness and word order freedom in Romance》、《语言规划视域下突厥语文字改革的计量研究》、《省力与表达力的博弈——基于依存语法的大模型翻译与人工翻译对比研究》、《依存语法与门策拉-阿尔特曼定律视角下词块化对英语文本句法复杂性的影响》、《<二十四史>词语风格的计算和对比研究》、《句法复杂度与汉语第二语言水平的关系:一项跨母语背景的研究》、《验证“古森斯假说”:高频词具有更规则的地理分布吗?》、《日语学习者书面语和口语句法复杂度计量研究》、《数字人文与语言计量研究中的可视化分析》进行了前沿动态的研究报告。
在讨论环节中,参会者们积极互动,交换了丰富的学术见解。大家一致认为,计量语言学与数字人文的融合不仅为学术研究提供了新的工具和方法,也为解决实际应用问题提供了广阔的空间。
闭幕式上,北京语言大学计量语言学研究中心主任于水源教授、浙江大学求是特聘教授刘海涛教授和南京师范大学文学院李斌教授分别致辞,感谢了各位参会专家、学者的积极参与,和为会议提供支持的主办方和承办方,特别感谢了会务组及志愿者的辛勤付出。刘海涛老师特别指出,人类如何与数智体共生,如何让其始终作为人类的伙伴和工具,需要大家共同付出艰辛的努力!组委会表示,希望通过本次大会,进一步加强国内外学术界的合作交流,推动计量语言学与数字人文研究向更深层次发展。大会在热烈的掌声中圆满闭幕。
图文来源:比特人文 文学院
排版:杨梦鸽
审核:张晓锋 徐砚田