讲座预告|唐旭日:搭配自动抽取与可视化分析

文摘   2024-08-13 08:00   中国澳门  

澳大-南师 语料库与数字人文暑期学院

第四讲


搭配自动抽取与可视化分析



时 间:2024年8月13日

    15:00-1700

主讲人:唐旭日

    华中科技大学 教授

直播链接:http://live.bilibili.com/1728480216



内容提要


搭配是一种语言现象,基于词语搭配可以初步获取词语的句法模式、语义韵、语义选择限制,进而为文体分析、话题分析、话语分析等提供量化证据,是故搭配在二语习得、话语分析、文体分析等应用语言学领域中得以广泛研究和运用。搭配工具的开发和应用在计算语言学(自然语言处理)和语料库语言学领域备受关注。讲座分析了现有搭配工具如AntConc、WordSmith等存在的局限性以及新提出的搭配网络的可视化方式问题,介绍基于PERS_UM搭配模型提出的搭配自动抽取及可视化方法的理论基础和具体应用案例。该方法以Firthian搭配理论为基础,给出全新的搭配形式化定义,并籍此开发了一系列计算工具,包括搭配可视化、语义抽象和相似度计算等,以支持基于Firthian搭配开展直观、多维和全面的语言比较分析,支持多种研究场景下的语言对比研究。讲座以近义词辨析和二语习得者搭配能力的量化分析为例,详细説明该工具的Python代码实现、语料库导入、数据分析方法、基于数据驱动的理论构建等,展示该方法在词性标注、句法分析等自然语言处理工具还不成熟的语言或子语言类型中的应用价值。



主讲人简介

唐旭日,博士,华中科技大学教授,中国中文信息学会自然语言生成与智能写作专委会委员,中国英汉语比较研究会外语教育技术专业委员会常务理事,中国人工智能学会会员,现任华中科技大学外国语学院语言研究中心主任,《信息技术与语言服务》省级一流课程负责人。研究方向为计算语言学,研究领域涉及语义演变计算、计算机辅助翻译、数据驱动话语分析、搭配计算以及隐喻计算等,主持2项国家社科基金,并作为主要成员参与多项国家社科基金、国家自然科学基金以及国家863高新技术等国家级课题。在International Journal of Corpus Linguistics, Natural Language Engineering, World Wide Web, Review of Cognitive Linguistics,《武汉大学学报(信息科学版)》、《中文信息学报》、《当代语言学》、COLING、 CCL等权威刊物和会议发表论文30多篇,出版专著1部,教材2部,申请发明专利2项。


主办单位

澳大-南师 语料库与数字人文暑期学院



镜海语言学
澳门大学语言学研究中心官方公众号
 最新文章