澳大-南师 语料库与数字人文暑期学院(1号通知)

文摘   2024-07-10 09:01   中国澳门  

转载自:“比特人文”公众号

随着大数据和人工智能技术的发展,语言学、历史、文学等人文研究都越来越多地引入了计算技术。人文学科与计算技术的交叉研究,关键在于人文大数据的构建。为推动计算语言学与数字人文的学科建设与人才培养,澳门大学人文学院和南京师范大学文学院协作,将于2024年8月10日-18日在澳门大学人文学院,通过线上线下结合的形式举办语料库与数字人文暑期学院,包括讲习班和讲座交流两大部分。


讲习班课程将以开源免费软件“MySQL数据库+PHP编程语言”为主要平台,以开源的全唐诗、北大人民日报语料库等数据为例,介绍语料库的构建方法、字符集编码以及计量分析方法。暑期学院还将邀请计算语言学和数字人文领域的知名学者开展学术讲座等交流活动。

01

 课程计划

 第一讲:课程简介与软件安装

 第二讲:数据表的构建

 第三讲:数据库的查询

 第四讲:PHP程序设计

 第五讲:字符编码

 第六讲:字符串处理

 第七讲:交互式网站搭建

 第八讲:课程汇报


讲师团:

主讲:李斌 常博林

助教:卢芃秀 戴俊阳 韩晓晓 谢锋 王乐致 (报名中)

课程目标:掌握诗词网站的构建技术和人文数据的结构化方法。

上课方式:  线上腾讯会议,8次课程,每次2小时(一般安排在晚上7-9点),全部免费,时间为下午和晚上。每次课后QQ群答疑1小时。

面向对象:数字人文、语料库语言学等相关学科的本科生、研究生,部分青年教师。采取线上报名的方式,总计不超过110人。其中,澳大南师的学员线上录取不超过30人,线下仅限澳大学生参加,不超过30人;其他单位的学员线上录取人数不超过50人。零基础或编程初学者,具备英语四级及以上水平,即可报名。已具备计算机相关专业背景请勿申请

结课方式以构建独立的人文数据库网站为考核目标,每位学员须录制三分钟视频讲解自己构建的数据库网站。

温馨提示建议学员上传个人简历、研究基础和学习目标。

注意事项为保证学习效果,课程报名成功后无特殊原因不得中途退出课程学习,并按时交作业。最终录取结果将通过邮件推送。欢迎各位对语料库和数据库编程应用技术感兴趣的同学踊跃报名!

 


02

 第一届讲习班回顾

2024年1月13日-22日的寒假讲习班,共有200多位学员报名,最终线上录取了70名学员。经过十天学习后,开发出40多个可用的数据库检索平台并在线展示,多位专家在线点评,进行开发指导和应用前景规划。共有60多名学员获得优秀或合格证书。

(2024寒假班学员汇报的优秀数据库系统合集

在上届讲习班期间特邀计算语言学领域专家、学者进行讲座,通过分享相关研究方法、研究经验、研究成果以拓展学员的研究视野。

作为第二届讲习班,本次课程在澳门大学设置线下会场招收本地30名学员,线上招收80名学员。


03

 系列讲座

暑期学院邀请计算语言学和数字人文领域的知名学者展开系列讲座,介绍前沿进展、理论基础、方法与技术,为广大学员提供在线研讨学习的机会。

(一般安排在下午3-5点,具体时间开课前一周推送)


讲座:澳门大学 袁毓林教授 《如何测试ChatGPT的语义理解与常识推理水平》

袁毓林,原北京大学中文系教授,博士生导师,现为澳门大学人文学院中国语言文学系讲座教授。主要研究理论语言学和汉语语言学。在《中国社会科学》、《中国语文》、《当代语言学》和《中文信息学报》等刊物发表论文100余篇,出版《语言的认知研究和计算分析》等10余部著作。多次获得教育部“高校科学研究优秀成果奖”。入选教育部长江学者特聘教授,国家“万人计划”哲学社会科学领军人才。


讲座:中国人民大学 卢达威博士《正则表达式的语料库应用》

卢达威,博士,中国人民大学文学院讲师,硕士生导师,中国人民大学吴玉章青年学者,澳门大学访问学者,中国中文信息学会青年工作委员会委员。研究方向为计算语言学,主要方向包括汉语小句复合体研究、语言资源建设等。在《中国社会科学》《中文信息学报》《语言教学与研究》等重要期刊发表论文10余篇,主持国家社科基金、教育部人文社科基金、国家语委重点项目、中国博士后科学基金等省部级以上项目4项,出版专著1部。


讲座:北京师范大学 胡韧奋副教授 《浅探语言智能技术驱动的人文研究

胡韧奋,博士,研究方向为计算语言学、计算机辅助语言教学、古汉语信息处理,北京师范大学国际中文教育学院数字人文系副教授、硕士生导师,中文信息学会青工委成员,主持国家社科基金青年项目、国家自科基金青年项目等多项课题,在国内外高水平刊物和计算机领域顶会发表学术论文40余篇,获国家发明专利授权5项,作为主持人或核心成员构建了中文词向量资源库、CCA中文搭配助手、古诗文断句标点系统、“AI太炎”古汉语大语言模型等资源和应用。


讲座:华中科技大学 唐旭日教授《搭配自动抽取与可视化分析》

唐旭日,博士,华中科技大学教授,中国中文信息学会自然语言生成与智能写作专委会委员,中国英汉语比较研究会外语教育技术专业委员会常务理事,中国人工智能学会会员,现任华中科技大学外国语学院语言研究中心主任,《信息技术与语言服务》省级一流课程负责人。研究方向为计算语言学,研究领域涉及语义演变计算、计算机辅助翻译、数据驱动话语分析、搭配计算以及隐喻计算等,主持2项国家社科基金,并作为主要成员参与多项国家社科基金、国家自然科学基金以及国家863高新技术等国家级课题。在International Journal of Corpus Linguistics, Natural Language Engineering, World Wide Web, Review of Cognitive Linguistics,《武汉大学学报(信息科学版)》、《中文信息学报》、《当代语言学》、COLING、CCL等权威刊物和会议发表论文30多篇,出版专著1部,教材2部,申请发明专利2项。


讲座:南京农业大学 王东波教授《古籍大模型“荀子”的开发与应用》

王东波,南京农业大学信息管理学院教授、博士生导师。主要从事古籍智能信息处理、科技文本知识挖掘研究。主持国家社科基金重大项目、国家自然科学基金面上、青年、国家社科基金特别委托项目及其他省部级项目共计12项。发表SCI、SSCl、EI、CSSCI检索论文120篇。先后获得江苏省哲学社会科学优秀成果一等、二等和三等奖四次,高等学校科学研究优秀成果奖(人文社会科学)二等奖和三等奖各一次。先后入选江苏省社科优青、江苏省第六期“333工程”第二层次培养对象和江苏高校“青蓝工程”中青年学术带头人等人才项目。


讲座:社科院民族所 龙从军研究员《民族语言OCR文字识别最新进展与应用

龙从军,中国社会科学院民族学与人类学研究所民族语言文化行为实验室研究员,主要研究方向为藏语计算语言学和语料库语言学。已发表学术专著3部(含合著),编著1部,发表研究论文50余篇,研制了100万词级的藏文分词、词性标注语料库,10万词级的藏文树库,并设计开发了系列配套藏文信息处理工具。近期在藏文、彝文的OCR领域取得诸多重要研究进展。

04

 报名方式

报名方式:扫码填写以下报名表,7月20日截止。


协办单位(排名不分先后)

中国民族语言学会语言资源与计算人文专委会

中国古籍保护协会古籍智能开发与利用专委会

南京师范大学语言科技研究所

南京师范大学语言大数据与计算人文研究中心


镜海语言学
澳门大学语言学研究中心官方公众号
 最新文章