CSSNLP 2023 将围绕大模型主题,从群体智能、知识工程、多语言、推荐系统、上下文学习等角度展开深入探讨,邀您现场和特邀嘉宾面对面交流。第四届中国自然语言处理学生研讨会(The China Student Symposium on Natural Language Processing, CSSNLP 2023)将于2023年12月30日(周六)09:00-17:20在北京中国科学院自动化研究所智能化大厦三层学术报告厅举办(线上同步直播),该会议由中国中文信息学会青年工作委员会主办,由中国科学院自动化研究所承办,社区支持为智源社区、MLNLP社区,旨在为国内研究人工智能与自然语言处理等相关领域的学生搭建更广阔、更便捷的交流平台,促进人工智能领域可持续发展。本次会议由中国科学院计算技术研究所冯洋研究员、中国科学院自动化研究所刘康研究员担任大会主席,由张绍磊(中国科学院计算技术研究所)、高珲(天津大学)担任程序委员会主席。本次会议包含特邀报告、前沿论坛、博士生论坛和学生研讨会四个环节。本次会议邀请了清华大学刘知远副教授、中国科学院软件研究所韩先培研究员进行特邀报告,邀请了北京大学冯岩松副教授、清华大学侯磊助理研究员进行前沿分享,邀请了郑值(中国科学技术大学)、王乐安(北京大学)、房庆凯(中国科学院计算技术研究所)、周昆(中国人民大学)、张静(天津大学)于博士生论坛和学生研讨会分享研究成果和科研心得。CSSNLP 2023 将围绕大模型主题,从群体智能、知识工程、多语言、推荐系统、上下文学习等角度展开深入探讨和交流,旨在为自然语言处理研究领域内的中国青年学者提供一个学术交流平台,同时鼓励更多的青年学者关注自然语言处理前沿研究,展示最新科研成果,促进国内青年学者的思想交流和学术合作,进而推动自然语言处理领域的发展。● 时间:2023年12月30日(周六)09:00-17:20● 地点:北京市中国科学院自动化研究所智能化大厦三层学术报告厅
清华大学计算机系副教授、博士生导师。主要研究方向为自然语言处理、知识图谱和社会计算。已在ACL、EMNLP、IJCAI、AAAI等人工智能领域的著名国际期刊和会议发表相关论文200余篇,Google Scholar统计引用超过3.9万次。入选北京智源研究院青年科学家、2020-2022连续3年Elsevier中国高被引学者、《麻省理工科技评论》中国区35岁以下科技创新35人榜单、中国科协青年人才托举工程。
摘要:2023年以来ChatGPT引爆了全球对大模型技术与应用的热烈关注,本报告首先简介人工智能的发展历程,阐明大模型技术的历史地位;然后,报告介绍大模型的智能涌现等特性,探讨大模型在群体智能方面的发展趋势和技术动态。
中科院软件所研究员及中文信息处理实验室副主任,主要研究方向为自然语言理解、大模型及知识图谱。承担中科院战略先导、科技创新2030课题、国家重点研发专项等十余项课题。在ACL、SIGIR、IJCAI等重要国际会议发表论文60余篇。入选国家优青、中国科协青年人才托举计划及北京智源青年科学家,担任中国中文信息学会理事及语言与知识计算专业委员会副主任。相关成果获中国中文信息学会汉王青年创新奖一等奖及科学技术奖一等奖。摘要:近年来,以ChatGPT和GPT-4为代表的大规模语言模型展现出了强大的知识记忆、知识推理和知识应用等能力,引导了新一轮的技术范式变革。然而,大模型的知识机制仍然尚未明确,同时大模型以分布式表示和大规模预训练为核心,展现出了与传统知识工程截然不同的特性,对大模型的应用落地提出了新的挑战。本报告将探讨以GPT为代表的大模型的知识机制和知识工程,并介绍实验室在知识记忆、知识传播、知识评估方面的一些探索。
北京大学王选计算机研究所副教授,主要研究方向包括自然语言处理、法律人工智能。担任ACL Rolling Review 高级执行编委,自然语言处理领域重要国际会议ACL、EMNLP、NAACL、EACL等的高级领域主席或领域主席。相关研究成果发表在 ACL、EMNLP、NAACL、TPAMI、AIJ 等自然语言处理领域顶级会议及期刊上。承担多项国家自然科学基金,科技部 863 计划和重点研发项目课题。摘要:大语言模型惊人的语言理解和生成能力经常体现在英语、汉语等资源丰富的语种上,而对那些受关注较少、可用语料非常有限的低资源语种而言,大模型的表现并不尽如人意。在本次报告中,我们将重点关注哈萨克语、蒙语、壮语等几种少数民族语言,分别从高质量语料收集、书写系统差异、稀缺资源利用等几个方面讨论在大模型时代如何促进低资源语种智能信息处理的相关研究。
清华大学计算机系知识工程实验室助理研究员。2016年获得清华大学博士学位,博士期间曾访问比利时鲁汶大学和新加坡国立大学。主要研究方向为网络环境下的知识工程,中国中文信息学会语言与知识计算专委会委员,担任TKDE、AAAI、ACL、EMNLP等领域重要国际期刊/会议审稿人。以第一作者或通信作者在AAAI、IJCAI、ACL、EMNLP、TOIS等国际重要学术会议和期刊上发表论文40余篇,曾获ACL 2023最佳演示系统论文奖、EMNLP 2023杰出论文奖。主持和参与多项国家级、部委级和国际合作项目,包括国家重点研发计划项目、国家自然科学基金重点项目和企事业单位合作项目,其中与阿里巴巴公司合作的“千亿级商品知识图谱的构建与应用”获得2020年中国中文信息学会钱伟长中文信息处理科学技术奖一等奖。摘要:近来,大语言模型展现出了强大的语言理解和知识掌握能力,极大地改变了知识工程和自然语言处理领域的研究范式。本报告简述团队对于大模型与知识工程的一些思考,主要介绍针对其知识能力的评测,具体包括:探索了开放信息抽取对多样句法结构的鲁棒性,梳理规范了事件抽取的不同范式和预处理方式,提出了面向知识密集型任务的编程语言,最后将上述任务统一到以布鲁姆认知理论组织的评测框架中。
中国科学技术大学三年级博士,中国中文信息学会青年工作委员会学生执委会副主任,导师为熊辉教授与徐童教授。于2019年获得中国科学技术大学学士学位,主要研究方向为自然语言理解与推荐系统。在KDD,WWW,AAAI,TOIS等国际重要学术会议与期刊上发表论文10余篇并担任审稿人。曾获得博士国家奖学金,腾讯犀牛鸟精英人才计划奖学金,元庆奖学金,深交所奖学金等奖励。摘要:随着大语言模型在众多任务上的成功,越来越多的研究者开始聚焦于探索大语言模型在推荐系统中的应用。本报告将首先对大语言模型在推荐系统中的应用建立分类体系,并分别介绍判别式大语言模型和生成式大语言模型在推荐系统中的建模范式与代表性工作。随后,本报告将简述团队在利用大语言模型进行图数据理解并进行工作推荐的相关研究。
王乐安,北大博士生,由孙栩老师指导。他目前的研究兴趣主要在于大模型的可解释性与机理。他在EMNLP 2023上发表的工作Label Words are Anchors: An Information Flow Perspective for Understanding In-Context Learning获得了最佳长论文奖。在此之前,他在北大图灵班(智能方向)获得了学士学位。报告主题:以标签为锚:从信息流动的视角分析上下文学习摘要:上下文学习是一种在大语言模型时代常用的小样本学习方法。它通过向大语言模型提供示例样本的方式,引导模型完成指定的任务。上下文学习无需参数更新,直观易用,非常契合大语言模型时代的需求。近来,已经有许多工作从不同角度分析了上下文学习。一些工作分析了上下文学习中示例的格式与排列组合对性能的影响,还有一些工作则尝试建立起上下文学习同梯度下降算法的联系,也有工作指出了上下文学习中任务向量的存在。我们的工作从信息流动的角度审视了上下文学习,提出并验证了“标签词在上下文学习中起锚点作用”的假设。根据这个假设,在模型的浅层,大语言模型会将示例文本中的信息汇总到相应示例的标签上,而在模型的深层,大语言模型会进一步从这些标签中提取信息来完成最终预测。本文设计了测量显著性的实验、阻断注意力的实验、测量注意力大小与分类结果相关性的实验,以验证这一猜想。进一步地,本文基于这一假设,提出了三个潜在应用:锚点重加权、仅含锚点的上下文压缩和基于锚点距离的错误诊断。这些应用展示了本文的分析结论的应用潜力,可以提高上下文学习的性能、效率,并在一定程度上解释上下文学习中出现的错误。同时,这些应用也从另一个侧面进一步证实了我们的假设。
中国人民大学信息学院2020级博士研究生,专业为大数据科学与工程,导师为文继荣教授与赵鑫教授,其研究关注自然语言处理和信息检索。至今为止已在领域内顶级会议上以第一作者身份发表论文十余篇。曾获2022年百度奖学金、2022年字节跳动奖学金、2022年微软学者奖学金等荣誉。报告主题:如何在新领域内开展科研——以大语言模型方向为例摘要:近几年来,AI社区涌现出许多新技术,在快速革命领域内方向的同时,也为研究者们带来巨大的新技术学习的压力。本报告将从讲者本人的角度,以大语言模型方向为例,介绍一名普通的博士生如何快速入门新领域,为同样有类似焦虑的同学们提供参考。
天津大学智能与计算学部2022级博士研究生,专业为计算机科学与技术,导师为张鹏教授,其研究关注于模型压缩与LLM Agent,曾发表四篇CCF A类会议(期刊)论文。曾获2021年天津大学华为奖学金。摘要:与个人研究工作流中的自主性不同,合作研究的工作流程往往更为复杂,但也相对能够整合更多资源并实现更迅速的成果产出。本报告将基于我个人从研究生一年级到博士二年级的研究历程,旨在探讨以更好、更快形成研究成果为目标时,如何从主导者和辅助者的角度体验合作研究。
大会主席:冯洋
冯洋,中科院计算技术研究所研究员、博士生导师、自然语言处理团队负责人,入选“新百星人才计划”,主要研究方向为自然语言处理、机器翻译和人机对话。担任中国中文信息学会青年工作委员会副主任、ARR Permanent Senior Action Editor以及ACL/EMNLP等会议高级领域主席/领域主席等。主导研发了百聆大模型,机器翻译方面的工作获得ACL 2019唯一最佳长文奖,为国内单位首次;获得2019年度CCF自然语言处理专委会 “青年新锐奖”、 “钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖等。
大会主席:刘康
中国科学院自动化研究所研究员,博士生导师,兼任中国科学院大学岗位教授、北京智源人工智能研究院青年科学家。研究领域包括自然语言处理、文本信息抽取、知识图谱、问答系统等。在自然语言处理、知识工程等领域国际重要会议和期刊发表多篇学术论文,出版《知识图谱》等专著2部、译著2部。曾获COLING 2014最佳论文奖、Google Focused Research Award、北京市科学技术进步一等奖等多项学术奖励。相关研究获得国家自然科学基金委优秀青年基金、中科院先导专项课题、科技部2030重大项目课题支持。
程序委员会主席:张绍磊
中国科学院计算技术研究所博士生四年级,导师为冯洋研究员。主要研究方向为自然语言处理、同声传译、大语言模型。以第一作者在ACL、NeurIPS、ICLR等国际会议中发表论文10余篇,曾获第二届国际同声传译测评比赛(AutoSimTrans 2021)流式输入赛道冠军。担任中文信息学会青年工作委员会学生执委会主任、ARR Action Editor/Area Chair。
程序委员会主席:高珲
天津大学三年级博士生,导师为张鹏教授,主要研究方向为量子信息检索、语言建模与评估等。在SIGIR, NeurIPS, IP&M等国际会议与期刊上发表多篇论文并与导师共同出版量子语言模型专著,现担任中文信息学会青年工作委员会学生执委会副主任。
Session主席:房庆凯
中国科学院计算技术研究所三年级直博生,导师为冯洋研究员。主要研究方向为自然语言处理、机器翻译、语音翻译。以第一作者在NeurIPS、ACL上发表CCF-A类论文5篇。曾获CCMT机器翻译评测第一名。多次担任ARR、ACL、EMNLP等会议审稿人。现担任中国中文信息学会青年工作委员会学生执委。
扫码报名 现场参会
地点:中国科学院自动化研究所智能化大厦三层学术报告厅*注意:现场参会报名时间截止至12月28日22:00。报名后请加入微信交流群,当前请持本人身份证进入中国科学院自动化研究所智能化大厦。
CSSNLP 2023交流群