COLING(INTERNATIONAL CONFERENCE ON COMPUTATIONAL LINGUISTICS)会议是国际自然语言处理领域最高级别的学术会议之一,主要是为促进人工智能在自然语言处理领域的研究和为相关研究人员、从业人员、科学家以及附属学科工程师提供一个良好的学术交流平台。COLING 2022正式会议将于今年10月12日召开。
COLING 2022论文预讲会由中国中文信息学会青年工作委员会主办、智源社区支持的学术活动,该活动邀请被COLING 2022会议录用的文章作者进行报告交流,旨在加强国内相关学者之间的交流,为国内学者和研究人员提供更快速更便捷的学习机会,同时为不能现场参会的人员提供一次学术分享,从而促进我国自然语言处理研究的发展,本次预讲会将在9月17日09:00-17:50于线上举办。
本次会议由中科院计算技术研究所冯洋研究员和中国人民大学严睿长聘副教授担任大会主席,由张绍磊(中科院计算技术研究所)、王思远(复旦大学)、姚远(清华大学)担任程序委员会主席。本次论文预讲会主要以线上口头报告的方式进行,共征集COLING 2022会议论文34篇,分为4个Session,包含自然语言分析和应用、知识和推理、信息检索、推荐系统、机器翻译、情感分析、对话控制和生成、自然语言生成、语言模型和跨语言处理等热点研究问题和方向,由谷舒豪(中科院计算技术研究所)、周昆(中国人民大学)、邓淑敏(浙江大学)和高珲(天津大学)担任Session主席。
本次活动还邀请复旦大学魏忠钰副教授和卡耐基梅隆大学刘鹏飞博士带来两场特邀报告,分别名为“跨视觉语言模态的联合语义学习和决策 – 任务和模型”和“reStructured Pre-training 是如何在今年高考英语中取得134分好成绩的?” 。两位嘉宾将和大家共同探讨自然语言处理的前沿研究!
冯洋,中科院计算技术研究所研究员、博士生导师、新百星人才引进计划入选者、自然语言处理团队负责人、中国人工智能学会首批杰出会员,主要研究方向为自然语言处理、机器翻译和人机对话。在自然语言处理领域顶级会议ACL发表长文20多篇,担任中文信息学会青年工作委员会副主任、ARR Permanent Senior Action Editor以及ACL/EMNLP会议高级领域主席/领域主席等。机器翻译方面的工作获得ACL 2019唯一最佳长文奖,并获CCF自然语言处理专委会 “青年新锐奖”、 “钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖等,并主持自然科学基金面上项目、国家重点研发计划重点专项等项目。
严睿,长聘副教授,中国人民大学。主要研究方向是人机对话与文本生成,发表论文100余篇,引用7000余次,入选中国人民大学杰出学者、智源人工智能研究院智源学者、微软亚洲研究院铸星学者。多次担任国际顶级学术会议的领域主席/资深评审委员,多次受邀于国际顶级学术会议宣讲教程报告。
张绍磊,中国科学院计算技术研究所博士生三年级,导师为冯洋研究员。主要研究方向为自然语言处理、机器翻译、同声传译。以第一作者在ACL、EMNLP等自然语言处理领域顶级国际会议中累计发表论文7篇。在第二届国际同声传译测评比赛(AutoSimTrans2021)文本到文本赛道中获得冠军。现担任中文信息学会青工委学生执委会主任。
王思远,复旦大学数据智能与社会计算实验室博士生,导师为魏忠钰副教授,研究方向为自然语言处理、文本推理。以第一作者/共同一作在ACL、EMNLP、AAAI、TASLP等人工智能会议和期刊发表论文多篇。现担任中文信息学会青工委学生执委会副主任。
姚远,清华大学自然语言处理实验室博士生,研究方向为信息抽取和知识图谱,导师为刘知远副教授。以第一作者/共同一作在ACL、EMNLP、AAAI、ICCV、ECCV、Nature Communications等国际顶级人工智能会议和期刊发表论文多篇。
谷舒豪,中科院计算技术研究所博士生,导师为冯洋研究员。他的研究方向为多语言多领域神经机器翻译,目前已在ACL、EMNLP、NAACL等自然语言处理会议上发表论文5篇,并多次担任相关会议审稿人。他曾分别在腾讯微信翻译团队和民汉翻译团队进行实习,相关实习成果落地线上系统。他还曾参加全国机器翻译比赛,并获得藏汉翻译比赛第一名。
周昆,中国人民大学博士生三年级,导师为赵鑫教授和文继荣教授。主要研究方向为预训练语言模型、信息检索。以第一作者身份在ACL、KDD、WWW等顶级国际会议中累计发表多篇论文。两篇论文被PaperDigest选中为Most Influential KDD & CIKM Papers之一。现担任中文信息学会青工委学生委员。
邓淑敏博士于今年六月份毕业于浙江大学计算机学院,即将赴新加坡国立大学计算机学院担任博后研究员,研究方向是:低资源场景下知识图谱构建方法研究,主要涉及知识图谱、信息抽取以及神经符号推理。目前是青工委的学生委员,在国际会议和期刊发表论文多篇,并担任审稿人。曾获2022年浙江省优秀毕业生、2020年度阿里巴巴集团学术合作杰出实习生等荣誉称号。
高珲,天津大学量子智能与语言理解实验室二年级博士生,师从张鹏教授,主要研究方向为量子信息检索与语言建模。在SIGIR,IP&M,INTERSPEECH,ICONIP等会议与期刊上发表多篇论文。承担天津市研究生科研创新项目,参与天津大学-中科闻歌联合实验室项目并合作申请多项专利。
张家俊,中国科学院自动化研究所研究员、博士生导师,主要研究方向为机器翻译和自然语言处理,获得国家优秀青年科学基金资助,入选中国科协首届青年人才托举工程、中国科学院青年创新促进会优秀会员和北京智源青年科学家。发表CCF-A/B类论文80余篇,出版学术专著2部、译著1部,获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖、青年创新奖一等奖和2020年北京市科学技术奖一等奖等。担任中国中文信息学会理事、青年工作委员会主任和机器翻译专委会副主任。担任ACL/EMNLP/COLING的(资深)领域主席,以及《自动化学报》等期刊的编委。
个人介绍:复旦大学大数据学院副教授,智能复杂体系实验室双聘研究员,博士生导师,复旦大学数据智能与社会计算实验室(Fudan DISC)负责人,香港中文大学博士,美国德州大学达拉斯分校博士后。现任中国中文信息学会情感计算专委会副秘书长,社交媒体处理专委会常务委员兼秘书,青年工作委员会执委会副主任。担任多个重要国际会议包括EMNLP、ACL的领域主席和组织委员会成员。主要研究领域包括自然语言处理,社会计算和多模态智能交互技术,在国内外相关领域高水平会议及期刊发表论文80余篇。曾获得2019年度中国中文信息学会社会媒体处理新锐奖,2020年度华为技术优秀成果奖,2021年上海市启明星计划。
报告题目:跨视觉语言模态的联合语义学习和决策 – 任务和模型
报告摘要:视觉和语言是我们感知外部环境的重要方式,某种程度上说,它们是同一个客观世界的两套表示方法,并且互有侧重。近年来,深度学习的发展为跨视觉和语言领域的研究提供了便利,也催生了很多跨模态任务,包括跨模态检索、生成、视觉导航、决策等。本次报告将介绍跨视觉语言模态的联合语义学习任务和一种结合多粒度语义学习的建模思路,进一步的,我们会介绍两个面向跨视觉语言模态决策任务的工作。
个人介绍:刘鹏飞博士,卡耐基梅隆大学语言技术研究所博士后,与Graham Neubig教授联合创立Inspired Cognition。在自然语言处理及人工智能领域的顶级会议发表学术论文 50 余篇,谷歌学术引用4500余次。曾连续获得 ACL2021 Best Demo Paper,ACL2022 Outstanding Demo Paper奖项,以及获上海市计算机学会优秀博士论文,人工智能学会优秀博士论文,百度奖学金,微软学者,AI华人青年学者等荣誉。担任顶级会议ACL,EMNLP,NeurIPS 等领域主席。
报告题目:reStructured Pre-training 是如何在今年高考英语中取得134分好成绩的?
报告摘要:本次报告试图解读过去十年NLP技术发展的内在联系,寻找本质,并为NLP技术的发展寻求一种可能新的学习范式,我们称之为重构预训练(RST)。在这样的范式中,数据的作用将被重新强调,模型的预训练和下游任务的微调被视为一个数据存储和访问的过程。在此基础上,我们实现了一个简单的原则,即良好的存储机制不仅应该具有缓存大量数据的能力,还应该考虑访问的方便性。在实验上,RST模型不仅在来自各种NLP任务的52/55个流行数据集上超过了目前表现最好的对比模型。并且在高考英语中取得优异成绩:在参数为GPT3 1/16的情况下,比学生平均成绩高出40分,比GPT3高出15分。尤其值得一提的是,在2018年的英语考试(全国试卷III)中,RST获得了138.5分的高分。今年高考取得了134分的好成绩。
欢迎有兴趣参会的各位老师、同学和业界研究者扫描下方二维码,加入COLING 2022论文预讲会交流微信群,以便后期接收通知和沟通讨论!
点击“阅读原文”,进入大会官网,预约直播。