《前沿学术沙龙》-第一期·大模型研究综述

学术   2023-10-26 13:00   上海  


大语言模型已经成为了人工智能、自然语言处理领域的一项重要研究内容。为进一步普及最新大模型前沿动态,推动国内大模型技术进步,帮助更多同学了解、入门大模型相关研究,中国中文信息学会青年工作委员会举行《前沿学术沙龙》系列活动。《前沿学术沙龙》第一期聚焦于大模型研究的相关综述,由中国科学院计算技术研究所的冯洋研究员担任大会主席,中国科学院计算技术研究所的张绍磊担任主持人,邀请了中国人民大学的周昆、天津大学的沈田浩、苏州大学的章岳分享大模型技术、对齐、幻觉等大模型热点的综述研究,为感兴趣的学者、学生和工程师提供系统学习和交流的机会。《前沿学术沙龙》由中国中文信息学会青年工作委员主办,MLNLP社区、智源社区提供社区支持。



前沿学术沙龙直播信息

时间:2023年10月28日 9:00-11:30

腾讯会议:137-579-515

https://meeting.tencent.com/dw/CPym5Swzs9te


日程安排



前沿学术沙龙交流群



大会主席

冯洋,中科院计算技术研究所研究员、博士生导师、自然语言处理团队负责人,入选“新百星人才计划”,主要研究方向为自然语言处理、机器翻译和人机对话。担任中国中文信息学会青年工作委员会副主任、ARR Permanent Senior Action Editor以及ACL/EMNLP等会议高级领域主席/领域主席等。机器翻译方面的工作获得ACL 2019唯一最佳长文奖,为国内单位首次;获得2019年度CCF自然语言处理专委会 “青年新锐奖”、 “钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖等。



特邀讲者

周昆 中国人民大学

报告题目:大语言模型背后的技术
报告简介:大语言模型已经成为了人工智能领域的一项重要技术,它们不仅改变了我们与计算机交互的方式,还在自然语言理解、文本生成、回答等领域发挥着关键作用。该报告将主要关注于大模型的训练、使用等各项基础背景知识,并介绍其未来将要面对的众多挑战和问题。
讲者简介:中国人民大学2020级博士研究生,导师为文继荣教授与赵鑫教授,其研究关注大语言模型和自然语言处理。至今为止已在领域内顶级会议上以第一作者身份发表论文十余篇。曾获2022年国家奖学金、2022年百度奖学金、2022年字节跳动奖学金、2022年微软学者奖学金等荣誉。



沈田浩 天津大学

报告题目:大语言模型对齐
报告简介:通用智能的 “智能-目标” 正交性及 “工具性趋同” 论点均要求通用智能的发展要智善结合。目前大语言模型在能力(智)方面发展迅速,但在更具挑战性的价值对齐(善) 方面研究相对滞后。本报告将概述对齐的基本概念和必要性,简述其存在的社会和技术挑战,分析大语言模型对齐的主要技术路线和方法,探讨如何对大语言模型对齐进行评测,并对未来趋势进行展望。
讲者简介:沈田浩,天津大学自然语言处理实验室(TJUNLP)三年级博士生,导师为熊德意教授,现研究方向为对话系统、检索式问答和大规模语言模型。曾获得第九届对话技术挑战赛 (DSTC9) “端到端多领域任务型对话”赛道第一名,在ACL、EMNLP等国际会议上发表多篇学术论文,并担任ACL, EMNLP, AACL等会议的审稿人。



章岳 苏州大学

报告题目:大规模语言模型的幻觉问题:评估、解释和缓解
报告简介:ChatGPT等大规模语言模型如今已经被广泛应用于人们的日常生活中。尽管大规模语言模型为日常工作生活带来了许多便利,但它们的幻觉问题一直为人们所诟病,难以让用户完全放心地使用。本报告从大语言模型时代的独特挑战出发,给出了幻觉问题的定义,同时介绍了现有面向幻觉问题的评估和缓解方案,旨在帮助听众更好地理解大语言模型幻觉这一重要的挑战。
讲者简介:章岳,苏州大学硕士生,导师为李正华教授。主要研究方向为:大规模语言模型、文本生成等。曾以第一作者身份在自然语言处理顶级会议ACL、EMNLP、NAACL等发表论文多篇。


END

中国中文信息学会青年工作委员会
中国中文信息学会青年工作委员会(cips_ywc)是中国中文信息学会的下属学术组织,专门面向全国中文信息处理领域的青年学者和学生开展工作。\x0d\x0a本公众号及时发布中文信息学会青年工作委员会的相关活动、热点事件、重大新闻
 最新文章