让机器理解人类语言是人工智能长期以来的梦想,经过几十年的发展,语言与智能技术发展到了什么程度,如何评价语言理解的智能水平,未来发展趋势如何?为了深入探讨这些重要问题,中国中文信息学会和中国计算机学会联合创办了“语言与智能高峰论坛”,首届论坛于2016年在北京举行,每年举行一次,至今已成功举办八届,旨在向社会公众介绍语言与智能的前沿动态和创新成果,推动我国相关领域快速发展!
第九届语言与智能高峰论坛将于2024年8月25日在北京西郊宾馆举行。本次论坛将邀请国内外相关领域的资深专家学者,呈现3场特邀报告,4场青年科学家报告,1场竞赛论坛,1天时间,干货满满。欢迎参会共同探讨语言与智能领域的新发展和新技术!
论坛时间:8月25日 09:00-17:00
论坛地点:北京·西郊宾馆·1号楼3层银杏大厅
论坛官网:
https://conference.cipsc.org.cn/lis2024/
论坛注册:
https://www.cipsc.org.cn/UpcomingEvents/info.aspx?itemid=4357
注册费(8.14前早鸟票):
① CIPS/CCF会员:学生800元/人;非学生1000元/人
② 非CIPS/CCF会员:学生1000元/人;非学生1300元/人
③ 同时报名暑期学校(CIPS ATT),论坛注册费优惠200元
08:45-09:00
开幕式
特邀报告
09:00-10:00
以语言为核心的多模态大模型和人工智能探索
张民(哈尔滨工业大学(深圳))
10:00-11:00
面向继续预训练的高效数据方法
文继荣(中国人民大学)
11:00-12:00
从语言大模型到智能体
李航(字节跳动)
12:00-14:00
午餐休息
青年科学家报告
14:00-14:30
大模型知识密度定律
刘知远(清华大学)
14:30-15:00
大语言模型的机制可解释性
邱锡鹏(复旦大学)
15:00-15:30
从语言大模型到代码大模型
车万翔(哈尔滨工业大学)
15:30-16:00
大模型知识机制探索
韩先培(中国科学院软件研究所)
竞赛论坛
16:00-16:15
2024语言与智能技术竞赛总结与展望
张叔夏 百度AI技术生态部高级运营经理
16:15-16:25
竞赛总结及百度和少儿社合作展望
洪星范 少年儿童出版社党委书记、常务副总编辑
16:25-17:00
颁奖&竞赛冠军团队方案分享
17:00-17:10
闭幕式
报告
题目
以语言为核心的多模态大模型和人工智能探索
报告摘要:
本报告将分享我们对语言大模型、以语言为核心的多模态大模型以及人工智能的一些观点,并介绍哈工大(深圳)最近的一些相关工作,包括自主可控立知大语言模型、以语言为核心的多模态大模型、大模型驱动的智能体应用以及对多智能体协作机制的初步探索。以下是几个主要观点:1. 作为人工智能的核心,语言智能的发展,带动人工智能不同层级的跃迁。2. 通过设计统一的以语言为中心的多模态大模型新型架构,减少模型运行所需的计算资源和能耗,是实现以大模型为基础构建通用人工智能模型的必由之路。3. 未来人工智能很可能走跟人类智能一样的发展路径,从单体智能到多智能体交互、竞争、博弈与协作。
张民
哈尔滨工业大学(深圳)
讲者简介:
张民,教授,博导。哈工大(深圳)特聘校长助理,计算与智能研究院院长。国家杰出青年科学基金获得者,“国家百千万人才工程”入选者,国家有突出贡献中青年专家,深圳市大模型智能与安全重点实验室主任,享受国务院政府特殊津贴。长期从事自然语言处理、大模型和人工智能研究。发表CCF A/B类会议和期刊论文300余篇,出版Springer专著2部,主编论著(论文集)16本,获部级科技进步奖3项,最佳会议论文4次。担任本领域10本期刊编委。
报告题目
面向继续预训练的高效数据方法
文继荣
中国人民大学
讲者简介:
文继荣,中国人民大学信息学院院长、高瓴人工智能学院执行院长,曾任微软亚洲研究院高级研究员和互联网搜索与挖掘组主任。长期从事人工智能和大数据领域的研究工作,近年来尤其专注于大模型相关的研究和应用。入选国家海外高层次人才计划、北京市卓越青年科学家计划等。担任北京市第十四届政协常委、中央统战部党外知识分子建言献策专家组专家、第八届教育部科技委委员、中国计算机学会常务理事、SIGIR 2020程序委员会主席等。
报告题目
从语言大模型到智能体
李航
字节跳动
讲者简介:
李航,字节跳动研究部门负责人。ACM Fellow, ACL Fellow, IEEE Fellow。京都大学毕业,东京大学博士。曾就职于 NEC 公司中央研究所,微软亚洲研究院,华为技术有限公司诺亚方舟实验室。主要研究方向自然语言处理、信息检索、机器学习、数据挖掘。
报告题目
大模型知识密度定律
报告摘要:
2018年以来大模型规模不断增大、产生智能涌现,验证了OpenAI提出的模型规模法则(Scaling Law),特别是ChatGPT的推出引发全世界对大模型技术的关注。面向未来,大模型的发展趋势是什么,就是不断增加模型参数规模以追求更多能力涌现么?本报告发现,过去大模型在印证规模法则的同时,还呈现知识密度持续增强的规律,可称为大模型知识密度定律。我们认为面向未来,我们更应从模型架构、成长算法和数据治理等方面不断改进模型制造工艺,提升模型制程,保证大模型知识密度定律的可持续,这将为我们揭示端侧智能的巨大潜力。
刘知远
清华大学
讲者简介:
刘知远,清华大学计算机系副教授、博士生导师。主要研究方向为自然语言处理、基础模型。2011年获得清华大学博士学位,已在ACL、EMNLP、IJCAI、AAAI等人工智能领域的著名国际期刊和会议发表相关论文200余篇,Google Scholar统计引用超过4.8万次。曾获教育部自然科学一等奖(第2完成人)、中国中文信息学会钱伟长中文信息处理科学技术奖一等奖(第2完成人)、中国中文信息学会汉王青年创新奖,入选国家青年人才项目、北京智源研究院青年科学家、2020-2022连续三年Elsevier中国高被引学者、《麻省理工科技评论》中国区35岁以下科技创新35人榜单、中国科协青年人才托举工程。担任中文信息学会理事、社会媒体处理专委会副主任,期刊AI Open副主编,ACL、EMNLP、WWW、CIKM、COLING等国际著名会议领域主席。
报告题目
大语言模型的机制可解释性
报告摘要:
尽管大语言模型在人工智能多个领域显示出极强的通用性,但理解其内部机制仍缺乏可规模化的手段和理论,这给下一代大模型的设计和优化带来了挑战。自2023年以来,机制可解释性(Mechanistic Interpretability)为大语言模型的规模化可解释性带来全新的活力。机制可解释性主要是利用稀疏自编码器技术提取大模型中数千万个高度可解释特征,为分析大模型的行为和机理提供了很好的工具。本次报告将介绍我们在大语言模型可解释性方面的研究进展,并展望可解释性技术对大模型训练数据、幻觉、安全性等重要问题的结合点。
邱锡鹏
复旦大学
讲者简介:
邱锡鹏,复旦大学计算机学院教授,担任中国中文信息学会大模型与生成专委会副主任、上海市计算机学会自然语言处理专委会主任,主要研究方向为自然语言处理基础模型和算法,发表CCF-A/B类论文100余篇,引用2万余次,入选中国高被引学者和全球前2%顶尖科学家榜单,曾获中国科协青年人才托举工程、国家优青等项目,获钱伟长中文信息处理科学技术奖一等奖(第一完成人),入选教育部“高校计算机专业优秀教师奖励计划”,上海市计算机学会青年科技英才,两次获得上海市计算机学会教学成果奖一等奖;主持研发的大模型MOSS已经成为国内影响力最大的开源大语言模型之一。著作《神经网络与深度学习》被上百家高校作为教材。
报告题目
从语言大模型到代码大模型
报告摘要:
由自然语言处理技术孕育而生的大模型已经成为人工智能领域的一个重要突破。这些模型通过大规模语言数据训练,能够实现对文本的深度理解和生成。然而,大模型的应用远远超过文本处理,其在代码上也展现出巨大的潜力,进而衍生出了代码大模型。代码大模型可以学习和理解各种编程语言,完成代码生成、摘要等典型编程任务,极大提高了开发效率。与此同时,代码所具备的高度结构化、可执行以及长距离依赖等特性,又反哺了对语言的理解和生成,提升了大模型逻辑推理、工具调用以及复杂问题分解与规划等能力。本报告将系统介绍语言大模型和代码大模型的基本概念、发展历程、技术原理以及应用场景。
车万翔
哈尔滨工业大学
讲者简介:
车万翔,哈尔滨工业大学计算学部长聘教授/博士生导师,人工智能研究院副院长,国家级青年人才,龙江学者“青年学者”,斯坦福大学访问学者。现任中国中文信息学会理事、计算语言学专业委员会副主任兼秘书长;国际计算语言学学会亚太分会(AACL)执委兼秘书长;国际顶级会议ACL 2025程序委员会共同主席。承担国家自然科学基金重点项目、2030“新一代人工智能”重大项目课题等多项科研项目。著有《自然语言处理:基于预训练模型的方法》一书。曾获AAAI 2013最佳论文提名奖。负责研发的语言技术平台(LTP)已授权给百度、腾讯、华为等公司付费使用。2016年获黑龙江省科技进步一等奖(排名第2),2020年获黑龙江省青年科技奖。
报告题目
大模型知识机制探索
报告摘要:
近年来,大模型展现出了强大的能力,但其背后机制却仍旧不明,极大制约了大模型的改进和应用。本报告介绍课题组在大模型知识机制方面的一些探索,如知识特性对大模型的影响和大模型对外在知识生态的影响,同时对大模型与知识的关系进行探讨。
韩先培
中国科学院软件研究所
讲者简介:
韩先培,中科院软件所研究员及中文信息处理实验室副主任,主要研究方向为自然语言理解、大模型及知识图谱。承担中科院战略先导、科技创新2030课题、国家重点研发专项等十余项课题。在ACL、SIGIR、IJCAI等重要国际会议发表论文60余篇。入选国家优青、中国科协青年人才托举计划及北京智源青年科学家,担任中国中文信息学会理事及语言与知识计算专业委员会副主任。相关成果获中国中文信息学会汉王青年创新奖一等奖及科学技术奖一等奖。
论坛日程持续更新,详情请关注论坛官网