倒计时10天 | 中国中文信息学会《前沿技术讲习班》- 大模型系列专题·乌鲁木齐站

学术   2024-05-01 13:37   上海  

为进一步普及最新大模型前沿动态,推动国内大模型技术发展,发展基础理论与应用,中国中文信息学会《前沿技术讲习班》(CIPSATT)推出大模型系列专题,本期将于2024年5月11日-12日在新疆乌鲁木齐线下举办。讲习班以大模型为主题,邀请了来自国内研究第一线的知名青年专家学者,系统讲述基础大模型构建技术、大模型智能体、多模态大模型等。为感兴趣的学者、学生和工程师提供系统学习和交流的机会,快速了解大模型前沿方向的基本概念、研究内容和发展趋势,欢迎相聚于乌鲁木齐草长莺飞的五月!

时间:2024年5月11日-12日

地点:中国科学院新疆理化技术研究所2号楼8楼报告厅

地址:新疆省乌鲁木齐新市区北京南路科学二街181号

注册参会:

http://reg.cipsc.org.cn/cipsatt42/index.html

大模型系列讲习班前期回顾

深圳站 - 7月

北京站 - 8月

济南站 - 9月

成都站 - 12月




会议

日程安排

本次讲习班内容涵盖大模型的多个方面,主题包括以下内容:

主题1:基础大模型技术

主题2:多语言大模型

主题3:大模型评价

主题4:端侧大模型应用

主题5:大模型智能体与代理系统

主题6:多模态大模型


5月11日

主持人:严睿 中国人民大学

10:00-10:30

开班仪式/青工委主任致辞

张家俊 中科院自动化研究所

10:30-11:40

报告1:多语言大模型:方法、训练与对齐

张家俊 中科院自动化研究所

11:40-11:50

合影留念

11:50-13:00

报告2:大模型驱动的智能体代理与角色扮演

严睿 中国人民大学

陈秀颖 阿卜杜拉国王科技大学

午餐

14:30-15:40

报告3:大语言模型技术的研发与思考

赵鑫 中国人民大学

15:50-17:00

报告4:自进化-大模型的智能飞轮

李永彬 阿里巴巴通义实验室

17:10-18:30

互动圆桌论坛

Panel嘉宾

5月12日

主持人:杨雅婷  中科院新疆理化技术研究所

10:30-11:40

报告5:多模态大模型的研究进展

穆亚东 北京大学

11:50-13:00

报告6:Mobile Agent的技术路线与挑战

刘伟 小米人工智能实验室

午餐

 14:30-15:40

报告7:生成式内容的可解释评估方法

毛先领 北京理工大学

15:50-17:00

报告8:基于大模型的智能体研究

高莘 电子科技大学

 17:10-18:20

报告9:“融疆融路”多语言大模型构建及应用技术研究

杨雅婷 中科院新疆理化技术研究所

杨奉毅 中科院新疆理化技术研究所

18:20-18:30

结课仪式/闭幕致辞

杨雅婷 中科院新疆理化技术研究所






特邀讲者

报告1:多语言大模型:方法、训练与对齐

报告内容随着模型参数与训练数据的不断增长,大语言模型展现出越来越强、越来越通用的能力。但是,无论是闭源模型还是开源模型,主要聚焦英文和中文等资源丰富语言,即使支持多种语言,不同语言之间的能力差距却非常显著。如何提升大语言模型的多语言能力、促进语言平等成为亟待解决的一个核心问题。该报告将从方法、训练和对齐三个角度系统介绍多语言大模型的构建和优化工作。


讲者简介

张家俊

中科院自动化研究所

张家俊,国家级青年人才计划入选者,中国科学院自动化研究所研究员、博士生导师,中国科学院大学岗位教授。主要研究方向为自然语言处理、语言模型及应用,获得国家优秀青年科学基金资助,入选中国科协首届青年人才托举工程、中国科学院青年创新促进会优秀会员和北京智源青年科学家,主持科技创新2030—“新一代人工智能”重大项目。发表CCF-A/B类论文100余篇,出版学术专著2部、译著1部,获得北京市科学技术奖一等奖等。担任中国中文信息学会理事、青年工作委员会主任和机器翻译专委会副主任。多次担任ACL/EMNLP/COLING的(资深)领域主席,担任IEEE/ACM T-ASLP和《自动化学报》等期刊的编委。

报告2:大模型驱动的智能体代理与角色扮演

报告内容:大语言模型(LLM)作为当前人工智能研究的前沿,正被广泛探索用于开发自主代理与角色扮演等技术。这些技术能够模拟人类的决策与行为,应对复杂多变的实际环境。本次讲习班将深入探讨基于大语言模型的自主代理与角色扮演技术的开发及其在多个领域的应用,包括社会科学、自然科学和工程学等领域,为人类社会的行为决策提供新的认识与发现。


讲者简介:

严睿

中国人民大学

严睿,国家级青年人才计划入选者,中国人民大学高瓴人工智能学院长聘副教授,博士生导师。曾入选北京智源人工智能研究院青年科学家,微软亚洲研究院铸星学者,中国人民大学杰出学者。发表论文100余篇,引用1.2万余次,主要研究方向为自然语言处理,文本挖掘与检索,人工智能。多次担任多个顶级学术会议的领域主席/资深审稿人,也多次受邀于多个顶级学术会议宣讲Tutorial报告。



陈秀颖

阿卜杜拉国王科技大学

陈秀颖,阿卜杜拉国王科技大学 (KAUST)博士生,于KAUST荣获院长名单奖。主要研究方向为预训练语言模型和大模型智能体,并在多个顶级学术会议及期刊上发表了40多篇研究论文,多次担任重要国内外学术会议的审稿人。

报告3:大语言模型技术的研发与思考

报告内容最近,以ChatGPT为代表的大语言模型受到了社会的广泛关注。本次报告将围绕大语言模型研发过程中的关键技术展开介绍,将从预训练、指令微调等方面展开讨论,分析现有技术特点以及局限之处,并且给出报告人对于这些方面的相关思考与实践经验。


讲者简介:

赵鑫

中国人民大学

赵鑫,国家级青年人才计划入选者,中国人民大学高瓴人工智能学院教授。2014年7月于北京大学获得博士学位,随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理,共计发表论文100余篇,谷歌学术引用1.7万余次,曾主导研发了伯乐(推荐系统库RecBole)、妙笔(文本生成库TextBox)等开源工具,组织编写了大语言模型综述论文《A Survey of Large Language Models》(预印版文章)以及《大语言模型》中文教科书。荣获2020年吴文俊人工智能优秀青年奖、ECIR 2021时间检验奖(Test of Time Award)、RecSys 2022最佳学生论文提名(Best student paper runner-up)、CIKM 2022最佳资源论文提名(Best resource paper runner-up)等,入选中国科协青年人才托举工程、北京智源青年科学家、CCF-IEEE CS青年科学家。

报告4:自进化(Self-Evolution)-大模型的智能飞轮

报告内容大语言模型在各个领域和智能体应用中取得了显著进展,但目前依赖人类或外部模型监督信号的方法不仅成本高昂,而且随着任务复杂性和多样性的增加,也逐渐面临性能瓶颈。为了解决这个问题,自进化(Self-Evolution)开始成为大模型领域的一个研究热点。在对自进化方向的上百篇论文进行了详细分析后,我们提出了一个大语言模型自进化的概念框架,其中模型可以自主地(1)获取经验(2)改进经验(3)迭代更新和(4)评估自身性能,通过迭代来持续优化模型效果。本次分享将详细介绍自进化框架中的核心模块、前沿进展、当前挑战和未来方向,并展示自进化学习如何能够在研究和应用上带来重要突破,为设计下一代超越人类表现的智能系统提供参考。


讲者简介:

李永彬

阿里巴巴通义实验室

李永彬,毕业于清华大学,阿里巴巴通义实验室资深算法专家,研究方向为大模型、代码智能、对话智能 及 AI Agents 等,打造了通义灵码(智能编码助手)和通义晓蜜(智能客服),支撑了通义听悟、通义智文、钉钉魔法棒等大模型应用。2020年以来,围绕预训练、对话、代码、大模型等方向发表70余篇国际顶会论文(ACL/EMNLP/AAAI/NeurIPS等)。

报告5:多模态大模型的研究进展

报告内容:本报告主要介绍讲者所负责的实验室在多模态理解及生成式大模型方面的近期研究进展,包括视觉语言大模型E-CLIP和Wasserstein-CLIP、文本-图像大模型LaVIT、文本-视频大模型Video-LaVIT以及文本-三维场景生成式大模型等,并结合近期OpenAI Sora来讨论多模态生成式大模型的设计要素。


讲者简介:

穆亚东

北京大学

穆亚东,国家级青年人才计划入选者,北京大学研究员、长聘副教授、博士生导师、博雅青年学者,新闻出版智能媒体技术重点实验室副主任,先后在北京大学获得理学学士和理学博士学位。曾在新加坡国立大学、美国哥伦比亚大学、华为香港诺亚方舟实验室、美国电话电报公司研究院(AT&T Labs)担任研究职位,主要研究领域为计算机视觉和机器人学,在国际主流会议和期刊发表论文100余篇,其中在CVPR等中国计算机学会论文推荐列表A类会议和T-PAMI等IEEE汇刊发表论文超过70篇,申请PCT、美国或中国专利30余项。获得陕西省自然科学一等奖、国际会议SIGIR最佳论文提名奖、北京大学京东方奖教金、杨王院士奖教金等。担任多媒体领域旗舰期刊IEEE Transactions on Multimedia的编委,多次担任人工智能领域顶级会议(如CVPR、ACM Multimedia)的领域主席。研究方向包括多模态基础模型、视觉语言学习、机械臂抓取和操作、视频语义分析技术等。近期代表工作包括视觉大模型ECLIP、视觉语言大模型LaVIT系列和基于Koopman控制理论的视觉表征等。

报告6:Mobile Agent的技术路线与挑战

报告内容从产业落地的视角,探讨大语言模型作为手机端AI Agent的作用与技术挑战。


讲者简介:

刘伟

小米人工智能实验室

刘伟,小米AI实验室人大模型算法负责人,北京大学心理与认知科学学院硕士行业导师,清华大学机器学习课程答辩导师,CCF YOCSEF总部候任AC,微软小冰初创成员。研究方向:人机对话和大语言模型。有超过10年的人机对话从业经历,主导和深度参与了微软小冰、小爱同学等业界具有影响力的人机对话产品的研发,获小米百万美金技术大奖,并有十数项专利和自然语言处理顶会论文发表。


报告7:生成式内容的可解释评估方法

报告内容生成式人工智能正在蓬勃发展,如何对生成内容的质量进行评价,对该领域高质量发展非常重要。本报告将系统地梳理已有工作,并介绍研究组相关研究工作。


讲者简介:

毛先领

北京理工大学

毛先领,国家级青年人才计划入选者,北京理工大学教授、博导。主要研究信息检索与数据挖掘。目前担任计算机学会中文信息技术专委会委员、中文信息学会青工委执委以及语言与知识专委会委员;已在SIGIR、WWW、SIGMOD、ACL、TOIS、TKDE等国际期刊会议上发表50余篇论文;主持研发了Hammer PDF等系列科技大数据挖掘系统,部分成果获2项最佳论文奖和3项省部级科技进步奖。


报告8:基于大模型的智能体研究

报告内容基于大规模语言模型的智能体研究是近期自然语言处理领域中一个新兴的研究方向,该领域的研究也推动了通用人工智能的进一步发展。本报告将围绕语言模型智能体的工具调用能力、多智能体协作方式与能力构建、语言模型智能体的应用三个方面展开,探讨语言模型智能体基础能力的构建方法以及如何将其应用在更多的下游任务上。


讲者简介

高莘

电子科技大学

高莘,电子科技大学助理教授、研究员,主要研究方向为预训练语言模型、大模型智能体和工具学习;在国际顶级会议期刊发表文章40余篇;目前担任中国中文信息学会青年工作委员会委员、信息检索专委会通讯委员,担任若干顶级会议的领域主席和高级程序委员会委员。


报告9:“融疆融路”多语言大模型构建及应用技术研究

报告内容:“丝绸之路”核心区及周边国家语言资源丰富,以英语为中心的大语言模型在维吾尔语、哈萨克语、塔吉克斯坦语等低资源语言上面临着数据不平衡的严峻挑战。本次报告围绕大语言模型的语言能力扩充展开,具体介绍如何快速扩展大语言模型的低资源语言能力,包括如何动态有效地扩充语言、如何减少对原语言能力的损害等。同时报告人也将介绍大语言模型在不同领域场景下的应用技术。


讲者简介

杨雅婷

中科院新疆理化

技术研究所

杨雅婷,研究员,博士研究生导师,中国科学院新疆理化技术研究所,多语种信息技术研究室副主任,新疆民族语音语言信息处理重点实验室副主任。主持或负责国家自然科学基金、国家重点研发计划、新疆维吾尔自治区重大科技专项等国家及省部级项目22项,入选新疆“天山英才”青年科技拔尖人才项目、中国科学院青促会优秀会员、国家自然科学基金本地青年人才培养专项、新疆高层次人才引进计划等多项人才计划。自2007 年起从事多语言智能信息处理技术研究,科研成果获得2019年度新疆科技进步一等奖,2022数字中国创新大赛全国总决赛二等奖。


杨奉毅

中科院新疆理化

技术研究所

杨奉毅,中国科学院新疆理化技术研究所特别研究助理,2023年博士毕业于中国科学院大学。研究方向为大语言模型、对话系统、检索增强生成等,在AAAI、IJCAI等人工智能国际会议上发表多篇论文。

住宿预订


如果需要预订住宿,请联系会务老师:

杨奉毅:13173170839

杨薇:19990318216

马博:13999418770

会务联系邮箱


yangfy@ms.xjb.ac.cn 

会议组织


主办:中国中文信息学会青年工作委员会

承办:中国科学院新疆理化技术研究所

大会主席


孙乐,中国科学院软件研究所

学术主席


严睿,中国人民大学

杨雅婷,中国科学院新疆理化技术研究所

张家俊,中国科学院自动化研究所

宣传主席


魏忠钰,复旦大学



本地支持单位

新疆软件行业协会

新疆计算机学会

新疆电子学会

独家算力支持单位


北京超级云计算中心

领取算力福利


注册参会的每一位师生均可免费获得由北京超级云计算中心提供的价值500元AI算力资源,以及7*24小时专家技术支持。

算力资源类型:包括A100 PCIE 40G、RTX 4090 24G、RTX 3090 24G等。


中国中文信息学会青年工作委员会
中国中文信息学会青年工作委员会(cips_ywc)是中国中文信息学会的下属学术组织,专门面向全国中文信息处理领域的青年学者和学生开展工作。\x0d\x0a本公众号及时发布中文信息学会青年工作委员会的相关活动、热点事件、重大新闻
 最新文章