SMP 2023讲习班 | 大模型技术与实践

学术   2023-10-27 15:47   上海  

讲习班简介: 随着GPT系列模型的推出,大模型已经成为自然语言处理、人工智能等领域的重要研究方向。为进一步普及大模型技术最新前沿动态,SMP 2023 大模型技术与实践讲习班将于2023年11月23日在合肥天鹅湖大酒店举办。本次讲席班由中国中文信息学会社会媒体处理专委会与中国中文信息学会青年工作委员会联合承办,邀请了来自学术界和工业界的一线年轻学者,包括MOSS、ChatGLM、GLM-130B、CogVLM和华为大模型的核心开发人员,分享大模型领域的最新研发成果和实践经验。





讲习班主席

东昱晓
清华大学 助理教授

主席简介:东昱晓,清华大学计算机系助理教授,知识工程实验室(KEG)成员,曾工作于脸书人工智能和微软总部研究院。研究方向为数据挖掘、图机器学习和预训练基础模型,相关成果应用于十亿用户级社交网络和知识图谱。入选2022年IJCAI Early Career Spotlight,获2017年ACM SIGKDD博士论文奖(第三名)和2022年ACM SIGKDD新星奖。




徐  童
中国科学技术大学 特任教授

主席简介:徐童,中国科学技术大学特任教授、博士生导师,中国中文信息学会青年工作委员会副秘书长。研究领域为大数据分析与智能应用技术。主持国家优秀青年科学基金在内的国家、省部级科研项目及校企合作项目10余项。发表中国计算机学会推荐A类期刊/会议论文60余篇。获3项国际学术会议论文奖项,指导学生获国内外学术竞赛/测评冠军10项。2022年获安徽省计算机学会优秀青年科学家奖。

论坛嘉宾

王喆锋
华为云


报告时间:09:00-10:30

嘉宾简介:王喆锋,博士,华为云AI系统创新Lab技术专家,负责华为云下一代AI系统技术规划与创新。研究领域包括AI系统、深度学习框架、自然语言处理、知识图谱等。在AAAI、ACL、中国科学等国内外顶级学术会议与期刊发表论文40余篇,曾获得中国科学技术大学首届优秀博士毕业论文奖、KSEM 2020最佳论文奖等。

报告主题:大模型时代的AI系统:思考与展望

报告摘要:ChatGPT、GPT-4等大模型的出现给AI应用带来全新的技术与发展,AI应用进入了大模型时代。回顾历史可以发现,新兴的超级应用会带来计算机系统的变革。大模型的出现对AI infrastructure、深度学习框架等系统基础设施带来了巨大挑战。进入大模型时代,需要什么样的AI系统是一个亟需回答的问题。本次报告首先回顾AI应用的发展历程以及带来的算力需求,然后分别从训练加速、推理成本以及AI应用三个方面去思考AI系统如何适应大模型带来的新挑战,最后从当前业界实践经验出发,展望未来AI系统的发展可能。



孙天祥
复旦大学


报告时间:10:30-12:00

嘉宾简介:孙天祥,复旦大学博士生,复旦MOSS系统主要设计者和开发者,作为第一作者在ICML, AAAI, ACL, EMNLP, NAACL, COLING等国际顶会发表多篇论文,据Google Scholar统计被引1800余次,曾获字节跳动奖学金、复旦大学学术之星、WAIC云帆奖·明日之星等荣誉。

报告主题:大型语言模型:数据、基座与对齐

报告摘要:近半年来,以ChatGPT、GPT-4为代表的大型语言模型得到了巨大关注,开源社区随之积极跟进产生了Llama等优秀模型。本次报告将从数据、基座、对齐三个维度介绍打造大型语言模型的一些方法论,试着结合已有的公开研究和MOSS的开发经验总结目前的最佳实践和值得探索的方向。



丁  铭
智谱 AI


报告时间:14:00-15:30

嘉宾简介:丁铭,2023年博士毕业于清华大学,师从唐杰教授,主要研究方向是大规模预训练、生成模型、多模态模型等,谷歌学术引用约4000次。

报告主题:视觉-语言预训练模型:生成与理解

报告摘要:视觉是人类认识世界最重要的信息来源,而语言是人类记录、交流知识的媒介。近年来,随着语言模型的兴起,如何结合多模态能力也成为许多研究者关注的焦点。本次报告将系统介绍多模态预训练的主要思路,以及讲者在CogView、CogVideo、Relay Diffusion、VisualGLM和最近的CogVLM等一系列多模态模型的设计开发过程中的经验,以及这个领域的发展方向。



曾奥涵
清华大学


报告时间:15:30-17:00

嘉宾简介:清华大学知识工程实验室博士生,为开源双语预训练模型 GLM-130B 和 ChatGLM 系统的主要开发者之一,研究方向为自然语言处理与大规模预训练模型,导师为唐杰教授。

报告主题:ChatGLM:预训练大模型探索与实践

报告摘要:年超大规模预训练模型取得了令人瞩目的进展,OpenAI发布大规模自然语言预训练模型 GPT-3/4,同时推出了AI聊天机器人ChatGPT,其卓越的性能激发了学术界和工业界的研究热情。GLM团队自研了GLM-130B中英双语模型,参数1300亿,算法采用自研的GLM,支持低成本、低资源使用,仅4张3090即可驱动。基于GLM-130B,GLM团队进一步探究了预训练模型的人类偏好对齐并发布了ChatGLM系列模型。本报告将介绍团队在研发基座模型GLM-130B和ChatGLM系统过程中碰到的困难和收获,同时介绍对ChatGPT技术点的理解,分析下一步要实现ChatGPT需要走的路和面临的技术挑战。

报名参会

会议时间:2023年11月23日-26日

会议地点:安徽合肥天鹅湖大酒店

会议官网:

https://conference.cipsc.org.cn/smp2023/

会议注册:

http://reg.cipsc.org.cn/smp2023/index.html




扫码完成会议注册报名


END


中国中文信息学会青年工作委员会
中国中文信息学会青年工作委员会(cips_ywc)是中国中文信息学会的下属学术组织,专门面向全国中文信息处理领域的青年学者和学生开展工作。\x0d\x0a本公众号及时发布中文信息学会青年工作委员会的相关活动、热点事件、重大新闻
 最新文章