回顾 | 信息科学技术学院第三十二期“知存讲座”顺利举办

财富 2024-11-26 20:40 北京

2024年11月22日晚，信息科学技术学院第三十二期“知存讲座”暨信息科学前沿与产业创新课程在理科教学楼107教室顺利举办。阿里云智能通义实验室高级技术专家姜碧野博士受邀进行了以“阿里云大模型服务中的技术挑战与实践”为主题的报告。信息科学技术学院副院长王润声老师主持了本次讲座。

姜碧野博士主讲

Part.1

讲座伊始，姜博士首先简要介绍了chatgpt革命，指出chatgpt确实是有史以来增长最快的一项技术，相比以往互联网，移动互联网很多应用的增长都要快。之后，姜博士指出开源是目前大模型的主旋律，我们可能正在经历一次最大的开源革命，开源模型的规模非常可观。当然，姜博士也强调说大模型时代给云带来了新的机遇与挑战。

本次讲座的第一部分的主题为LLM推理模式概要。首先姜博士简要介绍了大模型的推理过程，通过一个实际的例子来解释大模型的推理过程简单来说就是将前缀自底往上依次进行所有的layers，然后进行next token prediction，得到一个新的token，然后将该token加到队列中作为新的前缀重复上述过程。这样的重复生成过程直到达到预先设定的最大序列长度或生成了预定义的终止token时停止。之后姜博士介绍了在推理过程中两个很重要的阶段：Prefill与Decode。Prefill阶段因为已经知道输入的所有内容，所以可以进行并行计算，效率较高；而decode阶段只知道当前预测的token，而对之后的内容并不了解，所以每次计算都要带上之前的内容一步一步计算。然后姜博士简要介绍了静态批处理、连续批处理以及动态KV cache管理。并对Prefill和Decode阶段的负载特性简要的进行了介绍，指出Prefill阶段能够并行处理所有输入的tokens并生成首token，是计算密集型任务，在整体端到端时延中占比较少，而Decode阶段是迭代逐个生成输出token，是访存密集型任务，在整体端到端时延中占主要部分。Prefill阶段算力密集，耗时是可预测的；而Decode阶段总耗时较长且不确定，需要组batch以提高吞吐。

同学们认真聆听

Part.2

讲座的第二部分为云产品概要。姜博士介绍到，传统的云产品有计算（ECS）、存储（OSS）、数据库（RDS），而现在互联网应用的所有基础设施都可购买。而在介绍云服务的主要技术和驱动力时，姜博士指出虚拟化和弹性是云的主旋律，分布式和大数据都是近年来云技术发展的方向。同时，大模型也为云带来了新的动能。之后，姜博士着重介绍了大模型服务作为云产品的挑战。他指出这样的产品形式是以token计费的模式提供模型API调用服务。目前多元的用户诉求，波峰波谷明显的使用场景，昂贵、异构的GPU资源以及尺寸繁多的模型和数百GB级别的参数都是大模型云产品所面对的挑战，需要合理的调度匹配。然后姜博士说明GPU做好弹性不容易，因为GPU架构迭代频繁，并且与显存/NVLink高度绑定，同时大模型又过大，难以使用分片资源，难以快速启动服务。同时，成本也是一个很重要的问题。既然如此，做好调度匹配至关重要。姜博士从大模型服务的特点出发，简要介绍了请求侧调度中的推模式（类传统微服务模式），拉模式（传统离线任务模式）两种调度方式以及资源侧调度。

讲座的最后，姜博士对本次讲座进行了总结，说明了大模型服务有着广阔的应用场景，能够为大量不同诉求的客户提供帮助。同时虚拟化和弹性是云的必由之路。此外姜博士对computer systems也进行了介绍。

讲座现场

Part.3

在问答环节，同学们积极踊跃地向姜博士提问，姜博士都耐心地做出了答复。

同学向嘉宾提问交流

此次讲座聚焦于阿里云大模型服务中的技术挑战与实践，让同学们对于大模型、云有了更加深刻的认识，本次知存讲座以热烈的掌声圆满结束。

信息科学技术学院“知存讲座”将持续开展，邀请信息学科领域的知名人士为本科生介绍信息科学技术学科和产业发展热点和前沿话题，引导青年学子增进专业认知，确立前沿视野，寻找未来感兴趣的发展方向。

文字：李唯嘉陈文灏

摄影：冷信阁

排版：余彧泽

http://mp.weixin.qq.com/s?__biz=MzA4MTAzMzQ5NA==&mid=2650896087&idx=2&sn=5ded96a35e2429d72dffb4283f9bd159

大信科

北京大学信息科学技术学院学生活动信息分享发布

北京大学信息科学技术学院举办学生生涯发展校友导师聘书颁发仪式暨特斯拉技术分享活动

学术丨攻城狮的茶话会——学术交流留学专场，期待你的到来！

回顾 | 信息科学技术学院第三十二期“知存讲座”顺利举办

一二·九丨排练手记

Hello Week丨第十二周

文创 | 信科学生文创作品征集开始啦！

新生杯丨新生杯战报及预告第八期

招募｜“万象更新、信想事成”2025信息科学技术学院新年联欢会主持人招募与节目征集

回顾 | 信息科学技术学院第三十一期“知存讲座”顺利举办

新生杯丨信科网球队斩获新生杯亚军

新生杯丨新生杯战报第七期

Hello Week丨第十一周

征订丨秋季院衫订购开始啦~~

学生年度人物·2024候选人 | 信息科学技术学院2021级本科生刘胜与

回顾 | 信息科学技术学院第三十期“知存讲座”顺利举办

北大杯丨北大杯战报第一期

团校 | “设计思维工作坊”来啦!

Hello Week丨第十周

回顾丨信科2024年1024新工科文化节之互动小游戏

心有所信，薪火相传 | 信息科学技术学院举办选调生校友交流座谈会

预告 | CS Frontier Tutorial：激励诚实反馈的机制设计

回顾 | 信息科学技术学院第二十九期“知存讲座”顺利举办

新生杯丨新生杯战报第四期

北京大学信息科学技术学院“创新+”工作站 2024 年度项目中期答辩评审会顺利举行

Zhi Talk | Robotics and VMC

Hello Week丨第九周

回顾丨信息科学技术学院2024年1024新工科文化日顺利举办

回顾 | 信科2024年1024新工科文化节之“肥宅三项赛”

新生杯丨2024年羽毛球新生杯夺冠!

履信致远｜信息科学技术学院举办2024年思想政治实践课程总结展示大会

新生杯丨新生杯战报第三期

薪火相传，生生不息 | 2024智班学生大会暨“智班奖学金”颁奖仪式圆满举行

挑战杯丨2024年“挑战杯”联合宣讲会顺利举办

回顾 | 信息科学技术学院第二十八期“知存讲座”顺利举办

投票丨快来选出你最喜欢的秋冬院衫吧！

新闻｜北京大学信息科学技术学院 2024 级新生院长奖学金颁奖仪式成功举办

Hello Week丨第八周

回顾 | 信科青协电脑小队“秋日电脑减压计划”顺利举行！

信息科学技术学院举行2024年团学骨干换届大会

公示｜北京大学信息科学技术学院2024-2025学年团委部长名单公示

新生杯丨新生杯战报第二期（内附预告）

挑战杯 | 2024年“挑战杯”开始啦！欢迎报名宣讲会进一步了解！

预告丨倒计时3天！1024新工科文化日震撼来袭！

新闻丨信息科学技术学院学生会“走进4.0”学术交流讲座成功举办

回顾 | 信息科学技术学院第二十七期“知存讲座”顺利举办

一二·九 | 动员大会顺利召开

团校｜2024—2025学年度“信历”联合团校开学典礼顺利举行

新生杯丨羽毛球赛预告

新生杯丨第一期战报

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉