智算集群基础架构、国产化方案及发展趋势｜公开课预告

科技 2024-10-18 12:18 北京

随着人工智能技术的快速发展，尤其是大模型参数规模的持续增加，算力需求呈爆发式增长，对AI算力基础设施也提出了更高的要求，并进一步推动了智算集群的兴起。

在国际市场， Google推出了拥有26000块NVIDIA H100 GPU的超级计算机A3 Virtual Machines，同时基于自研芯片搭建TPUv5p 8960卡集群。Meta在2022年推出了拥有16000块NVIDIA A100 的AI研究超级集群，2024年初又公布2个包含24576块NVIDIA H100的集群，用于支持下一代生成式AI模型的训练。马斯克xAI团队拥有10万块H100的Colossus集群已经上线，也是目前全球最强的智算集群，而未来规模还要翻一倍，扩展到15万张H100+5万张H200。

在国内，字节跳动搭建了一个12288卡Ampere架构训练集群，研发MegaScale生产系统用于训练大语言模型。科大讯飞在2023 年建成首个支持大模型训练的国产万卡智能算力集群“飞星一号”。中国移动近日也宣布，其智算中心（哈尔滨）节点超万卡智算集群正式投用。

全球科技巨头、电信运营商、云服务厂商等都在加紧布局智算集群，以抢抓大模型发展的机遇。

但是，智算集群并不是简单的硬件堆砌，集群规模的线性提升也并不直接等同于集群有效算力的线性提升。要构建一个高能效的智算集群，需要从卡间和节点间的互联网络、软硬件的适配调优、算力的调度优化、设备的管理与运维等多个方面，进行综合考量和设计规划，更需要产业链上下游厂商通力合作。

为了帮助大家更好的了解智算集群，智猩猩芯片与算力教研组策划推出「智猩猩智算集群公开课」，聚焦集群构建、互联网络、算力调度、存储等关键技术。目前，来自中国移动、腾讯、矩向科技、益思芯、云脉芯联的五位技术专家和决策者已确认参加，并将以视频形式带来直播讲解。

10月21日19:30，「智猩猩智算集群公开课」第一期将开讲，由腾讯专有云首席架构师方天戟主讲，主题为《智算集群技术概述》。

方天戟老师首先会分享智算集群基础架构的发展趋势，并从计算、网络、存储等维度对常见的智算集群硬件架构进行解读。之后，方天戟老师还将带来国产化智算集群方案初窥，以及未来趋势。

第1期信息

主题

《智算集群技术概览》

提纲

1、智算集群基础架构发展趋势

2、常见的智算集群硬件架构

3、国产化智算集群方案初窥

4、小结与展望

主讲人

方天戟，腾讯专有云首席架构师，《大模型时代的基础架构》作者，《云鉴》编写组成员，20年行业经验，曾服务于华为、新华三、Juniper等业界著名企业，为航天科技、BMW、中国建筑等业界头部客户设计过企业上云整体方案并落地。

直播时间

10月21日19:30-20:30

报名方式

有公开课直播观看需求的朋友，可以添加小助手“瑞秋”进行报名。已添加过“瑞秋”的老朋友，可以给“瑞秋”私信，发送“智算集群01”进行报名。对于通过报名的朋友，之后将邀请入群进行观看和交流。

http://mp.weixin.qq.com/s?__biz=MjM5NTM4MTUyMg==&mid=2447908833&idx=2&sn=6fc982bb27521fedd03d683a74914b44

芯东西

芯东西专注报道芯片、半导体产业创新，尤其是以芯片设计创新引领的计算新革命和国产替代浪潮；我们是一群追“芯”人，带你一起遨游“芯”辰大海。

最新文章

日本芯片惨案

光羽芯辰创始人周强：通向个人大模型之路｜演讲预告

芯片设计公司正在工厂化

无问芯穹首席科学家戴国浩教授：软硬协同与多元异构，共筑大模型算力底座｜演讲预告

公开课预告：智算中心 AI Scale-Up 网络技术｜益思芯科技解决方案副总裁唐杰主讲

这些芯片在涨价，这些芯片在倒挂

中国芯片产业的一次底层突围，AI芯片创企勇挑RISC-V标准制定大梁

爱芯元智吴炜：多模态大模型在端侧的创新实践与挑战｜GenAICon 2024上海站演讲预告

3个月净赚近1400亿，英伟达仍为中国焦虑

国产 TPU 芯片“No CUDA”软件栈的构建实践｜中昊芯英朱国梁演讲预告

200亿，北京半导体今年最大一笔融资

AI Infra峰会同期举办，阿里云无问芯穹都来了！年度生成式AI大会上海站12月初举行

没有人能“杀死”中芯国际

倒计时2天！新思科技汽车处理器论坛集齐12位专家，全方位解读加速实现汽车SoC创新

血拼的国产CPU龙头，业绩大大不同

芯片IPO失败，一位创始人体面退出

AI芯片大厂，裁员千人

国产GPU独角兽摩尔线程启动IPO！

传三星停供中国大陆7nm AI芯片

广州，诞生一个芯片独角兽

曝台积电7nm AI芯片停供中国大陆！

特朗普上台对中国半导体的影响

模拟芯片，两起重磅收购！600亿龙头出手

公开课预告：智算集群网络互连技术创新应用与展望｜云脉芯联产品总监孙伟主讲

上海通信芯片大厂被告！涉案6.8亿

史上首个！单核突破4000分的量产CPU问世

亏损1182亿，芯片大厂业绩逆转！股价上涨7%

苹果最强3nm电脑芯片，来了！

武汉芯片独角兽冲刺IPO！年入38亿，大基金参投

美国遏华半导体政策升级！新规颁布，1月2日生效

融了15轮的成都半导体公司，要卖了

公开课预告：智算中心融合算力调度｜矩向科技CEO黄朝波主讲

酷睿Ultra 200S首测！功耗唰唰暴降，AI塞入台式机，英特尔这波稳了？

负债超20亿！上海芯片厂破产清算，“中国芯片教父”创办

突发！Arm取消对高通授权

高通汽车芯片大暴走！AI性能提升12倍，上车理想奔驰

高通旗舰芯皇性能狂飙，挤爆牙膏！

估值170亿美元！曝英特尔卖Altera股权

36家半导体企业，宣布并购重组！

智算集群基础架构、国产化方案及发展趋势｜公开课预告

英伟达台积电联盟，出现裂缝

黄仁勋对话Arm CEO：预言AI每年成本砍半，自曝演讲靠“硬着头皮”

湖南越摩研究院院长马晓波：玻璃基板Chiplet先进封装及多物理场仿真｜公开课预告

VC套现1.9亿，一家B轮半导体设备公司卖了

2美元/小时出租H100：GPU泡沫破灭前夜

为什么半导体人不愿意进晶圆厂？

AMD最强大模型芯片登场！五大硬核新品轰向AI，旗舰CPU单颗10万，OpenAI微软Meta都来站台

三年追超苹果，从能效比到端侧AI，联发科为高端芯片树立新标杆

中国集成电路“黄埔军校”，如今在走什么样的“芯”路

浪潮信息Stephen Feng：应对生成式AI发展四大挑战，以应用为导向以系统为核心解题丨GACS 2024

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉