本文参考自“全球云厂商复盘:AI驱动新一轮开支周期”,根据Statista、Synergy Research Group 披露数据,24Q1 全球云计算(包括PaaS和 SaaS)市场为 760 亿美金,同比+21%,行业快速增长;其中,亚马逊的 AWS 全球市占率为 31%,市占率第一;其次为微软的 Azure和谷歌的 Google Cloud,市占率分别为 25%、11%,三家合计市占率达到 67%。
细分领域来看:亚马逊 AWS 在IaaS、SaaS、AI 云服务领域具有领先优势。
IaaS领域:根据Gartner数据,23年全球IaaS市场 1399.99亿美金,同比+16.2%;其中,亚马逊实现收入546.48亿美金,市占率为39.0%,全球第一; SaaS 领域:AWS 具有广泛的云服务组合,提供Marketplace平台,允许独立软件供应商(ISV)在平台提供软件服务,被Gartner评为 SaaS 业务领导者; 云 AI 开发者服务领域:AWS 提供完整的生成式AI技术堆栈,覆盖算力(英伟达GPU实例)、基础模型(Amazon Bedrock等)和应用(AI编程助手 AmazonCodeWhisperer等),被 Gartner评为云AI开发者服务领导者。
根据公司披露数据,23 年 AWS 业务收入907.57 亿元,对应 14-23 年 CAGR 为 39.1%,AWS 收入持续提升;23 年 AWS 业务收入占比为 15.8%,相比于 14 年+10.6 个 pct,AWS 业务收入占比持续提升。
在 AI 浪潮的背景下,公司大力拓展以AI 算力(GPU 为主)支撑的智算中心,资本开支逐季度增长。行业层面,2022 年 11 月 30 日,OpenAI 发布 ChatGPT,引发一轮由 AI大模型驱动的 AI 浪潮,各互联网大厂及部分初创公司开始训练 AI 大模型,对 AI 算力的需求快速增长。
大力布局AI算力,开放更多AI实例:
1)硬件:23年7月AWS推出EC 2 P5实例,由英伟达H100算力卡支撑;23 年 11 月,AWS 推出由英伟达 H200支持的 P5e 实例,且成为 GH200 首家云服务供应商;另一方面,持续发力自研算力卡,23 年发布 AI 算力卡 Trainium 2,相比于第一代产品,效能提高 4 倍、能源效率提高 2 倍。
2)软件:23年4月发布Amazon Bedrock,其是一项完全托管的服务,提供各种来自领先AI公司(包括AI21 Labs、Anthropic、Cohere、Stability AI 和 Amazon等)的高性能基础模型(FM),目前 Claude 3.5 Sonnet、Llama 3、Mistral Large已登录Amazon Bedrock;同时,AWS Neuron、Aurora PostgreSQL等工具全面支持AI功能。
硬件维度:从单一供应商逐步向多供应商发展。
CPU 处理器:
1)Intel:AWS 成立之初便采用Intel CPU,且一直为 AWS 主流处理器。 2)AMD:18 年底,AMD 发布全球首款 7nm 数据中心处理器,相比于Intel 在处理器工艺制程占据了领先地位,AWS于18年11月宣布采用 AMDEPYC 处理器的 m5a、r5a实例。 3)自研芯片:18年AWS发布基于ARM 架构的自研数据中心处理器 Graviton,并发布由 Graviton支持的实例 EC2 A1。
GPU 处理器(AI 算力卡):
1)英伟达:13年发布专为 3D 图形功能而设计的G2 实例(由英伟达 Grid 处理器支持),16年发布 P2实例,配置16个英伟达Tesla k80 GPU,19 年发布 G4 实例,配置英伟达T4 TensorCore GPU,20年发布配置 NVIDIA A100 GPU 的 P4d 实例,23 年7月AWS 推出EC 2 P5实例,由英伟达 H100 算力卡支撑;23年11月,AWS推出由英伟达 H200 支持的 P5e实例,且成为GH200首家云服务供应商。
2)AMD:20年发布基于AMD RadeonPro V520 GPU的G4ad实例,用于图形优化的工作负载。
3)自研芯片:21年发布由自研 Inferentia 支撑的 Inf1 实例;18 年发布自研 AI 芯片Inferentia,21 年发布由自研 Inferentia 支撑的 Inf1 实例,22 年发布由自研 Inferentia 2 支撑的 Inf2 实例;此外,AWS 于 20 年发布机器学习定制训练芯片 Trainium,并于 22 年上线基于 Trainium 的实例 EC2 Trn1。
NVMe over RoCEv2 网络优化技术要求和测试规范
1、新一代智算数据中心基础设施技术方案白皮书
2、云化时代运营商数据中心业务及网络演进研究
3、探索未来数据中心:数据中心2030
4、云计算数据中心网络技术
5、数据中心网络解决方案Underlay网络设计指南
6、数据中心智能化运维发展研究报告
7、面向AI大模型的智算中心网络演进白皮书
1、面向算力网络的云边端协同调度技术
2、算力网络资源协同调度探索与应用
3、面向算力网络的多路径时敏优先调度机制
4、算力网络四面三级算力度量技术体系
5、东数西算场景下的算力网关研发及应用
本号资料全部上传至知识星球,更多内容请登录全栈云技术知识星球下载全部资料。
‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧ END ‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言删除,谢谢。
温馨提示:搜索关注“全栈云技术架构”微信公众号,“扫码”或点击“阅读原文”进入知识星球获取10000+份技术资料。