一分钟了解智算中心与传统数据中心、超算中心的区别和联系

文摘   2024-11-20 23:46   广东  

最近和很多朋友在聊智算中心的建设方案,经常会拿“智算中心和传统的数据中心、超算中心进行比较,很多非相关领域的朋友很难分清楚这三者的区别和联系,今天我们从不同的维度和大家分析一下它们各自的特点。

一、“数据中心建设是体系化工程

“智算中心作为最近两年兴起的新生事物,可以理解为是由传统“数据中心”演变而来,从本质上讲并没有太大区别,只因为承载的业务重心转为了人工智能的训练、推理等,因此命名为“智算中心”,介绍三类数据中心区别之前我们先从系统层面了解一下传统“数据中心”建设的组成。

1、L0层为土建工程:传统数据中心和智算中心的区别很小,因为智算建设算力密度提升,往往需要对地面的的承重有所增加,在建设成本和规划上没有太大变化。

2、L1为机房基础设施:可以理解为是给IT基础设施提供支撑的,机房的装修、供电、制冷、综合布线、机柜、液冷系统等都属于这一层,智算中心带来的变化是由低密向高密转变、由风冷向液冷(或者风液混合)转变、由低容量向高容量供电转变。

3、L2是IT基础设施:传统数据的三大件“计算、存储、网络”,在智算中心规划中也不例外,只是结构比例有所不同,体现在计算部分占比提升(约70-80%),以AI算力(主要是GPU)为主,网络也由传统的以太网方案转为RDMA网络(IB和Roce)为主,当然存储的性能容量也有变化。

4、L3和L4是平台和业务层:因为智算中心业务类型的转变(以AI大模型的训练和推理为主),所以在这两层会和传统数据中心有较大的变化(下文具体展开)。

二、“智算中心”的定义和概念

怎么去理解“智算中心”其实不同的领域对其定义也有所差异,下面图片是来自“中国通服数字基建产业研究院(华信咨询设计研究院)”对智算中心的两个定义,我们可以作为参考。

狭义的智算中心:是智能算力的物理载体,是“机房+网络+GPU 服务器+算力调度平台”的融合基础设施,是传统数据中心的增值性延伸。

广义的智算中心:是人工智能软硬件技术一体化的载体,是“算力+数据+算法”的融合服务,是促进 AI 产业化和产业 AI 化的重要引擎,是传统云数据中心的智能化升级。

三、“智算中心”与超算和传统数据中心的对比分析

数据中心的建设与社会的发展需求紧密结合,在不同发展阶段出现了通用计算数据中心、超级中心、智算中心等不同形态的算力基础设施,其本质也是从信息化走向数字化、智能化的过程。下面从建设的目的、功能特点、应用领域和投建运模式几个维度进行简单的对比分析:

1、建设目的:

  • 智算中心:为人工智能大模型类的业务发展和应用提供支撑服务。

  • 超算中心:为科学研究,科学计算提供支撑服务。

  • 传统数据中心:降本增效,更低成本承载用户个性化、规模化业务应用需求。

2、功能特点:

  • 智算中心:通过模型训练推理+智能体,赋能各行各业,重塑各行各业,实现质的提升。

  • 超算中心:极高的计算精度和速度,通过超算集群大规模并行计算解决单机无法解决的任务。

  • 传统数据中心:

    资源池化、按需服务、快速灵活部署管理。

3、应用领域:

  • 智算中心:机器学习、大语言模型、AI全模态创作、自动驾驶、生命科学领域等。

  • 超算中心:

  • 工业制造、生命医疗、模拟仿真、气象环境、天文地理等。大规模科学计算和工程计算任务。

  • 传统数据中心:众多应用场景,应用领域和应用层级不断扩张,支撑构造不同类型的应用。

4、投建运模式:

  • 智算中心:政府主导下的政企合作共建模式、多种资金方案组合,政府指导建设,企业承建运营;

  • 超算中心:政府科研单位投资建设运营。

  • 传统数据中心:行业巨头、政府投资建设、按需付费使用,以数据服务盈利,企业自主运营。

以上只是简单把三种算力中心做了比较,仅供大家参考!

----老张会持续通过公众号分享前沿IT技术,创作不易,大家多多点赞和关注!

小叶来滴茶
杰哥写字的地方:个人工作、生活的总结思考、顿悟的记录。
 最新文章