深入浅出:服务器组成及架构之争

科技   2024-09-26 07:47   四川  

前言:服务器是一种为客户机提供服务的高性能计算机。关于服务器最全分析材料请参考文章“重磅:服务器基础知识全解(终极版)”。


服务器是构建云计算的最核心基础设备,在“新基建”加快推进、公有云持续放量的背景下,服务器行业正迎来景气拐点。


本文围绕4个核心问题,由浅入深对服务器进行深入剖析:


1、服务器是什么?

2、服务器的构成?

3、服务器的分类?

4、X86/ARM之争?


一、服务器是什么?


服务器的英文名称为“ Server”,是指在网络上提供各种服务的高性能计算机。作为网络的节点,存储、处理网络上80%的数据、信息,因此也被称为网络的灵魂。


服务器和普通计算机的功能是类似的。只是相对于普通计算机,服务器在稳定性、安全性、性能等方面都要求更高,因此CPU、芯片组、内存、磁盘系统、网络等硬件和普通计算机有所不同。

 

服务器厂商会根据不同的应用场景,对服务器进行差异化设计,目前主要的应用场景包括文件交互、数据存储和查询、应用程序应答与运行等。



AI 服务器我们瞄准英伟达 DGX A100 和 DGX H100 两款具有标杆性产品力的产品进行分析,鉴于 H100 发布时间较短、资料详尽度不够,我们首先从 DGX A100 出发来观测具有产品力的 AI 服务器的基本架构。英伟达DGX A100 外形类似于常见的家用主机,通过对部件构成进行深度分解,我们认为 DGX A100 大体上可以分为五个硬件板块:


1) 风扇模组,从前部(Front)入手,首先看到的是风扇模组板块,DGX A100 的风扇模组由 8 个风扇组成,这一搭配与传统服务器 8U 规格的基本一致;

2) 硬盘,前部风扇模组板块的下方摆放了硬盘和前控制台板(控制与外接设备的信号传输),DGX A100 配备了 8 个 3.84TB 的硬盘,合计内部存储 30TB;

3) GPU 板组(GPU Board Tray),后部(Rear)是整个 AI 服务器的关键组件组装区域,最核心的板块就是 GPU 板组,这也是 AI 服务器区别与普通服务器的关键,从 DGXA100 的架构来看,GPU 板组主要包含 GPU 组件、模组板、NVSwitch 三块,这三块都会涉及到不同类型的 PCB 产品;

GPU 板组的 PCB 主要是由 4 个部分组成,GPU 载板、NVSwitch、OAM、UBB。


4) CPU 母板组(CPU Motherboard Tray),这一部分是所有服务器的核心部件(包括普通服务器和 AI 服务器),其中包含 CPU 母板、系统内存、网卡、PCIE Switch 等部件,CPU 母板、系统内存、网卡是主要涉及到 PCB 用量的部分;

CPU 母板组涉及到CPU载板、CPU主板和配板,其中功能性配板包括系统内存卡、网卡、拓展卡、存储操作系统驱动板。

5) 电源模组,DGX A100 后部的下方还配有 6 组电源,电源内部会涉及到厚铜 PCB 板的使用。

从功能性的角度,我们认为 AI 服务器的 PCB 价值量计算可以归纳为三个部分,其一是AI 服务器最为核心的 GPU 板组,其二是所有服务器都必备的 CPU 母板组,最后是风扇、硬盘、电源板块等配件组。本文将基于这三大部分逐一分解。

二、 服务器的构成?


2.1 服务器的逻辑架构


服务器的逻辑架构和普通计算机类似。但是由于需要提供高性能计算,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。服务器的逻辑架构中,最重要的部分是CPU和内存。CPU对数据进行逻辑运算,内存进行数据存储管理。



2.2 服务器的硬件


服务器硬件主要包括:处理器、内存、芯片组、I/O(RAID卡、网卡、HBA卡)、硬盘、机箱(电源、风扇)。


在硬件的成本构成上,CPU及芯片组、内存、外部存储是大头。以一台普通的服务器生产成本为例,CPU及芯片组大致占比50% 左右,内存大致占比 15% 左右,外部存储大致占比10%左右,其他硬件占比25%左右。



2.3 服务器的固件和OS


服务器的固件主要包括BIOS或UEFI、BMC、CMOS,OS包括32位和64位。


1)BIOS

(Basic input/ Output System)

即基本输入输出系统,是服务器启动后最先运行的软件。它包括基本输入输出控制程序、上电自检程序、系统启动自举程序、系统设置信息。BIOS是服务器硬件和OS之间的抽象层,用来设置硬件,为OS运行做准备。BIOS设置程序是储存在BIOS芯片中的。BIOS的进化版本是UEFI(Unified Extensible FirmwareInterface),即统一的可扩展固定接口。


2)BMC

(Baseboard Management Montroller)

即基板管理控制器,主要是对服务器进行监控和管理。BMC可以在服务器未开机的状态下,对机器进行固件升级、查看机器设备等。


3)CMOS

(Complementary metal-oxide-semiconductor)

是电脑主机板上一块特殊的RAM芯片,是系统参数存放的地方。CMOS存储器用来存储BIOS设定后的相关参数。


4)OS

(Operating system)

即操作系统,对服务器软硬件及数据资源进行管理调度。OS主要分为32位和64位,OS的位数版本决定了计算机处理器在RAM(随机存取储存器)处理信息的效率,64位版本比32位的可以处理更多的内存和应用程序。


三、服务器的分类?


服务器的分类标准是多元化的,目前主要可按产品形态、指令集架构、处理器数量、应用类型等对市场上的服务器进行分类。

 



3.1 按产品形态


服务器按产品形态,可以分为:塔式服务器、机架服务器、刀片服务器、机柜服务器等。



1)塔式服务器( Tower Server)


既常见的立式和卧式机箱结构的服务器,可放置在普通的办公环境,机箱结构较大,有较大的内部硬盘、冗余电源、冗余风扇的扩容空间,并具备较好的散热功能。塔式服务器密度低,多为单处理器系统(有少部分为双处理器系统)。系统电源和风扇一般是单配,非冗余可靠性较低。主要应用在企业官网、多媒体大流量APP、医疗成像、虚拟桌面基础架构(VD)等场景。



2)机架式服务器(Rack Server)


机架结构是传统电信机房的设备结构标准,宽度为19英寸,高度以单位“U”计算,每“U”为1.75英寸(可换算成4.445cm)。通常有1U、2U、4U和8U之分,其中以1U和2U为主,其次是4U和8U。近期市场也有3U和6U等高度的机架产品出现。机架服务器是一种外观按照统一标准设计的服务器,配合机柜使用。



3)刀片式服务器(Blade Server)


通常在一个机箱里可以插入数量不等的“刀片”,其中每一块“刀片”实际上就是一块服务器主板。刀片服务器通常只需要比机架服务器更少的机架空间,通过优化空间来提供更强的计算能力,是一种更高密度的服务器平台。一般包括刀片服务器、刀片机框(含背板)及后插板三大部分。不同厂商有不同高度的机框。



4)机柜式服务器(Cabinet Server)


是未来数据中心基础架构的核心形态和发展趋势。它集成计算、网络、存储于一体,以及面向不同应用时,可以部署不同的软件,提供一个整体的解决方案。机柜式服务器一般由一组冗余电源集中供电,散热方面由机柜背部风扇墙集中散热,功能模块和支撑模块相分离,通过供电、散热的整合,相比普通机架式服务器,运行功耗低、且可靠高效。



3.2 按指令集架构



1)CISC服务器


也被称为X86服务器,采用Intel、AMD或其它兼容X86指令集的处理器芯片以及Windows操作系统的服务器,是目前主流的服务器架构。



2)RISC服务器


RISC服务器基于RISC处理器,目前主要包括IBM的Power和Power PC处理器,SUN和富士通合作研发的SPARC处理器,华为基于ARM架构级授权研发的鲲鹏920处理器。


3)EPIC服务器


EPIC服务器基于EPIC处理器,目前主要是Intel研发的安腾处理器等。

 

使用RISC或EPIC架构的服务器又称非X86服务器。包括:大型机、小型机和UNIX服务器,并且主要采用UNIX和其它专用操作系统。




3.3 按处理器数量


按照处理器的数量可将服务器分为:单路服务器、双路服务器、四路服务器、八路服务器等。其中,“路”是指一台服务器内部的CPU个数,比如单路服务器内部CPU数量为1颗,双路服务器为2颗,以此类推。目前主流的服务器是双路服务器。


多路服务器用到了对称多处理技术(SymmetricalMulti-Processing,简称SMP),在一台服务器上,多颗CPU共享内存子系统以及总线结构。在服务器运行时,多颗CPU同时运行操作系统的单一复本,系统将任务队列对称地分布于每颗CPU之上,所有的CPU都可以平等地访问内存、I/O和外部中断,从而极大地提高了整个系统的数据处理能力。



四、 X86/ARM之争?


正如前文所述,按照指令集类型,服务器可以分为CISC服务器、RISC服务器、EPIC服务器。其中CISC服务器又被称为X86服务器,RISC和EPIC服务器又被统称为非X86服务器(也即Non-X86服务器)。从服务器的产业趋势来看,目前正形成双强的局面,其中X86服务器以Intel/AMD处理器为主导,而非X86服务器以ARM架构处理器为主导。双方各有优劣势,将长期共存。



4.1 X86服务器:市占率高


X86服务器是目前市场的主流选择。2009年以来,X86服务器逐步成为服务器市场的主流选择,收入方面的优势相较于Non-X86服务器不断扩大。根据Gartner的数据,2019年,全球X86服务器出货量和厂商销售额分别为1249.7万台和693.6亿美元,远超Non-X86服务器。



中国X86服务器市场需求有望拐点向上。在中国“新基建”政策的推动下,未来5年,中国X86服务器市场景气度有望提升。根据IDC的预测,2020-2024年,中国X86服务器的出货量复合增长率为9.1%。


英特尔10nm新一代芯片即将面世,X86服务器有望迎来新一轮产品迭代。处理器是服务器的核心,而X86服务器芯片的霸主为英特尔,英特尔的产品迭代对X86服务器的产业周期有重要影响。



目前,作为市场份额最高的服务器架构,X86服务器的核心优势在于:


1)性能领先。X86架构处理器设计的初衷在于性能,以2U服务器系统为例,可提供多达48 核的超强计算性能,灵活的存储扩展以及高速网络接入能力,非常适用于具有多重业务负载的复杂基础设施环境,包括企业级部署、云环境部署、大数据应用环境等。


2)生态完善。X86指令集是一个相对开放的指令集,在发展之初英特尔等供应商对独立软件开发商即进行指令集开放,对桌面软件兼容,发展至今,越来越多的玩家进入X86生态圈,形成了广阔、完善的护城河。


4.2 ARM服务器:潜力很大


ARM服务器迎来万物互联发展良机。ARM处理器的应用始于低功耗、计算量小的移动场景,并专注于嵌入式电子、消费电子、汽车电子等领域发展。因此,ARM在移动端、IOT侧占据压倒性的市场及技术优势。叠加其适配500万ARM原生应用,未来,ARM架构与X86架构的竞争值得关注。


5G和物联网推动边缘计算、端侧AI发展,能效、灵活性将成为用户重点考量因素。ARM服务器的有点包括:


  • ARM服务器的能耗低。X86架构采用效率相对较低的体系架构,功耗较高,而ARM采用精简指令集的设计理念,具有天生的计算高效能优势。


  • 单位面积内核数更多、算力更强。一个ARM核的面积仅为X86核的七分之一,同样尺寸下,ARM 核数是X86的4倍以上。由于芯片尺寸限制,ARM的众核横向扩展更符合分布式业务需求。


以鲲鹏920为例,其采用7nm工艺,可以支持32/48/64内核。此外,Ampere发布的Altra芯片具有80个内核,Marvell将推出的Thunder X3具有96个内核,相较于Intel至强白金系列的24-56个内核,具有单位面积内更强性能的优势。



未来,随着数据中心软件生态逐步支持ARM架构,以及其天生的低成本和低功耗特性,在华为、AWS等ICT巨头的带领下,ARM架构CPU的价格和性能有望改善,将可为用户提供更低成本的云计算服务,实现出货量的进一步成长。


分享完毕,关于服务器最全分析材料请参考文章“重磅:服务器基础知识全解(终极版)”。



转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。


推荐阅读

更多架构相关技术总结请参考“架构师全店铺技术资料打包”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价339元)。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取“IT技术全店资料打包汇总(全)电子书资料详情


架构师技术联盟
分享项目实践,洞察前沿架构,聚焦云计算、微服务、大数据、超融合、软件定义、数据保护、人工智能、行业实践和解决方案。
 最新文章