甲骨文发布Exadata数据库一体机(X11M),性能提升超55%,价格不变!

时事   2025-01-15 07:01   北京  

\ | /

★★★




X11M 


关系型数据库已经不再是数据中心建设的关注焦点,但自IBM在20世纪70年代末创建首个关系型数据库以来,其事务处理能力就是构建IT系统不可动摇的的核心技术
时至今日,IBM和Oracle依然是世界市场上唯二的软硬一体化协同产品公司,这些系统加速了数据库性能,同时为全球5000强企业以及成千上万中小企业提供了可靠性及扩展性。
  Exadata X11M 发布  
2025 年1月7日,Oracle发布了最新版Exadata数据库一体机X11M,这是2023年夏季发布X10M之后的又一次更新,是Oracle一体机的第十三个版本。
本次升级,提升了数据库计算服务器和闪存服务器的性能,降低了延迟,并且将芯片换成了AMD Epyc处理器,而非Intel Xeon处理器。
Oracle长期以来一直在设计适用于大规模关系型数据库的系统,回顾这些机器架构如何随着时间演变以满足对速度和容量不断增长的需求仍然令人感兴趣。此外,随着Exadata X11M的发布,思考AI是如何融入应用程序中并嵌入到数据库计算和存储引擎中的,以及实现这一功能需要什么或不需要什么也非常有趣。(提示:添加AI功能并不需要GPU,但它确实需要大量的矢量处理能力。)
回溯历史,2007年,当大衰退刚刚开始时,Oracle开始悄悄向选定客户发货第一代定制设计的Exadata X1数据库设备,这些客户正在寻找削减大型NUMA服务器成本的方法。Exadata X1机器正式宣布与HPE的ProLiant X86服务器部门合作,并结合InfiniBand网络链接数据库计算引擎,以便于数据库扩展,同时也连接基于闪存的存储服务器,后者为Oracle数据库提供底层存储引擎。InfiniBand的远程直接内存访问(RDMA)特性,使其成为高性能计算集群首选网络,也是Exadata设备的关键组成部分。
2009年9月推出Exadata V1,最初是为了数据仓库和快速数据查询而设计。到了Exadata V2,Oracle增加了基于闪存的存储服务器,将部分SQL处理任务卸载到这些存储服务器上,同时优化随机读写操作,使Exadata V2既适合在线事务处理也适合数据仓库,就是现在我们说的HTAP融合能力。
  更高的配置   
2025年初,一个Exadata X11M机架可以配置2到15个数据库服务器,以及3到17个存储服务器,以适应不同级别的计算和存储需求。一个Exadata X11M机架最多可拥有2,880个AMD “Turin”核心和42TB内存用于数据库处理,或者1,088个Turin核心和21.3TB RDMA寻址内存用于专门的SQL处理。所有这些处理器均以基础频率2.95GHz运行,并且是为Oracle定制的。
Exadata X11M客户可以选择每机架最高达462.4TB的高性能闪存或高达2PB的高容量闪存,如果延迟不是问题且需要容量的话,则可达4.4PB的磁盘容量。显然,客户可以在数据库和存储层级内混合搭配这些计算和存储组件的不同级别。(所以oracle从来不担心 “新一代”分布式会动摇它的市场地位…)
无论数据库和存储节点的配置如何,它们都通过双轨、主-主模式的100Gb/s以太网RDMA结构相连。多达14个Exadata机架可以通过现有的交换结构互连成一个巨大的数据库集群。如果需要更大的配置,可以增加另一层以太网交换来进一步扩展。
每个Exadata X11M存储服务器每机架可提供高达8.5TB/s的I/O带宽用于SQL操作,每秒可达2520万次8KB数据库读取IOPS和1300万次8KB写入IOPS。
以下是Exadata X11M单个服务器的一些配置参数:
  更高的性能,不变的价格  
对于同样的8个数据库服务器(普通版,非Z变种低核数版),每个服务器配备3TB容量,这部分Exadata集群的价格为178万美元。这八个数据库节点合计拥有1,536个X86核心(可能是2009年的Nehalem核心性能的两倍)和24TB内存。
如果您使用7个Extreme Flash存储节点(带有薄型闪存卡)并添加8个High Capacity存储节点(包含磁盘和闪存的混合),那么您将获得2.1PB磁盘和408TB闪存存储,额外花费118万美元。
总计下来,一个平衡配置的Exadata X11M机架总价为296万美元。
与2009年的Exadata V2相比,一个Exadata X11M机架在数据库服务器上的核心数量是其24倍,性能大约是48倍,总内存容量是76.8倍,磁盘和闪存容量大约是7.5倍,而成本仅为2.6倍。
此处的教训是,增加计算能力比增加存储更加经济,这一点在数据库操作及其应用程序中由于AI导致的矢量数学运算量上升时显得尤为方便。矢量搜索可以在Turin处理器中的矢量单元上运行,并且可以卸载到存储服务器上,实现自动并行化。具体来说:
得益于Exadata X11M使用的Turin处理器相较于前一代Exadata X10M中96核“Genoa”Epyc处理器额外的矢量处理能力,X11M数据库服务器上的内存矢量索引查询速度提高了43%,而存储服务器上的持久化矢量索引查询速度则提升了55%。此外,X11M机器能够多处理25%的事务,并且由于更快的6.4GHz DDR5内存,可以从闪存中为OLTP工作负载提供超43%的数据读取速度。
有趣的是,根据Oracle Exadata、数据库云服务和多云产品的副总裁Ashish Ray的说法,Exadata X11M机器的价格与2023年6月发布的前一代X10M相同。
在Exadata X11M机器中看不到更快的以太网RDMA网络或来自Nvidia或AMD的GPU。
Ray表示,在分布式数据库/存储服务器架构中,降低以太网网络的延迟远比将互连端口的带宽提升至200 Gb/s、400 Gb/s或800 Gb/s更为重要。
这里有一个很好的例子:
Exadata X8M和X9M平台使用了Intel的Optane 3D XPoint内存作为存储服务器中的快速缓存层,但随着几年前Intel停产该产品,Oracle创建了XRMEM内存缓存,它从存储服务器的主要内存中划分出一部分,并通过RDMA链接到数据库服务器。在X10M机器上,从数据库服务器到存储服务器上的XRMEM的链接延迟为17微秒。通过调整X11M堆栈中的微代码和网络栈,Oracle已经能够将这个时间减少到14微秒,这使得8 KB I/O进入数据库服务器的速度提高了21%,从而提升整体吞吐量。这一切都不需要更昂贵的网络设备。
尽管GPU已被用于加速列式数据处理——例如Heavy.AI(原MapD和OmniSci)、Kinetica和SQream等——但Ray表示,到目前为止,对于Oracle客户在其数据库上运行的OLTP和分析工作负载而言,这种做法并不是必要的。
Ray解释说:“Exadata平台上以及其Oracle数据库中发生的很多AI处理都与AI矢量处理有关。换句话说,进行矢量搜索,创建矢量或多维索引,以及最短距离Top K算法。Exadata并不涉足大型语言模型(LLM)训练业务,这正是GPU特别相关的领域。因此你会看到我们的云端GenAI服务中有GPU。关于Exadata,因为主要用于结构化的私有业务数据,所以矢量处理发生在我们为数据库服务器和存储服务器使用的超快速AMD处理器上。”
当AMD在其Epyc处理器中添加矢量核心时,可以肯定的是,Oracle工程师将会调整算法来利用这些新特性。但是,除非有令人信服的计算理由,否则我们不期望会在Exadata数据库机器中添加GPU或其他类型的加速器。这种情况未来可能会发生,尤其是在AI功能被加入到Oracle数据库管理系统中时。

 

点击关注,了解最新技术 

接下来的内容为占位符,能将平台广告封印于此,如果你在听取播放,那么可以停止了;

中国数据库发展有几个关键里程碑,而2024年注定成为国产数据库发展的重要转折点。

1977-国产技术元年  

第一个10年,技术启蒙1977年黄山数据库大会,被誉为中国数据库元年,因为从那一年开始,数据库技术在中国开始正式有组织、成系统地传播。数据库大会之后,1979年人民大学萨师煊老师将自己的讲稿汇集成《数据库系统简介》和《数据库方法》,在当时的《电子计算机参考资料》上发表,这是我国最早的数据库学术论文(正是这一年,甲骨文公司发布了其第一款商用数据库产品 Oracle 2.0);1983年,萨师煊与弟子王珊合作编写出版《数据库系统概论》,成为国内第一部系统阐明数据库原理、技术和理论的教材,至今已成为众多中国数据库技术人在校园里的启蒙课程,为中国数据库产业培养了大量人才。




1989-海外入侵  

第二个10年,观摩学习1989年甲骨文正式将Oracle数据库推入中国,中国正式进入初步信息化建设,随后IBMDB2,以及Sybase等纷纷进入中国市场,信息技术推动中国经济高速发展的同时,芯片、操作系统、数据库也彻底被海外厂商垄断。此时的国产数据库有了近距离观察、学习的机会,无疑加速了产品落地。

1999-国产商业化  

第三个10年,市场探索1999年,人民大学王珊老师带领团队,拿了人民大学几万块的投资,成立了中国第一家数据库公司-人大金仓,国产数据库正式以商业团队的形式出现。但已然比Oracle2.0发布晚了20年,比Oracle进入中国市场晚了10年。2000年,武汉达梦成立。2004年,南大通用成立国产数据库进入到纯粹政策引导的商业化探索阶段

 2015-国产大爆发  


第四个10年,黄金腾飞2015年,随着政策的频繁落地,信创替换的战役全面打响,一夜之间出现数百个国产品牌。而鉴于金仓、达梦、南大等企业已经在国产集中式数据库领域建立足够的市场壁垒,大量初创公司只能绕道冲入新兴分布式数据库赛道。(所以,国产分布式厂商打着弯道超车的口号,明面上是绕过oracle,实际上是想绕过国产集中式!)此后国产品牌数量持续增长,到2020年已经有超过200个产品,并且大量创业公司在这一年前后获得多则数亿元,少则大几千万的融资,这是国产数据库发展的黄金10年,接下来即将步入高速腾飞阶段。







 2024-产业大收缩  


第五个10年,稳健发展

三年新冠、AIGC崛起、美国制裁加剧、房地产经济泡沫破灭,整体经济出现下行等不利因素,数据库市场竞争进入拼刺刀阶段,阴招、狠招层出不穷,企业缺陷也在寒潮中暴露无遗。2024930日,中国信息安全测评中心突然发布安全可靠产品名单,分布式数据库名单重磅落地,然而让人唏嘘的是其中只包含一家初创分布式公司!这对大量的初创团队而言,无疑成为压死骆驼的最后一根稻草。

然而好的方向是,随着产业形态的收缩,头部效应更加明显。未来十年,前排厂商将会吸纳更多的人才与市场关注,中国数据库产业的发展将会更加快速、稳健...而这正是政策诱导、调控的目标和结果~

同时,出海成为国产数据库头部厂商关键布局,国产数据库在国际市场上的的突破,能否占据一席之地也将在接下来的10年发生和落定。




数据库管理系统,是一种用来存储、管理数据的软件,是系统数据安全和性能体验的关键技术保障。

过去,数据库技术基本被美国垄断,主要厂商(产品)包括:甲骨文(Oracle、MySQL)、IBM(DB2)、微软(SQL Server)等...

未来,数据库全面自主可控已是必然...


★★★★★

国产数据库企业代表...

中国信息安全测评中心发布安全可控数据库产品名录:入围厂商与产品汇总


中国技术

雄起!




【信创招、中标】【精品阅读】

金仓

达梦

南大

海量

瀚高

虚谷

甲骨文

OB

TDSQL

TiDB 

中兴

华为

麒麟

统信

【信创数据库名录】
【技术观察与观点】
【测试学习与实践】

【信创政策~记录】

【其他信创观察~】


天下观查
国产数据库产品测评、信创招标、技术趋势、企业新闻热点……【纵横天下,用心观查】
 最新文章