知道异构算力,但你知道异构存力吗?

科技   2024-11-21 17:11   北京  

英文有26个字母,在每个字母之后+PU,就构成了异构算力,其中我们最熟悉的是CPU、GPU和DPU,生成式AI就主要受益于GPU。


生成式AI仅有GPU是不够的,还需要配合数据和算法,其中数据对应于存力,也就是存储提供数据的能力。需要注意的是存力也有异构的问题?那么,异构存力是什么概念?异构存力调度为什么关键呢?为此,2024数据存储峰会期间,DOIT总编宋家雨特邀绿算技术首席科学家、烽烟研究院院长孟坤,结合异构存力进行了深入交流。

宋家雨:绿算技术成立至今只有3年多一点的时间,要想做到后发先至,要作对什么?为什么选择存储作为发力点?

孟坤:绿算真正运营是三年多时间,但之前修炼内功的时间更长一些,也包括团队的搭建。我们为什么开始做存储这个事情?当然一方面是各种机缘巧合,第二个就是觉得我们找到了一种正确做事情方法,也就是您说的后发优势。我们就是以问题为导向,从需求来做驱动,现实的信息技术发展,恰好我们在数据传输通道、数据高性能交付积攒了一些心得,所以就选择了存储这个实体来做。我们希望在数据服务的两个维度上,来提供一些高质量的服务,一个就是数据智能化加载,需要什么.我们能够快速推送过去;第二是数据存取时候的安全。

我们并没有把自己局限在存储上,但是存储在整个信息技术服务中间,是非常基础也是非常关键的,如今已经被大家提高到数据资产高度。把我们的技术和底层数据结合起来,是现阶段比较好的一个产品,能够给大家提供更好的服务。

宋家雨:GP6000 系列有哪些竞争的优势?

孟坤:GP6000是一个全闪存储,核心技术一是网络化扩展,我们提供了100G、200G、高速网络接口;二是数据传输协议卸载,我们使用芯片技术实现硬件级加速,让存储传输通道上面的数据更流畅;三是采用模块化的架构,每个组件都是冗余的,每一个组建都可以热插拔,不停机情况下做任何组件的替换和修复。

GP6000支持端到端NVMe协议,为了减低延时,网络提供了RDMA的支持。

宋家雨:所谓异构存力的调度指的是什么?

孟坤:我们怎么定义这个异构存力?其实异构存力一是从它的存储协议,二是用户对存储的要求,如安全、性能上的要求来定义。

我们知道存储经历了很长的发展,从介质上看,从磁介质、光介质,到现在的Flash (闪存)存储颗粒,其数据访存性能逐步提升;与此同时,存储传输协议、控制协议也在发生变化。但是我们不可能一次性用最好的技术,把所有东西替换掉,这个是不可能的,必须要做到向前兼容。

我们要考虑之前的数据怎么用?

我们不可能把它一次性搬过来,统一用NVMe的方式对它们进行管理和调度,我们怎么把它系统管理起来,调度起来,更好地为我们上层业务提供好支撑,这个就是我们所说的异构存储,异构存力。我们的目标就是把这些东西适当地调度起来,或者通过热数据、冷数据,或者通过业务把它们分开,放在不同的地方,这个就是我们存储都在做的事情。

宋家雨:从绿算的角度,如何看到数据创新和应用?当今阶段,应该从何入手?

孟坤:回答这个问题,我从两个角度来说。

第一个,先看看时代的需求。现在大家非常的重视数据,这是一个核心的变化,所谓数据资产。当数据资产化之后,生态问题就完全不一样了。资产有一个核心要素,就是这个资产归属权的问题。在数据资产化的时代,如何让数据更好的发挥它的价值来服务于美好生活的向往,这个是我们绿算一个重大的探索,当然这也是时代的要求。

第二个,如何实现创新?我们就看一看现在大家都在需求什么,无外乎从整个数据的全生命周期来看:一是数据你要采的时候、想采的时候一定要采得到;二是你采的数据自己要说得清,内容是什么,归属权到底是谁的;三是想存数据的时候,就要存能存得下;四是想用的时候,能用出来;五是数据资产时代,我想共享、想交易的时候,应该很方便的让大家共享起来、流动起来。

无论这个阶段中间的每一阶段的需求,可能都是我们需要创新技术的一些出发点。

现在生成式AI爆火,涉及有历史的数据,也有现实要采集的数据。历史的数据就不说了,它的真伪怎么样,所有权怎么样,历史的问题要解决,但是现实的问题要训练新的模型让它产生新的智能,就需要大量的数据,这些数据怎么弄?怎么快速准确的供给?怎么不涉及各种各样产权问题?这些都是需要解决的,这些点都是需要我们探索的。

我们的创新还是紧紧的围绕着用户的需求,以问题为导向。现阶段主要发力两个点,第一个是智能、性能、高性能,让大家能用起来、用好、存下来。第二个,保证我们探索,怎么让数据能够安全的存下来。

宋家雨:EDSFF、CXL这样技术会对存储产生哪些影响?

孟坤:我觉得这个影响是肯定的,我觉得现在可能就是个契机。其实大家追求更快、更安全、更有效,其实是我们亘古不变的一个追求,包括你刚才说的E.3规格SSD,我们在没有做绿算之前,就尝试使用过类似Ruler这样的SSD产品,它的最大的好处是密度比较高,体积比较小,所以当时我们做原型机的时候能做到1U上百TB的容量,因为采用铝合金外壳,它的散热非常好,整体均衡一下,发现整体功耗表现非常不错,如今,生成式人工智能、大模型出现之后对存储性能提出了更高的要求,新的SSD、CXL产品会大有用武之地。

现在已经开始或者我们自己也有规划,当然更多的我们有一些合作伙伴在一块探索,大家做一些联合的解决方案。说白了,其实我们的一个目的就是给用户提供更充足、更可靠、更安全的资源,让它上面更好的去创新、更好的去发挥。

END


 观看采访视频

DOIT传媒
百易传媒官方订阅号,专注于数据存储、云计算、服务器、数据中心等技术领域以及行业数字化转型。
 最新文章