信息技术的价值始终取决于性能和成本。我们从 IT 服务和产品中获得多少用处最初取决于限制因素,例如数据移动速度或存储成本。随着过去几十年硬件和软件的发展,性能提高,资源成本降低,IT 的批发实用性和利用率也随之上升。想想看,今天全球至少有 10 亿人在几秒钟内用手机观看高质量的 Netflix 电影。然而,1989 年,互联网用户还不到一百万,每人都无法在十分钟内下载一首歌曲。
基于 TCP/IP 的互联网服务变得如此受欢迎,很好地说明了这一点。在过去十年中,互联网总流量每年增长约 40%,而带宽(网络传输数据的容量)增长了近 900%(同比)。这一市场增长超过了宽带成本的相应下降;从 2016 年到 2021 年,互联网流量增长了 125%,而宽带成本平均仅下降了 31%。
同样,自 2010 年以来,数据存储成本下降了 69%,而每年出货的存储容量却增长了 483%,以满足对创建、捕获或复制的所有数字内容不断增长的需求。这意味着,随着成本降低 3 倍,存储需求增加了 6 倍。考虑到存储设备的使用寿命,这一趋势令人印象深刻,存储设备的使用寿命可能长达数年。事实上,尽管单位成本下降,但全球数据存储市场在 2022 年达到 2120 亿美元,预计到 2030 年将增长 17.9%。
毫不奇怪,同样的主题也适用于数据处理或计算能力。摩尔定律在过去约 60 年里一直适用,企业级和零售设备现在都以指数级的速度变得更强大、更小、更便宜。今天的手机比 1980 年代的 CRAY 超级计算机快 5,000 倍左右,而且普通消费者也能负担得起。其结果是,高性能计算的普及,广泛而强大的用途,创造了极高的移动需求和市场增长。手机占全球网络流量的 60%,自 2009 年以来,整个市场每年增长 300%。
简而言之,随着需求驱动型 IT 服务的资源容量和性能不断上调,这些服务的利用率也随之上升。在拨号上网速度下,搜索功能几乎无法发挥作用。如果没有廉价的泽字节内容存储,社交媒体就不会如此广泛地普及。如果我们不能随身携带互联网,互联网使用率将大幅下降。而且,由于对这些服务的需求超过了相应的资源成本下降,它们的市场规模不断扩大。
我们预计零知识证明市场也会出现类似的动态变化。利用率将受到对可验证或私有计算的强烈需求的推动。在短期内,主要用例是使 L1 区块链(主要是以太坊和Aleo)能够将交易处理外包,从而在不牺牲基于共识的安全性的情况下扩展 L1。不幸的是,证明生成时间对于外包来说仍然太慢,无法实时验证交易,这迫使依赖分布式验证器集进行即时确认。
通过高性能计算 (HPC) 最大限度地减少这种性能限制是满足(并超越)互联网高质量用户体验、可扩展性和互操作性基准的关键。高吞吐量、易于使用的数字支付平台和交易所交易代币和现实世界资产是短期采用 web3 的主要驱动力。我们预计区块链交易吞吐量的速率将超过证明生成成本的下降速度,从而使市场大幅增长。
对于像 ZKP 这样对性能要求极高的用例,仅限于在相对较少的 CPU 上进行顺序处理的通用计算是不够的。相反, HPC 通过大规模并行处理、低延迟组件和数千个核心的联网集群来突破性能极限。将 ZKP 加速到可以实时生成交易有效性证明的程度,需要利用并行处理、具有直接内存访问 (DMA) 的高性能加速系统和特定于应用程序的硬件。
大规模并行处理最初是由图形处理单元 (GPU) 的出现实现的,顾名思义,它们最初是为 3D 图形渲染而设计的,并在 20 世纪 90 年代和 21 世纪初推动了 PC 游戏的爆炸式增长。图形处理本质上是在显示器上点亮独特的像素向量以创建图像或视频。这意味着这些独立的程序指令可以同时执行,而不是按顺序执行。
GPU 加速计算很快推广到其他本质上也是并行的应用程序,例如人工智能。它通过将多次训练迭代从几周缩短到几天,直接将深度神经网络的速度提高了 10-20 倍,并成为能够实时决策的 AI 服务(如 ChatGPT 和自动驾驶汽车)的主要催化剂。我们可以在下面看到,在 Nvidia 用 K/M40 GPU 取代 CPU 后,Caffe 深度学习框架的速度在短短三年内就提升了 50 倍。这大大超越了摩尔定律。
零知识证明仍处于早期开发阶段,尚未对证明系统或系统参数进行标准化。然而,所有方法都相似,因为证明生成中最耗费计算资源的阶段都是高度可并行的。例如,存在执行多标量乘法运算 (MSM) 的并行算法,该运算占椭圆曲线 SNARK 证明计算成本的 80% 以上,这两种方法都从并行多线程处理中受益匪浅。
具有 DMA 的高性能硬件加速器 可在 CPU 和定制加速器之间实现高吞吐量、低延迟的信息传输。当今的 ZK 协议大多是数据绑定的(基于 MSM 的 SNARK 除外,它们仍然受计算限制),并且需要利用最大 PCIe 吞吐量的加速系统来最大限度地缩短数据传输时间。
这主要是通过使用复杂的驱动程序和 DMA 控制器来实现的,以适应 ZK 证明如何管理系统内存和 CPU 缓存中的数据。加速器应该能够比 CPU 更快地执行本机计算。虽然它们是为并行执行而设计的,但它们还必须能够进行流水线处理,以维持接口 PCIe 总线的数据速率。此外,服务器应该利用多个加速器,以便主机 CPU 可以以时域多路复用的方式调度计算。最终,优化的基于 DMA 的硬件加速器旨在通过将总 PCIe 吞吐量与总 DDR(数据)吞吐量相匹配来实现最高效率。
与传统 ASIC 不同,这些 HPC 具有高度可编程性,在 ZKP 领域我们称之为 ZPU (Zero-knowledge Processor Units,零知识处理器单元),专用于 ZKP 领域,针对 ZKP 协议和算法特点有一定的专用特性,能够抵抗协议更改,不仅不受数据吞吐量的限制,也不受计算限制。
ZKP 需要特定于应用程序的 ZPU,以实现 100 倍以上的性能提升,从而将实时客户端证明应用于垂直领域的一系列可验证计算应用程序,包括物联网、人工智能和可验证互联网。我们预计嵌入式 ZPU 内核将具有具有 ZK 友好指令的指令集,而不像常用简单的 x86 和 ARM 处理器那样缺乏足够的素数和二进制字段的自定义指令。
归根结底,ZKP(零知识证明)是实现实时交易验证的关键,区块链协议需要与“web2”互联网设定的高性能和用户友好基准相媲美并超越这一基准。实现高吞吐量、低延迟、低成本的交易需要 ZKP 专用硬件和加速系统。尽管生成证明的成本会降低,但随着去中心化网络的实用性增加,ZKP 和整个 web3 的需求和市场规模也会增加!
ZKT Aleo ZPU 芯片机 ,现正式开启第一批头矿预售!
2024 年全球 ZK 峰会 Aleo-ASIC 最有竞争力品牌!
感兴趣请扫码联系,ZKT ASIC 仅对大客户和大渠道!
转载:ZKTo完成Aleo专用ZPU芯片FPGA与PooL联调测试
重磅!Aleo的ARC42主网已经完成切换实施,PoS减产+PoW增产!
Aleo主网后PoSW数据全面分析汇总(10/28/2024)
什么是SNARK?什么是Varuna SNARK?与ZK-SNARK有什么区别?
ALEO 问答集锦 | 关于质押者、证明者和验证者官方最新解答
ALEO 问答集锦 | Aleo积分到底有什么用?区块奖励重大变化?