大会预告
01 当前AI计算网络面临的挑战
02 Enfabrica ACF-S解决方案
ACF架构通过将PCIe交换机和网卡的功能集成到单一芯片,构建全连接的I/O集线器,旨在消除数据传输中的瓶颈。
消除瓶颈:通过去除PCIe转换层,实现GPU与网络之间的高速数据流动。 简化架构:替代传统的PCIe交换机和网卡,降低服务器内部的连接复杂度,简化设计。 提高韧性:支持多路径交换和内存映射,能够在故障发生时自动切换路径,保证系统的稳定性。
单芯片带宽高达8Tb/s,支持32个100Gb/s端口。 仅需两层交换机即可连接超过50万个GPU,显著减少网络延迟。 能够有效应对光缆故障,通过无缝流量切换确保GPU性能不受影响。
ACF-S SuperNIC采用巨型网卡架构,提供高端口密度及可编程传输能力,赋予用户更大的网络控制权。
高扩展性:支持更大规模GPU集群的连接,简化网络拓扑,提升网络效率。 可编程性:用户可通过软件定义网络策略,灵活配置网络参数,实现精细化流量控制。 高韧性:支持多路径数据传输,确保在出现故障时系统稳定运行。
支持32个100Gb/s端口,聚合带宽可达3.2Tb/s。 与现有编程接口兼容,无需对应用程序进行改动即可提升性能。 提供开源驱动程序,便于用户开发与部署。
针对大规模AI训练与推理集群,尤其关注模型浮点运算利用率(MFU)和总拥有成本(TCO)。 支持生成式AI应用,如大型语言模型(LLMs)和分布式检索系统(DRRM)。
提升MFU,降低TCO。 提供高带宽、低延迟的网络连接,以满足大规模AI计算的需求。 支持可编程传输,便于用户进行定制化网络配置,优化资源管理。
—END—
点击下方名片
即刻关注我们