北京时间11月14日,日本移动通信网络运营商软银移动宣布与英伟达合作推出第一款AI与无线接入网融合(AI-RAN)解决方案(历时5G年打造),软银移动将其命名为“AITRAS”,而且还进行了AI-RAN现网试验(自称是世界上第一个AI和5G组合网络),5G公众号(ID:angmobile)注意到软银移动表示AI-RAN的试验效果很好;软银集团首席执行官孙正义表示它将成为日本通信基础设施的智能大脑,其他所有电信网络运营商都将不得不追随这一新浪潮;英伟达CEO黄仁勋表示AI-RAN网络将能够并行处理AI任务和5G数据流,为电信网络运营商开辟了新的收益途径,软银是首批收到英伟达新的Blackwell芯片设计的公司。
上述AI-RAN解决方案的最大看点,就是引入了英伟达公司。软银移动介绍,该AI-RAN解决方案是其自己与英伟达合作同开发的。5G公众号注意到正是主要由于引入了英伟达,软银移动的AI-RAN里没有了爱立信和诺基亚的任何产品的身影,具体地,用了英伟达的CPU、基于英伟达Al Aerial加速计算平台的RAN第一层软件、基于英伟达Al Enterprise的边缘AI、红帽公司的虚拟化平台,甚至5G公众号注意到软银移动连RAN第二/三层软件、射频单元都没有用爱立信和诺基亚的(而是用的富士通的),编排器是软银自己开发的,如下图所示。
由此看来,英伟达在RAN领域给巨头型设备商带来了不小的寒气。而且加之关键是,软银移动称其AI-RAN现网试验取得了很好的效果。AI-RAN现网试验在日本的神奈川县进行,5G公众号注意到软银表示英伟达加速的AI-RAN解决方案可以实现运营商级5G高性能和高质量,5G RAN仅需以大约三分之一的容量运行(在1台配备英伟达GH200 Grace Hopper超级芯片的服务器上实现20个4.9GHz频段100MHz带宽5G小区的基带处理,通过最多4层MIMO,实现了每个小区约1.3 Gbps的最大通信容量),而其余三分之二的容量用于对外提供AI推理服务;英伟达表示,软银的试验标志着AI-RAN商业化迈出了一大步,验证了技术的可行性、性能和经济性。
甚至,英伟达表示,软银与英伟达估计,移动网络运营商每投资1美元新的AI-RAN基础设施,就可以从中获得大约5美元的AI推理收入。英伟达电信高级副总裁Ronnie Vasishta表示,从单一用途的RAN转向多用途的AI-RAN意味着可以获得5倍的收入回报。5G公众号注意到软银表示进一步的计算表明在基础设施中添加的每个AI-RAN服务器都可以实现高达219%的回报——当同时考虑资本支出成本和运营支出成本时。
那么,如何通过AI-RAN提供AI推理服务?在现网AI-RAN试验中,软银使用英伟达AI Enterprise构建了现实世界的AI推理应用,包括自动驾驶汽车远程支持、机器人控制和边缘的多模态检索自动生成。英伟达表示,所有这些推理工作负载都能够在软银的AI-RAN网络上最佳运行。
此外,如何来集成和协调AI-RAN中的RAN和AI工作负载?答案就是上图中部署于AI-RAN的编排器,5G公众号了解到软银打算通过使用英伟达AI Enterprise无服务器应用程序编程接口(API)及软银自己开发的编排器来构建一个连接AI技术需求和供应的生态系统,这将使软银能够在单个英伟达GPU服务器上运行密集单元来提高通信效率,并能够在计算资源可用时将外部AI推理作业路由到AI-RAN服务器,以提供本地化、低延迟、安全的推理服务。