随着以大模型为代表的AIGC时代拉开序幕,算力需求持续爆发,AI与边缘深度融合已是大势所趋,越来越多的企业开始积极布局GenAI。
GenAI技术的商用化部署和应用成为企业竞逐的新阵地,勾勒出大模型从“技术力”转向“生产力”的新生态。
算力就是生产力,更丰富的算力资源成为人工智能竞争的核心基石。
IDC预计,全球AI计算市场规模将从2022年的195亿美元增长到2026年的346.6亿美元,其中GenAI计算市场规模将从2022年的8.2亿美元增长到2026年的109.9亿美元。
GenAI计算占整体AI计算市场的比例将从4.2%增长到31.7%。
此前,ChatGPT官网一度停止Plus付费项目的购买,GPT-4推出之后也已多次下调付费用户访问限制,原因是访问量激增超出了服务器的承受能力。
随着这场GenAI热潮逐步扩张,算力短缺已成为行业面临的共同挑战。
如果说传统算力是AI大模型的筋骨,那么边缘算力就是遍布全身的神经系统。
英伟达指出,为了有效运用算力达成AI应用目标,大规模数据中心势必要增加资本支出以扩大云端运算效能,同时也将带动边缘设备的销售。
在AI向实际场景落地的过程中,边缘算力的重要性将加速凸显。未来的AI运算将呈现出“训练与迭代在云端、推理与内容生产梯度分布(云侧+雾侧+边缘侧)”的格局变化,边缘算力有望成为AI算力的重要组成部分。
相较于传统云端,边缘计算作为一种分布式计算架构,具有低延迟、高安全性、高可靠性、保护用户隐私等优势,其在实时决策在自动驾驶、医疗保健、金融、制造等各个领域都至关重要。
从效率方面看,边缘计算使GenAI模型能够在边缘处理数据,从而显着减少延迟并实现更快洞察。这意味着可以实时做出关键决策,从而提高运营效率、增强客户体验和更好的整体业务成果。
其次,通过利用边缘计算,企业可以在边缘设备网络上分配计算负载,从而优化资源利用率并有效扩展。这种方法最大限度地减少了集中式云基础设施的压力并优化了带宽使用,从而节省了成本并提高了性能。
第三,通过边缘计算,GenAI模型可以直接在边缘设备或本地服务器上运行,最大限度地减少将敏感数据传输到集中式云服务器的需要。
通过使数据更接近其来源,公司可以显着降低与数据泄露、未经授权的访问和合规性问题相关的风险。
从关系上看,边缘计算并不寻求取代云计算,相反是对其重要的补充。边缘计算和云之间的协作可实现混合架构,最大限度地发挥两种范式的优势。
GenAI模型可以利用云的可扩展性和存储功能,同时受益于边缘设备的低延迟和本地处理能力。这种融合确保了GenAI采用的多功能且适应性强的基础设施。
对此,全球科技巨头开始将目光越来越多地转向这一领域。
比如,华为、高通均推出边缘AI产品。去年3月,高通中国在安卓手机上首次演示了模型参数超过10亿的Stable Diffusion;华为于去年7月发布智慧搜图功能,该功能通过对模型进行小型化处理。
华为与高通一定程度上验证了高性能边缘AI的可行性,并且表明通过模型压缩+联网智能的方式有望在边缘端实现AI大模型的体验。
此外,英伟达黄仁勋也表示,人工智能的下一个浪潮将是具身智能。具身智能能够在物理世界中进行操作和感知,输出各种机械动作。
具身智能将边缘算力需求提升到了一个新高度,具身智能的“大脑”不仅要处理视觉信息、生成提示词,更要负责输出指令来执行机械动作。在移动芯片无法满足所需算力的场景下,边缘IDC将是算力的有效补充措施。
AIPC、AI手机、具身智能、自动驾驶等AI新应用的兴起,无疑为边缘云市场带来了巨大影响,这种影响既体现在市场规模的扩张,也反映在技术要求的提升方面。
AIPC、AI手机作为AI普惠的终端,其本质在于云端与本地端的混合协作,通过利用云端的大数据处理能力来丰富本地设备的使用场景。
这种混合协作模式对云计算的性能和稳定性提出了更高的要求,同时也为云计算带来了更多的数据处理和存储需求。
边缘云作为离用户最近的数据处理中心,能够迅速响应这些需求,提供低延迟、高带宽的数据处理服务。
具身智能和自动驾驶的发展,更是推动了边缘云市场的快速增长。智能机器人需要在真实的物理环境下执行各种任务,这就需要边缘云提供强大的实时计算能力和数据交互能力。
不仅如此,边缘AI应用场景仍在持续丰富。边缘云服务提供商Zenlayer技术专家表示,对于实时性要求极高的应用,如自动驾驶和智能制造,边缘计算能够提供毫秒级的低延迟响应。
通过在车辆或生产线上部署边缘计算节点,客户可以实时处理传感器数据,进行决策和控制,从而确保安全和高效的生产运行。
其次,对于需要处理大量数据的应用,如智能视频监控和智慧城市,边缘计算能够减轻中心云的压力,实现数据的本地化处理。
通过在摄像头或传感器附近部署边缘计算设备,可以对视频流进行实时分析,识别异常事件,并及时进行响应。
此外,边缘计算还能够解决大模型在数据传输和隐私保护方面的问题。通过将模型推理过程放在边缘端进行,可以减少数据传输量,降低网络带宽要求,同时保护用户数据的隐私和安全。
事实上,目前已有企业开始探索边缘计算在AI大模型中的应用。
据Zenlayer技术专家介绍,某家专注于大模型技术的初创企业基于Zenlayer提供的一整套SDN解决方案,通过智能路由和数据传输协议优化等手段,搭建了一条高效稳定的数据传输通道,确保大模型在训练、推理等关键环节都能获得及时、准确的数据支持,从而显著提升了模型的应用效果和用户体验。
此外,还有对于一些AI大模型客户希望将算力资源部署至海外,Zenlayer针对这类需求,提供了算力托管或算力租赁服务,将计算资源部署在靠近用户的边缘数据中心,使大模型推理能够在本地进行,极大地降低了数据传输的延迟和成本。
同时,Zenlayer还为客户提供了一系列数据本地存储和传输方案,在满足各个国家对数据合规要求的同时,尽量优化业务交互体验。
相关阅读
【科技云报道原创】
转载请注明“科技云报道”并附本文链接