近年来,AI技术从感知理解发展到生成创造,大模型的学习和泛化能力不断增强,推动了AI应用的快速增长。随着AI在各个领域的广泛应用,推理场景的需求呈现爆炸式增长,大规模和超大规模的算力集群建设已成为行业大模型厂家的主流选择。在算力多样化发展的趋势下,如何有效适配各行业的算力需求尤为关键,而智算中心服务在这一过程中发挥着重要的作用。
论坛上,《中国智算中心服务发展报告(2024年)》正式发布。河南省通信管理局党组成员副局长常江、中国信息通信研究院副院长魏亮、中国信息通信研究院云计算与大数据研究所所长何宝宏、华为IT咨询与系统集成领域总裁张岳普、华为2012服务实验室主任孙虎共同启动发布仪式。
中国信息通信研究院云计算与大数据研究所副所长李洁博士在会上对《中国智算中心服务发展报告(2024年)》进行了深入解读,全面剖析了当前中国智算中心发展存在的问题与挑战,并介绍了智算中心服务的总体架构、发展现状以及未来发展趋势,提出服务力将成为综合算力新质生产力发展的关键要素。
首先,算力的发展呈现多样化趋势。随着人工智能在各行业的逐步深入应用,算力需求不再局限于大规模的集群建设和推理能力的下沉,而是拓展为更多形态的应用场景。算力作为引领时代发展的新质生产力,是支撑数字中国建设和数字经济运行的重要基础设施。要实现高质量的算力集群建设,关键在于加强算力集群服务体系的建设,从而更好地适配不同行业的算力需求。
其次,以复杂工程系统思维建设智算集群。算力集群是一个复杂的工程系统,而不是简单的软硬件堆叠,从算力集群的规划设计、工程实施,到平台运行保障以及模型开发部署,都面临诸多挑战。例如,一个典型的超大规模集群一年的运营成本超过亿元,单点故障导致训练时间浪费5%,将会带来上千万元的直接经济损失。华为智算集成以“复杂工程系统思维”统筹规划智算集群建设,打造 “3+1”算力产业体系,即算力、存力、运力与智算服务的紧密协同,以标准引领智算产业高质量发展。
区别于通用计算时代分层解耦的建设和运维模式,全栈的智算建设工程系统需要数据中心、算力/运力/存力基础设施、模型训练推理以及整体运维保障的紧密耦合,统一规划和建设,整体考虑生命周期服务。华为智算集成提供高品质算力服务,涵盖数据中心Facility集成、算/存/网统一规划与集成、AI计算使能与优化、运维保障的全栈服务解决方案,助力客户建好、用好、管好算力。
华为IT咨询与系统集成领域总裁张岳普
主题演讲环节,河南省许昌市市投数字经济产业集团有限公司副总经理江芊林、中国移动集团网络事业部处长蔡旭辉、广东移动规划技术部基建业务总监郭光鑫、招商银行总行信息技术部智算总监陈果,分别从人工智能计算中心的全栈建设、运营商超大规模集群的运营运维、智算中心升级改造、金融业务在AI领域的应用落地等角度,分享了与华为在算力集成建设领域的实践经验。依托华为的算力平台服务,企业有效解决了智算中心规划和改造难题,在高效运营的保驾护航下,真正实现了AI应用的场景化落地,极大加速了企业的智能化转型步伐。
主题演讲环节
智算集成服务论坛为业界提供了一个交流前沿算力领域的平台。面向未来,华为智算集成将始终以客户为中心,持续夯实算力底座,携手行业客户和合作伙伴,共建繁荣生态,打造AI时代的“算力底座”,加速千行万业走向智能化。