近日,优刻得凭借自研的云端算力引擎“孔明”智算平台,成功入选中国人工智能产业发展联盟(AIIA)发布的《2024年人工智能先锋案例集》,成为AI Infra领域的先锋企业,不断驱动多模态大模型的创新应用与发展。
为响应国家“人工智能+”行动号召,中国人工智能产业发展联盟、工业和信息化部新闻宣传中心、中国信息通信研究院2024年共同启动了“2024年人工智能先锋应用案例”征集活动,旨在甄选并推广具有高价值、标杆性、真落地的行业典型案例,更好地推动我国人工智能技术应用及产业发展,征集工作得到了行业和社会的广泛响应。
在多模态大模型应用领域,行业普遍面临算力资源成本高昂、资源调度管理复杂以及模型训练和推理的低效瓶颈,导致众多模型厂商在推进大模型技术的过程中,被限制了数据处理、实时推理和模型迭代上的能力和速度。
在这样的背景下,优刻得“孔明”智算平台应运而生。以其多元异构的算力资源、高效便捷的管理服务、安全可靠的运行环境,为大模型训练和推理过程提供稳定高效的算力支持和集群调度能力,以帮助AI企业更好地管理异构资源,并根据负载动态分配不同任务。
以先进的技术架构为模型厂商提供强大的算力支持和调度管理能力,“孔明”智算平台具备三大核心特性:
多元算力统一调度
“孔明”智算平台可对万卡集群统一纳管。支持对同构和异构GPU、高速计算网络、本地NVMe及并行文件存储的统⼀调度管理。智算集群的弹性扩展能力,可根据客户当前的资源数量进行集群动态管理。
高效分布式训练
“孔明”智算平台提供了稳定可靠的模型研发环境。平台预置主流算法框架,支持多任务同时训练,并可根据优先级抢占资源。此外,其断点续训的能力,可实现大模型训练任务异常时自动拉起,大幅缩短算力闲置时间,使得模型开发者能够更充分地利用GPU算力资源,以更低成本、更高效率来训练和优化模型,加速AI大模型在各领域的落地应用。
可视化智能运维
“孔明”智算平台对集群管理人员提供了可视化的资源管理界面,可对算力分配、算力监控、算力使用情况进行运营分析,极大程度简化了算法工程师的重复操作。通过多项目团队同时协作,减少管理成本、提升模型研发和部署应用效率。目前,平台已广泛应用于大模型训练、城市治理、自动驾驶、生物医药、工业制造等领域。