中国人工智能产业发展联盟第十三次全会
11月12日,中国人工智能产业发展联盟第十三次全会在北京召开。联盟全会上AI Infra工作组发布大模型平台多项标准、大模型基础设施高质量发展产业洞察,同时正式启动“大模型基础设施高质量推进计划”,并邀请首批成员单位华为、新华三进行大模型基础设施高质量发展实践演讲。
中国信通院人工智能研究所平台与工程化部主任曹峰汇报了AI Infra工作组成果并宣布启动“大模型基础设施高质量推进计划”。AI Infra工作组聚焦大模型基础设施高质量发展,构建了大模型平台标准体系,并形成了大模型基础设施高质量发展产业洞察,旨在深度挖掘大模型落地过程中的基础设施挑战和关键技术,为大模型基础设施高质量发展,提供标准化建议和指导,夯实大模型落地基石。
标准化方面,AI Infra工作组聚焦计算资源调度、数据处理、模型训练、模型推理等关键节点推动标准化工作。《大模型计算资源调度平台技术要求》全面梳理大模型计算资源调度平台的全流程功能要求和性能指标,致力于打造高效率、高可靠、可扩展的大模型算力资源供给。《大模型数据处理平台技术要求》提出大模型数据处理全流程环节需具备的技术能力,确保能够高效、高质量处理大规模数据。《大模型训练平台技术要求》整理了大模型训练平台的全流程功能要求和性能指标,面向微调、预训练场景旨在提升大模型训练效率、稳定性和易用性。《大模型推理平台技术要求》围绕大模型推理场景,以推理低时延、高吞吐、可扩展为目标提出技术和性能要求。《边缘人工智能平台技术要求和测试方法 第1部分:平台功能》围绕基础硬件能力、设备管理、数据管理、模型推理和应用管理等核心环节,提出通用功能要求。
产业研究方面,AI Infra工作组发布“大模型基础设施高质量发展产业洞察”。从AI存储、开发工具链、运维等层面对大模型基础设施面临的问题和关键技术进行了分析。AI存储方面,存在数据归集时间长、数据处理效率慢、推理记忆时间短等问题,要求AI存储具备数据编织能力、高扩展性、极致性能和长记忆能力。开发工具链方面,存在训练侧模型开发效率低、推理侧落地受硬件设备限制等问题,要求大模型开发工具链具备开发高效、模型压缩效率高、推理兼容性高等能力。运维方面,存在训练盲启动故障频发、集群器件种类多故障诊断效率低等问题,要求运维平台具备故障诊断与恢复智能化。大模型基础设施高质量建设需求呼唤全面、系统性的评价体系。大模型基础设施高质量发展产业洞察的全部内容将在《高质量大模型基础设施研究报告》中进行详细阐述。
为解决大模型基础设施面临的新挑战,推动大模型基础设施高质量建设,中国信通院以AI Infra工作组为基础,联合工商银行、中国联通、中国移动、华为、百度、新华三、蚂蚁集团、阿里云、腾讯云等正式发起“大模型基础设施高质量推进计划”,从需求角度出发,以提升大模型基础设施的质量与效能为目标,共同加快布局“高效计算调度+高性能AI存储+高通量网络+高效能开发平台+智能化运维平台”,助力大模型工程化落地。
新华三CTO办公室主任周宏毅受邀发表《汇聚产业力量,打造开放合作的新型智算中心》的主题演讲。阐述了标准化工作对于大模型基础设施生态发展的重要作用,同时提出大模型时代需要统一的标准和测试方法,汇聚多方力量,共同促进大模型基础设施产业的开放共赢,协同推进AI新质生产力的发展。
华为闪存存储领域总裁黄涛受邀发表《构建先进AI存储,助力AI大模型高质量发展》的主题演讲。阐述了AI存储赋能大模型落地过程中的关键技术和实践成效,同时提出大模型时代需要AI原生存储,产学研用需加强合作,共同引领AI原生存储发展方向,助力大模型高质量发展。
JION US
AI Infra工作组将致力于推动大模型高质量发展,夯实大模型基础设施供给能力,通过技术研究、标准编制、政策研究等工作,促进供需对接和应用落地。工作组持续开放报名,欢迎有意向的企业扫描下方二维码报名。
转自:人工智能产业发展联盟AIIA
MORE / 推 荐 阅 读
EVENTS / 近 期 要 闻