大模型平台是整合了大模型算法、资产、开发工具的一体化平台,为企业构建自身专属大模型提供了全流程开发能力及运营管理能力,以提升大模型落地效率降低成本。头部科技厂商纷纷投入大模型平台的建设工作,推动了大模型的广泛应用和产业的快速发展。
中国信通院持续开展大模型平台评估工作,2024年10月,紫光软件系统有限公司参与了新一轮评估工作,评估结果显示紫光银河大模型平台的功能完善,通过了该轮大模型平台评估并达到4+级水平,为当前最高等级。大模型平台评估以《大规模预训练模型技术和应用评估方法第3部分:模型运营(AIIA/PG 0108-2023)》(已完成ITU国际标准立项)为依据,涉及5个能力项,15个能力子项,共考察82项基本功能和60项高级功能,涵盖大模型开发的全生命周期所需能力,包括数据工程、模型调优、模型交付、服务运营、平台能力等关键环节。
紫光银河大模型平台是自研的一站式领域大模型开发和应用平台,提供全流程可视化工具链和多智能体框架,加速了垂直领域大模型的训练和应用开发,降低了算力成本和人工成本。
紫光银河大模型平台基于业务领域数据集,通过模型重训、模型微调、强化学习训练、模型评估等能力,帮助用户实现一站式、可视化的领域大模型构建。聚焦地理(战场环境)大模型、运筹学(国防动员)大模型、雷达对抗大模型、网络安全大模型等垂域大模型的重训及应用开发。本平台适配国产化软硬件,具备快速部署、灵活扩展、跨平台的特点。
中国信通院持续进行MaaS相关能力(大模型平台、大模型服务平台等)评估,目前已有6家企业通过相关评估,欢迎其他单位报名参与。
图 可信AI MaaS系列标准评估结果一览表
MaaS系列评估围绕大模型服务能力和平台能力开展,一方面为服务或平台的提供商提供产品的评价标准,另一方面为使用方提供选型参考的依据,目前已经启动大模型平台、大模型服务平台、大模型服务能力三项评估,模型管理平台和应用开发平台能力评估启动报名,欢迎业界各企业积极参与。
大模型平台能力评估
验证平台定制专属模型的能力。评估依据《MaaS模型即服务技术与应用要求第3部分:模型平台能力要求》,包含数据工程、模型调优、模型交付、服务运营、平台能力五大模块。
大模型服务平台能力评估
验证平台生产高性能模型服务的能力。评估依据《MaaS模型即服务技术与应用要求第4部分:模型服务平台能力要求》,包含模型服务部署、模型服务测试、模型服务管理、模型服务运营四大模块。
大模型服务能力评估
验证模型服务的性能、可用性等指标是否达到SLA承诺水平。评估依据《MaaS模型即服务技术与应用要求第2部分:模型服务能力评估方法》,对模型推理性能、服务可用性、服务安全性、计量准确性、权责条款等五大模块,共60项指标开展评估。
模型管理平台能力评估
验证平台管理模型和数据集等AI资产的能力。评估依据《MaaS模型即服务技术与应用要求第5部分:模型管理平台能力要求》,包含模型文件管理、模型广场、数据集管理、平台能力四大模块。
大模型应用开发平台能力评估
验证平台开发和管理Agent等AI应用的能力。评估依据《MaaS模型即服务技术与应用要求第6部分:模型应用开发平台平台能力要求》,包含组件支持度、AI能力构建成熟度、AI能力集成、平台运营管理四大模块。
联系人
中国信息通信研究院人工智能所
李老师1811506316(微信同号)
lizhenjia@caict.ac.cn
齐老师 15501080011(微信同号)
qijing1@caict.ac.cn
秦老师 13488684897(微信同号)
qinsisi@caict.ac.cn
- END -
2017年10月初,工业和信息化部正式批复中国信息通信研究院承建人工智能关键技术和评测工业和信息化部重点实验室(以下简称“部重点实验室”)。
中国信通院为进一步推动我国人工智能的工程化进程,依托部重点实验室成立了AI工程化推进委员会。委员会聚焦人工智能开发工具和平台,AI研发运营和管理,大模型应用,知识计算应用和AI数据集治理等技术方向,以产业活动、研究报告、标准和评估、最佳实践等手段,推动人工智能工程化相关的工具、系统、流程和治理体系的完善。
企业单位申请链接: