近日标准进入报批过程,标准名称已更新为《人工智能 大模型 第2部分:评测指标与方法》
会上为华为云盘古大模型颁发了标准符合性评测证书。该评测依据国家标准《人工智能 大模型 第2部分:评测指标与方法》开展,是首个大模型国家标准符合性评测,也是首个大模型基准测试国家标准符合性评测。该国家标准由全国信标委人工智能分委会归口,由电子标准院联合70余家业界单位共同编制。
▲大模型国家标准评测体系一览
理解能力,包括文本分析能力、信息抽取能力、推理能力、任务分解、知识问答、编程代码理解等。
生成能力,包括摘要总结能力、模板化文本生成能力、机器翻译、文本改写、编程代码生成、结构化数据生成等。
▲华为云盘古NLP大模型服务
模型层覆盖至L0. C的基础能力,对话问答、文案生成;以及高阶能力,代码生成、NL2SQL、插件、模型调用、具身智能。其中,推理能力通过文本+代码融合训练获取思维链提升。
工程层通过插件提升大模型数学能力及知识实时更新,并且从数据管理、模型开发、应用开发提供了全套解决方案。
华为云盘古NLP大模型为深圳福田政数局提供人性化的问答服务,涵盖办事流程、政策法规、经济概况、文旅介绍及自然策略等知识。政务公文无需人工整理成FAQ格式,直接通过大模型进行答疑,支持灵活检索和实时更新。结合大模型与检索方案,确保问答的严肃性和正确性,并通过改写和信息查询优化问答效果。
其中,在公文生成场景,盘古NLP大模型可在1分钟内生成5000字公文,提升拟文效率300%;
通过一句话定会、要点秒级提取和纪要自动生成,提升办会效率;
公文任务自动提取并导入督办,提升办事效率80%。
▲大模型测试基准研究组联合组长单位证书
戳“阅读原文”,了解华为云