首批!华为云盘古大模型通过大模型国家标准38项评测

科技   2024-11-28 17:11   广东  

近期全国信标委人工智能分委会2024年会议周在青岛成功召开,工信部科技司、山东省工信厅、中国电子技术标准化研究院(简称电子标准院)及人工智能产学研用单位代表等200位成员参加会议。

▲华为云盘古大模型评测证书。

近日标准进入报批过程,标准名称已更新为《人工智能 大模型 第2部分:评测指标与方法》

会上为华为云盘古大模型颁发了标准符合性评测证书。该评测依据国家标准《人工智能 大模型 第2部分:评测指标与方法》开展,是首个大模型国家标准符合性评测,也是首个大模型基准测试国家标准符合性评测。该国家标准由全国信标委人工智能分委会归口,由电子标准院联合70余家业界单位共同编制。


▲大模型国家标准评测体系一览


华为云盘古NLP大模型在文本分析、摘要总结、文本改写、知识问答等38项任务全部通过,展示两类任务能力优势:


理解能力,包括文本分析能力、信息抽取能力、推理能力、任务分解、知识问答、编程代码理解等。


生成能力,包括摘要总结能力、模板化文本生成能力、机器翻译、文本改写、编程代码生成、结构化数据生成等。


▲华为云盘古NLP大模型服务


核心技术能力方面,华为云盘古大模型整体模型架构分为L0.F (foundation,基础大模型)-L0.C (capability,任务大模型)-L1(行业大模型)-L2(场景模型)。


模型层覆盖至L0. C的基础能力,对话问答、文案生成;以及高阶能力,代码生成、NL2SQL、插件、模型调用、具身智能。其中,推理能力通过文本+代码融合训练获取思维链提升。


工程层通过插件提升大模型数学能力及知识实时更新,并且从数据管理、模型开发、应用开发提供了全套解决方案。

华为云盘古NLP大模型为深圳福田政数局提供人性化的问答服务,涵盖办事流程、政策法规、经济概况、文旅介绍及自然策略等知识。政务公文无需人工整理成FAQ格式,直接通过大模型进行答疑,支持灵活检索和实时更新。结合大模型与检索方案,确保问答的严肃性和正确性,并通过改写和信息查询优化问答效果。



其中,在公文生成场景,盘古NLP大模型可在1分钟内生成5000字公文,提升拟文效率300%


通过一句话定会、要点秒级提取和纪要自动生成,提升办会效率;



公文任务自动提取并导入督办,提升办事效率80%


▲大模型测试基准研究组联合组长单位证书


会上宣读了《关于任命大模型测试基准研究组组长的决定》,任命华为云计算技术有限公司为大模型测试基准研究组联合组长单位并颁发证书。研究组锚定大模型评测领域的前沿阵地,开展基础通用大模型测试基准和行业大模型测试基准研究,涵盖测评指标、测评方法和评测数据集等核心要素,以大模型评测平台为支撑开展大模型测评。主旨演讲环节,华为技术有限公司标准化总监刘晓辉作《人工智能国际标准化概况》报告,在大模型标准化评测走向国际化的当下,为中国人工智能标准体系化构建在标准阵地和工作方向提出洞察与建议。

▲华为报告《人工智能国际标准化概况》

盘古NLP大模型首批通过首个大模型国家标准评测,是对华为云盘古NLP大模型能力的权威肯定。2023年国家人工智能标准化总体组任命华为云为大模型专题组联合组长,2024年新一代人工智能标准与应用工信部重点评测实验室任命华为云为大模型测试基准研究组联合组长,是对华为云引领大模型产业标准委以厚望。华为云将持续在人工智能领域深耕,积极参与国家人工智能标准化工作,以盘古大模型赋能千行万业,助力“人工智能+”行动实现应用落地,为我国人工智能产业高质量发展提供技术与标准支撑。





戳“阅读原文”,了解华为云




华为云
一切皆服务,共建智能世界云底座
 最新文章