首批！华为云盘古大模型通过大模型国家标准38项评测

科技 2024-11-28 17:11 广东

近期全国信标委人工智能分委会2024年会议周在青岛成功召开，工信部科技司、山东省工信厅、中国电子技术标准化研究院（简称电子标准院）及人工智能产学研用单位代表等200位成员参加会议。

▲华为云盘古大模型评测证书。

近日标准进入报批过程，标准名称已更新为《人工智能大模型第2部分：评测指标与方法》

会上为华为云盘古大模型颁发了标准符合性评测证书。该评测依据国家标准《人工智能大模型第2部分：评测指标与方法》开展，是首个大模型国家标准符合性评测，也是首个大模型基准测试国家标准符合性评测。该国家标准由全国信标委人工智能分委会归口，由电子标准院联合70余家业界单位共同编制。

▲大模型国家标准评测体系一览

华为云盘古NLP大模型在文本分析、摘要总结、文本改写、知识问答等38项任务全部通过，展示两类任务能力优势：

理解能力，包括文本分析能力、信息抽取能力、推理能力、任务分解、知识问答、编程代码理解等。

生成能力，包括摘要总结能力、模板化文本生成能力、机器翻译、文本改写、编程代码生成、结构化数据生成等。

▲华为云盘古NLP大模型服务

核心技术能力方面，华为云盘古大模型整体模型架构分为L0.F (foundation，基础大模型)-L0.C (capability，任务大模型)-L1（行业大模型）-L2（场景模型）。

模型层覆盖至L0. C的基础能力，对话问答、文案生成；以及高阶能力，代码生成、NL2SQL、插件、模型调用、具身智能。其中，推理能力通过文本+代码融合训练获取思维链提升。

工程层通过插件提升大模型数学能力及知识实时更新，并且从数据管理、模型开发、应用开发提供了全套解决方案。

华为云盘古NLP大模型为深圳福田政数局提供人性化的问答服务，涵盖办事流程、政策法规、经济概况、文旅介绍及自然策略等知识。政务公文无需人工整理成FAQ格式，直接通过大模型进行答疑，支持灵活检索和实时更新。结合大模型与检索方案，确保问答的严肃性和正确性，并通过改写和信息查询优化问答效果。

其中，在公文生成场景，盘古NLP大模型可在1分钟内生成5000字公文，提升拟文效率300%；

通过一句话定会、要点秒级提取和纪要自动生成，提升办会效率；

公文任务自动提取并导入督办，提升办事效率80%。

▲大模型测试基准研究组联合组长单位证书

会上宣读了《关于任命大模型测试基准研究组组长的决定》，任命华为云计算技术有限公司为大模型测试基准研究组联合组长单位并颁发证书。研究组锚定大模型评测领域的前沿阵地，开展基础通用大模型测试基准和行业大模型测试基准研究，涵盖测评指标、测评方法和评测数据集等核心要素，以大模型评测平台为支撑开展大模型测评。主旨演讲环节，华为技术有限公司标准化总监刘晓辉作《人工智能国际标准化概况》报告，在大模型标准化评测走向国际化的当下，为中国人工智能标准体系化构建在标准阵地和工作方向提出洞察与建议。

▲华为报告《人工智能国际标准化概况》

盘古NLP大模型首批通过首个大模型国家标准评测，是对华为云盘古NLP大模型能力的权威肯定。2023年国家人工智能标准化总体组任命华为云为大模型专题组联合组长，2024年新一代人工智能标准与应用工信部重点评测实验室任命华为云为大模型测试基准研究组联合组长，是对华为云引领大模型产业标准委以厚望。华为云将持续在人工智能领域深耕，积极参与国家人工智能标准化工作，以盘古大模型赋能千行万业，助力“人工智能+”行动实现应用落地，为我国人工智能产业高质量发展提供技术与标准支撑。

戳“阅读原文”，了解华为云

华为云

一切皆服务，共建智能世界云底座

最新文章

全面拥抱AI Native，2024创原会年度技术峰会成功举办

业界首个大模型混合云运营能力标准正式发布！

混合云AI，领导者

三年蝉联，中国工业互联网平台市场第一

八项第一，华为云领跑中国行业公有云市场

超酷超炫！2024华为开发者年度盛典！！

共筑智能时代伟大品牌，零售创新峰会2024成功举办

华为云IPDCenter：统一产品数据模型，助力企业高效数字化转型

只有我一个人不知道世界已经进化成这样了吗？

华为云pEDA Space，构建“新一代电路板设计工具链”新标杆

混合云，双第一！

No.1！华为云GaussDB刷新记录

卓越级！华为云盘古大模型通过信通院工业大模型评估

华为云iDME打造工业数字主线底座，助力企业高效数字化转型

唯一通过三项能力测评，华为云获得大模型服务能力领先评级

云聚青岛，智出渤海：华为云城市大会共建“数智山东”底座

之了集团&华为云，数字机器人引领教培行业革新

华为云尚海峰：全面推进深化主机上云

华为云商专车跑出华能伊敏露天矿无人驾驶“新动能”

华为云Stack大模型混合云荣获最高引领级！

金山办公 & 华为云，第一！

1+1+1，华为&泸州九年合作再升级

国家管网集团&华为联创成果——“管网”大模型正式上线应用

华为云硬件开发工具链，加速企业研发创新与数字化转型

首批！华为云盘古大模型通过大模型国家标准38项评测

传统数仓上云迁移，广发银行这一步走得快稳准

华为云黄瑾：云上跃迁，AI重塑千行万业

华为&花都，全国首个城市级工业人工智能中心亮相

新兴亚太大数据市场，华为云综合竞争力位居首位

每日千万次图片备份，稳定又安全

数据资产平台技术能力评估，华为云8项满分！

柳钢集团：从“制造”到“智造”，引领传统产业向新而行

华为云商专车，“无人驾驶”奔腾马脚山矿

亚洲唯一！华为入选Gartner®云应用平台魔力象限

中国行业大模型市场，七项领先！

打造AI原生的云，华为云携手法国企业共赢行业智能化未来

迈动汽车“老厂换新记”

长沙人社&华为云GaussDB，打造智慧就业新生态

同聚“滇”峰，共赢两亚AI新时代：华为云大模型云南峰会成功举办

《大模型混合云工程化交付》标准正式发布！

安全、合规！源康健&华为云，加速医疗产业数智化转型

中国实时湖仓市场，华为云位居领导者类别

全球领导者！华为云容器服务产品战略和执行全球第一

政务大模型加速落地，华为云六项满分行业领先

华为云开源项目Sermant正式成为CNCF官方项目

中国工业AI，领导者！

云上新矿藏，AI为安全护航

华为云董理斌：解难题做难事，AI重塑千行万业

华为云携手公牛集团，行业“领头牛”领跑数智征途

大庆油田：云端之上，石油人办公的新篇章

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉