浩鲸科技通过可信AI智能体（AI Agent）平台和工具专项评估，获当前最高评级

文摘 2024-11-11 10:36 北京

近年来，大模型的能力边界不断拓展，为基于大模型的新应用、新服务、新业态夯实了坚实的技术基础。智能体作为大模型的重要应用形态，可以将大模型的技术能力转化为实际问题的解决能力，是打通业务场景和人类交互的桥梁。目前，智能体正逐步渗透到大模型应用的各个层面，有望重塑大模型产业生态，驱动人工智能产业变革。

中国信息通信研究院（以下简称“中国信通院”）人工智能研究所高度关注智能体技术及应用发展动态，联合业界多家单位共同编制并发布了《智能体技术要求与评估方法》系列标准，覆盖智能体平台和工具、智能体技术能力、智能体应用服务、金融智能体、政务智能体、手机智能体、数据分析智能体等多个方向。此外，中国信通院依据上述标准开展智能体评估工作，截至目前，已为13家企业提供智能体专项评估服务。

2024年10月，浩鲸云计算科技股份有限公司（简称：浩鲸科技）参与中国信通院组织的智能体评估，其产品鲸智智能体开发平台【WhaleDI Agent Builder】顺利通过智能体平台和工具评估并最终获得当前最高评级4+级。此次评估，依据标准《智能体技术要求与评估方法第1部分：平台和工具》开展，标准围绕智能体平台管理和运营、智能体开发和管理、API服务和管理三个方面构建智能体平台工具评价指标。其中，平台管理和运营关注智能体平台在用户管理、数据管理、安全管理等任务的支持度，智能体开发和管理关注智能体平台在开发、管理和市场等场景的能力，API服务和管理关注智能体平台在API服务、性能等方面的成熟度。

【鲸智智能体开发平台介绍】

（以下介绍信息由浩鲸云计算科技股份有限公司提供）

鲸智智能体开发平台（WhaleDI Agent Builder）是浩鲸云计算科技股份有限公司推出的一站式大模型应用开发平台，通过零代码和低代码的开发方式，降低了AI应用的门槛，让每个人都能快速构建智能化应用，全面赋能企业业务场景，助力企业实现智能化转型。平台的核心能力包括知识管理、插件开发、智能体开发和应用广场等。此外，该产品在自动化知识构建、高准确度的知识召回算法以及丰富的触点触达能力方面独具特色，帮助企业构建知识大脑，促进知识共享，打通大模型应用在企业落地的最后一公里。

图 1 鲸智智能体开发平台（WhaleDI Agent Builder）

在意图理解方面，平台支持精准意图识别、快速准确理解用户问题。鲸智智能体开发平台支持问题分解、关键要素提取、输入联想、多轮对话等意图识别能力，精准解析用户输入，减少交互次数，提升问答效率。平台通过与大模型、工具和知识库的生态兼容，实现自主规划决策和任务执行，利用内置算法和模型进行最优策略选择，并通过执行器或系统接口完成任务，自动化执行过程，显著减少人工客服工作量，降低交付成本。

在应用构建方面，平台提供开箱即用的智能体编排视图，分钟级构建应用。平台内置丰富的开发资源和灵活的定制选项，通过工作流的可视化开发形态，将模型、知识库、数据库、插件工具等进行链式整合。用户可通过拖拽组件进行编排，支撑场景化与个性化的智能流程能力，快速搭建满足不同业务需求的开发工具，并支持快速在线调试验证，实现分钟级的应用构建。

在触点交互方面，平台支持对接社交媒介、第三方应用和生态设备等触点。平台的应用涵盖了从简单的知识问答到复杂的任务决策制定等多个领域，包括生活助手、教育学习、营销助手和经营分析等典型应用场景。通过申请、开通、配置、发布、流控、黑白名单、运营统计等要素来进行系统化管理，确保每次交互都能为用户提供一致且积极的体验。

【评估介绍】

为客观、准确、及时跟踪智能体发展态势，树立产业发展风向标，提升技术方先行示范影响力，协助应用方选取适配产品，中国信通院将持续开展智能体评估工作，评估包括平台和工具、技术能力、应用服务三个部分，各部分评估范围如下：

（1）平台和工具：关注智能体管理、开发和使用过程，旨在保障智能体技术支撑底座稳定可控。依据标准《智能体技术要求与评估方法第1部分：平台和工具》，涵盖智能体平台管理和运营、智能体开发和管理、API服务和管理共3个能力域，20余个能力项。

（2）技术能力：关注智能体各项技术能力及性能，旨在建立全面的能力框架并评估。依据标准《智能体技术要求与评估方法第2部分：技术能力》，涵盖感知认知能力、规划能力、记忆能力、执行能力共4个能力域，30余个能力项。

（3）应用服务：关注智能体服务的质量和效果，旨在保障智能体服务稳定可靠。依据标准《智能体技术要求与评估方法第3部分：应用服务》，标准涵盖应用丰富度、服务优越度、应用成熟度共3个能力域，30余个能力项。

图 2 评估范围

图 3 评估通过企业清单

中国信通院智能体评估工作持续进行中，欢迎各方单位参与。

评估联系人

张丹，19852822678

zhangdan3@caict.ac.cn

陶老师，18951766189

taoqiuyu@caict.ac.cn

周老师，13773372013

zhoujing3@caict.ac.cn

- END -

AI工程化推进委员会

2017年10月初，工业和信息化部正式批复中国信息通信研究院承建人工智能关键技术和评测工业和信息化部重点实验室（以下简称“部重点实验室”）。
中国信通院为进一步推动我国人工智能的工程化进程，依托部重点实验室成立了AI工程化推进委员会。委员会聚焦人工智能开发工具和平台，AI研发运营和管理，大模型应用，知识计算应用和AI数据集治理等技术方向，以产业活动、研究报告、标准和评估、最佳实践等手段，推动人工智能工程化相关的工具、系统、流程和治理体系的完善。
企业单位申请链接：

https://mp.weixin.qq.com/s/nZ_ZkBtk18lRyHuCkGEqCg

http://mp.weixin.qq.com/s?__biz=Mzg3ODU5NDI0MQ==&mid=2247494135&idx=1&sn=5ee2e11e9bc5de0e3f867431b37af3ff

可信AI评测

“可信AI评测”是依托于中国信息通信研究院开展的第三方评估测试工作，涵盖人工智能产品服务评测、应用成熟度评测和可信风险评估三大模块，目前已完成人工智能评测标准体系，拥有权威的测试数据集和软硬件环境，可为企业单位出具技术产品测试报告和证书。

最新文章

紫光银河大模型平台通过可信AI评估，助力大模型落地！

自主创新引领未来，AI4SE创新巡航活动走进华为成功举办

共谋企业智能化转型新篇章——人工智能中台标准公开研讨会顺利召开

2024 AIIA先锋案例 | AI4SE银弹案例系列分享第二期即将举办

“2024大模型技术与应用创新论坛”12月12日，北京见！

探索MaaS平台产品能力，首期MaaS系列沙龙顺利召开

中国信通院牵头制定的8项大模型标准正式发布

首批首家通过！中国电信集团有限公司通过中国信通院通信大模型专项评估

中国信通院发布“方升”大模型基准测试系列成果

政务推进组重磅发布 | 首个《政企业务智能化成熟度模型》标准

可信AI观察 | 大模型一体机加速大模型落地应用

大模型平台多项标准发布，大模型基础设施高质量推进计划启动

中国信通院可信AI智能体多项评估进行中

启动大模型应用生态培育行动计划，助力大模型交付落地

关于征集端侧智能系列标准参编单位的通知

政务推进组重磅发布 |《政务垂类模型算力基础底座及典型应用建设指南》

关于召开“模型服务（MaaS）系列技术沙龙之产品篇”的通知

关于征集大模型落地路线系列标准参编单位的通知

AI4SE标准体系持续升级，应用效能度量标准编制启动会顺利召开

AIIA全会预热 | “大模型基础设施高质量发展产业洞察”主题分享

浩鲸科技通过可信AI智能体（AI Agent）平台和工具专项评估，获当前最高评级

可信AI标准｜关于征集《智能化成熟度评估模型第3部分：智慧农业》标准参编单位的通知

电信数智通过可信AI智能体（AI Agent）平台和工具专项评估，获当前最高评级

会议通知 | 人工智能中台标准研讨会即将召开

可信AI大模型-康养大模型专项首轮评估正式启动

关于召开“模型服务（MaaS）系列技术沙龙之产品篇”的通知

可信AI大模型-城市治理大模型专项首轮评估正式启动

代理型人工智能（Agentic AI）技术沙龙暨标准研讨会顺利召开

2024 AIIA先锋案例 | AI4SE银弹案例分享系列直播首期圆满落幕

火山引擎通过可信AI智能体（AI Agent）平台和工具专项评估，获当前最高评级

探索高质量大模型推理平台建设路径——大模型推理标准第四次研讨会即将召开

关于征集水利大模型标准参编单位的通知

中国信通院可信AI大模型服务平台专项评估正式启动

可信AI评估 | 关于启动可信AI遥感大模型评估的通知

全会预热 | 首个政企业务智能化成熟度标准即将发布，加速行业数智化转型

中国信通院可信AI端侧大模型第二轮评估正式启动

重磅发布 | 全国政务服务便民热线创新发展典型案例（2023-2024）

AIIA 科学智能工作组发布产业研究报告，推动科研智能高质量发展

案例说 | 中国信通院MaaS加速企业大模型落地

可信AI智能体-手机智能体专项评估正式启动

家电行业首家！海信通过中国信通院可信AI多模态大模型专项评估

直播预告 | 2024 AIIA先锋案例AI4SE银弹案例分享系列直播第一期

中国信通院可信AI财税大模型首轮评估正式启动

首批！可信AI多模态大模型专项评估正式启动

可信AI标准｜关于征集《智能化成熟度评估模型第3部分：智慧农业》标准参编单位的通知

关于召开代理型人工智能（Agentic AI）技术沙龙暨标准研讨会的通知

可信AI评估 | 关于启动可信AI气象大模型评估的通知

首届“数据标注产业大会暨供需对接会”在京顺利召开

聚焦证券、保险领域，金融大模型系列标准研讨会顺利召开

可信AI智能体 | 政务智能体首轮标准符合性验证正式启动

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉