浩鲸科技通过可信AI智能体(AI Agent)平台和工具专项评估,获当前最高评级

文摘   2024-11-11 10:36   北京  




近年来,大模型的能力边界不断拓展,为基于大模型的新应用、新服务、新业态夯实了坚实的技术基础。智能体作为大模型的重要应用形态,可以将大模型的技术能力转化为实际问题的解决能力,是打通业务场景和人类交互的桥梁。目前,智能体正逐步渗透到大模型应用的各个层面,有望重塑大模型产业生态,驱动人工智能产业变革。


中国信息通信研究院(以下简称“中国信通院”)人工智能研究所高度关注智能体技术及应用发展动态,联合业界多家单位共同编制并发布了《智能体技术要求与评估方法》系列标准,覆盖智能体平台和工具、智能体技术能力、智能体应用服务、金融智能体、政务智能体、手机智能体、数据分析智能体等多个方向。此外,中国信通院依据上述标准开展智能体评估工作,截至目前,已为13家企业提供智能体专项评估服务。


2024年10月,浩鲸云计算科技股份有限公司(简称:浩鲸科技)参与中国信通院组织的智能体评估,其产品鲸智智能体开发平台【WhaleDI Agent Builder】顺利通过智能体平台和工具评估并最终获得当前最高评级4+级。此次评估,依据标准《智能体技术要求与评估方法 第1部分:平台和工具》开展,标准围绕智能体平台管理和运营、智能体开发和管理、API服务和管理三个方面构建智能体平台工具评价指标。其中,平台管理和运营关注智能体平台在用户管理、数据管理、安全管理等任务的支持度,智能体开发和管理关注智能体平台在开发、管理和市场等场景的能力,API服务和管理关注智能体平台在API服务、性能等方面的成熟度。


【鲸智智能体开发平台介绍】

(以下介绍信息由浩鲸云计算科技股份有限公司提供)


鲸智智能体开发平台(WhaleDI Agent Builder)是浩鲸云计算科技股份有限公司推出的一站式大模型应用开发平台,通过零代码和低代码的开发方式,降低了AI应用的门槛,让每个人都能快速构建智能化应用,全面赋能企业业务场景,助力企业实现智能化转型。平台的核心能力包括知识管理、插件开发、智能体开发和应用广场等。此外,该产品在自动化知识构建、高准确度的知识召回算法以及丰富的触点触达能力方面独具特色,帮助企业构建知识大脑,促进知识共享,打通大模型应用在企业落地的最后一公里。


图 1  鲸智智能体开发平台(WhaleDI Agent Builder)


在意图理解方面,平台支持精准意图识别、快速准确理解用户问题。鲸智智能体开发平台支持问题分解、关键要素提取、输入联想、多轮对话等意图识别能力,精准解析用户输入,减少交互次数,提升问答效率。平台通过与大模型、工具和知识库的生态兼容,实现自主规划决策和任务执行,利用内置算法和模型进行最优策略选择,并通过执行器或系统接口完成任务,自动化执行过程,显著减少人工客服工作量,降低交付成本。


在应用构建方面,平台提供开箱即用的智能体编排视图,分钟级构建应用。平台内置丰富的开发资源和灵活的定制选项,通过工作流的可视化开发形态,将模型、知识库、数据库、插件工具等进行链式整合。用户可通过拖拽组件进行编排,支撑场景化与个性化的智能流程能力,快速搭建满足不同业务需求的开发工具,并支持快速在线调试验证,实现分钟级的应用构建。


在触点交互方面,平台支持对接社交媒介、第三方应用和生态设备等触点。平台的应用涵盖了从简单的知识问答到复杂的任务决策制定等多个领域,包括生活助手、教育学习、营销助手和经营分析等典型应用场景。通过申请、开通、配置、发布、流控、黑白名单、运营统计等要素来进行系统化管理,确保每次交互都能为用户提供一致且积极的体验。


【评估介绍】

为客观、准确、及时跟踪智能体发展态势,树立产业发展风向标,提升技术方先行示范影响力,协助应用方选取适配产品,中国信通院将持续开展智能体评估工作,评估包括平台和工具、技术能力、应用服务三个部分,各部分评估范围如下:


(1)平台和工具:关注智能体管理、开发和使用过程,旨在保障智能体技术支撑底座稳定可控。依据标准《智能体技术要求与评估方法 第1部分:平台和工具》,涵盖智能体平台管理和运营、智能体开发和管理、API服务和管理共3个能力域,20余个能力项。

(2)技术能力:关注智能体各项技术能力及性能,旨在建立全面的能力框架并评估。依据标准《智能体技术要求与评估方法 第2部分:技术能力》,涵盖感知认知能力、规划能力、记忆能力、执行能力共4个能力域,30余个能力项。

(3)应用服务:关注智能体服务的质量和效果,旨在保障智能体服务稳定可靠。依据标准《智能体技术要求与评估方法 第3部分:应用服务》,标准涵盖应用丰富度、服务优越度、应用成熟度共3个能力域,30余个能力项。


图 2  评估范围


图 3 评估通过企业清单


中国信通院智能体评估工作持续进行中,欢迎各方单位参与。


评估联系人

张丹,19852822678

zhangdan3@caict.ac.cn


陶老师,18951766189

taoqiuyu@caict.ac.cn


周老师,13773372013

zhoujing3@caict.ac.cn


END -


AI工程化推进委员会

2017年10月初,工业和信息化部正式批复中国信息通信研究院承建人工智能关键技术和评测工业和信息化部重点实验室(以下简称“部重点实验室”)。
中国信通院为进一步推动我国人工智能的工程化进程,依托部重点实验室成立了AI工程化推进委员会。委员会聚焦人工智能开发工具和平台,AI研发运营和管理,大模型应用,知识计算应用和AI数据集治理等技术方向,以产业活动、研究报告、标准和评估、最佳实践等手段,推动人工智能工程化相关的工具、系统、流程和治理体系的完善。
企业单位申请链接:

https://mp.weixin.qq.com/s/nZ_ZkBtk18lRyHuCkGEqCg


可信AI评测
“可信AI评测”是依托于中国信息通信研究院开展的第三方评估测试工作,涵盖人工智能产品服务评测、应用成熟度评测和可信风险评估三大模块,目前已完成人工智能评测标准体系,拥有权威的测试数据集和软硬件环境,可为企业单位出具技术产品测试报告和证书。
 最新文章