火山引擎通过可信AI智能体(AI Agent)平台和工具专项评估,获当前最高评级

文摘   2024-11-05 16:30   北京  




近年来,大模型的能力边界不断拓展,为基于大模型的新应用、新服务、新业态夯实了坚实的技术基础。智能体作为大模型的重要应用形态,可以将大模型的技术能力转化为实际问题的解决能力,是打通业务场景和人类交互的桥梁。目前,智能体正逐步渗透到大模型应用的各个层面,有望重塑大模型产业生态,驱动人工智能产业变革。


中国信息通信研究院(以下简称“中国信通院”)人工智能研究所高度关注智能体技术及应用发展动态,联合业界多家单位共同编制并发布了《智能体技术要求与评估方法》系列标准,覆盖智能体平台和工具、智能体技术能力、智能体应用服务、金融智能体、政务智能体、手机智能体、数据分析智能体等多个方向。此外,中国信通院依据上述标准开展智能体评估工作,截至目前,已为13家企业提供智能体专项评估服务。


2024年10月,北京火山引擎科技有限公司参与中国信通院组织的智能体评估,其产品HiAgent企业AI应用创新平台顺利通过智能体平台和工具评估并最终获得当前最高评级4+级。此次评估,依据标准《智能体技术要求与评估方法 第1部分:平台和工具》开展,标准围绕智能体平台管理和运营、智能体开发和管理、API服务和管理三个方面构建智能体平台工具评价指标。其中,平台管理和运营关注智能体平台在用户管理、数据管理、安全管理等任务的支持度,智能体开发和管理关注智能体平台在开发、管理和市场等场景的能力,API服务和管理关注智能体平台在API服务、性能等方面的成熟度。


【HiAgent企业AI应用创新平台介绍】

(以下介绍信息由北京火山引擎科技有限公司提供)


HiAgent 企业AI 应用创新平台是一个创新的企业大模型应用开发平台,它采用低代码/无代码模式,使AI应用构建即时可得,实现“人人可开发”,具有开发效率高、成本低、易上手等特点;同时,它也是企业AI应用的加工厂与孵化器,能够让企业实现Agent创建、发布、自运营等一体化流程。


HiAgent企业AI应用创新平台采用了创新的梯级划分策略。当前,企业员工对AI Agent依然存在陌生感以及对其价值的认识不足,针对该问题挑战,平台采用划分策略有效地解决了这一问题,帮助企业用户逐步深入了解平台的能力和价值,提升员工采用开发平台的动力。


HiAgent企业AI应用创新平台建立了完善的生产保障机制。构建“Demo 级AI Agent”容易,构建“生产级AI Agent”则比较困难。HiAgent 通过原厂轻咨询、内置最佳实践以及应用效果评测的三重策略,为企业提供了一条清晰的路径,以确保构建出真正能够投入生产的AI Agent。


图 1  HiAgent企业AI应用创新平台


【评估介绍】


为客观、准确、及时跟踪智能体发展态势,树立产业发展风向标,提升技术方先行示范影响力,协助应用方选取适配产品,中国信通院将持续开展智能体评估工作,评估包括平台和工具、技术能力、应用服务三个部分,各部分评估范围如下:


(1)平台和工具:关注智能体管理、开发和使用过程,旨在保障智能体技术支撑底座稳定可控。依据标准《智能体技术要求与评估方法 第1部分:平台和工具》,涵盖智能体平台管理和运营、智能体开发和管理、API服务和管理共3个能力域,20余个能力项。

(2)技术能力:关注智能体各项技术能力及性能,旨在建立全面的能力框架并评估。依据标准《智能体技术要求与评估方法 第2部分:技术能力》,涵盖感知认知能力、规划能力、记忆能力、执行能力共4个能力域,30余个能力项。

(3)应用服务:关注智能体服务的质量和效果,旨在保障智能体服务稳定可靠。依据标准《智能体技术要求与评估方法 第3部分:应用服务》,标准涵盖应用丰富度、服务优越度、应用成熟度共3个能力域,30余个能力项。


图 2  评估范围


图 3 评估通过企业清单


中国信通院智能体评估工作持续进行中,欢迎各方单位参与。


联系人

张老师,19852822678

zhangdan3@caict.ac.cn


陶老师,18951766189

taoqiuyu@caict.ac.cn


周老师,13773372013

zhoujing3@caict.ac.cn


END -


AI工程化推进委员会

2017年10月初,工业和信息化部正式批复中国信息通信研究院承建人工智能关键技术和评测工业和信息化部重点实验室(以下简称“部重点实验室”)。
中国信通院为进一步推动我国人工智能的工程化进程,依托部重点实验室成立了AI工程化推进委员会。委员会聚焦人工智能开发工具和平台,AI研发运营和管理,大模型应用,知识计算应用和AI数据集治理等技术方向,以产业活动、研究报告、标准和评估、最佳实践等手段,推动人工智能工程化相关的工具、系统、流程和治理体系的完善。
企业单位申请链接:

https://mp.weixin.qq.com/s/nZ_ZkBtk18lRyHuCkGEqCg


可信AI评测
“可信AI评测”是依托于中国信息通信研究院开展的第三方评估测试工作,涵盖人工智能产品服务评测、应用成熟度评测和可信风险评估三大模块,目前已完成人工智能评测标准体系,拥有权威的测试数据集和软硬件环境,可为企业单位出具技术产品测试报告和证书。
 最新文章