近日,神州泰岳成功通过了中国信通院的《基于大模型的运维平台技术要求》评估,成为首批完成此评估的企业。
据悉,该评估主要针对运维平台大模型相关解决方案的建设单位和服务提供商,旨在利用大模型的复杂推理能力,实现在复杂故障场景下的的快速诊断和准确响应。评估规定了运维平台在应用大模型后应具备的关键指标,包括故障处置支持、效果衡量、安全保障、运营管理等四大能力域。
产品介绍
神州泰岳全业务端到端可观测性平台是“数智化新IT”运营体系的核心产品之一。该产品以业务为中心,构建业务全局可观测、业务应用可观测、应用架构可观测、资源可观测、变更可观测、故障可观测六大可观测场景,实现业务全链路无死角洞悉,提供自动化、数字化、智能化的业务可靠性及稳定性保障。
神州泰岳全业务端到端可观测性平台于2023年率先通过信息技术应用创新全链路端到端监控平台能力评估。2024年,神州泰岳紧跟智能运维领域发展趋势,融合AI大模型技术对该平台进行了全新升级,重塑故障识别、隐患识别、定界定位、应急预案推荐、故障处置等运维全生命周期的智能运维场景,顺利通过运维大模型平台评估。基于大模型的全业务端到端可观测性平台,进一步帮助企业提高运维效率、降低运维成本、提升系统稳定性和可靠性。
神州泰岳“全业务端到端可观测性平台”功能架构
1. 高效识别隐患告警
提供面向全专业的多模态数据采集能力,实现对运维海量数据的实时监控和智能分析,能够在复杂、模糊的故障场景下,实时对运维数据进行预处理,提供语义理解和上下文感知能力,从而准确发现系统中的潜在隐患。
2. 精准定位故障根因
具备日志挖掘、知识标注、知识图谱能力,支持跨域分析,能够关联计算、存储、网络等不同领域的故障信息和数据,通过AI算法和规则库汇聚生成故障根因诊断结果。
3. 智能生成解决方案
具备知识融合与推理能力,支持自适应学习与优化,能够根据用户的反馈和实际效果,自适应地学习和优化推荐算法和解决方案库,为复杂的运维故障场景提供智能化故障解决方案。
4. 快速响应故障处置
支持自动、半自动化故障处置,大模型可根据用户的预设条件,结合人工指令执行故障处置操作。同时平台具备故障处置的自我优化能力,基于历史处置数据和效果,自动学习和优化处置策略,提高自动化处置的准确性和效率。
5. 多维度效果衡量
支持从准确性、高效性、可观测性、可扩展性多维度衡量运维实现的效果,同时具备任务分配和调度效率、数据处理速度、资源消耗合理性、处置方案专业性、资源动态管理合理性等衡量能力。
6. 可靠的模型安全保障
平台具备身份认证机制,支持安全漏洞的发现与修复,覆盖数据安全、网络安全、访问控制、安全审计、事件响应等方面。支持大模型安全防护策略自适应调整的能力。支持对大模型潜在故障的预测和防护能力。
7. 一体化运营管理
支持数字资产可视化的态势管理,支持大模型服务实时监控和历史数据分析能力,具备统一的服务接口规范以及集中式的管理控制台,方便运维人员进行配置、部署和监视。
面向ICT运营管理领域,神州泰岳正在全面打造“1+N+X”大模型产品体系,为用户智能化场景赋能加速提效。“1+N+X”大模型产品包括:1 个 MaaS 平台,N 个专用模型和 X 个应用场景。未来,神州泰岳将持续深耕AI+实践,推动人工智能与行业深度融合,加速发展新质生产力,赋能行业数智化升级!