首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AI驱动的可观测性：从AIOPS的失败中汲取教训

文摘科技 2024-09-09 00:00 山东

GenAI 承诺改变我们使用可观察性工具的方式，但要实现预期，就必须吸取 AIOps 错误的教训。

译自AI-Powered Observability: Picking Up Where AIOps Failed，作者 Asaf Yigal。

生成式 AI 在可观测性工具中的出现是不可避免的，但市场上已经出现了极端的炒作。监控、DevOps和 ITOps 从未免受趋势的影响，而随着生成式 AI (GenAI) 功能的出现，炒作机器正在失控。

希望搭上 GenAI 浪潮的组织无疑会想起围绕 AIOps 工具的大量炒作，这在不久的过去。AIOps 的核心目的是解决运营遥测的复杂性、数量和速度，从而实现主动事件响应并减少人工干预。

许多人认为AIOps 是未来，可以解决系统内部的问题，但采用率滞后，因为AIOps 无法满足关键 IT 使用案例的需求。组织试图从 AIOps 中获得什么？哪些是合适的工具？这些问题从未得到解答。

为了取得成功，AIOps 需要组织改变其流程，而许多组织不愿这样做。未能从这些解决方案中获得收益并非由于技术问题，而是因为组织没有做出必要的改变来获得这些收益。

基于 AI 的可观测性如何满足预期

组织正在寻求其 IT 环境中的生产力提升。许多人会问：“我们如何更快地完成任务？我们如何提高价值实现时间？我们能做些什么来更快地修复问题，以便从业务中的核心问题中获得最大收益？”

GenAI 和基于 AI 的可观测性工具可以帮助解决所有这些问题。提供有关系统行为的见解，并提供有关如何修复遥测数据（日志、指标和跟踪）中出现的问题的直接知识，这是可观测性应该提供的。

传统上，这些见解只对了解复杂查询语言或深入了解流经系统的遥测数据的技术专家和分析师可用。但如果基于 AI 的可观测性可以更进一步呢？如果您可以使用自然语言与您的系统交互呢？

这些工具有可能为更广泛的用户群打开更深入的见解。这可以显著提高对系统行为的认识，将可观测性民主化到非技术用户，并提供对环境中故障点或困难点的更深入了解。

在 IT 人员知识差距和招聘困难的时代，基于 AI 的可观测性可以满足其中的一些需求。如果您的团队拥有相当于初级开发人员在您的技术平台中直接工作的功能，这意味着什么呢？

当今可观测性最强大的应用涉及通过 GenAI 集成提供的战略能力。这些能力从自动收集相关上下文见解和异常检测到能够精确定位关键数据以优化数据和成本。

基于 AI 的功能可以通过重新设计核心监控和故障排除实践（从查询到根本原因分析）来改变工程和 DevOps 团队的日常交互。

这些类型的基于 AI 的系统（具有完整的仪表盘、数据可视化以及对紧迫问题的秒级答案）可以帮助实现 AIOps 旨在提供的承诺。

AIOps 的核心思想是尽可能多地引入遥测数据以识别异常。然而，这与可观测性解决方案提供的不同。可观测性提供对选择性遥测数据的服务，并显示实时指标，例如 CPU 使用率或其他感兴趣的领域。

虽然在这些指标中加入 AI 进行异常检测可能看起来像是一个 AIOps 功能，但它实际上是对可观测性解决方案的增强。相比之下，AIOps 从 AI 开始，可能不提供单个仪表盘。

革命正在等待，但我们必须先进化

必须将 AIOps 的经验教训应用于下一代可观测性工具，以帮助组织满足围绕短暂的云原生架构的各种复杂用例。

得益于 GenAI，我们与可观测性工具交互的方式以及我们组织运营团队的方式都存在着潜在的演变变化。

我们已经看到了将 GenAI 引入可观测性工具的好处：

团队可以使用这些功能过滤掉无关数据，从而加快故障排除速度。
AI 可以识别出最常见的错误，并提出潜在的缓解策略。
可以自动化手动流程，为工程师节省数小时的工作时间，让他们可以专注于更宏观的策略和项目。

谈论实施这些功能是一回事，而利用它们又是另一回事。问题仍然是组织从这些转变中可以实际获得什么好处。用例必须得到满足，生产力提升必须实现。组织可能难以理解和接受必要的改变；如果障碍太大，好处就无法实现。

下一代系统监控和管理方法即将到来，它利用 GenAI 和机器学习自动检测、诊断和解决问题，无需人工干预。这种演变将使技术团队能够专注于战略性任务，同时确保最佳的系统性能和可靠性。

团队最好记住过去快速技术转变的成功和失败。准备好改变整个组织的思维方式，以实现您的目标。

http://mp.weixin.qq.com/s?__biz=MzIzMzcxMTUxOQ==&mid=2247494563&idx=1&sn=3573a487e09791b556bfe442f24cd6df

关注云原生时代的普通人 - 云原生 | 平台工程 | AI

最新文章

尝试“自上而下”的解决KUBERNETES蔓延问题

ANYSCALE：RAY的全新优化运行时，KUBERNETES OPERATOR

运行时上下文：KUBERNETES安全的缺失部分

在防火墙后部署KUBERNETES的技术

开发者游乐场：用途和设计模式

我最喜欢的5个命令行工具

如何使用安全即代码实现DEVSECOPS

PDF通过新的RAG架构更容易进入GENAI

平台工程最关键的第一个决定

DORA 2024：人工智能和平台工程未能达到预期

平台工程：克服数据管理挑战

Tetrate和彭博合作开发基于Envoy的AI网关

KUBERNETES是否环保？

人工智能与物联网的集成将代理带入物理世界

如何处理事件流中的不良数据

组织简化DevOps流水线的4种方法

优先考虑稳健的工程设计，而非过度吹嘘的生成式人工智能承诺

语义路由器及其在设计代理工作流中的作用

LINUX访问控制列表指南

Sicredi：从人工银行到平台工程

现代应用程序架构：简约之道

列式存储：开发人员实时分析的关键

Redis用户希望改变

通过调整LLM提示定义AI代理角色

OPENAI 结构化输出：开发者指南

人工智能如何改变应用程序的身份验证和授权

亚马逊用代码转换和安全功能改造开发者AI

架构反转：通过移动计算而不是数据来扩展

想要实时？在数据库中运行脚本

利用CPU优化数据库性能

MONGODB 8专注于时间序列数据和横向扩展

云原生网络：KUBERNETES迈入第二个十年

虚拟KUBERNETES集群是什么？

使用THANOS和KUBERNETES构建指标系统

KUBERNETES中的OOM KILLER优化技巧

微服务测试：特性开关与预览环境

在NESTJS中配置微服务：初学者指南

多云架构中微服务的安全保护方法

社会网络基金会启动 – W3C如何参与联邦宇宙？

微软开源OPENVMM，一款基于RUST的虚拟机监控器

面向集成构建是面向未来的增长战略

是时候开始左移了

REACT服务器组件会摧毁REACT吗？

如何在KUBERNETES上停止担心并开始热爱数据库

Kubernetes 的数据库配置：比较您的选择

将存储和数据库置于Kubernetes的控制之下

KUBERNETES上的数据库：为什么、何时以及需要考虑什么

AI代理：开发者全面入门指南

PYTHON多智能体系统中的协同智能

将人工专业知识与LLM辅助相结合来简化编码

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉