使用 Kanister 在 K8s 上进行向量数据库的备份与恢复

文摘 2024-11-01 10:03 中国香港

作者：Pavan Navarathna Devaraj 和 Shwetha Subramanian

人工智能是一个令人兴奋且快速发展的领域，能够增强每个主要企业应用。它可以通过动态扩展、预测性维护、资源优化和个性化用户体验来提升云原生应用。然而，基础设施、运营和数据管理等方面的挑战仍然阻碍了大规模采用。幸运的是，云原生基础设施结合开源软件、模型、工具和数据库，使得实验和生产就绪的 AI 模型能够高效地训练、测试和部署。

训练机器学习模型需要在庞大的数据集上进行多次迭代。这些模型通常会生成高维数据，存储在向量数据库中。训练、测试和部署 AI 模型的过程资源密集，要求大量的计算能力和 GPU 计算周期。随着迭代次数的增加，向量数据库不断增长，保存这些昂贵操作的结果，成为推动 AI 工作负载的重要资产。

向量数据库在 AI 工作负载中的重要性

向量数据库存储高维向量，代表文本、图像和音频等非结构化数据。这些向量支持相似性搜索，可用于检索增强生成（RAG），从庞大的向量化数据集中提取相关上下文。这些附加上下文有助于提高大型语言模型（LLM）生成响应的质量。备份这些数据库对于维护数据完整性和防止可能中断 AI 应用的昂贵数据丢失至关重要。

将 AI 应用与向量数据库共同放在云原生基础设施上，组织可以优化运营并更轻松地管理基础设施。然而，由于向量数据库中存储的高维嵌入量巨大，数据保护至关重要，以保存迭代训练结果，避免在终止临时计算资源时丢失数据。失去这些数据可能会拖慢关键 AI 工作负载的进展，因此强有力的备份和灾难恢复（DR）策略变得不可或缺。

我们是如何通过 Kanister 解决这个问题的

在 2024 年北美 KubeCon + CloudNativeCon 大会上，我们的演讲“构建韧性：Kubernetes 上向量数据库的有效备份与灾难恢复^[1]”将展示如何使用 Kanister^[2]（一个开源 CNCF 沙箱项目）为流行的向量数据库提供高效安全的备份和恢复策略。Kanister 是一个工作流管理工具，通过自定义资源（称为 Blueprint 和 ActionSet）简化 Kubernetes 上的数据管理，提供执行原子数据操作的能力。

其工作原理如下：ActionSet 指示 Kanister 控制器执行某个操作，如备份，而 Blueprint 定义在特定数据库上执行这些操作所需的步骤。在我们的演讲中，我们将：

展示一个 Kanister Blueprint，详细说明一个流行向量数据库的备份与恢复操作。
演示如何创建一个 ActionSet，将备份执行到对象存储并恢复数据库到你的环境中。

这次实用演示将为你提供使用 Kanister 保护 AI/ML 数据、确保韧性和效率的清晰路线图。

为什么你应该参加！

在 AI 变革每个行业的时代，保护这些模型所依赖的基础设施至关重要。如果你正在处理 AI、管理向量数据库或管理 Kubernetes 上的应用，这个环节非常适合你！通过参加，你将学习：

向量数据库在 AI/ML 工作负载和 RAG 中的关键作用。
如何在 Kubernetes 环境中高效部署这些数据库。
使用 Kanister 简化 AI 驱动应用的备份和 DR 操作的最佳实践。

何时何地

请加入我们在盐湖城盐宫大礼堂 GI 举办的演讲“构建韧性：Kubernetes 上向量数据库的有效备份与灾难恢复”。

日期：2024 年 11 月 13 日，星期三
时间：下午 4:30 – 5:05 MST

我们将向你展示如何为你的 AI 应用做好未来准备，保护你的云原生基础设施。不要错过这个学习如何保护 AI 工作负载、确保商业连续性的机会！

参考资料

[1]

构建韧性：Kubernetes 上向量数据库的有效备份与灾难恢复: https://sched.co/1i7m3

[2]

Kanister: https://www.kanister.io/

点击【阅读原文】阅读网站原文。

CNCF概况（幻灯片）

扫描二维码联系我们！

CNCF (Cloud Native Computing Foundation)成立于2015年12月，隶属于Linux Foundation，是非营利性组织。

CNCF（云原生计算基金会）致力于培育和维护一个厂商中立的开源生态系统，来推广云原生技术。我们通过将最前沿的模式民主化，让这些创新为大众所用。请关注CNCF微信公众号。

http://mp.weixin.qq.com/s?__biz=MzI5ODk5ODI4Nw==&mid=2247549805&idx=4&sn=420116bb77ce7c23a3fd4d22d8e65190

CNCF

云原生计算基金会（CNCF）致力于培育和维护一个厂商中立的开源生态系统，来推广云原生技术。我们通过将最前沿的模式民主化，让这些创新为大众所用。

最新文章

CNCF Weekly 24-47

Kube-OVN 1.13 发布：更高的质量与全新的功能，感谢社区的支持！

Shipwright v0.14.0 发布

PyPI 的 Sigstore 驱动的认证现已普遍可用

宣布CNCF 2025活动安排

openGemini v1.3.0稳定版本正式发布

SpinKube 简介

宣布云原生英雄挑战

狙击 K8s 用户的“流氓”专利：分布式软件定义网络 (dSDN)

定居 - Score 在 CNCF 生态系统中的旅程

是时候踏上Dockerless之路了

标准化与多样性齐头并进的 KubeCon 见闻

openGemini社区多副本性能优化小组成员公示

Argo内部：一部关于简化Kubernetes部署的自动化工具的新纪录片

KubeEdge 如何构建适应边缘网络的安全可信隧道

推出集成的 Backstage 和 Headlamp 体验

K8s 自定义调度器 Part1：通过 Scheduler Extender 实现自定义调度逻辑

openGemini社区新晋Committer徐业：开源如萤光聚，最终汇聚成一束束耀眼的光芒

KCL 开源社区最新动态 | 更流畅的 IDE 与工具链体验！

【公告】2025年认证考试价格即将调整

下午直播｜Fluid 引入Openkruise进行缓存Runtime扩缩容的实践

Cilium 项目旅程报告概览

eBPF 威胁模型和验证器代码审计

开启 OpenSearch 的未来

帮助我们测试 OpenTofu 1.9.0-alpha2

CNCF Weekly 24-46

CNCF 欢迎 wasmCloud 升级到孵化阶段

Keycloak 26：跨组织的可扩展认证

宣布 KubeVirt v1.4 发布

Phippy 和朋友们的新故事：Izzy 拯救了生日

宣布云原生英雄挑战的开幕赛

CNCF 宣布 cert-manager 毕业

软件供应链安全最佳实践 v2 出炉

用 Jenkins X 构建 CI/CD（LFS268）课程现已更新升级

CNCF 宣布 Dapr 毕业

从 ClickOps 到 GitOps：全新的 Flux UI

探索 OTel Profiling 进展：eBPF 代理快速上手

Minder成为OpenSSF沙箱项目｜简化开源安全工具集成与使用

快速、安全且简单：Istio 的 Ambient 模式在 v1.24 中正式推出

Kubewarden 1.18 发布，实现 SLSA 级别 3

来 KubeCon NA 2024 和 WasmEdge 交流吧

Karpenter v1.0.0 对 K8s 自动伸缩的意义

关于日本的 Kubernetes 上游培训的特别报道

KubeCon 北美倒计时｜在“养老圣地”畅谈云原生的开源未来

CNCF Weekly 24-45

KubeEdge 1.19.0版本发布！更完备的节点设备能力，全新的Dashboard体验

Karpor v0.5.0 发布 - 更加安全、易用的 K8s 数据面，感谢社区！

Envoy Gateway v 1.2.0 版本发布：新功能与改进介绍

拥抱 OTel：阿里云 Java Agent 演进实践

与 Perses 深度集成，重构 GreptimeCloud 可视化工作台

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉