KubeCon 上那些关于服务网格的新思路

科技   2024-10-10 16:02   上海  

服务网格技术的成熟度正在不断提高,社区的活跃度也在增加。Istio、Linkerd、Consul 等主流服务网格项目持续更新,带来了新特性和改进。同时,也有一些新的服务网格项目不断涌现,为用户提供了更多选择。

KubeCon China 2024 HongKong 已经结束,本文总结了一下关于服务网格领域的相关议题,看看在当前,服务网格领域有哪些新东西,社区的热门话题是什么,又有哪些创新和期待?

01

eBPF 模式网格

Istio 数据平面的新选择:全新性能体验的架构创新

此议题主要介绍了 Istio 服务网格及其 Ambient 模式,还包括与 Ambient 模式类似的 Cilium Service Mesh 的大致内容,从而引出了基于 eBPF 实现的、Sidecarless 模式的服务网格:Kmesh

通过分析 Sidecar 模式下的性能影响,Zhonghu Xu 描述了使用 eBPF 实现 Sidecarless 模式服务网格的必要性,并给出了简单的性能报告,表示 Kmesh 在不同情况下,相比于 Sidecar 和 Ambient 模式皆有不小的性能提升

最后,他介绍了 Kmesh 的功能与实现,包括支持双引擎(类似 Ambient 模式)、Sidecar 流量 Bypass 以及加速,并提出未来希望能够在内核(eBPF)层面支持 7 层治理

详情查看:https://sched.co/1eYWy

用内核原生无边车架构彻底改变服务网格

此议题重点介绍了 Kmesh 的一些技术细节

  1. 通过 eBPF 拦截内核的 connect4 函数,并返回特定的假数据,让应用认为链接已经被建立,可以正常收发数据。

  2. 拦截 sendmsg 函数,拦截业务发送的数据(比如请求),根据连接的信息,判断是否需要建立连接(懒连接),并在连接建立完成后将数据发生,可以在这里实现负载均衡、策略等。

  3. 如果需要处理七层协议,会在 sendmsg 处,修改数据包,在包前加上 tlv(type-length-value,会包含一些元数据),然后发往 Kmesh Waypoint 进行处理,Waypoint 可以根据元数据进行路由或者策略。

此外,还介绍了 Kmesh 如何解决不中断业务的情况下升级 Kmesh 的 daemon,以及如何实现可观测。

因为这个过程使用的是 eBPF 技术,所以即便 Kmesh 进程退出,也不会影响现有业务的流量。

详情查看:https://sched.co/1eYYm

重新定义服务网格:利用 eBPF 优化 Istio 环境架构和性能

此议题主要介绍了目前 Istio 的 Ambient 模式存在的一些问题,并尝试给出一些解决方案:

  1. Ambient 模式在升级过程中,会导致所有业务流量中断。

  2. Ambient 模式的 ztunnel 的性能不理想。

Yuxing Zeng 主要介绍了使用 eBPF + IPSec/WireGuard 来代替 ztunnel 的实现方式 - Mocket,并通过轻量化的 ambient-agent 组件,来实现 mTLS-lite 的组件,将数据面和控制面解耦,避免因为 ambient-agent 组件退出而导致业务不可用的情况发生。

并且,该方案大幅提升了性能和降低了延迟

详情查看:https://sched.co/1eYYo

02

Istio & 多云

在多云环境中通过服务网格实现统一管理、连续性和合规性

我在这个议题中主要讲述了通过结合 Istio 和 Karmada,来实现统一的多云服务管理方案。包括通过 Karmada 解决多云应用分发、故障后应用转移等问题,以及通过 Istio 解决多云之间通讯和流量策略的问题及相关的技术细节。

我还介绍了一种托管网格的架构,能够在配置复杂度、高可用等方面都有不错表现的部署架构。

此外,在多云通信场景中,针对负载均衡和熔断可能导致的服务不可用问题,Istio 和 Karmada 社区提供了一些有效的解决方案。对此感兴趣的朋友可以通过查看回放来获取更多信息。

详情查看:https://sched.co/1eYZ3

最佳实践:Karmada 和 Istio 提高生产分布式云的工作负载和流量弹性

本议题探讨了 Karmada 与 Istio 的结合应用,特别强调了它们在故障转移、集群升级和迁移方面的能力

故障转移能力涵盖了节点、集群和区域级别的故障场景,并结合了 Istio 的本地优先策略,确保了故障转移过程的平稳性和可靠性。

Istio 与 Karmada 的紧密协作使得集群升级和迁移成为可能。利用 Istio 的流量管理功能,可以精确控制跨集群的流量分配,从而实现平滑的流量切换和负载均衡。

详情查看:https://sched.co/1eYWs

03

AI

模型服务网格:大规模 AI 模型服务部署和管理的新范式

在 AI 领域,流量处理与常规 Web 服务领域相比有着显著的不同。为了提供更优质的 AI 服务,我们必须在负载均衡、排队策略和缓存机制上进行细致的优化。在本次议题中,两位讲师围绕 Model Service Mesh 提出了一系列创新解决方案,包括但不限于 token 长度预测、优先级设置和配额管理等。

他们还探讨了如何以优雅且高效的方式加载 AI 模型,并深入讨论了数据、模型和运行时环境的安全性问题,旨在确保大语言模型(LLM)在整个链路上的安全性。此外,还涉及了与 AI 工作流(AI Workflow)相关的解决方案。

为了实现这些功能,讲师们提出了通过扩展服务网格的控制平面来达成目标。这种方法不仅能够提升 AI 服务的性能,还能够确保服务的安全性和可靠性

详情查看:https://sched.co/1eYan

04

其他

Istio 和现代 API 网关:引领服务网格的未来

这个圆桌议题主要讨论了 Ambient 模式的现状,Sidecar 模式和 Ambient 模式的选择、期望能够倾听更多用户的声音,提出 Ambient 更加倾向于“基础设施”的定义

在选择服务网格模式方面,还是要考虑企业的实际情况,充分考虑各自的优缺点,以及迁移或者共存的

还讨论了 Envoy Gateway 或其他 Gateway 于 Istio 的结合/集成相关问题,讨论了关于 Envoy Gateway 的一些用户案例,以及东西/南北向网关集成统一的必要性。

最后讨论了关于服务网格未来的方向

  • 对于性能方面,关注 eBPF 加速服务网格。

  • 支持自动识别硬件特性,自动使用这些硬件特性。

  • AI Gateway,能够让网更好理解、处理 LLM 相关的流量。

在这个圆桌议题,开发者们深入探讨了 Ambient 模式的现状及其与 Sidecar 模式的对比。讨论的核心在于理解用户的实际需求,以便更精准地定义 Ambient 模式作为“基础设施”的角色

在服务网格模式的选择上,他们讨论强调了必须基于企业的具体情况来决定。这包括评估每种模式的优势和劣势,以及迁移到新架构或实现现有架构与新架构共存的可行性。

此外,会议还探讨了 Envoy Gateway 以及其他 Gateway 与 Istio 的集成问题。通过分析 Envoy Gateway 的用户案例,讨论了统一东西向和南北向网关集成的必要性,以及如何实现这一目标。

对于服务网格的未来方向,讨论聚焦在以下几个关键点:

  • 性能提升探讨了如何利用 eBPF 技术来加速服务网格,以提高网络性能。

  • 硬件特性识别:讨论了服务网格如何自动识别并利用硬件特性,以实现优化。

  • AI 网关:提出了 AI Gateway 的概念,这种网关能够更智能地理解和处理与大语言模型(LLM)相关的流量,从而提升网关的智能化水平。

详情查看:https://sched.co/1eYY6





 本文作者 




刘齐均

「DaoCloud 道客」服务网格专家、Istio 指导委员会成员





热门推荐

            

访问以下网址,或点击文末【阅读原文】立即体验

d.run,让算力更自由
https://d.run/




DaoCloud 公司简介

「DaoCloud 道客」,云原生领域的创新领导者,成立于 2014 年底,凭借其自主知识产权的核心技术,成功打造了新一代云原生操作系统 DaoCloud Enterprise 5.0,致力于推动企业数字化、智能化转型。依托在云原生领域的技术积淀与持续创新,「DaoCloud 道客」推出 d.run 算力一体化解决方案,作为专业的技术提供商参与并推动多个区域算力枢纽中心的建设,为各行各业提供稳定、高效的算力支持。成立迄今,公司已在金融科技、先进制造、智能汽车、零售网点、城市大脑等多个领域深耕,标杆客户包括交通银行、浦发银行、上汽集团、格力集团、京东方、屈臣氏集团等。公司总部位于上海,并在新加坡、北京、深圳、成都、南京、武汉等地设立多家分公司及合资公司,总员工人数超过 300 人,是国家级“专精特新”小巨人企业、上海市高新技术企业,并入选了科创板培育企业名单。


网址:www.daocloud.io

邮件:info@daocloud.io

电话:400 002 6898



道客船长
分享云原生技术相关信息,助力开发者和企业云海扬帆!本公众号由 DaoCloud 负责运营
 最新文章