服务网格技术的成熟度正在不断提高,社区的活跃度也在增加。Istio、Linkerd、Consul 等主流服务网格项目持续更新,带来了新特性和改进。同时,也有一些新的服务网格项目不断涌现,为用户提供了更多选择。
KubeCon China 2024 HongKong 已经结束,本文总结了一下关于服务网格领域的相关议题,看看在当前,服务网格领域有哪些新东西,社区的热门话题是什么,又有哪些创新和期待?
eBPF 模式网格
Istio 数据平面的新选择:全新性能体验的架构创新
此议题主要介绍了 Istio 服务网格及其 Ambient 模式,还包括与 Ambient 模式类似的 Cilium Service Mesh 的大致内容,从而引出了基于 eBPF 实现的、Sidecarless 模式的服务网格:Kmesh。
通过分析 Sidecar 模式下的性能影响,Zhonghu Xu 描述了使用 eBPF 实现 Sidecarless 模式服务网格的必要性,并给出了简单的性能报告,表示 Kmesh 在不同情况下,相比于 Sidecar 和 Ambient 模式皆有不小的性能提升。
最后,他介绍了 Kmesh 的功能与实现,包括支持双引擎(类似 Ambient 模式)、Sidecar 流量 Bypass 以及加速,并提出未来希望能够在内核(eBPF)层面支持 7 层治理。
详情查看:https://sched.co/1eYWy
用内核原生无边车架构彻底改变服务网格
此议题重点介绍了 Kmesh 的一些技术细节:
通过 eBPF 拦截内核的 connect4 函数,并返回特定的假数据,让应用认为链接已经被建立,可以正常收发数据。
拦截 sendmsg 函数,拦截业务发送的数据(比如请求),根据连接的信息,判断是否需要建立连接(懒连接),并在连接建立完成后将数据发生,可以在这里实现负载均衡、策略等。
如果需要处理七层协议,会在 sendmsg 处,修改数据包,在包前加上 tlv(type-length-value,会包含一些元数据),然后发往 Kmesh Waypoint 进行处理,Waypoint 可以根据元数据进行路由或者策略。
此外,还介绍了 Kmesh 如何解决不中断业务的情况下升级 Kmesh 的 daemon,以及如何实现可观测。
因为这个过程使用的是 eBPF 技术,所以即便 Kmesh 进程退出,也不会影响现有业务的流量。
详情查看:https://sched.co/1eYYm
重新定义服务网格:利用 eBPF 优化 Istio 环境架构和性能
此议题主要介绍了目前 Istio 的 Ambient 模式存在的一些问题,并尝试给出一些解决方案:
Ambient 模式在升级过程中,会导致所有业务流量中断。
Ambient 模式的 ztunnel 的性能不理想。
Yuxing Zeng 主要介绍了使用 eBPF + IPSec/WireGuard 来代替 ztunnel 的实现方式 - Mocket,并通过轻量化的 ambient-agent 组件,来实现 mTLS-lite 的组件,将数据面和控制面解耦,避免因为 ambient-agent 组件退出而导致业务不可用的情况发生。
并且,该方案大幅提升了性能和降低了延迟。
详情查看:https://sched.co/1eYYo
02
Istio & 多云
在多云环境中通过服务网格实现统一管理、连续性和合规性
我在这个议题中主要讲述了通过结合 Istio 和 Karmada,来实现统一的多云服务管理方案。包括通过 Karmada 解决多云应用分发、故障后应用转移等问题,以及通过 Istio 解决多云之间通讯和流量策略的问题及相关的技术细节。
我还介绍了一种托管网格的架构,能够在配置复杂度、高可用等方面都有不错表现的部署架构。
此外,在多云通信场景中,针对负载均衡和熔断可能导致的服务不可用问题,Istio 和 Karmada 社区提供了一些有效的解决方案。对此感兴趣的朋友可以通过查看回放来获取更多信息。
详情查看:https://sched.co/1eYZ3
最佳实践:Karmada 和 Istio 提高生产分布式云的工作负载和流量弹性
本议题探讨了 Karmada 与 Istio 的结合应用,特别强调了它们在故障转移、集群升级和迁移方面的能力。
故障转移能力涵盖了节点、集群和区域级别的故障场景,并结合了 Istio 的本地优先策略,确保了故障转移过程的平稳性和可靠性。
Istio 与 Karmada 的紧密协作使得集群升级和迁移成为可能。利用 Istio 的流量管理功能,可以精确控制跨集群的流量分配,从而实现平滑的流量切换和负载均衡。
详情查看:https://sched.co/1eYWs
03
AI
模型服务网格:大规模 AI 模型服务部署和管理的新范式
在 AI 领域,流量处理与常规 Web 服务领域相比有着显著的不同。为了提供更优质的 AI 服务,我们必须在负载均衡、排队策略和缓存机制上进行细致的优化。在本次议题中,两位讲师围绕 Model Service Mesh 提出了一系列创新解决方案,包括但不限于 token 长度预测、优先级设置和配额管理等。
他们还探讨了如何以优雅且高效的方式加载 AI 模型,并深入讨论了数据、模型和运行时环境的安全性问题,旨在确保大语言模型(LLM)在整个链路上的安全性。此外,还涉及了与 AI 工作流(AI Workflow)相关的解决方案。
为了实现这些功能,讲师们提出了通过扩展服务网格的控制平面来达成目标。这种方法不仅能够提升 AI 服务的性能,还能够确保服务的安全性和可靠性。
详情查看:https://sched.co/1eYan
04
其他
Istio 和现代 API 网关:引领服务网格的未来
这个圆桌议题主要讨论了 Ambient 模式的现状,Sidecar 模式和 Ambient 模式的选择、期望能够倾听更多用户的声音,提出 Ambient 更加倾向于“基础设施”的定义。
在选择服务网格模式方面,还是要考虑企业的实际情况,充分考虑各自的优缺点,以及迁移或者共存的
还讨论了 Envoy Gateway 或其他 Gateway 于 Istio 的结合/集成相关问题,讨论了关于 Envoy Gateway 的一些用户案例,以及东西/南北向网关集成统一的必要性。
最后讨论了关于服务网格未来的方向:
对于性能方面,关注 eBPF 加速服务网格。
支持自动识别硬件特性,自动使用这些硬件特性。
AI Gateway,能够让网关更好地理解、处理 LLM 相关的流量。
在这个圆桌议题,开发者们深入探讨了 Ambient 模式的现状及其与 Sidecar 模式的对比。讨论的核心在于理解用户的实际需求,以便更精准地定义 Ambient 模式作为“基础设施”的角色。
在服务网格模式的选择上,他们讨论强调了必须基于企业的具体情况来决定。这包括评估每种模式的优势和劣势,以及迁移到新架构或实现现有架构与新架构共存的可行性。
此外,会议还探讨了 Envoy Gateway 以及其他 Gateway 与 Istio 的集成问题。通过分析 Envoy Gateway 的用户案例,讨论了统一东西向和南北向网关集成的必要性,以及如何实现这一目标。
对于服务网格的未来方向,讨论聚焦在以下几个关键点:
性能提升:探讨了如何利用 eBPF 技术来加速服务网格,以提高网络性能。
硬件特性识别:讨论了服务网格如何自动识别并利用硬件特性,以实现优化。
AI 网关:提出了 AI Gateway 的概念,这种网关能够更智能地理解和处理与大语言模型(LLM)相关的流量,从而提升网关的智能化水平。
详情查看:https://sched.co/1eYY6
本文作者
「DaoCloud 道客」服务网格专家、Istio 指导委员会成员
热门推荐
访问以下网址,或点击文末【阅读原文】立即体验
DaoCloud 公司简介
网址:www.daocloud.io
邮件:info@daocloud.io
电话:400 002 6898