解决POSTGRESQL逻辑复制的挑战

文摘科技 2024-09-11 00:00 山东

在最新版本中，分布式 Postgres 供应商 pgEdge 加强了对大型对象的支持，增强了错误处理和自动化。

译自Tackling the Challenges of Logical Replication in PostgreSQL，作者 Susan Hall。

分布式 Postgres 供应商pgEdge继续通过其最新版本（称为“星座版”）来解决逻辑复制的复杂性，该版本提供了增强的并行处理、大对象支持和错误处理。

pgEdge 首席执行官Phillip Merrick表示，更高的吞吐量、灵活性和控制使 pgEdge 成为需要多主功能的传统数据库工作负载的可行的开源替代方案。他在一封电子邮件中表示，如今这些工作负载通常运行在诸如OracleGoldengate 之类的传统平台上。

这些工作负载需要能够在分布式数据库集群中的多个节点上接收读写流量，以实现低数据延迟或非常高的可用性（四个或五个九）或两者兼而有之。他解释说，一个例子可能是跨多个区域运行的金融服务应用程序或永远不会停机的关键电子商务应用程序。

Merrick 和他的联合创始人Denis Lussier（他们之前共同创建了 EnterpriseDB）在开源PostgreSQL上构建了pgEdge，其理念是，地理分布式集群中的几个节点（每个节点处理读写）可以提供低延迟、高可用性、弹性和性能。

尽管Postgres 中的逻辑复制是一项强大的功能，但它也存在一些挑战，包括一致性、同步、冲突解决和开销，这些都会影响性能。

星座版的功能包括：

大型对象逻辑复制 (LOLOR): 此 PostgreSQL 插件替换使现有应用程序的媒体资产（例如二进制文件、图像和其他非关系数据类型）与逻辑复制兼容。现在，这些 PostgreSQL 数据库中的大型文件可以在 pgEdge 上运行而无需修改。尽管 Postgres 支持将大型对象作为目录表中的块进行存储，但复制这些表需要特殊处理，根据其大型对象逻辑复制 (LOLOR)GitHub 页面所述。使用 LOLOR，此数据存储在非目录表中，以简化跨多个数据库实例或服务器的复制。它根据逻辑更改（例如插入、更新和删除操作）而不是存储级别的物理更改来复制数据，并使用更改数据捕获来确保与其他数据库实例的近乎实时的同步。根据 pgEdge 的说法，这在一致性、可用性和容错性至关重要的分布式系统中尤其有用。
复制异常处理和日志记录: 通过更新的错误处理和日志记录机制，复制错误将记录到一个新的异常表中，以防止它们阻止后续更改。这增强了对复制错误的可见性，以便更轻松地进行故障排除，而不会中断整体系统操作。
复制修复模式: 一个新功能允许用户在特定数据库节点上使用或选择不使用“修复模式”。此额外控制可用于在错误解决期间或修改单个数据库节点状态时阻止复制更改。它还支持通过外部工具进行错误修复，而不会影响整个集群。

虽然将这些功能列为本次发布的一部分，但该公司在 4 月宣布了自动数据定义语言 (DDL) 复制和 Snowflake 序列。

DDL 用于通过CREATE、ALTER和DROP等命令语句创建和修改 Postgres 对象。传统上，Postgres 需要通过 DDL 命令手动在每个节点上进行表定义的修改。通过这种自动化，您可以在单个节点上更新数据库模式，更改将无缝传播到集群中的其他节点。Snowflake 序列解决了在多主复制场景中管理序列的复杂性。在分布式多主 Postgres 系统中，序列必须在不同的区域进行更新，如果每个节点独立更新序列，就会产生无法解决的冲突。这种对 PostgreSQL 序列定义的替代方案提供了一个唯一的序列——一个时间戳、一个计数器和一个唯一的节点标识符——在一个集群中，可以在不同的区域使用，而无需编写代码或修改模式。

该公司在 1 月份宣布了其免费的云开发人员版，并在去年 10 月宣布了其使用开源扩展pgvector的向量搜索功能。

pgEdge 表示，在第四季度，它将添加高性能并行复制，它称之为“行业的游戏规则改变者”。

Merrick 解释说，高性能并行复制是指在每个节点之间的网络连接上运行多个数据复制流的能力，使用每个节点上的多个 CPU 来实现更高的数据吞吐量。当前 Postgres 的复制架构只允许节点之间有一个流，这限制了复制性能的上限。

这种复制吞吐量的提升将在高流量、跨区域的事务工作负载中，使用户能够在高需求环境中管理更大规模的数据复制，同时减少延迟并确保及时同步。

http://mp.weixin.qq.com/s?__biz=MzIzMzcxMTUxOQ==&mid=2247494584&idx=3&sn=050ed2730751d0e8be1057ae3fd50531

云云众生s

关注云原生时代的普通人 - 云原生 | 平台工程 | AI

最新文章

尝试“自上而下”的解决KUBERNETES蔓延问题

ANYSCALE：RAY的全新优化运行时，KUBERNETES OPERATOR

运行时上下文：KUBERNETES安全的缺失部分

在防火墙后部署KUBERNETES的技术

开发者游乐场：用途和设计模式

我最喜欢的5个命令行工具

如何使用安全即代码实现DEVSECOPS

PDF通过新的RAG架构更容易进入GENAI

平台工程最关键的第一个决定

DORA 2024：人工智能和平台工程未能达到预期

平台工程：克服数据管理挑战

Tetrate和彭博合作开发基于Envoy的AI网关

KUBERNETES是否环保？

人工智能与物联网的集成将代理带入物理世界

如何处理事件流中的不良数据

组织简化DevOps流水线的4种方法

优先考虑稳健的工程设计，而非过度吹嘘的生成式人工智能承诺

语义路由器及其在设计代理工作流中的作用

LINUX访问控制列表指南

Sicredi：从人工银行到平台工程

现代应用程序架构：简约之道

列式存储：开发人员实时分析的关键

Redis用户希望改变

通过调整LLM提示定义AI代理角色

OPENAI 结构化输出：开发者指南

人工智能如何改变应用程序的身份验证和授权

亚马逊用代码转换和安全功能改造开发者AI

架构反转：通过移动计算而不是数据来扩展

想要实时？在数据库中运行脚本

利用CPU优化数据库性能

MONGODB 8专注于时间序列数据和横向扩展

云原生网络：KUBERNETES迈入第二个十年

虚拟KUBERNETES集群是什么？

使用THANOS和KUBERNETES构建指标系统

KUBERNETES中的OOM KILLER优化技巧

微服务测试：特性开关与预览环境

在NESTJS中配置微服务：初学者指南

多云架构中微服务的安全保护方法

社会网络基金会启动 – W3C如何参与联邦宇宙？

微软开源OPENVMM，一款基于RUST的虚拟机监控器

面向集成构建是面向未来的增长战略

是时候开始左移了

REACT服务器组件会摧毁REACT吗？

如何在KUBERNETES上停止担心并开始热爱数据库

Kubernetes 的数据库配置：比较您的选择

将存储和数据库置于Kubernetes的控制之下

KUBERNETES上的数据库：为什么、何时以及需要考虑什么

AI代理：开发者全面入门指南

PYTHON多智能体系统中的协同智能

将人工专业知识与LLM辅助相结合来简化编码

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉