冷门的PostgreSQL性能优化来了：利用事务链减少与SERVER端的往返开销

文摘 2024-07-17 06:00 天津

前言

本文是一篇PostgreSQL比较冷门的优化小技巧，通过事务链(transaction chain)的使用，来减少与Server端交互次数，从而达到提高性能的目的。

分析

使用PostgreSQL或任何关系数据库实现业务应用程序，通常相当于执行事务序列。给定事务是否以COMMIT或ROLLBACK结束并不重要，因为在这两种情况下，下一个事务在前一个事务完成后立即启动。此外，对于大多数应用程序，前一个事务和下一个事务具有相似的特征，例如它们的隔离级别。从本质上讲，你最终得到的是一个看起来如下的模式:

START TRANSACTION;
-- workload of 1st transaction
COMMIT;
START TRANSACTION;
-- workload of 2nd transaction
ROLLBACK;
START TRANSACTION;
-- workload of 3rd transaction
COMMIT;

在上面的SQL脚本中，您可以看到三个后续事务和总共六个语句(每个事务两个)，但是您可以想象更长的事务序列。事情是这样的:每个语句都需要一个单独的服务器往返通信来执行。这是没有办法的，即使三个示例事务是空的——不包含任何语句——也没有什么区别。

监控连接状态

与其相信我的话，我们可以很容易地证明服务器往返通信确实发生了。为了进行这个实验，我们需要两个连接到同一个PostgreSQL服务器(例如，两个psql会话)。第一个连接使用postgres数据库，第二个连接使用demo数据库。

好了，现在我们可以使用pg_stat_activity，这是一个属于pg_catalog模式的内置视图，在第一个连接查询PostgreSQL关于使用demo数据库的第二个连接的状态:

postgres=# SELECT state FROM pg_stat_activity WHERE datname='demo';
 state
-------
 idle
(1 row)

正如您所看到的，连接当前处于空闲状态（idle)，因为它没有做任何事情。然而，如果我们在第二个连接上启动一个事务，我们可以看到该连接的状态立即变为事务中的空闲状态(idle in transaction)。

demo=# START TRANSACTION;
START TRANSACTION

postgres=# SELECT state FROM pg_stat_activity WHERE datname='demo';
        state
---------------------
 idle in transaction
(1 row)

这证明了START TRANSACTION语句导致了与服务器之间的往返通信，因为如果没有这样做，第一个连接将无法看到第二个连接的状态更改。如果我们用COMMIT或ROLLBACK结束事务，情况也是一样的，在这种情况下，连接立即恢复到空闲状态(idle):

demo=*# COMMIT;
COMMIT

postgres=# SELECT state FROM pg_stat_activity WHERE datname='demo';
 state
-------
 idle
(1 row)

往返通信（round-trips)的开销

因此，长话短说，事务的开始和结束可能会造成很大的开销。具体来说，如果满足以下任何一个条件:

到服务器的往返时间很慢。通常情况下，如果客户机和服务器之间的网络距离很远，则会出现这种情况。
有许多事务的平均运行时间很短。这是因为对于较短的事务，开销占总运行时的百分比更高。

这样来看，我们如何才能减少往返开销并提高性能呢？

事务进行链化（transaction chaining)

事务链化，隐约可以进行某种程度的优化。

SQL标准有一个内置的解决方案，由PostgreSQL实现:AND CHAIN参数。该参数可用于COMMIT和ROLLBACK语句，其效果如下:

如果提供了AND CHAIN参数，则提交(或回滚)当前事务，并且立即启动具有相同特征(例如，ISOLATION LEVEL)的后续事务。

因此，如果我们将此应用于原始示例，我们可以将服务器往返次数基本上减少50%(从n减少到n/2+1)。

START TRANSACTION;
-- workload of 1st transaction
COMMIT AND CHAIN;
-- workload of 2nd transaction
ROLLBACK AND CHAIN;
-- workload of 3rd transaction
COMMIT;

我们可以做同样的实验来证明这和预期的一样有效。我再次使用两个连接，一个使用postgres数据库，另一个使用demo数据库。最初，demo数据库连接是空闲的，但是一旦我们启动一个新事务，它的状态就会变成事务中空闲（idle in transaction)。

demo=# START TRANSACTION;
START TRANSACTION
postgres=# SELECT state FROM pg_stat_activity WHERE datname='demo';
        state
---------------------
 idle in transaction
(1 row)

那么，如果demo连接执行COMMIT AND CHAIN语句会发生什么呢? 正如我所说，PostgreSQL会立即启动一个后续事务，所以我们不会看到状态变化。

demo=# COMMIT AND CHAIN;
COMMIT AND CHAIN

postgres=# SELECT state FROM pg_stat_activity WHERE datname='demo';
        state
---------------------
 idle in transaction
(1 row)

当我们执行ROLLBACK and CHAIN时，我们会得到完全相同的行为——没有明显的状态改变。

demo=# ROLLBACK AND CHAIN;
ROLLBACK AND CHAIN

postgres=# SELECT state FROM pg_stat_activity WHERE datname='demo';
        state
---------------------
 idle in transaction
(1 row)

最后，当我们发出一个普通的COMMIT或ROLLBACK命令时，状态会变回初始空闲状态。

demo=# COMMIT;
COMMIT

postgres=# SELECT state FROM pg_stat_activity WHERE datname='demo';
 state
-------
 idle
(1 row)

希望你能从这篇文章里得到启发，享受到其中的乐趣。

总结：

文中的内容确实蛮有意思的。在实际的应用开发过程中，把一些频繁调用的小事务（commit, rollback)，可以使用 (commit and chain, rollback and chain) 链接起来，就能达到交互次数极大减少的目的。

如果抽象起来，

interface Connection {
    void commit(boolean chained);
    default void commit() {
        commit(false);
    }
    void rollback(boolean chained);
    default void rollbavck() {
        rollback(false);
    }
}

这个想想就蛮有意思的。性能优化无止境。配合PostgreSQL本身的特性，在应用层就可以不断地挖掘和利用那些特性，进行适当的优化。有一个说法是，应用层出问题的比例大概就是80%或以上。

参考:

Using Transaction Chaining to Reduce Server Round-Trips：
https://bugfactory.io/articles/using-transaction-chaining-to-reduce-server-round-trips/

我是【Sean】, 欢迎大家长按关注并加星公众号：数据库杂记。有好资源相送，同时为你提供及时更新。已关注的朋友，发送0、1到7，都有好资源相送。

往期导读:
1. PostgreSQL中配置单双向SSL连接详解
2. 提升PSQL使用技巧：PostgreSQL中PSQL使用技巧汇集(1)
3. 提升PSQL使用技巧：PostgreSQL中PSQL使用技巧汇集(2)
4. PostgreSQL SQL的基础使用及技巧
5. PostgreSQL开发技术基础:过程与函数

http://mp.weixin.qq.com/s?__biz=Mzg4NDA0NTEwNA==&mid=2247502580&idx=3&sn=f5a6d9991e97c575ab8667bc6032186d

AustinDatabases

关于数据库相关的知识分享

糟糕！开发问国产数据库选型，怎么回答他们？

OceanBase 学习记录 -- 临时工开始入门

PostgreSQL 13.0-13.15 功能更新和bug fixed列表

撕逼！ PostgreSQL 和 MongoDB 开撕，MySQL却躺枪

2024 MongoDB 中国用户大会上海站成功举办圆满结束：技术驱动未来，携手共创辉煌

Windows 是MySQL和PostgreSQL高性能数据库的坟墓

大厂喜欢通过那些面试题来考察DBA？

阿里云数据库--市场营销聊胜于无--3年的使用感受与反馈系列

DBA 实战手记（薛晓刚） -- 综合类数据库技能经验类书籍介绍

最近一段不务正业的 "学习成果" 与 “众人”是什么！

阿里云数据库产品对内对外一样的卷 --3年阿里云数据库的使用感受与反馈系列

临时工说: 实际实例揭穿AI, 上云就不用DBA的谎言

阿里云数据库使用感受--客户服务问题深入剖析与什么是廉价客户 --3年的使用感受与反馈系列

云原生数据库是青出于蓝胜于蓝，还是数据库产品的倒退？

阿里云数据库使用感受--操作界面有点眼花缭乱 --3年的使用感受与反馈系列

PostgreSQL 软肋 “最大连接数” 到底是不是问题？

Prometheus监控神器-Kubernetes篇（一）

MongoDB 系统IOPS 告警系统处于崩溃，优化语句从1秒优化到1毫秒解决问题

谁是蹭流量文章的 “拥护者” 与擦边要有“度”

躺平其实也挺好，一段时间的思考&反思

PostgreSQL 具有createdb的用户无法创建数据库的原因（之一）

专访唐建法-从MongoDB中国第一人到TapData掌门人的故事

MongoDB VS Austindatabases 上海MongoDB 大会专属礼物领取贴

PolarDB 最近遇到加字段加不上的问题与使用PolarDB 三年感受与恳谈

临时工说：DBA 7*24H 给2万的工作，到底去不去？

DISS 阿里云 DAS数据库服务，阿里云数据库服务的毒瘤

MongoDB 入门教学贴从术语到操作（约束怎么建立内部培训贴）

DTCC 中国数据库大会联合 Austindatabases 公众号送票活动

PostgreSQL 同样的语句一会快一会慢到底怎么回事，

你有发表论点的自由，我们DBA有屏蔽你封杀你的自由

数据库最近第一比较多，OceanBase 定语加多了？

优化技法：使用In-memory Disk代替PostgreSQL中的临时文件

MongoDB 入门教学贴从术语到操作（基本操作到 javascript 打印日常维护信息案例内部培训贴）

MySQL 8.0x 到 9.0均可能崩溃--云厂商开发指责 MYSQL不测试就推新版本？

PostgreSQL 14 小版本分析，有那个版本不建议使用

临时工说：改了三次还是不能播的，数据库市场思考

一文带你了解 GB 18030-2022 字符集

PolarDB serverless 真敢搞，你出圈了你知道吗!!!!

MongoDB 入门教学贴从术语到操作（用户权限内部培训贴）

冷门的PostgreSQL性能优化来了：利用事务链减少与SERVER端的往返开销

MySQL 让你还用5.7 出事了吧，用着用着5.7崩了

PostgreSQL 稳定性平台 PG中文社区大会--杭州来去匆匆

云原生数据库是一场闹剧，还是数据库市场的程咬金

PolarDB 从节点Down机后，引起的主从节点强一致的争论

有思想的人，在这个年代会很痛苦？躺平还是醒着都无所谓了

MongoDB 谨献给说MongoDB 这不好那不好的“古董” -- 发展与演进,从3 到 7 的卓越变化

MongoDB 入门教学贴单机的安装与设置（内部培训贴）

临时工说: 网友问35岁就淘汰，我刚入行DBA 怎么办？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

冷门的PostgreSQL性能优化来了：利用事务链减少与SERVER端的往返开销

前言

分析

监控连接状态

往返通信（round-trips)的开销

事务进行链化 （transaction chaining)

总结：

参考:

事务进行链化（transaction chaining)