SQL性能优化秘籍:如何避免计算导致索引失效

文摘   2024-07-23 07:31   北京  

适用于MySQL、PostgreSQL、Oracle等各种数据库的优化技巧

问题剖析

设想我们为customer表的c_acctbal列创建了一个B树索引c_acctbal_idx,以加速相关查询。然而,一个看似无害的计算可能会阻碍索引的使用。比如这样的查询:

SELECT * FROM customer WHERE c_acctbal + 100 = 10000.0

通过EXPLAIN命令查看查询计划:

-> Filter: ((customer.C_ACCTBAL + 100) = 10000.0)  (cost=102301.50 rows=900955)   -> Table scan on customer  (cost=102301.50 rows=900955)

显而易见,数据库优化器选择了全表扫描而非预期的索引查找,导致查询成本激增。

深入诊断

我们尝试将计算从左侧移至右侧,改写查询条件:

SELECT * FROM customer WHERE c_acctbal = 10000.0 - 100;

再次使用EXPLAIN

-> Index lookup on customer using c_acctbal_idx (C_ACCTBAL=(10000.0 - 100))  (cost=5.50 rows=5)

这次,优化器明智地选择了c_acctbal_idx索引,查询成本降至原来的1%以下。

诊断结论: 实验表明,在索引列上进行计算会导致索引失效。这不仅适用于算术运算,也适用于函数调用和其他所有索引列上的计算。

解决方案

面对这一问题,我们有两种解决策略:

  1. 重写查询,将计算从索引列移至其他位置,以便查询能够利用现有的索引。

  2. 创建函数索引以匹配特定条件。例如:

    CREATE INDEX phone_func_idx ON customer(LEFT(c_phone, 3))

    注意:函数索引仅适用于与索引定义完全一致的条件,譬如LEFT(c_phone, 4) = '1390'将不会采用这个函数索引。

PawSQL的智能优化

PawSQL通过自动检测问题条件,并将其自动重写为等价形式,实现了上述第一个解决方案。

支持的内置运算符

PawSQL的自动重写优化支持以下算术运算符及其组合在条件上的运算:

  • 乘法 (*)

  • 加法 (+)

  • 减法 (-)

  • 除法 (/)

  • 一元负号 (-)

支持的内置函数

PawSQL智能重写多种MySQL 8.0内置函数,包括但不限于:

  • 日期时间函数:ADDDATE(), DATE_ADD(), DATE_SUB(), SUBDATE(), DATEDIFF()

  • 时间计算函数:ADDTIME(), SUBTIME(), TIMEDIFF()

  • 时间戳函数:TIMESTAMPADD(), TIMESTAMPDIFF()

  • 时间转换函数:SEC_TO_TIME(), TIME_TO_SEC(), FROM_DAYS(), TO_DAYS()

  • IP地址转换函数:INET_ATON(), INET_NTOA(), INET6_ATON(), INET6_NTOA()

  • 字符串函数:LEFT(), STRCMP()

  • 日期格式化函数:DATE_FORMAT(), STR_TO_DATE()

  • 其他函数:YEAR(), EXTRACT(), CAST(), IFNULL(), ISNULL()

其他数据库的函数支持将在后续添加.

PawSQL重写前后的SQL对比

PawSQL重写前后的执行计划对比

总结

通过应用PawSQL的重写优化,SQL查询不仅能够:

  • 利用索引减少数据访问成本,还能

  • 通过将计算从列上移到常量字面值上,避免对每一行进行计算。

这大大提升了查询的性能和效率。🚀

🌐 关于PawSQL

PawSQL专注数据库性能优化的自动化和智能化,提供的解决方案覆盖SQL开发、测试、运维的整个流程,支持MySQL,PostgreSQL,openGauss,Oracle等各种数据库。

欢迎点击关注PawSQL公众号👇👇👇

PawSQL
PawSQL专注于数据库性能优化的自动化和智能化,支持MySQL、PostgreSQL、openGauss,金仓、达梦、Oracle等主流商用和开源数据库,为开发者和企业提供一站式的创新SQL优化解决方案。
 最新文章