openGauss/POSTGRESQL 中float类型到int类型的隐式转换

文摘 2024-11-18 17:30 广东

一、问题背景

在一次测试中，发现下面这条sql在oracle和POSTGRESQL/OPENGAUSS中的查询结果不一致

select  cast(cast(0.5 as float) as integer);

在oracle中返回1，在openGauss中返回0，咋一看好像是openGauss中使用了截断的方式,但是如果执行

select  cast(cast(1.5 as float) as integer);

则会发现oracle和openGauss中同样返回了2，这个时候就会猜想是不是这个float类型在两个数据库中实现并不一样导致的，因为ORACLE的float是按number格式存储的，不是标准定义中的浮点类型，而是一种精确类型；而openGauss中的float符合标准定义的浮点类型，是一种非精确类型。
但我们并不能妄下这种判断，多测几组数据:

select  cast(cast(0.5 as float) as integer) c1 , cast(cast(0.6 as float) as integer) c2 , cast(cast(1.5 as float) as integer) c3, cast(cast(2.5 as float) as integer) c4, cast(cast(3.5 as float) as integer) c5,  cast(cast(4.5 as float) as integer) c6

c1	c2	c3	c4	c5	c6
0	1	2	2	4	4

从这组数据中发现一个规律，当小数尾数为5进行舍入时，前一位总是偶数，这自然联想到了另一种四舍五入算法，即银行家算法，对应ORACLE12C新增的一个函数round_ties_to_even。

openGauss数据库是开源的，我们完全可以通过查看源码来验证我们的猜想。

二、分析

接下来开始就是说明如何通过这种问题来找到对应的源码逻辑。

首先要知道一些openGauss的元数据基础知识。
openGauss的元数据基本继承postgresql，所以这个知识可以复用。
在postgresql中，几乎所有的类型、函数、操作符、规则等，都可以在元数据表中查到。对于类型转换，即cast，也有一张对应的表，即pg_cast,下面这个SQL就是查询从float8到int8是否存在直接的类型转换规则

select * from pg_cast h where h.castsource ='float8'::regtype and h.casttarget ='int8'::regtype;

castsource	casttarget	castfunc	castcontext	castmethod	castowner
701	20	483	i	f

查到了是有的，这里castmethod为f，表示这个转换是使用某个函数进行转换的，一般是二进制存储结构有变更才会需要使用到函数。然后castfunc即为这个转换函数的oid,接下来我们去查这是用的哪个函数

select proname,prosrc from pg_proc where oid=483;

proname	prosrc
int8	dtoi8

可以看到使用的是int8函数，然后int8的函数源码是dtoi8,此时我们就可以去openGauss源码中搜索dtoi8了，

找到了
.\openGauss-server\src\common\backend\utils\adt\int8.cpp

/* dtoi8() * Convert float8 to 8-byte integer. */Datum dtoi8(PG_FUNCTION_ARGS){    float8 num = PG_GETARG_FLOAT8(0);
    /*     * Get rid of any fractional part in the input.  This is so we don't fail     * on just-out-of-range values that would round into range.  Note     * assumption that rint() will pass through a NaN or Inf unchanged.     */    num = rint(num);
    /*     * Range check.  We must be careful here that the boundary values are     * expressed exactly in the float domain.  We expect PG_INT64_MIN  to be an     * exact power of 2, so it will be represented exactly; but PG_INT64_MAX     * isn't, and might get rounded off, so avoid using it.     */    if (num < (float8)PG_INT64_MIN || num >= -((float8)PG_INT64_MIN) || isnan(num)) {        if (fcinfo->can_ignore && !isnan(num)) {            ereport(WARNING, (errmsg("bigint out of range")));            PG_RETURN_INT64(num < (float8)PG_INT64_MIN ? LONG_MIN : LONG_MAX);        }        ereport(ERROR, (errcode(ERRCODE_NUMERIC_VALUE_OUT_OF_RANGE), errmsg("bigint out of range")));    }
    PG_RETURN_INT64((int64)num);}

这段代码注释加警告比实际逻辑还多，但真正要看的只有 num = rint(num);这一行，这里又引用到了rint函数，点进去

double rint(double x){    return (x >= 0.0) ? floor(x + 0.5) : ceil(x - 0.5);}

如果不是开发人员，对这种计算看不懂，可以借助AI

这段代码定义了一个名为 rint 的函数，用于将一个双精度浮点数 x 四舍五入到最接近的整数。具体来说：
如果 x 大于或等于 0.0，则返回 floor(x + 0.5)，即将 x 加上 0.5 后向下取整。
如果 x 小于 0.0，则返回 ceil(x - 0.5)，即将 x 减去 0.5 后向上取整。
这样可以实现对正数和负数的四舍五入。

这里是按照常规的算法进行四舍五入的，但结果竟然和银行家算法一样。

看到这里我一下犯了迷糊，理所当然的认为一定会走到这个rint，但后来根据openGauss社区专家的指点，实际上这里调用的是std::rint(float)，c++内置的一个标准函数，而这个函数就是使用的银行家算法！

三、扩展

既然已经定位到了原理，于是我们回到ORACLE看看，不精确的浮点类型在ORACLE的表现是怎样的？其实ORACLE也有这种浮点类型，叫binary_float和binary_double，这两个类型不能在sql中使用，只能在plsql中使用，我们写个简单的例子在ORACLE进行测试

declarex binary_integer;beginselect  cast(0.5 as binary_double) into x from dual;dbms_output.put_line(x);select  cast(0.6 as binary_double) into x from dual;dbms_output.put_line(x);select  cast(1.5 as binary_double) into x from dual;dbms_output.put_line(x);select  cast(2.5 as binary_double) into x from dual;dbms_output.put_line(x);select  cast(3.5 as binary_double) into x from dual;dbms_output.put_line(x);end;

0
0
1
2
3

竟然出现了第三种结果，即全部都是按trunc

再把binary_integer改成integer，再在ORACLE中测试

declarex integer;beginselect  cast(0.5 as binary_double) into x from dual;dbms_output.put_line(x);select  cast(0.6 as binary_double) into x from dual;dbms_output.put_line(x);select  cast(1.5 as binary_double) into x from dual;dbms_output.put_line(x);select  cast(2.5 as binary_double) into x from dual;dbms_output.put_line(x);select  cast(3.5 as binary_double) into x from dual;dbms_output.put_line(x);end;

.5
.59999999999999998
1.5
2.5
3.5

出现了第四种结果！ORACLE的integer竟然能显示出小数！

我们理解不同的数据类型可以有不同的表现行为，也知道oracle中的integer其实是按number类型进行的实现，但是这明晃晃的声明了integer类型竟然还能打印出小数，这对于应用开发者来说如何能够接受？
当然，我们可以认为这个用例的用法是不合理的，正常情况下小数转换成整数应该使用函数来处理，而不是通过类型转换。也可能之前从来没有人这么用过，所以ORACLE一直没发现存在这个问题。

于是回到最开始的问题上，openGauss/postgresql和ORACLE表现不一致，究竟谁是对的，或许我们永远都无法找到准确答案，这只能算是一种行为差异，并且都可以解释得通。但在看到ORACLE换个方式出现了第三种结果，甚至还出现了整数类型显示小数这种奇葩BUG时，ORACLE的权威性陡然下降。

为了避免这种问题，建议无论在用什么数据库时，对于类型转换，还是慎重一些为好

点击阅读原文跳转作者文章

http://mp.weixin.qq.com/s?__biz=MzIyMDE3ODk1Nw==&mid=2247519137&idx=1&sn=d3a4e0d31a3dd816945a1d7c4acd4549

openGauss

开源关系型数据库

最新文章

快讯 | openGauss6.0.0 登陆RISC-V架构

openGauss6.0.0企业版使用普通用户搭建一主一备

数据库性能诊断工具DBdoctor快速纳管openGauss数据库

openGauss 内存管理

openGauss/POSTGRESQL 中float类型到int类型的隐式转换

openGauss 6.0.0 LTS 企业版：单机部署与配置实战

倒计时1天丨上海Meetup亮点速递，专家共论数智化转型，前沿技术与实践案例一站尽览

判断备机是否需要重建

addr2line解析openGauss日志

印美软件（上海）有限公司正式加入openGauss社区

openGauss6.0主备节点都为Primary分析处理

DataKit6.0将MySQL8.0迁移至openGauss6.0

深入体验openGauss 6.0 LTS：功能实战评测

2024 年度openGauss标杆应用实践案例征集工作正式启动

第八届openGauss技术文章征集活动 | 第二批初审合格名单公布！

openGauss智能化运维监控平台—DataKit

openGauss6.0企业版单中心一主一备切换

Centos7.6安装openGauss 6.0.0 (LTS)

使用dbops部署单中心opengauss6.0企业版（一主两从）

openGauss运维工具DataKit6.0部署

openGauss6.0单点企业版部署_openEuler22.03_x86

大道云行携手openGauss社区，共创智数时代先进存力

openGauss 6.0.0-LTS部署宝典：轻松掌握数据库部署的核心技巧

openGauss与pgpool-Ⅱ共建高可用方案的设想

openGauss6.0.0（LTS）企业版搭建主备集群保姆级部署手册

openGauss一种索引实现三种扫描方式：位图、索引和仅索引

openGauss社区8-10月季度汇报

第八届openGauss技术文章征集活动 | 首批初审合格名单公布！

跃昉科技正式加入openGauss社区，共同推动数据库技术创新与应用落地

openGauss 6.0.0-RC1 DataVec向量数据库测试

磐维数据库一体机发布开启国产数据库新征程，共创openGauss行业生态

四川众信互联科技有限公司正式加入openGauss社区

易库智能正式加入openGauss社区

【我和openGauss的故事】第八届openGauss技术文章征集活动

openGauss 6.0.0-RC1逻辑复制特性测试

统信服务器操作系统V20 1070e【openGauss 5.0.2 LTS 单节点扩容主备节点】

openGauss 6.0.0 LTS 版本正式发布!

海量数据出席华为全联接大会，再获殊荣

华为全联接大会丨以创新驱动变革，MogDB揭示关键行业数据库改造升级的高效路径

记录一次openGauss空间膨胀的故障排查

DBeaver连接openGauss报错Invalid username/password问题排查

一站式安装openGauss 6.0.0企业版

openGauss的数据处理能力调优实践

openGauss 6.0.0-RC1新特性：一站式交互安装初体验

统信服务器操作系统V20 1070e【openGauss 5.0.2 LTS 主备2节点部署】

观测openGauss的行组、页、数据类型三者的关系

openGauss 6.0.0新版本安装测评

DBeaver远程连接openGauss数据库报错汇总

Centos平台下openGauss 6.0.0-RC1企业版单机部署

CPU使用率异常增长？别慌，试试这个办法......

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉