一文带你了解 GB 18030-2022 字符集

文摘   2024-07-18 08:33   新加坡  

转自少安事务所

GB18030 全称《‌信息技术 中文编码字符集》‌,‌是我国信息技术领域的强制性国家标准之一,是中华人民共和国国家标准所规定的变长多字节字符集,字符以单字节、双字节或四字节编码。

当前执行标准为 GB 18030-2022,于 2023 年 8 月1 日正式实施,是对 GB18030 标准的第二次修订,第一版为 GB18030-2000 (已废止),第二版为 GB18030-2005 (已废止)。

现行版本共收录汉字 87887 个,由包含了简体和繁体汉字,支持中国少数民族现行文字,包含了日韩等国的象形文字,还包括了 214 个康熙部首(KANGXI RADICALS)。覆盖中国绝大部分人名、地名用生僻字以及文献、科技等专业领域的用字,满足公安、‌地图、‌古籍出版等行业的应用需求。

GB18030 对汉字友好,对 GB/T 2312 完全兼容,对 GBK (已废止) 完全兼容,兼容所有 Unicode 字符。

此外,强制性国家标准 GB 18030-2022 《信息技术中文编码字符集》标准宣贯会暨首批通过认证测试产品发布会于 2023 年 8 月 17 日在北京成功召开。

获得首批 GB 18030-2022 产品认证的企业,参见列表。

可以看到,共有来自 23 家厂商的 29 款数据库产品获证。

序号公司名称产品名称
1平凯星辰(北京)科技有限公司平凯数据库企业版软件 V7.1
2北京人大金仓信息技术股份有限公司金仓数据库管理系统 KingbaseES V8
金仓数据库管理系统 KingbaseES V9
3武汉达梦数据库股份有限公司达梦数据库管理系统 V8
4天津南大通用数据技术股份有限公司南大通用安全数据库管理系统 V8.8
南大通用大规模分布式并行数据库集群系统 V9.5
南大通用大规模分布式并行数据库集群系统 V9.8
南大通用多模多态数据库管理系统 V5
5成都虚谷伟业科技有限公司虚谷数据库管理系统 V11.0
6腾讯云计算(北京)有限责任公司腾讯云分布式数据库 TDSQL 管理系统 10.3
TDSQL 关系型数据库管理系统软件 8.0
7天津神舟通用数据技术有限公司神通数据库管理系统 V7.0
8金篆信科有限责任公司GoldenDB 数据库软件 V6
9杭州易景数通科技有限公司義和(Halo)通用数据库系统软件 V1.0
10北京优炫软件股份有限公司优炫数据库管理系统 V2.1
11贵州易鲸捷信息技术有限公司易鲸捷 QianBase 数据库管理系统软件
12北京奥星贝斯科技有限公司OceanBase 数据库软件 V4
13新华三技术有限公司H3C 川海数据库系统软件 V2.0
14华为云计算技术有限公司GaussDB V2.0
15云和恩墨(北京)信息技术有限公司MogDB 企业版数据库管理系统 V3.0
16福建星瑞格软件有限公司星瑞格数据库管理系统 SinoDB V16.8
17北京华宇信息技术有限公司ArteryBase 数据库管理系统 V3.6
18北京柏睿数据技术股份有限公司柏睿数据企业级交易型数据库系统(信创版)V4.0
19北京海量数据技术股份有限公司海量数据库管理系统 Vastbase G100 V3.0
20湖南亚信安慧科技有限公司亚信安慧 AntDB 数据库系统6.2(集中式)
亚信安慧 AntDB 数据库系统6.2(分布式)
21深圳九有数据库有限公司九有数据库 UDB-TX 软件 V2.4
22阿里云计算有限公司阿里云 PolarDB 数据库管理软件 V2.0
23深圳计算科学研究院崖山数据库 V23

这里以 平凯数据库企业版软件 为例,简要介绍数据库中的 GB 18030-2022 字符集。

平凯数据库企业版软件 (以下简称“平凯数据库”)是由平凯星辰(北京)科技有限公司(以下简称“平凯星辰”)自主研发的一款分布式数据库产品。

得益于自主创新和架构的先进性,平凯数据库支持在线事务处理(OLTP - Online Transaction Processing) 及混合负载(HTAP - Hybrid Transactional and Analytical Processing),具备高度兼容MySQL 协议和语法、弹性水平扩缩容、金融级高可用、实时分析、云原生等典型技术特点,并提供异构数据(例如Oracle)迁移、备份恢复等一系列企业级周边工具,被广泛应用于海量数据、海量并发、实时在线分析等对稳定性、性能和安全均要求极苛刻的关键业务场景。

目前,平凯数据库自主开源的知名开源项目 TiDB Open Core,有超过 1400 多位全球范围的活跃贡献者,同时超过 1500 个企业的真实生产场景。

更多内容参考:国产基础软件“出海”标杆炼成记

登陆平凯数据库。

查看对 GB18030-2022 字符集的支持情况。

tidb> SHOW CHARACTER SET WHERE CHARSET = 'gb18030';
+---------+---------------------------------+--------------------+--------+
| Charset | Description                     | Default collation  | Maxlen |
+---------+---------------------------------+--------------------+--------+
| gb18030 | China National Standard GB18030 | gb18030_chinese_ci |      4 |
+---------+---------------------------------+--------------------+--------+
1 row in set (0.008 sec)

tidb> SHOW COLLATION WHERE CHARSET = 'gb18030';
+--------------------+---------+------+---------+----------+---------+
| Collation          | Charset | Id   | Default | Compiled | Sortlen |
+--------------------+---------+------+---------+----------+---------+
| gb18030_bin        | gb18030 |  249 |         | Yes      |       1 |
| gb18030_chinese_ci | gb18030 |  248 | Yes     | Yes      |       2 |
+--------------------+---------+------+---------+----------+---------+
2 rows in set (0.001 sec)

注:目前,国际主流开源数据库尚不支持 GB18030-2022 新国标,推荐使用新版本的国产数据库。

🌻 往期精彩 ▼


-- / END / --

👉 这里可以找到我

  • 微信公众号:少安事务所
  • 墨天轮:严少安
  • PGFans: 严少安
  • ITPUB:少安事务所
  • TiDB 专栏:@ShawnYan

如果这篇文章为你带来了灵感或启发,就请帮忙点『』or『在看』or『转发』吧,感谢!ღ( ´・ᴗ・` )~

AustinDatabases
关于数据库相关的知识分享
 最新文章