MongoDB 用东北村里大喇叭,分析8.0的野心

文摘   2024-12-05 06:00   天津  

开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, OceanBase, Sql Server等有问题,有需求都可以加群群内有各大数据库行业大咖,可以解决你的问题。加群请联系 liuaustin3 ,(共2600人左右 1 + 2 + 3 + 4 +5 + 6 + 7 + 8 )(1 2 3 4 5 6群均已爆满,新人进7群,8群,准备9群)


       MongoDB 8.0发布了,在国外是好大的阵仗,鞭炮齐鸣,锣鼓喧天。外行的光看了热闹,可稍微有点心的,就看出来了,这是要出事。(要看东北大喇叭播报的,文章尾部)

      一众RDBMS,以外的数据库正在瑟瑟发抖,这个词用的好,瑟瑟发抖在RDBMS还在互相撕扯,抓头发,扇嘴巴子的时候,MongoDB对非RDBMS得一众数据库发起了“我都行”的攻坚战。

不信我们看看MongoDB 8.0干了什么。

1 时序型数据库:时序性数据库最大的特点是什么?我说到这里,WHO KNOWS。一众传统数据库的使用者你们能说出来时序性数据库的特点是什么????

1  数据量大

2  数据精度高

3  数据库最终要分析

这是我马上能想到的,对数据量大,数据最终要分析,这两点会劝退一众的传统数据库产品。因为假模假式的说支持时序性数据库还可以,但是如果要直接说数据量大,那么就难了,然后还要做OLAP的数据分析,这就难为人了。

MongoDB在5.0引入了时间序列的概念,而在8.0引入了时序性数据的分析功能,也就是OLAP。

         引用原文 “在MongoDB 8.0中,我们引入了时间序列集合的关键优化,以帮助用户在管理日益复杂的工作负载时最大化资源价值。在之前的版本中,时间序列集合以未压缩格式插入数据,导致工作集增大、缓存使用增加和写入放大,导致高I/O,因为未压缩的数据被写入WiredTiger存储引擎。这对于拥有数百万设备、传感器等的高基数工作负载尤其成问题。

         通过MongoDB 8.0,时间序列集合现在直接以列压缩格式写入,减少了缓存使用,降低了写入I/O,提高了插入性能和存储效率。对于用户来说,降低缓存使用的好处直接转化为成本节省。用户将能够从现有集群资源中提取更多价值,从而实现更好的性价比。我们观察到吞吐量提高了2-3倍,缓存使用量相比于7.0版本的工作负载减少了10-20倍。举例来说,MongoDB 7.0上的工作负载可能会经历性能波动,导致写入性能不一致,并因I/O过载而出现锯齿形模式。将大量未压缩的数据写入磁盘会使检查点受到压力。”

        看完这段,说明一个点数据压缩对于数据库本身来说,除了IO上的压力以外,实际上数据压缩对于其他的部分也是有帮助的比如插入的速度。 不信我们看这段

        "在8.0版本中,写入性能现在稳定,消除了I/O压力。如下所示,在Atlas M50上相同的工作负载实现了稳定的600K插入/秒,消除了之前的锯齿形模式。"

       用户参与强调了查询性能在时间序列工作负载扩展时的重要性。传统上,MongoDB 查询引擎一次处理一个文档,这在大规模分析中可能效率低下。对于时间序列集合,这种低效是由于需要解压和重塑大量压缩数据。为了解决这个问题,我们为时间序列集合引入了块处理——一种新的自动查询执行模型,可以一次处理“数据块”,利用列级摘要,同时避免解压和重塑文档的开销。这种方法显著提高了性能,特别是对于利用sort、setWindowFields)的聚合。通过使每个步骤更高效,整体影响变得呈指数级,减少了开销,并利用了以前无法获得的时间序列数据模式。每个聚合阶段处理更大的数据块,从而导致更高效的查询执行模型,性能显著更快。像金融分析和物联网这样的用例,涉及密集的过滤、分组和排序(即group、$sort),将看到重大性能提升。通过块处理,我们观察到性能提升范围从 10 到 40 倍,某些大规模聚合甚至达到 100 倍。

2 数据分片上的性能提升和简化操作,我们看原文

       " 当您的网站开发机构从数百个用户扩展到数百万个用户时,扩展是至关重要的。MongoDB 8.0 改进了横向扩展,使数据在分片之间的分配速度提高了 50 倍,并将相关成本降低了 50%。这一变化对扩展操作来说是一个游戏规则的改变,以前的扩展操作复杂得像盲人解魔方一样。大多数网站开发服务都包括为未来的增长而构建,而 MongoDB 8.0 帮助实现这一目标,而无需预先配置大量服务器。该更新自动化并简化了分片管理,消除了手动配置的麻烦。您的应用程序现在可以无缝扩展,保持架构精简且具有成本效益。简化扩展:以前,如果您需要为一个集合设置分片,这可能是一个繁琐的过程。MongoDB 8.0 的智能分片算法加快了这一过程:sh.enableSharding(‘myDatabase’); db.createCollection(‘shardedCollection’); sh.shardCollection(‘myDatabase.shardedCollection’, { shardKey: 1 }); 这些调整确保您的项目架构能够在流量激增时适应,最小化手动干预。时间序列和向量数据"

    这段的意思很明显,MongoDB 要将自己的数据横向扩展能力继续的进行智能化的工作,可以更方便的承载一般数据库无法承载的数据量。

3 向量数据库的处理能力

      我们看这段原文 “从事物联网和人工智能的技术负责人和开发人员都知道处理大规模时间序列数据集或向量搜索的重要性。MongoDB 8.0 提供了 200% 更快的时间序列聚合和优化的向量数据资源使用,使其成为预测分析和实时监控的强大选择。想象一下,您正在开发一个实时监控物联网数据的人工智能驱动仪表板。速度和高效的数据处理在这里变得至关重要,而 MongoDB 8.0 表现出色。通过优化的向量处理,机器学习模型可以更快地训练,加速开发周期。向量数据处理示例:如果您正在构建推荐系统,处理向量可能看起来像这样:db.recommendations.find({vector: { $near: [1.0, 2.5, 3.3] }}); MongoDB 8.0 对这些操作的支持使其成为涉及机器学习和数据科学项目的强有力竞争者。”

4 数据加密,数据安全能力的提升

我们在来看这段 “更快的读写操作以及更好的内存管理,让我们能够构建快速响应的网页应用程序,即使在处理复杂或大型数据集时也是如此。无论是定制网页开发服务还是数据密集型解决方案,我们都确保为您的用户提供流畅的高速交互。 通过先进的加密保护您的数据 在安全性方面,MongoDB 8.0为您提供保障。通过可查询加密等功能,我们可以在保持丰富查询的同时保护您的数据安全。这对于医疗或金融等行业来说是完美的,因为数据隐私至关重要。我们充分利用这些功能来保护您的商业数据,而不影响性能。 轻松扩展 随着您的业务增长,您的应用程序需要无缝扩展。MongoDB 8.0通过改善水平扩展简化了这一过程,使您能够轻松扩展系统而不会出现问题。因此,无论您是添加新功能还是扩大用户基础,MongoDB 8.0都能确保您的数据库管理得到彻底革新。”

5 性能大幅度的提升

“MongoDB 8.0 在速度和性能方面提供了显著的改进。与早期版本相比,MongoDB 8.0 提供了明显的速度和性能提升。虽然具体的改进可能会根据使用方式有所不同,但 MongoDB 的内部测试显示,与 7.0 版本相比,8.0 版本的以下优势:在 95% 读取和 5% 写入的混合情况下,速度提高了 32%(使用 Yahoo! 云服务基准测试,YCSB);读取数据时速度提高了 36%(YCSB);批量写入时速度提高了 56%(YCSB);根据 Meta 的社交图谱基准测试(Linkbench),速度提高了 24%;在聚合时间序列数据时速度提高了超过 200%,查询时间序列数据时速度提高了多达 60%(Timescale 时间序列基准套件);在数据复制期间并发写入速度提高了 20%;在重新分片期间数据分发速度提高了多达 50 倍;在水平扩展时启动成本降低了 50%(使用 1 个分片集群和嵌入式配置服务器)。”

好了,这是我看到的一些对于MongoDB的宣传,我们把这些串起来,我们就可以看出来MongoDB的“想法”有多么的宽广。

我个人假设一下: MongoDB 8.0在性能上有了很大的飞跃,让客户使用更低的成本来享受更高的速度,而同时在数据的分片上他的操作更加的简单,方便智能,与此同时在数据的安全上也提高了水平数据传输的加密方式提高了再金融和医疗行业的数据安全支持的力度,而且在数据的压缩和提取以及数据压缩和解压的方面提高了数据的存储能力,降低了处理数据的系统性能要求,最后在向量和时序上数据的处理上有所突破。

大致就是这个意思,可能看完我上面说的一部分不熟悉这个领域的人还没明白,我现在用东北农村大喇叭的形式给你播报一遍:

“村里的老少爷们,注意了,注意了,芒果村长给大家带来好消息了,以后那些做时序数据处理的不用去乡里镇上了,来俺们这就行了,成本低,你现在一亩地能干10个时序数据,上了咱们村8.0,你能处理2000个时序数据,你还去别的地方干哈,而且咱们村的地不够用,咱们能扩展,以前的跑乡里镇上批条子,麻烦,大家都不愿意,现在好了,咱们升级了直接和北京挂钩了,以后要地有地,要人有人,想扩哪都行,还有那个北京上海才有的高科技向量数据处理,也不用去那旮沓了,来俺们这村里就给你处理了,嘎嘎好,嘎嘎板正,以后除了那些传统晒苞米,晒谷子的活咱们不行,其他的以前往咱们村弄的自动化机械化的机器,咱们都有了,自己就把地里的活都干了,不用在叫河南的,安徽的开农机的来了,不用花那个冤枉钱了,啊老铁们!!,没听明白的,往俺们家,咱们继续唠”



截止今天共发布1263篇文章

MongoDB 相关文章

MongoDB 合作考试报销活动 贴附属,MongoDB基础知识速通

MongoDB 年底活动,免费考试名额 7个公众号获得

MongoDB 使用网上妙招,直接DOWN机---清理表碎片导致的灾祸 (送书活动结束)

数据库 《三体》“二向箔”  思维限制 !8个公众号联合抽奖送书 建立数据库设计新思维

MongoDB  是外星人,水瓶座,怎么和不按套路出牌的他沟通?

17000多张MongoDB表的锅 自动分析删除表数据难题--从头到尾的处理过程(文尾有MongoDB开发规范)
MongoDB 插入更新数据慢,开发问哪的问题?附带解决方案和脚本
MongoDB 不是软柿子,想替换就替换
MongoDB  挑战传统数据库聚合查询,干不死他们的MongoDB 2023纽约 MongoDB 大会 -- 我们怎么做的新一代引擎 SBE Mongodb 7.0双擎力量(译)
MongoDB 2023年度纽约 MongoDB 年度大会话题 -- MongoDB 数据模式与建模
MongoDB  双机热备那篇文章是  “毒”
MongoDB   会丢数据吗?在次补刀MongoDB  双机热备
MONGODB  ---- Austindatabases  历年文章合集



MySQL相关文章


MySQL timeout 参数可以让事务不完全回滚
"DBA 是个der" 吵出MySQL主键问题多种解决方案

MySQL 让你还用5.7 出事了吧,用着用着5.7崩了

MySQL 的SQL引擎很差吗?由一个同学提出问题引出的实验
用MySql不是MySQL, 不用MySQL都是MySQL 横批 哼哼哈哈啊啊
MYSQL  --Austindatabases 历年文章合集

OceanBase 相关文章


跟我学OceanBase4.0 --阅读白皮书 (4.0优化的核心点是什么)

跟我学OceanBase4.0 --阅读白皮书 (0.5-4.0的架构与之前架构特点)

跟我学OceanBase4.0 --阅读白皮书 (旧的概念害死人呀,更新知识和理念)

聚焦SaaS类企业数据库选型(技术、成本、合规、地缘政治)

OceanBase 学习记录-- 建立MySQL租户,像用MySQL一样使用OB
OceanBase  学习记录 -- 安装简易环境
OceanBase  学习记录 --  开始入门
数据库最近第一比较多,OceanBase 定语加多了?
临时工访谈:OceanBase上海开大会,我们四个开小会 OB 国产数据库破局者
临时工说:OceanBase 到访,果然数据库的世界很卷,没边
数据库信息速递  阿里巴巴的分布式数据库OceanBase旨在进军中国以外的市场 (翻译)

PolarDB 相关文章


PolarDB for MySQL 三大核心之一POLARFS 今天扒开它--- 嘛是火星人

PolarDB-MySQL 并行技巧与内幕--(怎么薅羊毛)

PolarDB 并行黑科技--从百套MySQL撤下说起 (感谢8018个粉丝的支持)

PolarDB 杀疯了,Everywhere Everytime Everydatabase on Serverless

POLARDB  从一个使用者的角度来说说,POALRDB 怎么打败 MYSQL RDS

PolarDB 最近遇到加字段加不上的问题 与 使用PolarDB 三年感受与恳谈

PolarDB 从节点Down机后,引起的主从节点强一致的争论

PolarDB serverless 真敢搞,你出圈了你知道吗!!!!

PolarDB VS PostgreSQL  "云上"性能与成本评测 -- PolarDB 比PostgreSQL 好?

临时工访谈:PolarDB  Serverless  发现“大”问题了  之 灭妖记 续集

临时工访谈:庙小妖风大-PolarDB 组团镇妖 之 他们是第一

PolarDB for PostgreSQL  有意思吗?有意思呀
PolarDB  Serverless POC测试中有没有坑与发现的疑问
临时工说:从人性的角度来分析为什么公司内MySQL 成为少数派,PolarDB 占领高处
POLARDB  到底打倒了谁  PPT 分享 (文字版)

POLARDB  -- Ausitndatabases 历年的文章集合

PolarDB for PostgreSQL  有意思吗?有意思呀

PolarDB  搞那么多复杂磁盘计费的东西,抽筋了吗?


PostgreSQL 相关文章


全世界都在“搞” PostgreSQL ,从Oracle 得到一个“馊主意”开始PostgreSQL 加索引系统OOM 怨我了--- 不怨你怨谁

PostgreSQL “我怎么就连个数据库都不会建?” --- 你还真不会!

病毒攻击PostgreSQL暴力破解系统,防范加固系统方案(内附分析日志脚本)
PostgreSQL 远程管理越来越简单,6个自动化脚本开胃菜

PostgreSQL 稳定性平台 PG中文社区大会--杭州来去匆匆

PostgreSQL 如何通过工具来分析PG 内存泄露

PostgreSQL  分组查询可以不进行全表扫描吗?速度提高上千倍?

POSTGRESQL --Austindatabaes 历年文章整理

PostgreSQL  查询语句开发写不好是必然,不是PG的锅

PostgreSQL  字符集乌龙导致数据查询排序的问题,与 MySQL 稳定 "PG不稳定"
PostgreSQL  Patroni 3.0 新功能规划 2023年 纽约PG 大会 (音译)
PostgreSQL   玩PG我们是认真的,vacuum 稳定性平台我们有了
PostgreSQL DBA硬扛 垃圾 “开发”,“架构师”,滥用PG 你们滚出 !(附送定期清理连接脚本)

DBA 失职导致 PostgreSQL 日志疯涨


SQL SERVER 系列

SQL SERVER维保AI化,从一段小故事开始
SQL SERVER 如何实现UNDO REDO 和PostgreSQL 有近亲关系吗
SQL SERVER 危险中,标题不让发,进入看详情(译)
SQL SERVER 我没有消失,SQL SERVER下一个版本是2025 (功能领先大多数数据库)
SQL SERVER 2022 针对缓存扫描和Query Store 的进步,可以考虑进行版本升级



阿里云系列

阿里云数据库产品权限设计缺陷 ,六个场景诠释问题,你可以做的更好?

阿里云数据库--市场营销聊胜于无--3年的使用感受与反馈系列

阿里云数据库产品 对内对外一样的卷 --3年阿里云数据库的使用感受与反馈系列

阿里云数据库使用感受--客户服务问题深入剖析与什么是廉价客户 --3年的使用感受与反馈系列

阿里云数据库使用感受--操作界面有点眼花缭乱 --3年的使用感受与反馈系列



临时工访谈系列

本地存储还有活路吗? 从上周一个供应商问我的问题开始
一年又一年,成了老梆子,别回头,往前看!
临时工说: 实际实例揭穿AI, 上云就不用DBA的谎言
临时工说:DBA 7*24H 给2万的工作,到底去不去?
国内最大IT服务公司-招聘DBA “招聘广告”的变化--分析与探讨
临时工说:  网友问35岁就淘汰,我刚入行DBA 怎么办?

跟我学OceanBase4.0 --阅读白皮书 (OB分布式优化哪里了提高了速度)

AustinDatabases
PostgreSQL ACE ,PolarDB 3年, OceanBase 极速学习ING, MongoDB 8年经验, MySQL OCP, SQL SERVER, MCITP,REDIS ,做一个合格的数据库架构师
 最新文章