转自:InfoQ(ID:infoqchina) 整理:冬梅、核子可乐
OpenAI 收购数据库公司 Rockset
近日,OpenAI 正式宣布收购 Rockset——这是一款以数据索引及查询功能而闻名的实时分析数据库。OpenAI 在其官方博客上发表的一篇文章中表示,它将整合 Rockset 的技术来“为其所有产品的基础设施提供支持”。
Rockset 团队的成员将加入 OpenAI,而 Rockset 的现有客户也将“逐步”离开 Rockset 平台。完整文章如下:
AI 技术有望改变个人和组织运用自身数据的方式,也正因如此,我们(OpenAI)决定收购 Rockset。Rockset 是一款领先的实时分析数据库,可提供国际一流的数据索引与查询功能。
Rockset 使得用户、开发人员及企业在使用 AI 产品及构建智能化应用程序时,能够更好地运用自身数据并访问实时信息。
我们将整合 Rockset 技术以支持 OpenAI 的跨产品检索基础设施,收购完成后 Rockset 旗下卓越的团队成员也将加入 OpenAI。
OpenAI 公司首席运营官 Brad Lightcap 介绍称,“Rockset 的基础设施能够帮助企业客户将其数据转化为可操作的情报。我们很高兴能够将 Rockset 的底层技术整合进 OpenAI 产品,从而为客户提供更多助益。”
Rockset 公司 CEO Venkat Venkataramani 也指出,“我们很高兴加入 OpenAI,通过为 AI 方案引入强大检索功能的形式,帮助用户、企业及开发人员得以充分利用其数据。”
Rockset 功能的整合工作已经启动,敬请期待更多后续消息。
此次收购中的财务条款细节尚未披露。
Rockset 由前 Facebook 工程师 Venkat Venkataramani 和 Tudor Bosman 以及数据库架构师 Dhruba Borthakur 于 2016 年共同创立,提供基于云的实时分析数据库,允许开发人员构建数据密集型应用程序。值得注意的是,这支团队构建了 RocksDB,这是 Google LevelDB 的一个分支,LevelDB 是由 Jeff Dean 亲自编写的可嵌入 NoSQL 数据库。
Venkat Venkataramani 担任创始人兼 CEO,曾任 Facebook 基础设施团队的工程总监,所带领的团队为 15 亿用户管理在线数据服务;更早之前,Venkat 在甲骨文公司担任主要技术人员,同样从事数据库工作。
Dhruba Borthakur 是公司联合创始人兼 CTO,他也同样在 Facebook 从事过数据库工作,还是 Hadoop 分布式文件系统的创始工程师之一,以及开源 Apache HBase 项目的贡献者。
Tudor Bosman 担任公司架构负责人,他硕士毕业于斯坦福计算机系,也曾在 Facebook 工作过多年,是 Facebook 搜索引擎 Unicorn 的领导者,还曾在甲骨文、谷歌等公司担任软件工程师。
多年来,Rockset 产品不断从 Kafka、MongoDB、DynamoDB 和 S3 等产品中提取和索引数据,从而实现无需预定义架构的实时查询。Rockset 使用开源 RocksDB 持久键值存储作为基础,充当 OLTP 数据库、数据湖和流媒体平台的外部二级索引。这可以加速实时分析查询并为主要事务系统提供性能隔离。
Rockset 的数据库平台支持推荐引擎、物流跟踪仪表板等,以及与 OpenAI 特别相关的金融科技和电子商务等领域的聊天机器人。
据 Crunchbase 数据显示,在被收购之前, Rockset 已成功从 Icon Ventures、Sequoia 和 Greylock 等投资者手中筹集了超过 1.175 亿美元的资金。该公司还拥有 Meta 和 JetBlue 等知名客户,这些客户将 Rockset 用作其航班延误预测聊天机器人的组件。
收购大局已定,Rockset 用户需要做何准备?
对于当前使用 Rockset 产品的用户来说,时间已经相当紧迫。根据该公司发布的 FAQ 内容来看,所有未签订合同的按月付费用户必须在 2024 年 9 月 30 日之前退出。虽然签约客户将有权与自己的 Rockset 客服团队具体协调合适的退出计划,但全体客户必须尽快为 Rockset 物色替代方案已经成为不争的事实。面对板上钉钉的收购,各位 Rockset 用户必须提前想好下一步规划。
Rockset 用户可以采取以下措施进行应对:
评估自己的当前使用情况及要求:最好先做到心中有数,确保在评估替代方案前了解自己需要什么,这能为我们节省大量时间。
搜集功能相当或者更好的替代平台:您的业务需求可能很简单、可能极复杂,具体取决于您此前使用 Rockset 的方式。每种平台都有其优势和短板,请整理出平台在稳定支持您业务时至少应当具备的功能和特性,避免浪费宝贵时间评估那些根本无法满足您性能及功能需要的解决方案。
着手规划迁移流程,以避免对正常运营造成干扰:无论您选择了开源方案还是商业产品,对其背后支持能力或社区建设情况的评估都至关重要。请寻找一家能手把手指导您完成概念验证的合作伙伴,或者确定您打算选择的开源产品拥有全天候活跃、足以帮助您完成故障排查的技术社区,这一切将成为顺利迁移乃至未来长久应用的必要前提。
Rockset 用户有哪些方案可选?
在制定下一步计划时,Rockset 用户应当探索每一种替代方案的合理性,根据企业自身的特定用例与性能需求,不同平台提供的功能配伍也各有适用范围。下面几个重要选项可以作为参考:
面向实时分析 SQL 工作负载的开源选项:
Apache Druid: Druid 是一款高性能实时分析数据库,可在大规模、高强度负载下对流式及批量数据执行亚秒级查询。
ClickHouse: ClickHouse 是一款速度出色的开源列式数据库管理系统,允许使用 SQL 查询实时生成数据分析报告。
StarRocks: 非常适合运行可扩展的 JOIN 查询,并可在无需非规范化管线的情况下实现实时分析。凭借开箱即用的实时数据更新支持,StarRocks 能够直接在其列式存储上为可变数据提供秒级更新支持。
面向实时分析 SQL 工作负载的专有(商业)托管解决方案:
Imply: 具有企业级服务支持的云端托管版 Apache Druid。
CelerData: 云托管版 StarRocks,由 StarRocks 项目的发起者和维护者提供支持。
开源向量搜索 (VectorDB):
Weaviate: Weaviate 是一款开源向量数据库,可存储对象及向量,允许将向量搜索与结构化过滤相结合,具备云原生数据库的容错性及可扩展性。
Milvus: 面向下一代 AI 应用的云原生向量数据库及存储方案。
Qdrant: 面向下一代 AI 的高性能、大规模向量数据库。
托管向量搜索 (VectorDB):
SingleStore: 除 SQL 功能之外,SingleStore 还提供托管向量搜索功能,这也使其成为适合两类工作负载的综合性解决方案。
Zilliz: 作为 Milvus 的同门师兄弟,Zilliz 提供向量搜索托管服务,在继承 Milvus 优势的同时提供额外的支持和维护保障。
Pinecone: 一套完全托管的向量搜索平台,可简化向量搜索应用程序的部署和扩展,确保高可用性及性能水平。
迁移工作已经迫在眉睫,各位用户需要确保自己的关键基础设施始终保持完整及稳定运行。不同平台各有优势,需要实际开展评估以确保成功迁移。
参考链接:
https://web.swipeinsight.app/posts/openai-acquires-rockset-to-enhance-real-time-analytics-and-retrieval-capabilities-7788
https://starrocks.medium.com/rockset-is-acquired-by-openai-what-does-it-mean-for-its-users-3fa9561979d2
https://techcrunch.com/2024/06/21/openai-buys-rockset-to-bolster-its-enterprise-ai/
https://www.singlestore.com/blog/openai-acquires-rockset/