近日,国外科技杂志《theregister》报道,Databricks斥巨资收购了Tabular,交易金额可能达到20亿美元(145亿人民币...)。
而Tabular是一家2021年刚成立,直到去年9月仅有25名远程工作人员的初创公司。如果这些信息确实可信,那么这25人便是人均产值5.8亿人民币的高端大牛。
Tabular是由一群原Netflix工程师成立的企业,在Netflix期间他们开发了apache Iceberg,这是一种开源的表存储格式,能够为大型数据集提供可扩展且高效的存储管理方案,解决了数据湖存储和查询性能上的瓶颈。
目前apache Iceberg在github上拥有2.1k的fork和6.1k的star:
这群人成立独立公司后的主要工作也是在维护apache Iceberg,而这是一个遵循apache宽松许可协议的开源产品,他的代码任何人都能获取并再次商业化应用。所以,花钱买Tabular就纯粹是为了获得Iceberg的这群开发者!
这简直就是技术人的终极梦想,不用去办公室坐班,没人会管你的考勤,远程待在家里自由编程,就人均身价5.8亿,这产值多么的让人羡慕,这神仙公司怎么就轮不到我呢。
似乎所有短期实现高价值的企业都是拥有极强自由意志的企业,包括前段时间的duckdb:《震惊:开发一款世界瞩目的数据库仅需18人》
Databricks是一家云数据库公司,也是湖仓解决方案的佼佼者,现在Databricks把自己的目标定位在“干掉”Snowflake,正所谓抱着“干掉第一,我就是第一”的态度,直指Snowflake当时超过1000亿美金的市值。
Snowflake现在市值仅剩387亿美元,这中间必然有Databricks的功劳,然而最初,两家公司还是如胶似漆的合作伙伴,甚至在商业客户上还会互相推荐。2012年Snowflake成立,2013年Databricks成立,一开始前者做 SQL 数据仓库,后者做 Apache Spark 的托管服务,两个产品市场互补,关系一度十分融洽~然而后来,Snowflake 开发了 Snowpark,看名字就知道目标是要迁移替换 Spark的 工作负载。与此同时,DataBricks 推出了 Photon 和 DataBricks SQL 等功能,扩大了其在数据仓库领域的足迹。直到现在从 Databricks 中创建“SQL 仓库”的接口界面,甚至都直接复制了 Snowflake 创建“虚拟仓库”的设计和设置:包括他们官网,Snowflake 称自己为“数据云”,而 DataBricks 则称自己为“数据智能平台”,产品与市场目标出现了高度重合!2020 年,Databricks 首创了 lakehouse 架构,其目的是将传统的数据仓库任务和 AI 任务在一个受管控的数据副本上进行整合。 大概在 Delta Lake 诞生的同一时期, Tabular团队成员在 Netflix时推出了Apache Iceberg 项目。从那以后,Delta Lake 和 Iceberg 逐渐成为湖仓架构的两大开源领军标准。虽然这两种格式都建立在 Apache Parquet 的基础上,且有着相似的目标和设计理念,但由于各自独立的开发进程,导致它们之间存在严重的不兼容问题。随着时间的流逝,企业往往只需要采纳其中一个标准构建湖仓,这导致Databricks 创建的lakehouse 价值被极大的削弱。而且,Snowflake 还投入了大量资金和研发力量来增加对Apache Iceberg的支持,以便他们的客户可以直接从Snowflake管理和利用数据湖。所以Databricks 收购Tabular也有一种被迫的和打击竞争对手的感觉!2021年11月,Databricks 与 Snowflake 创始人甚至开始公开互撕:11 月 2 日,Databricks 在其官方博客发布声明,其湖仓(lake house)技术创下 TPC-DS 基准测试新记录,并强调性能可达 Snowflake 的 2.5 倍。11 月 12 日,Snowflake 做出回应,发布了自己的测试结果,同时称 Databricks 公布的测试和研究本身存在缺陷,并表达在这个年代发布数据库基准测试结果是“将正常的技术交流变成了缺乏完整性的营销噱头”(气势上似乎弱了一点)。11 月 15 日,Databricks 的创始人再次在其公司博客上给予回应,指责 Snowflake 的测试改了 TPC-DS 的输入数据,不仅作弊还“酸葡萄”。近日,Snowflake的CEO斯里达哈·拉马斯瓦米(Sridhar Ramaswamy)评价Databricks 对Tabular的收购:这恰恰证明了Snowflake支持Apache Iceberg作为表格式的选择是正确的!点赞、在看、转发,也非常感谢~