随着数据管理技术的不断发展,湖仓架构(Lakehouse)目前在业界已得到越来越多的使用。Lakehouse 是由 Data Warehouse(数仓)和 Data Lake(数据湖)这两种数据架构的融合,同时兼具二者的优势而形成自己独特的优点。基于 Lakehouse,我们不仅可以对结构化的数据,也可以对非结构化数据或半结构化数据进行统一存储。同时,基于 Lakehouse 开放的数据架构优势,使 Lakehouse 的数据湖存储可和业界主流的大数据计算范式(如流计算、批计算、OLAP 分析)进行较好的集成和融合,同时也能兼容常见的机器学习和 AI 的计算模型。
Apache Flink 诚邀您参加 7 月 27 日在杭州举办的阿里云开源大数据Workshop,了解流式湖仓、湖仓一体架构的最近演进方向,共探企业云上湖仓实践案例。本次 Workshop 将在 Apache Community Over Code 大会举办,CommunityOverCode是由 Apache(ASF)主办的一系列全球性会议,旨在促进开源技术的发展和社区参与。
活动推荐