数据洪流中的智能航舵——Oceanus 流式湖仓探索,弹性降本方案

文摘   2024-11-24 18:01   北京  

导读 在数字化转型加速的今天,企业对数据实时处理和分析的需求日益增长,传统批处理方式已难以应对。腾讯云流计算 Oceanus 作为一款企业级实时大数据分析平台应运而生,它依托 Apache Flink 引擎,为企业提供了一站式开发、无缝连接、亚秒延时、低廉成本、安全稳定的企业级实时大数据分析平台。Oceanus 能够帮助企业实时捕捉、处理和分析海量数据,从而实现业务决策的快速响应,提升运营效率,发掘新的增长机会。本次分享将聚焦于 Oceanus 的两个全新亮点:新型流式湖仓方案和基于弹性包年包月集群的降本方案,相信这两个亮点将为企业带来新的价值。

今天的介绍会围绕下面七点展开:

1. 湖仓场景现状和挑战

2. 流式湖仓方案架构介绍

3. 流式湖仓方案优势

4. 流式湖仓应用场景

5. 实时业务成本挑战

6. 新型弹性降本方案

7. 总结

分享嘉宾|李哲 腾讯云 资深产品经理 

编辑整理|孙蒙新

内容校对|李瑶

出品社区|DataFun


01

湖仓场景现状和挑战

传统上,用户会选用 Lambda 架构来搭建数据分析的链路。Lambda 架构是当时较为成熟和稳定的流批数据处理架构,允许离线和实时数据处理走独立的链路。离线链路通常将数据存储到 Hive 等离线存储引擎中,使用 Spark 进行多层数据之间的转换,这种方式适合时效性要求不高的场景,在数据规模和成本上具有一定优势。随着实时场景需求的增加,客户逐渐采用 Flink 加 Kafka 的方式构建实时分层链路,数据最终写入在线数据库和数仓,能够提供秒级的数据延迟,但也存在着一些问题。

  • 灵活性低:Kafka 作为中间数据存储系统,主要起到数据管道的作用,缺乏数据探索和数据分析功能,且无法长期保存历史数据。这就限制了业务使用的灵活性,也增加了问题排查的难度。

  • 成本较高:实时链路是独立的链路,维护 Kafka 和 Flink State 的存储和计算资源需求较大,常驻链路的成本也高昂。

  • 对更新场景支持不足:如果 Kafka 写入的数据不是完整的变更日志(changelog),则无法直接进入后续的 Flink 作业进行流式处理。虽然 Flink 提供了 Upsert Kafka 来应对这种情况,但 Upsert Kafka 依赖于本地状态存储,成本较高。

  • 数据重复存储和计算成本高:由于 Lambda 架构的离线和实时链路是独立的,数据存储和计算引擎相互隔离,相同数据需重复存储,实时和离线计算逻辑也需单独开发,增加了维护、管理和业务变更的复杂性。

02

流式湖仓方案架构介绍

为实现离线与实时链路的统一,我们首先需要统一数据存储,使其能够同时满足以下两个需求:

  • 支持离线数据仓库的 OLAP 分析需求,能够从数据仓库中快速提取数据。

  • 兼容实时流处理,提供与 Flink 兼容的完整变更日志(changelog)。

基于上述需求,我们推出了腾讯云流式湖仓,这是腾讯自研的基于 Apache Iceberg 生态的流式湖仓解决方案。

腾讯云流式湖仓架构基于 LSM Tree 存储引擎进行底层文件管理,因此能够高效支持主键更新场景。此外,它在数据写入过程中支持数据合并操作(Stream Outs),允许对单行数据的部分列进行更新。同时,在数据更新过程中,腾讯云流式湖仓能够生成完整的变更日志(changelog),从而使得下游的 Flink 作业可以基于增量处理生成下一层数据。

03

流式湖仓腾讯云流式湖仓的优势

1. 传统统一存储,简化架构

  • 打破数据孤岛:腾讯云流式湖仓打破了传统 Lambda 架构中的数据存储壁垒,避免了数据重复存储和计算逻辑的重复开发。

  • 简化运维:通过统一的数据存储和计算引擎,简化了系统的运维管理,降低了运维成本。

2. 实时处理能力强

  • 完整变更日志:生成完整的变更日志(changelog),使得 Flink 等流处理引擎能够对数据进行增量处理,保证了数据的实时性。

  • 高效更新:基于 LSM Tree 存储引擎,支持高效的主键更新和部分列更新,以满足实时业务的快速响应需求。

3. 灵活的数据访问

  • 兼容 Iceberg 生态:腾讯云流式湖仓与 Iceberg 生态完全兼容,用户可以无缝迁移现有的 Iceberg 查询作业。

  • 支持多种查询引擎:支持 Spark SQL、Trino、Presto等多种查询引擎,可满足用户的多样化查询需求。

4. 性能优异

  • 大表优化:对大表的数据提交流程进行了优化,提高了数据写入速度。

  • 压缩编码与分区优化:采用高效的压缩编码格式和分区策略,减少存储空间需求,提升了查询性能。

5. 成本低

  • 避免重复存储:传统 Lambda 架构中,离线和实时数据需要分别存储,导致数据冗余。腾讯云流式湖仓通过统一的存储层,避免了这种冗余,显著降低了存储成本。

这套架构通过统一存储和灵活访问,既提高了实时处理能力,又优化了数据存储与查询性能,具有明显的成本优势。

04

流式湖仓应用场景

流计算 Oceanus 的流式湖仓方案(腾讯云流式湖仓)适用于众多行业和场景,包括但不限于游戏、出行、教育、电商等行业的实时数据分析、用户画像推荐、实时大屏展示等场景。下面是一个电商行业中实时订单交易数据分析的场景示例,该场景基于腾讯云流式湖仓实现了数据的统一处理,并支持多种类型的数据加工和分层流式湖仓。

在此方案中,根据业务数据更新频率的不同,用户可以选择通过实时或批量方式将数据写入腾讯云流式湖仓的 ODS 层表中。数据进入 ODS 层后,系统自动完成小文件合并等治理操作,保证了查询的性能。在 ODS 层的数据基础上,用户可以进一步利用腾讯云流式湖仓生成变更日志(changelog)的能力,创建 Flink 作业进行流式数据聚合。

例如,对于订单表和订单商品表,用户可以基于部分列更新的能力实现实时数据关联,并将其与商品分类表进行维表关联,从而生成一张包含商品销售详情的宽表。基于这张宽表,用户可以进一步执行增量分析和数据聚合,构建出一套完整的分层数据分析链路。

在具体流程上,ODS 层的数据可通过 Doris 关联外表的方式进行 OLAP 分析,或通过 DLC/EMR 中的 Spark、Presto 引擎实现离线报表计算,进而实现数据复用。

基于流式湖仓方案,用户可以将离线链路和实时链路的数据存储进行统一,显著降低了大数据分析的成本和维护复杂度。

此外,Oceanus 平台在变更数据捕获(CDC)场景下进行了深入优化。因为流式湖仓需要首先将客户的业务数据同步到腾讯云流式湖仓中,CDC 是一种从数据库中实时抽取数据的常用方式。Oceanus 实现了高效的 At-least-once 数据同步模式,通过目标端的 upsert 能力确保端到端的数据一致性。并且在存量同步阶段,可以带来 10 倍以上的性能提升,效果非常显著。

05

实时业务成本挑战

接下来介绍本次分享的第二个亮点:新型弹性降本方案。

近年来,企业普遍面临着成本上升和利润下降的挑战,为了应对挑战企业必须采取有效措施来降低成本并提高运营效率,特别是在实时领域,常常需要投入大量人力物力。主要问题包括:

1. 困难的资源管理

  • 用户通常需要大量时间给作业调优,实现精细化资源管理。

  • 弹性作业常导致资源利用效率低下,容易造成资源浪费。

2. 复杂的运维管理

实时平台的运维管理工作繁琐复杂,涉及多个方面,包括资源监控、作业告警、日志分析、事件处理和性能优化等,需要专业技术人员持续操作和维护。

3. 弹性扩展困难

随着业务快速增长,企业需要根据业务需求进行弹性扩展,但实现这一点往往面临技术和资源的挑战。

06

新型弹性降本方案

为了解决这些问题,Oceanus 提供了新型弹性降本方案。

1. 支持弹性,灵活度高

支持弹性伸缩:配合作业扩缩容可以灵活利用资源。

支持混合部署:用户可以在一个集群内使用包年包月资源和按量付费资源。避免多集群管理,作业不同集群多副本管理带来麻烦。

2. 低成本

Oceanus 首创了弹性包年包月集群模式。对于用量较大且业务具有明显波峰波谷的用户,新推出的弹性包年包月集群可以更优地贴合业务使用。用户可以在包年包月集群上额外开启定量的弹性额度,这部分弹性资源只有在包年包月计算资源用满之后才会投入使用,并且会按照按量付费的价格进行计费。相比传统的包年包月或者包年加按量组合的计费方式,可以节省约两成的资源成本。

3. 自动扩缩容+细粒度资源配置

在作业级别的资源方面,流计算 Oceanus 提供了基于资源使用情况自动扩缩容和基于时间策略扩缩容的能力,可以大幅提升资源利用率,用户无需再花费大量时间手动调优作业,就可以解决性能调优问题,并适应不同业务场景下的资源需求,从而实现资源的精细化使用。

Oceanus 还进一步优化了资源配置的灵活性,支持作业级别和算子级别的细粒度资源配置。通过Slot 共享组机制,用户可以为每个算子单独配置 CPU、内存等资源,实现更精准的资源分配,避免资源浪费。与 Flink 原生 Slot 配置相比,Oceanus 将算子级别细粒度配置界面化,功能更加灵活,能更精准地满足不同算子的资源需求,进一步提高资源利用率,降低成本。

4. 0 成本运维

在运维方面,Oceanus 提供了完善的监控、告警、事件和日志功能,帮助企业简化运维管理,大幅降低运维成本。通过这些工具,企业可以更高效地监控作业状态,快速响应问题,减少因运维问题导致的业务中断。

综合运营弹性伸缩、细粒度资源配置等降本手段和完善的运维能力,Oceanus 能够帮助客户显著降低成本,减少资源浪费,同时提高业务的响应速度和市场竞争力。

07

总结

首先,流式湖仓腾讯云流式湖仓的推出,突破了传统数据处理的界限,以一种全新的数据处理模式极大地简化了数据存储和分析流程,为企业提供了一个统一、高效的实时数据处理方案,使数据价值得以充分释放。

其次,全新的弹性降本方案,展示了我们对成本效益的不懈追求。通过灵活的资源管理和优化,Oceanus 提供了更贴合业务逻辑的资源配置选择,在保障高效数据处理的同时,大幅降低企业的成本。

在此想要强调的是,Oceanus 不仅是一个技术产品,更是我们对企业数字化转型承诺的体现。我们坚信,通过 Oceanus,客户能够更加自信地迎接数据时代的挑战,实现更加辉煌的成就。

最后,诚挚地邀请大家持续关注 Oceanus 的未来发展,并希望与大家共同探索数据的无限可能。谢谢大家。
以上就是本次分享的内容,谢谢大家。


分享嘉宾

INTRODUCTION


李哲

腾讯云

资深产品经理

互动有礼

按以下方式参与互动,即有机会获赠礼品

数据智能知识地图是由17位高级别专家历时两个月精心打造的专业工具,覆盖数据采集与治理、数据架构、数据能力、数据应用四大领域,包含15个数据模块。是数据智能领域的宝贵资源。

活动方式:

在评论区留言参与与文章相关的话题互动。留言点赞最高1位用户赠送一套《数据智能知识地图》

说明:

1. 留言需要与本文相关,点赞数需真实有效如发现刷赞行为,将取消参与资格。
2. 中奖者请在收到通知的24小时内将您的“姓名+电话+快递地址”留言至原评论下方处即可,隐私信息不会被放出,未在规定时间内回复视作自动放弃兑奖资格。

活动时间:截至12月2日开奖。 快快拉上你的小伙伴参与进来吧~~

往期推荐


京东健康基于大模型的生成式推荐在电商标品推荐的应用

替代 NL2SQL,Agent+业务语义的创新产品设计

超拟人大模型技术与情绪价值应用深度解析

数据湖存储加速方案的发展和对比分析

GMI Cloud:基于高稳定性 GPU 集群的 AI 出海应用高效业务开发探索

货拉拉利用大模型打造多场景个人、办公助理实践

DataOps for LLM 的数据工程技术架构实践

腾讯云助力出海企业高效构建全球大数据基础设施

腾讯分析型 BI+AI 产品 OlaChat 创新探索

NebulaGraph 的 GraphRAG 进展、实践

点个在看你最好看

SPRING HAS ARRIVED

DataFunSummit
DataFun社区旗下账号,专注于分享大数据、人工智能领域行业峰会信息和嘉宾演讲内容,定期提供资料合集下载。
 最新文章