首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

PB级数据量下的MPP数仓+Hadoop的传统大数据平台向信创环境迁移，有哪些难点？

科技 2024-10-18 07:36 北京

社区探讨，供大家参考：

PB级数据量下的MPP数仓+Hadoop的传统大数据平台向信创环境迁移，有哪些难点？

银行眼下均在往信创迁移，比较关注的疑难点：

1、落地实践经验的信创方案

2、数据一致性如何保障？

3、数据的多样性和数据格式的兼容，多数据源的支持如何？

欢迎同业老师交流指导！

问题来自社区会员@大Andy 银行系统工程师，以下分享均来自社区会员

@jinhaibo 昆仑银行技术管理：

PB级数据量下的数据平台迁移有以下的难点：

基础环境的成熟性：信创领域技术产品众多，性能和稳定性参差不齐。银行需要在众多的国产数据库、服务器、操作系统等产品中进行选择，建议选择主流的供应商和产品，不要另辟蹊径。另外需要在行内进行POC工作，将行内应用在信创产品上测试一下，主要关注性能和兼容性问题，和供应商沟通好适配工作内容和同业经验。

影响范围广：银行的业务系统通常较为复杂，与大数据平台紧密集成。迁移到信创环境需要通过数据平台屏蔽对上下游系统的业务影响，这不仅涉及到技术层面的调整，还可能影响业务流程和用户体验。改造过程中需要确保业务的连续性，不能因为迁移而导致业务中断，这对项目的规划和实施提出了很高的要求。

信创产品人才短缺：信创技术相对较新，熟悉信创技术的专业人才相对较少。银行在迁移过程中可能面临人才短缺的问题，难以找到足够的技术人员来实施和维护信创环境下的大数据平台。

数据迁移过程中的一致性问题:PB 级数据量的迁移是一个复杂的过程，可能会出现数据丢失、重复或不一致的情况。在迁移过程中，需要采用可靠的数据迁移工具和方法，确保数据的完整性和准确性。不同数据源之间的数据格式和编码方式可能存在差异，这也增加了数据一致性的保障难度。

业务系统对数据一致性的要求：银行的业务系统对数据一致性要求非常高，任何数据不一致都可能导致业务错误或风险。在迁移过程中，需要确保业务系统能够正确地读取和处理信创环境下的数据，保证数据的一致性。

@jillme 组某大型银行 CIO：

向信创迁移，首先建议选择相同产品的信创版本，这样能够避免很多不同版本之间数据差异性的问题。

以hadoop为例子，可以采用x86与ARM的混合部署，将2者部署到一个集群内，然后1个1个将x86节点的组件下线，删除并移除节点。实现集群内部的数据转移，解决迁移过程中数据不一致性的问题。在迁移的过程中，外部数据依旧可以访问/调整访问集群的入口进行数据写入，达到受到的影响最小。

多数据源和数据格式的多样性，可以考虑使用doris或者数据湖解决。

@Infrastructure 某银行系统工程师：

目前技术适配看来是最容易解决的，因为无论是信创版本还是非信创版本，开源大数据组件在社区层面都会做相应的适配尽可能减少业务迁移的难度。数据一致性在不同版本的大数据组件中，一般都可以得到向下兼容的保障。

难点主要还是老集群的平滑演进，需要配合的相关方较多，一个数据湖承接了上百套应用，需要逐个推动改造，更多的成本在于数据迁移、业务迁移过程中的不可控因素。

基于此问题，我们还是建议从技术手段尽可能减少业务迁移的工作量，例如开发统一的JDK工具，域名改造，自动化程序迁移工具等。

您怎么看？

欢迎来探讨

欢迎点击文末阅读原文到社区阅读和讨论交流，发表您的看法
觉得本文有用，请转发或点击在看，让更多同行看到

资料/文章推荐：

欢迎关注社区 “大数据平台”技术主题 ，将会不断更新优质资料、文章。地址：https://www.talkwithtrend.com/Topic/21469

下载 twt 社区客户端 APP

长按识别二维码即可下载

或到应用商店搜索“twt”

长按二维码关注公众号

*本公众号所发布内容仅代表作者观点，不代表社区立场

http://mp.weixin.qq.com/s?__biz=MjM5NTk0MTM1Mw==&mid=2650700851&idx=2&sn=8ae89069462900596e3fe99f136f0683

twt企业IT社区

talkwithtrend.com社区（即twt社区）官方公众号，持续发布优秀社区原创内容。内容深度服务企业内各方向的架构师、运维主管、开发和运维工程师等IT专业岗位人群，让您时刻和国内企业IT同行保持信息同步。

最新文章

金融行业国产数据库容灾建设五大难点及解决方案（多位专家观点可供参考）

Kubernetes / OpenShift 日常巡检（非常详细）

一文读懂虚拟 GPU（vGPU）技术

中小城商行如何选择合适的“小云”来适应一云多芯？

金融行业关键系统信创数据库备份选型需要关注的难点问题（同行交流共识）

信创（麒麟）操作系统选型适配、运维实施难点及应对方案

详解Kubernetes控制器

金融行业云原生应用趋势及建设优化合集（2024年度）【联盟专属资料放送】

星期五招聘日 | 北京上海福州顺德等6市20余岗，中国银联、中信建投证券、顺德农商银行、福建海峡银行、兴业银行信用卡中心等招聘

某银行开发测试准生产机房基于虚拟卷技术实现“信创数据库+信创虚拟化+信创SAN存储”实践分享

金融企业数据湖建设难点和解决思路（同行交流共识）

从办公管理系统信创应用改造看运维体系的变化

信创异构环境下审视云原生二层和三层容器网络

某银行权益类系统基于“业务容器化+数据库多租户”架构实现Oracle信创替换并建设同城双活实践分享

金融行业系统可观测性建设思路和难点

开源生态是一把双刃剑，风险挑战怎样应对？

金融行业私有云上业务系统混合部署的五个关键难题（同行交流共识）

DBA 定制自动化巡检工具（附参考脚本）

存储 IO 性能优化方案与瓶颈分析（15图干货）

金融行业VMware虚拟化替换策略及实践经验合集【联盟专属资料放送】

星期五招聘日 | 北京上海海口苏州等6市20岗，交通银行招聘高层次人才，苏州银行、海南农商银行、成方金信等企业急聘

金融行业信创运维体系建设

金融企业如何进行大数据平台信创整体规划实现平稳迁移与架构优化？| 11月9日·杭州站，报名中

大模型技术在金融领域数据挖掘场景中的运用【大模型行业应用实践系列】

信创数据库环境下如何确保备份解决方案的合规性？（同行交流共识）

某银行日志平台 Elasticsearch 运维（动态配置篇）：集群、索引GC等方面

金融企业为什么有建设数据湖的必要性？价值如何体现？（同行共识总结）

（麒麟、统信）信创操作系统与非信创操作系统稳定性、性能、故障率以及运维难度对比差异（同行交流共识）

结合大语言模型与 Zabbix API 实现 Zabbix 模板自动化翻译

“PostgreSQL技术路线+集中式存储”平滑替换Oracle后，如何开展IT架构高效运维？

某银行基于全闪NAS双活统一高性能文件共享存储实践分享

某金融企业生产环境下信创数据库运维管理规范

存储架构技术发展演变30年：从原始时期到 SAN & NAS 共存阶段；从SDS兴起、百花齐放，到沉淀并分类聚焦的时代

制造行业VMware虚拟化替换策略探讨合集【联盟专属资料放送】

星期五招聘日 | 深圳上海郑州沈阳等城市岗位，中信银行信用卡中心、兴业银行上海分行、河南农商联合银行等企业招聘

向量数据库的性能、数据安全和隐私保护机制（同行交流共识）

如何评估可观测性建设的成效？有哪些关键指标？

信创虚拟化资源池支撑银行重要交易类系统多类信创数据库稳定运行实践分享

十年历程：某三甲医院网络系统的三次改造

企业Centos操作系统迁至（麒麟、统信）信创操作系统迁移成本对比及如何控制（同行交流共识）

《中小银行行业重要及关键系统信创数据库备份软件选型参考共识》（来自中小银行行业群体投票及建议，可下载）

数据库平替的不同场景下，如何选择计算与存储平台的组合？

算力未来，GPU or CPU ？

基于三层模型构建自研存储自动化（实践干货分享）

详解“三保一评”：分保、等保、关保、密评之间的联系与区别

企业信创操作系统落地实践经验合集（下）【联盟专属资料放送】

星期五招聘日 | 上海沈阳柳州江阴东莞精选十余岗，中国工商银行辽宁分行、江阴农商银行、柳州银行、东莞农商银行、华富基金招聘

PB级数据量下的MPP数仓+Hadoop的传统大数据平台向信创环境迁移，有哪些难点？

如何设计智能投研系统，从海量、多源、非结构化的数据中自动提取价值线索，生成投资分析报告？（同行交流共识）

以系统工程思想构建 DevOps 体系

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉