简简单单一份大数据面经

科技   2024-08-03 10:49   浙江  

这是最近辅导的一位同学的面经,最终拿到了某头部公司的Offer。 

所有问题看起来并不难,但是答好不容易。

文中删掉了部分涉及项目隐私问题。

框架部分

JVM垃圾回收机制
HashMap与HashTable区别
Hbase中rowkey设计原则?工作中怎么设计rowkey的
Flink提交流程
Flink水位线机制
Flink状态与状态后端
Flink如何实现精准一次语义
Flink的checkpoint机制
Hadoop中MR工作原理相关
Hive的分区表和分桶表区别
Hive的四个by
Hive的优化
Hive数据倾斜
HDFS读写流程
Doris优化
Doris的架构原理

项目

有没有做过数据治理?都做过什么?
离线或实时数仓的分层架构?每一层都做了什么
实时数仓和离线数仓的不同
离线或实时工作中遇到过数据倾斜么?
工作中最难或最有意义的项目是哪个? 有什么困难的点?
实时数仓中遇到过背压么?一旦产生背压会影响什么?怎么解决的?结合实际工作说说
离线工作中遇到过大表join大表慢的情况么? 怎么解决的? 说一个实际场景
实时计算中多流join怎么解决
什么叫主题域,数仓中数据域、主题和主题域的区别?
工作中是怎么进行业务建模的?
数据湖和流批一体了解么?
实时任务一旦失败或者丢数了,如何修复?
实时数据怎么保证准确性一致性?
各个部门之间怎么保证数据口径一致
Hbase热点问题遇到过么?
数仓为什么分层,有什么好处
页面上实时展示历史累计去重值或者周期性最大最小值,说一下全链路的处理思路,考虑高并发

HR问题

想了解一下为什么离职或跳槽
我们公司最吸引你的地方是什么?
工作期间最让你成长最有收获的事情
某个项目中遇到最大的挑战是什么?
当时加入某司的时候,你自己希望有的一些发展或者说成长是什么?那现在回头回过头来看,你的一些成长和发展是实际来看是怎么样子?
下一份工作的一些成长发展的诉求或期待是什么样子的?或者说职业规划是什么?


300万字!全网最全大数据学习面试社区等你来!


如果这个文章对你有帮助,不要忘记 「在看」 「点赞」 「收藏」 三连啊喂!

全网首发|大数据专家级技能模型与学习指南(胜天半子篇)
互联网最坏的时代可能真的来了
我在B站读大学,大数据专业
我们在学习Flink的时候,到底在学习什么?
193篇文章暴揍Flink,这个合集你需要关注一下
Flink生产环境TOP难题与优化,阿里巴巴藏经阁YYDS
Flink CDC我吃定了耶稣也留不住他!| Flink CDC线上问题小盘点
我们在学习Spark的时候,到底在学习什么?
在所有Spark模块中,我愿称SparkSQL为最强!
硬刚Hive | 4万字基础调优面试小总结
数据治理方法论和实践小百科全书
标签体系下的用户画像建设小指南
4万字长文 | ClickHouse基础&实践&调优全视角解析
【面试&个人成长】社招和校招的经验之谈
大数据方向另一个十年开启 |《硬刚系列》第一版完结
我写过的关于成长/面试/职场进阶的文章
当我们在学习Hive的时候在学习什么?「硬刚Hive续集」

大数据技术与架构
王知无,大数据卷王,专注大数据技术分享。
 最新文章