开篇
- 当前大数据行业的就业形势
- 如何快速拿到大数据行业的offer
大数据处理架构
- 云平台的总体架构
- 系统设计
小文件问题
- hdfs(hdfs架构、hdfs读写流程、hdfs ha)
- 小文件(什么是小文件、什么情况下产生小文件、小文件给集群带来什么瓶颈、解决方案)
sql on hadoop
- 架构层面调优
- 语法层面调优
- 执行框架底层调优
- sql实战案例
数据倾斜
- 什么是数据倾斜及产生的原因
- 大数据中的shuffle
- 产生数据倾斜的场景
- 数据倾斜的解决方案
spark调优
- 算子的合理选择给计算性能带来的深远影响
- 合理的序列化整合spark使用为性能提速
- 如何保证sparkstreaming流处理过程的零数据丢失
- sparkstreaming流处理数据sink到目的地的n中错误剖析
- 案例实战:如何基于spark定制外部数据源
java
- 注解和反射
- 多线程
- jvm(classloader机制、内存模型、垃圾回收)
其他
- zookeeper
- Linux
技巧篇
- 为什么要离职
- 你的职业规划是什么
- 你的优缺点
- 你对加班的看法
- 为什么要选择我们公司
閱讀更多 用戶2400944646791933 的文章