02.27 大数据面试

开篇

  1. 当前大数据行业的就业形势
  2. 如何快速拿到大数据行业的offer

大数据处理架构

  1. 云平台的总体架构
  2. 系统设计

小文件问题

  1. hdfs(hdfs架构、hdfs读写流程、hdfs ha)
  2. 小文件(什么是小文件、什么情况下产生小文件、小文件给集群带来什么瓶颈、解决方案)

sql on hadoop

  1. 架构层面调优
  2. 语法层面调优
  3. 执行框架底层调优
  4. sql实战案例

数据倾斜

  1. 什么是数据倾斜及产生的原因
  2. 大数据中的shuffle
  3. 产生数据倾斜的场景
  4. 数据倾斜的解决方案

spark调优

  1. 算子的合理选择给计算性能带来的深远影响
  2. 合理的序列化整合spark使用为性能提速
  3. 如何保证sparkstreaming流处理过程的零数据丢失
  4. sparkstreaming流处理数据sink到目的地的n中错误剖析
  5. 案例实战:如何基于spark定制外部数据源

java

  1. 注解和反射
  2. 多线程
  3. jvm(classloader机制、内存模型、垃圾回收)

其他

  1. zookeeper
  2. Linux

技巧篇

  1. 为什么要离职
  2. 你的职业规划是什么
  3. 你的优缺点
  4. 你对加班的看法
  5. 为什么要选择我们公司



分享到:


相關文章: