02.27 大數據面試

開篇

  1. 當前大數據行業的就業形勢
  2. 如何快速拿到大數據行業的offer

大數據處理架構

  1. 雲平臺的總體架構
  2. 系統設計

小文件問題

  1. hdfs(hdfs架構、hdfs讀寫流程、hdfs ha)
  2. 小文件(什麼是小文件、什麼情況下產生小文件、小文件給集群帶來什麼瓶頸、解決方案)

sql on hadoop

  1. 架構層面調優
  2. 語法層面調優
  3. 執行框架底層調優
  4. sql實戰案例

數據傾斜

  1. 什麼是數據傾斜及產生的原因
  2. 大數據中的shuffle
  3. 產生數據傾斜的場景
  4. 數據傾斜的解決方案

spark調優

  1. 算子的合理選擇給計算性能帶來的深遠影響
  2. 合理的序列化整合spark使用為性能提速
  3. 如何保證sparkstreaming流處理過程的零數據丟失
  4. sparkstreaming流處理數據sink到目的地的n中錯誤剖析
  5. 案例實戰:如何基於spark定製外部數據源

java

  1. 註解和反射
  2. 多線程
  3. jvm(classloader機制、內存模型、垃圾回收)

其他

  1. zookeeper
  2. Linux

技巧篇

  1. 為什麼要離職
  2. 你的職業規劃是什麼
  3. 你的優缺點
  4. 你對加班的看法
  5. 為什麼要選擇我們公司



分享到:


相關文章: