前言
作為一個程序員大家都應該知道現在Flink裡面是比較吃香的。Flink源的分佈式流式處理框架不僅提供準確的結果,甚至在出現無序或者延遲加載的數據的情況下。Flink狀態化的容錯的,同時在維護一次完整的的應用狀態時,能無縫修復錯誤。在大規模運行,在上千個節點運行時有很好的吞吐量和低延遲。
Flink簡介
- Flink是一個針對流數據和批數據的分佈式引擎,主要由 java 代碼實現
- 運行速度比Spark更快,計算量越大,性能優勢更明顯
- 真正的流計算,就像Storm一樣,同時也支持批處理
- 比Spark更輕量級的容錯
- 支持 scala和 Java API
相比Flink、Spark、Storm
Flink生態圈
看到這張圖可以看出
- 支持Java和Scala API
- 支持Table(SQL)
- 支持圖操作(Flink Gelly)
- 支持機器學習(Flink ML)
- 支持將Flink程序部署到YARN
怎麼學習Flink大綱
有很多的小白不知道怎麼去學習Flink,走了不少的盲區,下面是小編整理的大綱,希望對大家有用!
Flink基本概念和編程模型
Flink程序的基礎構建模塊是流(streams)與轉換(transformations),每一個數據流都起始於一個或多個source,並且終止於一個或多個sink。
時間窗口:
流上的聚合需要由窗口來劃定範圍,比如"計算過去的5分鐘"或者"最後的100個元素的和"。窗口通常被區分為不同的類型,比如滾動窗口(沒有重疊),滑動窗口(有重疊),以及會話窗口(由不活動的間隙所打斷)
如圖:
Flink知識點
下面是小編整理的一些關於Flink的知識點,希望大家能夠喜歡。
想要獲取的小夥伴可以私信小編【學習】即可獲取哦~~~
適合小白的入門新一代大數據計算引擎 Flink從入門到實戰