Apache Flink新的穩定版本發佈,流處理更牛了!

在過去的5個月裡,Apache Flink社區一直在努力解決超過780個問題。Flink社區沒有將流處理看作是構建快速連續數據管道的更快分析和更加條理化的方式,而是構建數據驅動和數據密集型應用程序的範例,並將數據處理邏輯和應用程序/業務邏輯集成。

Apache Flink新的穩定版本發佈,流處理更牛了!

Flink背後的團隊旨在讓這個平臺滿足進行數據工程/數據處理的用戶,以及構建數據/事件驅動應用程序的用戶,當然還有那些在應用程序中將這兩個方面結合在一起的用戶感覺自然。

重新部署和處理的流程模型:額外支持動態資源分配和動態釋放YARN和Mesos調度器上的資源,以提高資源利用率,故障恢復以及動態擴展。此外,此功能為Flink與Kubernetes集成的未來改進奠定了基礎。

支持廣播狀態:常規流的處理由控制流的消息配置。通過將規則或模式廣播到函數的所有並行實例,它們可以應用於常規流的所有事件。

改進的網絡堆棧:在流處理環境中,兩個性能指標非常重要:延遲和吞吐量。Flink 1.5改進了網絡堆棧,基於信用的流量控制並改善了傳輸延遲。基於信用的流量控制將“on the wire”上的數據量降至最低,同時保持高吞吐量。

Task-local狀態恢復:Task-local狀態恢復利用作業通常由於單個崩潰的operator,TaskManager或機器而失敗的事實。在將operator的狀態寫入遠程存儲器時,Flink現在也可以在每臺機器的本地磁盤上保留一份副本。在故障轉移的情況下,調度程序會嘗試將任務重新安排到其以前的計算機,並從本地磁盤而不是遠程存儲裝載狀態,從而加快恢復速度。

SQL和表API的擴展連接支持: Flink 1.5增加了對窗口化外部Equi連接的支持。對於不應在有限時間間隔內連接兩個流表的情況,Flink SQL現在還支持非窗口式內部連接。這可以實現全歷史匹配,這在許多標準SQL語句中很常見。


分享到:


相關文章: