Flink 狀態管理與 Checkpoint 機制

2020-01-20 04:40:29 zhisheng的blog

一、狀態分類

相對於其他流計算框架，Flink 一個比較重要的特性就是其支持有狀態計算。即你可以將中間的計算結果進行保存，並提供給後續的計算使用：

具體而言，Flink 又將狀態 (State) 分為 Keyed State 與 Operator State。

1.1 算子狀態

算子狀態 (Operator State)：顧名思義，狀態是和算子進行綁定的，一個算子的狀態不能被其他算子所訪問到。官方文檔上對 Operator State 的解釋是：each operator state is bound to one parallel operator instance，所以更為確切的說一個算子狀態是與一個併發的算子實例所綁定的，即假設算子的並行度是 2，那麼其應有兩個對應的算子狀態：

1.2 鍵控狀態

鍵控狀態 (Keyed State) ：是一種特殊的算子狀態，即狀態是根據 key 值進行區分的，Flink 會為每類鍵值維護一個狀態實例。如下圖所示，每個顏色代表不同 key 值，對應四個不同的狀態實例。需要注意的是鍵控狀態只能在 KeyedStream 上進行使用，我們可以通過 stream.keyBy(...) 來得到 KeyedStream 。

二、狀態編程

2.1 鍵控狀態

Flink 提供了以下數據格式來管理和存儲鍵控狀態 (Keyed State)：

•ValueState：存儲單值類型的狀態。可以使用 update(T) 進行更新，並通過 T value 進行檢索。•ListState：存儲列表類型的狀態。可以使用 add(T) 或 addAll(List) 添加元素；並通過 get 獲得整個列表。•ReducingState：用於存儲經過 ReduceFunction 計算後的結果，使用 add(T) 增加元素。•AggregatingState：用於存儲經過 AggregatingState 計算後的結果，使用 add(IN) 添加元素。•FoldingState：已被標識為廢棄，會在未來版本中移除，官方推薦使用 AggregatingState 代替。•MapState：維護 Map 類型的狀態。

以上所有增刪改查方法不必硬記，在使用時通過語法提示來調用即可。這裡給出一個具體的使用示例：假設我們正在開發一個監控系統，當監控數據超過閾值一定次數後，需要發出報警信息。這裡之所以要達到一定次數，是因為由於偶發原因，偶爾一次超過閾值並不能代表什麼，故需要達到一定次數後才觸發報警，這就需要使用到 Flink 的狀態編程。相關代碼如下：

<code>publicclassThresholdWarningextends/<code><code>RichFlatMapFunction<tuple2>, Tuple2<string>>> {/<string>/<tuple2>/<code>
<code>// 通過ListState來存儲非正常數據的狀態/<code><code>privatetransientListState<long> abnormalData;/<long>/<code><code>// 需要監控的閾值/<code><code>privateLong threshold;/<code><code>// 觸發報警的次數/<code><code>privateInteger numberOfTimes;/<code>
<code>ThresholdWarning(Long threshold, Integer numberOfTimes) {/<code><code>this.threshold = threshold;/<code><code>this.numberOfTimes = numberOfTimes;/<code><code>}/<code>
<code>@Override/<code><code>publicvoid open(Configuration parameters) {/<code><code>// 通過狀態名稱(句柄)獲取狀態實例，如果不存在則會自動創建/<code><code> abnormalData = getRuntimeContext.getListState(/<code><code>newListStateDescriptor<>("abnormalData", Long.class));/<code><code>}/<code> 

<code>@Override/<code><code>publicvoid flatMap(Tuple2<string> value, Collector<tuple2>>> out)/<tuple2>/<string>/<code><code>throwsException{/<code><code>Long inputValue = value.f1;/<code><code>// 如果輸入值超過閾值，則記錄該次不正常的數據信息/<code><code>if(inputValue >= threshold) {/<code><code> abnormalData.add(inputValue);/<code><code>}/<code><code>ArrayList<long> list = Lists.newArrayList(abnormalData.get.iterator);/<long>/<code><code>// 如果不正常的數據出現達到一定次數，則輸出報警信息/<code><code>if(list.size >= numberOfTimes) {/<code><code>out.collect(Tuple2.of(value.f0 + " 超過指定閾值 ", list));/<code><code>// 報警信息輸出後，清空狀態/<code><code> abnormalData.clear;/<code><code>}/<code><code>}/<code><code>}/<code>

調用自定義的狀態監控，這裡我們使用 a，b 來代表不同類型的監控數據，分別對其數據進行監控：

<code>finalStreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment;/<code><code>DataStreamSource<tuple2>> tuple2DataStreamSource = env.fromElements(/<tuple2>/<code><code>Tuple2.of("a", 50L), Tuple2.of("a", 80L), Tuple2.of("a", 400L),/<code><code>Tuple2.of("a", 100L), Tuple2.of("a", 200L), Tuple2.of("a", 200L),/<code><code>Tuple2.of("b", 100L), Tuple2.of("b", 200L), Tuple2.of("b", 200L),/<code><code>Tuple2.of("b", 500L), Tuple2.of("b", 600L), Tuple2.of("b", 700L));/<code><code>tuple2DataStreamSource/<code><code>.keyBy(0)/<code><code>.flatMap(newThresholdWarning(100L, 3)) // 超過100的閾值3次後就進行報警/<code><code>.printToErr;/<code><code>env.execute("Managed Keyed State");/<code>

輸出如下結果如下：

2.2 狀態有效期

以上任何類型的 keyed state 都支持配置有效期 (TTL) ，示例如下：

<code>StateTtlConfig ttlConfig = StateTtlConfig/<code><code>// 設置有效期為 10 秒/<code><code>.newBuilder(Time.seconds(10)) /<code><code>// 設置有效期更新規則，這裡設置為當創建和寫入時，都重置其有效期到規定的10秒/<code><code>.setUpdateType(StateTtlConfig.UpdateType.OnCreateAndWrite) /<code><code>/*設置只要值過期就不可見，另外一個可選值是ReturnExpiredIfNotCleanedUp，/<code><code>代表即使值過期了，但如果還沒有被物理刪除，就是可見的*//<code><code>.setStateVisibility(StateTtlConfig.StateVisibility.NeverReturnExpired)/<code><code>.build;/<code><code>ListStateDescriptor<long> descriptor = newListStateDescriptor<>("abnormalData", Long.class);/<long>/<code><code>descriptor.enableTimeToLive(ttlConfig);/<code>

2.3 算子狀態

相比於鍵控狀態，算子狀態目前支持的存儲類型只有以下三種：

•ListState：存儲列表類型的狀態。•UnionListState：存儲列表類型的狀態，與 ListState 的區別在於：如果並行度發生變化，ListState 會將該算子的所有併發的狀態實例進行彙總，然後均分給新的 Task；而 UnionListState 只是將所有併發的狀態實例彙總起來，具體的劃分行為則由用戶進行定義。•BroadcastState：用於廣播的算子狀態。

這裡我們繼續沿用上面的例子，假設此時我們不需要區分監控數據的類型，只要有監控數據超過閾值並達到指定的次數後，就進行報警，代碼如下：

 

<code>publicclassThresholdWarningextendsRichFlatMapFunction<tuple2>, /<tuple2>/<code><code>Tuple2<string>>>> implementsCheckpointedFunction{/<string>/<code>
<code>// 非正常數據/<code><code>privateList<tuple2>> bufferedData;/<tuple2>/<code><code>// checkPointedState/<code><code>privatetransientListState<tuple2>> checkPointedState;/<tuple2>/<code><code>// 需要監控的閾值/<code><code>privateLong threshold;/<code><code>// 次數/<code><code>privateInteger numberOfTimes;/<code>
<code>ThresholdWarning(Long threshold, Integer numberOfTimes) {/<code><code>this.threshold = threshold;/<code><code>this.numberOfTimes = numberOfTimes;/<code><code>this.bufferedData = newArrayList<>;/<code><code>}/<code>
<code>@Override/<code><code>publicvoid initializeState(FunctionInitializationContext context) throwsException{/<code><code>// 注意這裡獲取的是OperatorStateStore/<code><code> checkPointedState = context.getOperatorStateStore./<code><code> getListState(newListStateDescriptor<>("abnormalData",/<code><code>TypeInformation.of(newTypeHint<tuple2>> {/<tuple2>/<code><code>})));/<code><code>// 如果發生重啟，則需要從快照中將狀態進行恢復/<code><code>if(context.isRestored) {/<code><code>for(Tuple2<string> element : checkPointedState.get) {/<string>/<code><code> bufferedData.add(element);/<code><code>}/<code><code>}/<code><code>}/<code>
<code>@Override/<code><code>publicvoid flatMap(Tuple2<string> value, /<string>/<code><code>Collector<tuple2>>>> out) {/<tuple2>/<code><code>Long inputValue = value.f1;/<code><code>// 超過閾值則進行記錄/<code><code>if(inputValue >= threshold) {/<code><code> bufferedData.add(value);/<code><code>}/<code><code>// 超過指定次數則輸出報警信息/<code><code>if(bufferedData.size >= numberOfTimes) {/<code><code>// 順便輸出狀態實例的hashcode/<code><code>out.collect(Tuple2.of(checkPointedState.hashCode + "閾值警報！", bufferedData));/<code><code> bufferedData.clear;/<code><code>}/<code><code>}/<code>
<code>@Override/<code><code>publicvoid snapshotState(FunctionSnapshotContext context) throwsException{/<code><code>// 在進行快照時，將數據存儲到checkPointedState/<code><code> checkPointedState.clear;/<code><code>for(Tuple2<string> element : bufferedData) {/<string>/<code><code> checkPointedState.add(element);/<code><code>}/<code><code>}/<code><code>}/<code>

調用自定義算子狀態，這裡需要將並行度設置為 1：

<code>finalStreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment;/<code><code>// 開啟檢查點機制/<code><code>env.enableCheckpointing(1000);/<code><code>// 設置並行度為1/<code><code>DataStreamSource<tuple2>> tuple2DataStreamSource = env.setParallelism(1).fromElements(/<tuple2>/<code><code>Tuple2.of("a", 50L), Tuple2.of("a", 80L), Tuple2.of("a", 400L),/<code><code>Tuple2.of("a", 100L), Tuple2.of("a", 200L), Tuple2.of("a", 200L),/<code><code>Tuple2.of("b", 100L), Tuple2.of("b", 200L), Tuple2.of("b", 200L),/<code><code>Tuple2.of("b", 500L), Tuple2.of("b", 600L), Tuple2.of("b", 700L));/<code><code>tuple2DataStreamSource/<code><code>.flatMap(newThresholdWarning(100L, 3))/<code><code>.printToErr;/<code><code>env.execute("Managed Keyed State");/<code><code>}/<code>

此時輸出如下：

在上面的調用代碼中，我們將程序的並行度設置為 1，可以看到三次輸出中狀態實例的 hashcode 全是一致的，證明它們都同一個狀態實例。假設將並行度設置為 2，此時輸出如下：

可以看到此時兩次輸出中狀態實例的 hashcode 是不一致的，代表它們不是同一個狀態實例，這也就是上文提到的，一個算子狀態是與一個併發的算子實例所綁定的。同時這裡只輸出兩次，是因為在併發處理的情況下，線程 1 可能拿到 5 個非正常值，線程 2 可能拿到 4 個非正常值，因為要大於 3 次才能輸出，所以在這種情況下就會出現只輸出兩條記錄的情況，所以需要將程序的並行度設置為 1。

三、檢查點機制

3.1 CheckPoints

為了使 Flink 的狀態具有良好的容錯性，Flink 提供了檢查點機制 (CheckPoints) 。通過檢查點機制，Flink 定期在數據流上生成 checkpoint barrier ，當某個算子收到 barrier 時，即會基於當前狀態生成一份快照，然後再將該 barrier 傳遞到下游算子，下游算子接收到該 barrier 後，也基於當前狀態生成一份快照，依次傳遞直至到最後的 Sink 算子上。當出現異常後，Flink 就可以根據最近的一次的快照數據將所有算子恢復到先前的狀態。

3.2 開啟檢查點

默認情況下，檢查點機制是關閉的，需要在程序中進行開啟：

<code>// 開啟檢查點機制，並指定狀態檢查點之間的時間間隔/<code><code>env.enableCheckpointing(1000); /<code>
<code>// 其他可選配置如下：/<code><code>// 設置語義/<code><code>env.getCheckpointConfig.setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE);/<code><code>// 設置兩個檢查點之間的最小時間間隔/<code><code>env.getCheckpointConfig.setMinPauseBetweenCheckpoints(500);/<code><code>// 設置執行Checkpoint操作時的超時時間/<code><code>env.getCheckpointConfig.setCheckpointTimeout(60000);/<code><code>// 設置最大併發執行的檢查點的數量/<code><code>env.getCheckpointConfig.setMaxConcurrentCheckpoints(1);/<code><code>// 將檢查點持久化到外部存儲/<code><code>env.getCheckpointConfig.enableExternalizedCheckpoints(/<code><code>ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION);/<code><code>// 如果有更近的保存點時，是否將作業回退到該檢查點/<code><code>env.getCheckpointConfig.setPreferCheckpointForRecovery(true);/<code>

3.3 保存點機制

保存點機制 (Savepoints) 是檢查點機制的一種特殊的實現，它允許你通過手工的方式來觸發 Checkpoint，並將結果持久化存儲到指定路徑中，主要用於避免 Flink 集群在重啟或升級時導致狀態丟失。示例如下：

觸發指定id的作業的Savepoint，並將結果存儲到指定目錄下

bin/flink savepoint :jobId [:targetDirectory] 複製代碼更多命令和配置可以參考官方文檔：savepoints

四、狀態後端

4.1 狀態管理器分類

默認情況下，所有的狀態都存儲在 JVM 的堆內存中，在狀態數據過多的情況下，這種方式很有可能導致內存溢出，因此 Flink 該提供了其它方式來存儲狀態數據，這些存儲方式統一稱為狀態後端 (或狀態管理器)：

主要有以下三種：

•MemoryStateBackend

默認的方式，即基於 JVM 的堆內存進行存儲，主要適用於本地開發和調試。

•FsStateBackend

基於文件系統進行存儲，可以是本地文件系統，也可以是 HDFS 等分佈式文件系統。需要注意而是雖然選擇使用了 FsStateBackend ，但正在進行的數據仍然是存儲在 TaskManager 的內存中的，只有在 checkpoint 時，才會將狀態快照寫入到指定文件系統上。

•RocksDBStateBackend

RocksDBStateBackend 是 Flink 內置的第三方狀態管理器，採用嵌入式的 key-value 型數據庫 RocksDB 來存儲正在進行的數據。等到 checkpoint 時，再將其中的數據持久化到指定的文件系統中，所以採用 RocksDBStateBackend 時也需要配置持久化存儲的文件系統。之所以這樣做是因為 RocksDB 作為嵌入式數據庫安全性比較低，但比起全文件系統的方式，其讀取速率更快；比起全內存的方式，其存儲空間更大，因此它是一種比較均衡的方案。

4.2 配置方式

Flink 支持使用兩種方式來配置後端管理器：第一種方式：基於代碼方式進行配置，只對當前作業生效：

<code>// 配置 FsStateBackend/<code><code>env.setStateBackend(newFsStateBackend("hdfs://namenode:40010/flink/checkpoints"));/<code><code>// 配置 RocksDBStateBackend/<code><code>env.setStateBackend(newRocksDBStateBackend("hdfs://namenode:40010/flink/checkpoints"));/<code>

配置 RocksDBStateBackend 時，需要額外導入下面的依賴：


<code><dependency>/<code><code><groupid>org.apache.flink/<groupid>/<code><code><artifactid>flink-statebackend-rocksdb_2.11/<artifactid>/<code><code><version>1.9.0/<version>/<code><code>

第二種方式：基於 flink-conf.yaml 配置文件的方式進行配置，對所有部署在該集群上的作業都生效：

<code>state.backend: filesystem/<code><code>state.checkpoints.dir: hdfs://namenode:40010/flink/checkpoints/<code>

•Working with State•Checkpointing•Savepoints•State Backends•Fabian Hueske , Vasiliki Kalavri . 《Stream Processing with Apache Flink》. O'Reilly Media . 2019-4-30

本文轉自：https://juejin.im/post/5dd2661cf265da0bf175d5bb

如果覺得文章對你有幫助，請轉發朋友圈、點在看，讓更多人獲益，感謝您的支持！

END

Flink 系列文章

分享到:

閱讀更多 zhisheng的blog 的文章

關鍵字: 存儲機制檢查點

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

Flink Native Kubernetes實戰

Flink SQL Client綜合實戰

Flink 消息聚合處理方案

Flink 基礎入門

Flink 流批一體的實踐與探索

花一元學習一下 Spark，對比一下 Flink

實時流處理框架Storm+SparkStreaming+Samza+Flink，誰可笑傲江湖

自從阿里拿下 Flink 以後, 你還不懂 Flink 就 out 了

一行配置作業性能提升53%！Flink SQL 性能之旅

高級大數據工程師必備知識：Hadoop+Spark+Flink+Kylin

Flink 狀態(State)管理在推薦場景中的應用

Kafka + Flink + Redis 的電商大屏實時計算案

Flink 基礎知識大補

02.13 基於 Flink 的實時特徵平臺在攜程的應用

基於 Flink 的實時特徵平臺在攜程的應用

Flink Broadcast State實戰案例：電商平臺用戶行為模式分析

Flink Checkpoint機制原理剖析與參數配置

Flink 基礎學習(一)初識和基礎概念

2019 年的 Apache Flink

Flink水印機制（watermark）

12.25 使用 Apache Flink 開發實時 ETL

12.21 Flink 全鏈路端到端延遲的測量方法

基於Kafka+Flink+Redis的電商大屏實時計算案例

美團點評基於 Apache Flink 的實時數倉平臺實踐

12.14 美團點評基於 Apache Flink 的實時數倉平臺實踐

11.21 Flink 單並行度內使用多線程來提高作業性能

Flink 原理與實現：內存管理

Flink State 有可能代替數據庫嗎？

Flink 快速實戰開發

Flink 流式計算在節省資源方面的簡單分析

Flink 實時寫入數據到 ElasticSearch 性能調優

汽車之家基於 Flink 的實時 SQL 平臺設計思路與實踐

Flink：你繞不過去的 Hello World

Apache Flink 零基礎入門（二）：DataStream API編程

深入瞭解 Apache Flink 的網絡協議棧

如何從小白進化成 Apache Flink 技術專家？9節基礎課程免費公開

5分鐘從零構建第一個 Apache Flink 應用

Apache Flink Time & Window 深度解析

一文了解 Apache Flink 核心技術

Flink 在有贊實時計算的實踐

大數據實時處理引擎 Structured Streaming VS Flink

槓上 Spark、Flink？Kafka 為何轉型流數據平臺

Spark Streaming VS Flink

Flink 靠什麼征服餓了麼工程師？

Spark Streaming 和 Flink 誰是數據開發者的最愛？

Flink StreamSQL 原理介紹

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"

Flink 狀態管理與 Checkpoint 機制

一、狀態分類

1.1 算子狀態

1.2 鍵控狀態

二、狀態編程

2.1 鍵控狀態

2.2 狀態有效期

2.3 算子狀態

三、檢查點機制

3.1 CheckPoints

3.2 開啟檢查點

3.3 保存點機制

觸發指定id的作業的Savepoint，並將結果存儲到指定目錄下

四、狀態後端

4.1 狀態管理器分類

4.2 配置方式

相關文章:

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

Flink Native Kubernetes實戰

Flink SQL Client綜合實戰

Flink 消息聚合處理方案

Flink 基礎入門

Flink 流批一體的實踐與探索

花一元學習一下 Spark，對比一下 Flink

實時流處理框架Storm+SparkStreaming+Samza+Flink，誰可笑傲江湖

自從阿里拿下 Flink 以後, 你還不懂 Flink 就 out 了

一行配置作業性能提升53%！Flink SQL 性能之旅

高級大數據工程師必備知識：Hadoop+Spark+Flink+Kylin

Flink 狀態(State)管理在推薦場景中的應用

Kafka + Flink + Redis 的電商大屏實時計算案

Flink 基礎知識大補

02.13 基於 Flink 的實時特徵平臺在攜程的應用

基於 Flink 的實時特徵平臺在攜程的應用

Flink Broadcast State實戰案例：電商平臺用戶行為模式分析

Flink Checkpoint機制原理剖析與參數配置

Flink 基礎學習(一)初識和基礎概念

2019 年的 Apache Flink

Flink水印機制（watermark）

12.25 使用 Apache Flink 開發實時 ETL

12.21 Flink 全鏈路端到端延遲的測量方法

基於Kafka+Flink+Redis的電商大屏實時計算案例

美團點評基於 Apache Flink 的實時數倉平臺實踐

12.14 美團點評基於 Apache Flink 的實時數倉平臺實踐

11.21 Flink 單並行度內使用多線程來提高作業性能

Flink 原理與實現：內存管理

Flink State 有可能代替數據庫嗎？

Flink 快速實戰開發

Flink 流式計算在節省資源方面的簡單分析

Flink 實時寫入數據到 ElasticSearch 性能調優

汽車之家基於 Flink 的實時 SQL 平臺設計思路與實踐

Flink：你繞不過去的 Hello World

Apache Flink 零基礎入門（二）：DataStream API編程

深入瞭解 Apache Flink 的網絡協議棧

如何從小白進化成 Apache Flink 技術專家？9節基礎課程免費公開

5分鐘從零構建第一個 Apache Flink 應用

Apache Flink Time & Window 深度解析

一文了解 Apache Flink 核心技術

Flink 在有贊實時計算的實踐

大數據實時處理引擎 Structured Streaming VS Flink

槓上 Spark、Flink？Kafka 為何轉型流數據平臺

Spark Streaming VS Flink

Flink 靠什麼征服餓了麼工程師？

Spark Streaming 和 Flink 誰是數據開發者的最愛？

Flink StreamSQL 原理介紹

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪