Apache Nifi 的使用

Nifi 作為一個數據流處理引擎,在我這邊的工作中扮演了一個極其重要的角色。

因為很多時候,處理 同步數據, 刪除 hdfs上的歷史分區數據,管理數據庫的分區,查看job的運行任務,都作為一個很好的助手,最重要的是,它免費,不花錢,而且有用,哈哈。

我這邊先給大家 介紹 Nifi 如何 管理數據庫的分區表的事情。

相信大家都知道 oracle的分區表,是需要有分區,數據寫入的時候才會正常,而一般dba對錶的分區建立都是一年一次,幫你們建立一年的分區,等過年期間,dba會再次統計分區表 和 建立分區。

而我在公司中作為 每天和大數據打交道的人,自己分析後的數據,通過spark運行後,也會寫入oracle中,而針對一些明細的數據,會保留近3個月的數據。

那麼問題來了,將近上億的數據,為了查詢沒有壓力,我這邊的考慮是:

1---建立分區表

2---建立索引

3---定期刪除歷史分區 和 建立未來的分區。

先給大家看下我配置的nifi的圖片吧,畢竟現在流行有圖有真相。


Apache Nifi 的使用


Apache Nifi 的使用


Apache Nifi 的使用

下一篇章,我為大家講解,如何配置 分區表自動化管理。

配置的核心就是:

1:生成對應表的分區sql語句

2:一共是兩句,一是刪除分區,二是建立分區

3:刪除分區的時候判斷此時的分區是否是最小的分區

4:添加分區的時候判斷此時的分區是否已經存在。

5:執行sql語句。


分享到:


相關文章: