深入 HBase 架構解析

2018-10-19 22:53:56 oscube

來源：http://blog.jobbole.com/91913/

前記

公司內部使用的是MapR版本的Hadoop生態系統，因而從MapR的官網看到了這篇文文章：An In-Depth Look at the HBase Architecture，原本想翻譯全文，然而如果翻譯就需要各種咬文嚼字，太麻煩，因而本文大部分使用了自己的語言，並且加入了其他資源的參考理解以及本人自己讀源碼時對其的理解，屬於半翻譯、半原創吧。

HBase架構組成

HBase採用Master/Slave架構搭建集群，它隸屬於Hadoop生態系統，由一下類型節點組成：HMaster節點、HRegionServer節點、ZooKeeper集群，而在底層，它將數據存儲於HDFS中，因而涉及到HDFS的NameNode、DataNode等，總體結構如下：

其中HMaster節點用於：

管理HRegionServer，實現其負載均衡。
管理和分配HRegion，比如在HRegion split時分配新的HRegion；在HRegionServer退出時遷移其內的HRegion到其他HRegionServer上。
實現DDL操作（Data Definition Language，namespace和table的增刪改，column familiy的增刪改等）。
管理namespace和table的元數據（實際存儲在HDFS上）。
權限控制（ACL）。

HRegionServer節點用於：

存放和管理本地HRegion。
讀寫HDFS，管理Table中的數據。
Client直接通過HRegionServer讀寫數據（從HMaster中獲取元數據，找到RowKey所在的HRegion/HRegionServer後）。

ZooKeeper集群是協調系統，用於：

存放整個 HBase集群的元數據以及集群的狀態信息。
實現HMaster主從節點的failover。

HBase Client通過RPC方式和HMaster、HRegionServer通信；一個HRegionServer可以存放1000個HRegion；底層Table數據存儲於HDFS中，而HRegion所處理的數據儘量和數據所在的DataNode在一起，實現數據的本地化；數據本地化並不是總能實現，比如在HRegion移動(如因Split)時，需要等下一次Compact才能繼續回到本地化。

本著半翻譯的原則，再貼一個《An In-Depth Look At The HBase Architecture》的架構圖：

這個架構圖比較清晰的表達了HMaster和NameNode都支持多個熱備份，使用ZooKeeper來做協調；ZooKeeper並不是雲般神秘，它一般由三臺機器組成一個集群，內部使用PAXOS算法支持三臺Server中的一臺宕機，也有使用五臺機器的，此時則可以支持同時兩臺宕機，既少於半數的宕機，然而隨著機器的增加，它的性能也會下降；RegionServer和DataNode一般會放在相同的Server上實現數據的本地化。

HRegion

HBase使用RowKey將表水平切割成多個HRegion，從HMaster的角度，每個HRegion都紀錄了它的StartKey和EndKey（第一個HRegion的StartKey為空，最後一個HRegion的EndKey為空），由於RowKey是排序的，因而Client可以通過HMaster快速的定位每個RowKey在哪個HRegion中。HRegion由HMaster分配到相應的HRegionServer中，然後由HRegionServer負責HRegion的啟動和管理，和Client的通信，負責數據的讀(使用HDFS)。每個HRegionServer可以同時管理1000個左右的HRegion（這個數字怎麼來的？沒有從代碼中看到限制，難道是出於經驗？超過1000個會引起性能問題？）。

HMaster

HMaster沒有單點故障問題，可以啟動多個HMaster，通過ZooKeeper的Master Election機制保證同時只有一個HMaster出於Active狀態，其他的HMaster則處於熱備份狀態。一般情況下會啟動兩個HMaster，非Active的HMaster會定期的和Active HMaster通信以獲取其最新狀態，從而保證它是實時更新的，因而如果啟動了多個HMaster反而增加了Active HMaster的負擔。前文已經介紹過了HMaster的主要用於HRegion的分配和管理，DDL(Data Definition Language，既Table的新建、刪除、修改等)的實現等，既它主要有兩方面的職責：

1.協調HRegionServer

啟動時HRegion的分配，以及負載均衡和修復時HRegion的重新分配。
監控集群中所有HRegionServer的狀態(通過Heartbeat和監聽ZooKeeper中的狀態)。

2.Admin職能

創建、刪除、修改Table的定義。

ZooKeeper：協調者

ZooKeeper為HBase集群提供協調服務，它管理著HMaster和HRegionServer的狀態(available/alive等)，並且會在它們宕機時通知給HMaster，從而HMaster可以實現HMaster之間的failover，或對宕機的HRegionServer中的HRegion集合的修復(將它們分配給其他的HRegionServer)。ZooKeeper集群本身使用一致性協議(PAXOS協議)保證每個節點狀態的一致性。

How The Components Work Together

ZooKeeper協調集群所有節點的共享信息，在HMaster和HRegionServer連接到ZooKeeper後創建Ephemeral節點，並使用Heartbeat機制維持這個節點的存活狀態，如果某個Ephemeral節點實效，則HMaster會收到通知，並做相應的處理。

另外，HMaster通過監聽ZooKeeper中的Ephemeral節點(默認：/hbase/rs/*)來監控HRegionServer的加入和宕機。在第一個HMaster連接到ZooKeeper時會創建Ephemeral節點(默認：/hbasae/master)來表示Active的HMaster，其後加進來的HMaster則監聽該Ephemeral節點，如果當前Active的HMaster宕機，則該節點消失，因而其他HMaster得到通知，而將自身轉換成Active的HMaster，在變為Active的HMaster之前，它會創建在/hbase/back-masters/下創建自己的Ephemeral節點。

HBase的第一次讀寫

在HBase 0.96以前，HBase有兩個特殊的Table：-ROOT-和.META.（如BigTable中的設計），其中-ROOT- Table的位置存儲在ZooKeeper，它存儲了.META. Table的RegionInfo信息，並且它只能存在一個HRegion，而.META. Table則存儲了用戶Table的RegionInfo信息，它可以被切分成多個HRegion，因而對第一次訪問用戶Table時，首先從ZooKeeper中讀取-ROOT- Table所在HRegionServer；然後從該HRegionServer中根據請求的TableName，RowKey讀取.META. Table所在HRegionServer；最後從該HRegionServer中讀取.META. Table的內容而獲取此次請求需要訪問的HRegion所在的位置，然後訪問該HRegionSever獲取請求的數據，這需要三次請求才能找到用戶Table所在的位置，然後第四次請求開始獲取真正的數據。當然為了提升性能，客戶端會緩存-ROOT- Table位置以及-ROOT-/.META. Table的內容。如下圖所示：

可是即使客戶端有緩存，在初始階段需要三次請求才能直到用戶Table真正所在的位置也是性能低下的，而且真的有必要支持那麼多的HRegion嗎？或許對Google這樣的公司來說是需要的，但是對一般的集群來說好像並沒有這個必要。在BigTable的論文中說，每行METADATA存儲1KB左右數據，中等大小的Tablet(HRegion)在128MB左右，3層位置的Schema設計可以支持2^34個Tablet(HRegion)。即使去掉-ROOT- Table，也還可以支持2^17(131072)個HRegion，如果每個HRegion還是128MB，那就是16TB，這個貌似不夠大，但是現在的HRegion的最大大小都會設置的比較大，比如我們設置了2GB，此時支持的大小則變成了4PB，對一般的集群來說已經夠了，因而在HBase 0.96以後去掉了-ROOT- Table，只剩下這個特殊的目錄表叫做Meta Table(hbase:meta)，它存儲了集群中所有用戶HRegion的位置信息，而ZooKeeper的節點中(/hbase/meta-region-server)存儲的則直接是這個Meta Table的位置，並且這個Meta Table如以前的-ROOT- Table一樣是不可split的。這樣，客戶端在第一次訪問用戶Table的流程就變成了：

從ZooKeeper(/hbase/meta-region-server)中獲取hbase:meta的位置（HRegionServer的位置），緩存該位置信息。
從HRegionServer中查詢用戶Table對應請求的RowKey所在的HRegionServer，緩存該位置信息。
從查詢到HRegionServer中讀取Row。

從這個過程中，我們發現客戶會緩存這些位置信息，然而第二步它只是緩存當前RowKey對應的HRegion的位置，因而如果下一個要查的RowKey不在同一個HRegion中，則需要繼續查詢hbase:meta所在的HRegion，然而隨著時間的推移，客戶端緩存的位置信息越來越多，以至於不需要再次查找hbase:meta Table的信息，除非某個HRegion因為宕機或Split被移動，此時需要重新查詢並且更新緩存。

hbase:meta表

hbase:meta表存儲了所有用戶HRegion的位置信息，它的RowKey是：tableName,regionStartKey,regionId,replicaId等，它只有info列族，這個列族包含三個列，他們分別是：info:regioninfo列是RegionInfo的proto格式：regionId,tableName,startKey,endKey,offline,split,replicaId；info:server格式：HRegionServer對應的server:port；info:serverstartcode格式是HRegionServer的啟動時間戳。

HRegionServer詳解

HRegionServer一般和DataNode在同一臺機器上運行，實現數據的本地性。HRegionServer包含多個HRegion，由WAL(HLog)、BlockCache、MemStore、HFile組成。

1.WAL即Write Ahead Log，在早期版本中稱為HLog，它是HDFS上的一個文件，如其名字所表示的，所有寫操作都會先保證將數據寫入這個Log文件後，才會真正更新MemStore，最後寫入HFile中。採用這種模式，可以保證HRegionServer宕機後，我們依然可以從該Log文件中讀取數據，Replay所有的操作，而不至於數據丟失。這個Log文件會定期Roll出新的文件而刪除舊的文件(那些已持久化到HFile中的Log可以刪除)。WAL文件存儲在/hbase/WALs/${HRegionServer_Name}的目錄中(在0.94之前，存儲在/hbase/.logs/目錄中)，一般一個HRegionServer只有一個WAL實例，也就是說一個HRegionServer的所有WAL寫都是串行的(就像log4j的日誌寫也是串行的)，這當然會引起性能問題，因而在HBase 1.0之後，通過HBASE-5699實現了多個WAL並行寫(MultiWAL)，該實現採用HDFS的多個管道寫，以單個HRegion為單位。關於WAL可以參考Wikipedia的Write-Ahead Logging。順便吐槽一句，英文版的維基百科竟然能毫無壓力的正常訪問了，這是某個GFW的疏忽還是以後的常態？

2.BlockCache是一個讀緩存，即“引用局部性”原理（也應用於CPU，分空間局部性和時間局部性，空間局部性是指CPU在某一時刻需要某個數據，那麼有很大的概率在一下時刻它需要的數據在其附近；時間局部性是指某個數據在被訪問過一次後，它有很大的概率在不久的將來會被再次的訪問），將數據預讀取到內存中，以提升讀的性能。HBase中提供兩種BlockCache的實現：默認on-heap LruBlockCache和BucketCache(通常是off-heap)。通常BucketCache的性能要差於LruBlockCache，然而由於GC的影響，LruBlockCache的延遲會變的不穩定，而BucketCache由於是自己管理BlockCache，而不需要GC，因而它的延遲通常比較穩定，這也是有些時候需要選用BucketCache的原因。這篇文章BlockCache101對on-heap和off-heap的BlockCache做了詳細的比較。

3.HRegion是一個Table中的一個Region在一個HRegionServer中的表達。一個Table可以有一個或多個Region，他們可以在一個相同的HRegionServer上，也可以分佈在不同的HRegionServer上，一個HRegionServer可以有多個HRegion，他們分別屬於不同的Table。HRegion由多個Store(HStore)構成，每個HStore對應了一個Table在這個HRegion中的一個Column Family，即每個Column Family就是一個集中的存儲單元，因而最好將具有相近IO特性的Column存儲在一個Column Family，以實現高效讀取(數據局部性原理，可以提高緩存的命中率)。HStore是HBase中存儲的核心，它實現了讀寫HDFS功能，一個HStore由一個MemStore 和0個或多個StoreFile組成。

MemStore是一個寫緩存(In Memory Sorted Buffer)，所有數據的寫在完成WAL日誌寫後，會寫入MemStore中，由MemStore根據一定的算法將數據Flush到地層HDFS文件中(HFile)，通常每個HRegion中的每個 Column Family有一個自己的MemStore。
HFile(StoreFile) 用於存儲HBase的數據(Cell/KeyValue)。在HFile中的數據是按RowKey、Column Family、Column排序，對相同的Cell(即這三個值都一樣)，則按timestamp倒序排列。

雖然上面這張圖展現的是最新的HRegionServer的架構(但是並不是那麼的精確)，但是我一直比較喜歡看以下這張圖，即使它展現的應該是0.94以前的架構。

HRegionServer中數據寫流程圖解

當客戶端發起一個Put請求時，首先它從hbase:meta表中查出該Put數據最終需要去的HRegionServer。然後客戶端將Put請求發送給相應的HRegionServer，在HRegionServer中它首先會將該Put操作寫入WAL日誌文件中(Flush到磁盤中)。

寫完WAL日誌文件後，HRegionServer根據Put中的TableName和RowKey找到對應的HRegion，並根據Column Family找到對應的HStore，並將Put寫入到該HStore的MemStore中。此時寫成功，並返回通知客戶端。

MemStore Flush

MemStore是一個In Memory Sorted Buffer，在每個HStore中都有一個MemStore，即它是一個HRegion的一個Column Family對應一個實例。它的排列順序以RowKey、Column Family、Column的順序以及Timestamp的倒序，如下所示：

每一次Put/Delete請求都是先寫入到MemStore中，當MemStore滿後會Flush成一個新的StoreFile(底層實現是HFile)，即一個HStore(Column Family)可以有0個或多個StoreFile(HFile)。有以下三種情況可以觸發MemStore的Flush動作，需要注意的是MemStore的最小Flush單元是HRegion而不是單個MemStore。據說這是Column Family有個數限制的其中一個原因，估計是因為太多的Column Family一起Flush會引起性能問題？具體原因有待考證。

當一個MemStore的大小超過了hbase.hregion.memstore.flush.size的大小，默認128MB。此時當前的HRegion中所有的MemStore會Flush到HDFS中。
當全局MemStore的大小超過了hbase.regionserver.global.memstore.upperLimit的大小，默認40％的內存使用量。此時當前HRegionServer中所有HRegion中的MemStore都會Flush到HDFS中，Flush順序是MemStore大小的倒序（一個HRegion中所有MemStore總和作為該HRegion的MemStore的大小還是選取最大的MemStore作為參考？有待考證），直到總體的MemStore使用量低於hbase.regionserver.global.memstore.lowerLimit，默認38%的內存使用量。
當前HRegionServer中WAL的大小超過了hbase.regionserver.hlog.blocksize * hbase.regionserver.max.logs的數量，當前HRegionServer中所有HRegion中的MemStore都會Flush到HDFS中，Flush使用時間順序，最早的MemStore先Flush直到WAL的數量少於hbase.regionserver.hlog.blocksize * hbase.regionserver.max.logs。這裡說這兩個相乘的默認大小是2GB，查代碼，hbase.regionserver.max.logs默認值是32，而hbase.regionserver.hlog.blocksize是HDFS的默認blocksize，32MB。但不管怎麼樣，因為這個大小超過限制引起的Flush不是一件好事，可能引起長時間的延遲，因而這篇文章給的建議：“Hint: keep hbase.regionserver.hlog.blocksize * hbase.regionserver.maxlogs just a bit above hbase.regionserver.global.memstore.lowerLimit * HBASE_HEAPSIZE.”。並且需要注意，這裡給的描述是有錯的(雖然它是官方的文檔)。

在MemStore Flush過程中，還會在尾部追加一些meta數據，其中就包括Flush時最大的WAL sequence值，以告訴HBase這個StoreFile寫入的最新數據的序列，那麼在Recover時就直到從哪裡開始。在HRegion啟動時，這個sequence會被讀取，並取最大的作為下一次更新時的起始sequence。

HFile格式

HBase的數據以KeyValue(Cell)的形式順序的存儲在HFile中，在MemStore的Flush過程中生成HFile，由於MemStore中存儲的Cell遵循相同的排列順序，因而Flush過程是順序寫，我們直到磁盤的順序寫性能很高，因為不需要不停的移動磁盤指針。

HFile參考BigTable的SSTable和Hadoop的TFile實現，從HBase開始到現在，HFile經歷了三個版本，其中V2在0.92引入，V3在0.98引入。首先我們來看一下V1的格式：

V1的HFile由多個Data Block、Meta Block、FileInfo、Data Index、Meta Index、Trailer組成，其中Data Block是HBase的最小存儲單元，在前文中提到的BlockCache就是基於Data Block的緩存的。一個Data Block由一個魔數和一系列的KeyValue(Cell)組成，魔數是一個隨機的數字，用於表示這是一個Data Block類型，以快速監測這個Data Block的格式，防止數據的破壞。Data Block的大小可以在創建Column Family時設置(HColumnDescriptor.setBlockSize())，默認值是64KB，大號的Block有利於順序Scan，小號Block利於隨機查詢，因而需要權衡。Meta塊是可選的，FileInfo是固定長度的塊，它紀錄了文件的一些Meta信息，例如：AVG_KEY_LEN, AVG_VALUE_LEN, LAST_KEY, COMPARATOR, MAX_SEQ_ID_KEY等。Data Index和Meta Index紀錄了每個Data塊和Meta塊的其實點、未壓縮時大小、Key(起始RowKey？)等。Trailer紀錄了FileInfo、Data Index、Meta Index塊的起始位置，Data Index和Meta Index索引的數量等。其中FileInfo和Trailer是固定長度的。

HFile裡面的每個KeyValue對就是一個簡單的byte數組。但是這個byte數組裡麵包含了很多項，並且有固定的結構。我們來看看裡面的具體結構：

開始是兩個固定長度的數值，分別表示Key的長度和Value的長度。緊接著是Key，開始是固定長度的數值，表示RowKey的長度，緊接著是 RowKey，然後是固定長度的數值，表示Family的長度，然後是Family，接著是Qualifier，然後是兩個固定長度的數值，表示Time Stamp和Key Type（Put/Delete）。Value部分沒有這麼複雜的結構，就是純粹的二進制數據了。隨著HFile版本遷移，KeyValue(Cell)的格式並未發生太多變化，只是在V3版本，尾部添加了一個可選的Tag數組。

HFileV1版本的在實際使用過程中發現它佔用內存多，並且Bloom File和Block Index會變的很大，而引起啟動時間變長。其中每個HFile的Bloom Filter可以增長到100MB，這在查詢時會引起性能問題，因為每次查詢時需要加載並查詢Bloom Filter，100MB的Bloom Filer會引起很大的延遲；另一個，Block Index在一個HRegionServer可能會增長到總共6GB，HRegionServer在啟動時需要先加載所有這些Block Index，因而增加了啟動時間。為了解決這些問題，在0.92版本中引入HFileV2版本：

在這個版本中，Block Index和Bloom Filter添加到了Data Block中間，而這種設計同時也減少了寫的內存使用量；另外，為了提升啟動速度，在這個版本中還引入了延遲讀的功能，即在HFile真正被使用時才對其進行解析。

FileV3版本基本和V2版本相比，並沒有太大的改變，它在KeyValue(Cell)層面上添加了Tag數組的支持；並在FileInfo結構中添加了和Tag相關的兩個字段。關於具體HFile格式演化介紹，可以參考這裡。

對HFileV2格式具體分析，它是一個多層的類B+樹索引，採用這種設計，可以實現查找不需要讀取整個文件：

Data Block中的Cell都是升序排列，每個block都有它自己的Leaf-Index，每個Block的最後一個Key被放入Intermediate-Index中，Root-Index指向Intermediate-Index。在HFile的末尾還有Bloom Filter用於快速定位那麼沒有在某個Data Block中的Row；TimeRange信息用於給那些使用時間查詢的參考。在HFile打開時，這些索引信息都被加載並保存在內存中，以增加以後的讀取性能。

這篇就先寫到這裡，未完待續。。。。

參考：

https://www.mapr.com/blog/in-depth-look-hbase-architecture#.VdNSN6Yp3qx

http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable

http://hbase.apache.org/book.html

http://www.searchtb.com/2011/01/understanding-hbase.html

http://research.google.com/archive/bigtable-osdi06.pdf

分享到:

閱讀更多 oscube 的文章

關鍵字: HDFS 節點 HBase

HBase 可見性標籤

HBase：標籤

HBase 數據安全

HBase：用於安全操作的客戶端配置

HBase：用於安全操作的服務器端配置

HBase MapReduce摘要到RDBMS

HBase MapReduce摘要到沒有Reducer的HBase

HBase MapReduce摘要到HBase示例

HBase MapReduce讀寫示例

HBase MapReduce 讀取示例

使用sqoop 導入MySQL數據到 HBASE

HBase 二級索引和備用查詢路徑

HBase 生存時間（TTL）

HBase 支持的數據類型

HBase 列族數量

HBase 模式(Schema) 創建

HBase 排序順序、列元數據以及聯合查詢

HBase 版本介紹

HBase 數據模型操作

HBase 版本號和兼容性

HBase 動態配置

HBase 重要配置

HBase 配置示例

HBase 默認配置

HBase 開始運行

HBase 運行模式

HBase 基礎條件

HBase 快速啟動

HBase Region管理（拆分+合併+負載均衡）

HBase WAL機制

HBase scan命令：查詢全表數據

HBase get命令：從表中獲取數據

HBase put命令：插入數據

HBase Exists

HBase Admin API

Java 操作 HBase 教程

你想要的 HBase 原理都在這了

HBase NotServingRegionException排查

使用Lily HBase NRT Indexer為HBase構建二級索引

下一代的 HBase 系統 HydraBase

MongoDB、Hbase、Redis等NoSQL分析

Hadoop數據存儲—Hbase

Hbase 統計表行數的3種方式總結

MongoDB、Hbase、Redis等NoSQL優劣勢、應用場景

ELK hadoop hbase

海量數據高速存儲資料庫：HBase

Hbase 性能優化

HBase 的MOB壓縮分區策略介紹

HBase 架構｜存儲

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"