「時序資料庫」Druid 多維查詢Bitmap索引

2018-06-29 11:33:23 Farmer001

時序數據庫從抽象語義上來說總體可以概括為兩個方面的基本需求，一個方面是存儲層面的基本需求：包括LSM寫入模型保證寫入性能、數據分級存儲（最近2小時的數據存儲在內存中，最近一天的數據存儲在SSD中，一天以後的數據存儲在HDD中）保證查詢性能以及存儲成本、數據按時間分區保證時間線查詢性能。另一方面是查詢層面的基本需求：包括基本的按時間線進行多個維度的原始數據查詢、按時間線在多個維度進行聚合後的數據統計查詢需求以及TopN需求等。

可見，多維條件查詢通常是時序數據庫的一個硬需求，其性能好壞也是評價一個時序數據庫是否優秀的一個重要指標。調研了市場上大多時序數據庫（InfluxDB、Druid、OpenTSDB、HiTSDB等），基本上都支持多維查詢，只有極個別的暫時支持的並不完美。通常來說，支持多維查詢的手段無非兩種：Bitmap Index以及Inverted Index，也稱為位圖索引和倒排索引。

接下來筆者會重點介紹使用Bitmap索引來加快多維條件查詢的基本原理以及工程實踐，最後也會對倒排索引進行一個簡單的介紹。其實這兩種索引無論在原理上還是在工程實踐上都極其相似，只是在幾個小的細節問題上有所不同，在文章最後筆者也會進行詳細的說明。

Bitmap索引到底是個神馬

Bitmap稱為位圖，對此不瞭解的童鞋可以自行Google。在此我們舉個簡單的例子來演示如何使用Bitmap Index來加速數據庫的多維查詢性能。下圖是一張典型的時序數據表：

Timestamp

Page

Username

Gender

City

Added

Removed

2011-01-01T01:00:00Z

Justin Bieber

Boxer

Male

San Francisco

1800

2011-01-01T01:00:00Z

Justin Bieber

Reach

Female

Taiyuan

2912

2011-01-01T02:00:00Z

Ke$ha

Helz

Female

Calgary

1953

2011-01-01T02:00:00Z

Ke$ha

Xeno

Male

Taiyuan

3194

170

圖中Timestamp列是時序列，Page、Username、Gender和City這幾個列是維度列，Added以及Removed兩列是數值列。基於這樣的原始表，可以構造一個典型的多維查詢如下：

select Added from datasource where Gender = ‘Female’ and City = ‘Taiyuan’

查詢中使用兩個維度條件進行過濾，分別是Gender以及City列。很顯然，如果不使用任何技術手段的話，在原始表上根據如上兩個維度的過濾條件進行查詢需要遍歷整個原始表，並對相應維度列進行過濾，這個代價很顯然是非常可觀的。那能不能有一種方法可以直接根據維度的過濾條件得到待查找目標行，比如上述示例中能不能根據Gender = ‘Female’ and City = ‘Taiyuan’這兩個過濾條件直接定位到待查找目標行就是第二行，其他行都不滿足條件，這樣的話只需要查找第二行的Added列返回給用戶即可，不再需要野蠻的全表掃描並一條一條數據進行對比。這就是Bitmap索引（倒排索引）的使命！

使用Bitmap索引的基本原理是將這兩列上的數值映射到bitmap上，再採用intersection表示來實現and、or等這種查詢謂詞。在上述示例中，將Gender以及City兩列映射成bitmap如下圖所示：

原始表中，Gender列中有兩個值：Male和Female，因此需要設置兩個對應的bitmap，Male分配一個，Female分配一個，兩個bitmap的大小對應原始表的數據行數，原始數據有4行，bitmap的大小就是4。再看原始表的Gender列，行1和行4是Male，行2和行3是Female。因此將Male對應的bitmap中座標為1和4的值置為1，其他兩位置為0。Female對應的bitmap中座標為2和3的值置為1，其他兩位置為0。

這樣的bitmap表示什麼意思呢？以Male對應的bitmap來說，下標是1和4的值為1就表示原始表中這一列的第一行和第4行的值為Male。同理，Female對應的bitmap中下標是2和3對應的值為1表示原始表中這一列的第2行和第3行的值為Female。同樣的道理，City列可以表示為上圖右側3個bitmap。

可見，每個維度列有多少種取值（Cardinality），這個維度列就會有多少個Bitmap。每個Bitmap表示對應取值在原始表中哪些行出現過。

這樣表示完成之後，再來看看查詢語句：where Gender = ‘Female’ and City = ‘Taiyuan’，就可以使用對應bitmap表示為如下形式：

分別拿出 Gender = ‘Female’ and City = ‘Taiyuan’ 對應的bitmap，執行and操作實際上對應位圖的與運算，最終得到一個結果位圖，結果位圖中只有下標2的值置為1，說明原始表中滿足查詢條件的行只有第二行。接下來的工作就是怎麼查詢第二行的Added數值，這裡就不再贅述。

很多講解位圖索引的博客對位圖索引的介紹大多到此為止，僅僅介紹位圖索引的工作原理。本文在介紹位圖索引工作原理的基礎上還會進一步深入介紹在真實的工程實踐中整個位圖索引工作體系。本文以Druid系統的目標，對Druid中位圖索引的工作原理深入分析。主要包括如下幾個部分：

之前在一個開源項目中實現過一個倒排索引功能，其實與Bitmap索引實現原理基本一致。因為在之前並沒有接觸過倒排索引相關的實踐知識，因此頭腦中也沒有非常完整的勾勒出這個功能的核心體系，在實現的時候才發現這樣那樣的問題，雖說最後也實現了功能，現在想來整個系統的模塊化設計並不是非常考究。經過倒排索引項目的洗禮，再結合這段時間對Druid中Bitmap索引實現的研究，才將Bitmap索引這樣一個大功能分解成上圖中的五個小功能，每個小功能都是一個獨立模塊，筆者認為任何對Bitmap索引的工程實現都可以參考這五個模塊進行設計思考。接下來就以Druid中Bitmap索引的實現分別就這五個小功能的細節問題進行深入分析。

Bitmap索引如何在內存中構建？

Druid數據實時寫入節點採用LSM結構保證數據的寫入性能。數據先寫入內存，每隔10min（可配）會將內存中的數據persist到本地硬盤形成文件，然後會有一個線程再每隔1h（可配）將本地硬盤的多個文件合併成一個segment。

Bitmap索引構建時機

這裡實際上會碰到第一個需要權衡的問題：Bitmap索引是應該在數據寫入的同時實時構建呢，還是應該在數據從內存persist到硬盤的時候批量構建。很顯然，實時構建會對數據寫入吞吐量造成一定影響，實際測試下來發現寫入性能會下降5%到15%，而且表維度越多，性能下降越明顯。而另一方面，如果是批量構建，那麼內存中的數據實際上是沒有索引的，這部分數據的檢索方式必然與已經持久化到硬盤文件數據的檢索方式完全不同：內存中的數據檢索不走索引直接查數據，文件中的數據檢索需要先走索引再查數據，在實際查詢實現中需要分別處理。

Druid中Bitmap的構建時機採用的後者，即在數據從內存persist到硬盤的時候批量構建。本人實現倒排索引時採用的是前者，主要考慮的問題是希望無論數據是在內存還是在硬盤，都能夠採用統一的檢索方式，即都先根據索引查詢行號，再根據行號查具體數據。這樣將內存檢索和硬盤檢索統一處理的好處是在代碼實現上更加方便，更加簡潔。當然，會犧牲一部分寫入性能。

維度列構建維度字典

為維度列構建維度字典是Druid中非常重要的一個步驟。維度列中的值通常都可枚舉，比如上文示例中維度列Gender只有兩個可選值：Mela和Female，City列同樣取值可枚舉。因此有必要為每個維度列構建字典，將維度值（大多數為String）映射為Int值，大規模減少數據量。維度字典最核心的是兩個Map映射：valueToId和idToValue，以City列為例，該列有三個值，構建出的字典就是 valueToId : , , ，idToValue是map反過來。可以看出來，構建字典就是為維度列的取值賦一個自增的Int值。

同理，可以分別為Page列、UserName列和Gender列構建相應的維度字典，構建完成之後，原始表中第三行的所有維度列就不再是Page:Ke$ha, UserName:Helz, Gender:Female, City:Calgary，而是[1, 2, 1, 2]。

構建Bitmap索引

上文說到Druid中Bitmap索引是在內存數據異步persist到硬盤文件的時候構建的，那接下來就需要看看錶中一行記錄過來之後如何分別為每個維度列構建Bitmap索引。

在介紹具體的構建流程之前，需要先說明一個關鍵的點：每個維度列實際上都會維護一個Bitmap數組：MutableBitmap[]，數組大小為每個維度列的可取值多少（Cardinality），比如Gender列只有Male和Female兩個取值，Bitmap數組大小就為2。數組的第一個值為Male對應的位圖數據，數組的第二個值為Female對應的位圖數據。這裡就有一個問題，為什麼說數組的第一個值是Male對應的位圖數據，而不是第二個值呢？這就是用到了上文中提到的維度字典，Male對應的維度字典值為0，就對應數組下標為0；Female對應的維度字典值為1，對應數據下標就為1。

下面以其中一行數據為例介紹構建Bitmap索引的過程：

1. 首先會為每一行生成一個自增的rowNum

2. 遍歷所有維度列，分別為每個維度列構建相應的Bitmap數組

針對某個緯度列的value值，首先在維度字典中根據value找到對應的id，這個id即是Bitmap數組的下標，根據這個下標找到該value對應的位圖數據，即MutableBitmap[id]
定位到位圖數據之後，再將該位圖下標為rowNum的bit位置為1

為了更加具體地理解整個Bitmap索引構建的過程，我們以上文中Gender維度列為例模擬構建的過程：

1. Gender維度列會維護了一個位圖數組MutableBitmap[] bitmaps，裡面有兩個位圖元素，下標為0的是Male對應的bitmap，下標為1的是Female對應的bitmap。初始時這兩個bitmap中都沒有任何數字。

2. 遍歷第一行（rowNum = 0），值為Male，根據維度字典找到對應的id位0，即Male對應的位圖數據為bitmaps[0]，將bitmaps[0]下標0（rowNum為0）的bit位置為1，得到：

3. 遍歷第二行（rowNum = 1），值為Female，根據維度字典找到對應的id位1，即Male對應的位圖數據為bitmaps[1]，將bitmaps[1]下標1（rowNum為1）的bit位置為1，得到：

4. 遍歷第三行（rowNum = 2），值為Female，根據維度字典找到對應的id位1，即Male對應的位圖數據為bitmaps[1]，將bitmaps[1]下標2（rowNum為2）的bit位置為1，得到：

5. 遍歷第一行（rowNum = 3），值為Male，根據維度字典找到對應的id位0，即Male對應的位圖數據為bitmaps[0]，將bitmaps[0]下標3（rowNum為3）的bit位置為1，得到：

這樣，就可以得到Gender維度列的Bitmap索引。當然，遍歷一行數據時，同時會為所有其他維度列構建Bitmap索引，上述過程僅以Gender維度列作為示例，其他維度列同理可得。

Bitmap索引如何進行壓縮處理？

Bitmap索引為什麼需要壓縮？

還是以Gender列為例，上文我們知道這個維度列只有兩個取值：Male和Female，因此無論對於Male對應的位圖數據，還是Female對應的位圖數據，都會存在大量的連續的0或者連續的1，非常適合壓縮編碼，減小存儲空間。

Bitmap索引如何進行壓縮？

針對Bitmap的壓縮有非常多的算法，大家可以自行Google。根據壓縮效率、解碼效率以及intersection等計算效率等指標的權衡，特別推薦使用RoaringBitmap壓縮算法。有興趣的同學可以自行Google。

Bitmap索引如何持久化存儲？

Druid中原始數據每隔一段時間就會落盤一次，隨著原始數據的落盤，原始數據中維度列對應的Bitmap索引也需要執行持久化存儲。在實際實現中，Druid首先將維度字典持久化到文件，再將原始數據（維度列都使用維度字典編碼處理）持久化到文件，最後再將維度列對應的Bitmap索引持久化到文件。

對於Druid系統來說，這裡需要關注兩點：

1. Druid系統是列式存儲系統，同一個segment中所有列的數據都會分別獨立存儲在一起形成多個列文件，比如City列的數據會存儲在一起形成文件，Added列的數據會存儲在一起形成文件。其他列同理。

2. Druid系統中的文件分為兩種，一種是定長文件格式，一種是非定長文件格式。定長文件針對於列數值是定長的，比如某些數值列是Double的，有些數據列是Long類型，再比如維度列經過編碼之後所有維度列都是Int類型，時間列是Long類型。這些定長文件格式很簡單，直接存儲數值即可。而非定長文件通常主要針對列數值不是定長的，比如維度字典文件中需要存儲維度值，這些維度值通常是字符串，並不定長；比如Bitmap索引的存儲文件中需要存儲Bitmap位圖數據，這些值也不是定長的。下文主要介紹Bitmap索引的存儲，所以重點介紹非定長文件格式。

Druid中非定長數值存儲的文件格式如下圖所示：

可以看出，Druid系統中使用了3個文件來存儲非定長數據：meta文件，header文件以及value文件，其中meta文件主要存儲一些元數據信息，比如存儲數值個數、存儲數值總大小等；value文件存儲實際的數值，一個數值一個數值寫進去，在實際數據之前有一個int值表示該數值的大小；header文件實際上是value文件中每個數值在value文件的偏移量，文件中每個值都是一個int。

維度字典文件存儲

緯度列數據字典在數據寫入的時候就會構建，並一直保存在內存。Druid會在persist的時候將其持久化形成維度字典文件，每個維度列的字典會單獨形成一個文件，比如Gender維度列的數據字典會形成一個文件，City維度列的數據字典會形成另一個文件。下圖是City維度列形成的維度列字典文件格式（沒有列出meta文件）：

City維度列的數據字典一共有3個值：Calgary、San Francisco和Taiyuan，持久化到文件後就是上圖格式，需要特別注意的是：數據字典的值是按照字典序由小到大排列之後存入文件的。比如上圖中Calgary、San Francisco和Taiyuan就是按照由小到大排序後存儲的。

這個點是工程實踐中非常重要的一個技術點。上文中我們說數據字典在構建的時候其實並沒有強調排序，而是按照維度列進來系統的順序構建字典的，比如San Francisco先進入系統，在第一行，所以San Francisco對應的編碼值就為0，Taiyuan是第二行，所以Taiyuan對應的編碼值為1，同理，Calgary編碼值為2。而且，Bitmap索引構建也是依賴於非排序的維度字典。如果此時在持久化的時候要將維度字典進行排序，那意味著Bitmap位圖數據在Bitmap數組MutableBitmap[]中的位置也需要相應的變化，保持一致。

為什麼需要排序？如果不排序直接存儲行不行？

解答這個問題之前先看看維度字典文件，可以得到文件中只存儲了維度列的值，並沒有存儲對應的編碼值，那編碼值哪去了？實際上編碼值隱含在維度列值的下標，比如Calgary是第一個值，那對應的編碼值就是0，Taiyuan是第三個值，對應的編碼值就是2。基於這樣的事實，如果不排序，你來告訴我如果說我想查Taiyuan對應的編碼值，如何查？那就蒙圈了，需要一個一個遍歷的查，如果某個維度Cardinality很大的話，不就跪了。而反過來，如果排序的話，就可以通過二分查找來查，下文會舉例介紹。

Bitmap索引文件存儲

Bitmap索引文件和維度字典文件是一一對應的，每個維度列的Bitmap索引會單獨形成一個文件，比如Gender維度列的Bitmap索引會形成一個文件，City維度列的Bitmap索引會形成一個文件。下圖是City維度列形成的Bitmap索引文件：

注意，Bitmap索引文件中Bitmap位圖數據的存儲順序必須和維度字典中對應值的存儲順序一致。比如維度字典中Calgary存儲在文件中第一的位置，對應的Bitmap位圖就必須存儲在相應第一的位置。

查詢時如何根據Bitmap索引構建Cursor體系？

以查詢語句select Added from datasource where Gender = ‘Female’ and City = ‘Taiyuan’為例，看看如何實現將where Gender = ‘Female’ and City = ’Taiyuan’這麼一個多維度過濾條件轉化成如下Bitmap與運算的結果：

這樣一個過程實際上可以分為兩步：

1. 如何根據Gender = ‘Female’找到對應的位圖數據？同理，如何根據City = ’Taiyuan’找到對應的位圖數據？

2. 如何根據and操作符實現位圖與操作？

根據and操作符實現位圖與操作是比較簡單的，現在很多Bitmap實現包中都有類似的功能，在此不再贅述。因此構建Cursor體系實際上就簡化為根據維度過濾條件查找對應的位圖數據這樣一個問題。為了更加具體，我們以City = ’Taiyuan’為例定位對應的位圖數據。整個過程分為如下幾個部分：

1. 在City列對應的維度字典文件中查找’Taiyuan’值在文件中的下標

因為文件中維度值是由小到大排序的，所以查找的戰術思想是二分查找。首先將查找指針移動到header文件的中心，中心下標curIndex = (minIndex,maxIndex)>>>1，header文件的中心值為offset_SanFrancisco，這個offset實際上指向了value文件中的San Francisco（這裡忽略了一些細節），這個值與我們要找的值Taiyuan相比較，很顯然前者小於後者，因此繼續往後找。經過多次的查找，最終定位到Taiyuan對應的下標是2（從0開始哦）。

2. 在City列對應的Bitmap索引文件中查找下標為2的Bitmap位圖數據，如下圖所示，首先在header文件中找到下標為2的offset為offset_ty_bm，再根據偏移值在value文件中定位出Taiyuan對應的bitmap位圖數據。（忽略具體的查找細節）

經過這兩步的執行就可以根據City = ’Taiyuan’得到對應的bitmap位圖數據，同理，根據Gender = ‘Female’可以得到對應的bitmap位圖數據，兩者使用與運算就可以得到一個最終的Bitmap位圖索引，這個位圖索引我們稱為Cursor。

如何根據Cursor體系快速查找對應行數據？

Cursor結構體構建出來之後，如果根據這個結構快速的查找對應的行數據呢？這個過程也可以分為兩步：

1. 根據上文介紹知道Cursor結構體實際上就是一個bitmap，bitmap中置為1的下標表示該行數據符合過濾條件。因此需要順序遍歷這個bitmap的所有位，如果目標位為1，表示該目標位下標對應的行滿足過濾條件，需要將該行的對應數據找出來返回給用戶。否則不滿足過濾條件，直接跳過。

2. 假如bitmap中下標為的位置值為1，表示第二行滿足過濾條件，因此需要查找第二行Added列的值。實現起來很簡單，因為該列的所有值都存儲在一個文件中，而且每個值都定長（都是Int），因此可以很快的在文件中加載出startOffset為Ints.Bytes，endOffset為2*Ints.Bytes的值，即為Added的值。

其他需要考慮的問題

講到這裡，筆者基本上已經將Bitmap索引的工程實踐需要考量的技術點都做了介紹，但還有幾個點需要考慮：

1. Bitmap索引目前僅支持寫入，不支持更新。如果需要支持更新，需要做另外的考慮。

2. Bitmap索引文件需要在segment合併的時候也執行合併，合併的過程實際上也是一行一行的讀出來，然後再根據上述過程生成一個新的Bitmap索引文件。

Inverted Index（倒排索引）工程實踐

筆者之前在一個開源項目中實現了倒排索引功能，現在看來，基本實現思路和上述過程基本一致，核心不同點在於：倒排索引中每個維度列取值不再對應bitmap，而是對應一個列表。舉個栗子，Bitmap索引體系中，Gender維度列中Male對應一個bitmap是[1,0,0,1]。換成倒排索引，Gender維度列中Male對應的不再是bitmap，而是一個List : [0,2]，分別表示第1行和第三行。

除此之外，還有一些實現細節有些許不同：

1. Bitmap壓縮性能通常沒有倒排索引中List壓縮效果好，前者會存在較大的存儲空間開銷。

2. Bitmap使用intersection實現and、or等操作的性能要好於倒排索引的List結構，後者需要從小到大遍歷查找

3. 使用Bitmap構建的Cursor加速原始數據查找，需要遍歷bitmap來找哪一行滿足條件，只有bit位是1的才滿足條件；而倒排索引構建的Cursor不需要查找，List中的數值就直接對應行號。

在常見的時序數據庫中，InfluxDB和HiTSDB都使用了倒排索引來加速多維度查詢，倒排索引會首先在內存中構建並持久化到文件（或HBase），在使用時再將索引加載到內存。

文章總結

這是很早之前花時間將之前研究的Bitmap索引知識整理了出來，拿出來和大家分享。本文從理論和工程實踐兩個方面對Bitmap索引的工作原理進行了深入的介紹，筆者認為文章的核心在於如何在工程實踐中將Bitmap索引這麼一個大命題分解成五個子命題，每個子命題中我們又應該重點關注哪些技術點。不得不說，要講清楚Bitmap索引的工程實踐確實有一定難度，文中或多或少會有一些難於理解的地方甚至紕漏。還忘各位看官擔待指正！

分享到:

閱讀更多 Farmer001 的文章

關鍵字: Google 寫入技術

史上最全MySQL剖析：優化+存儲+查詢+索引+複製+可擴展+高可用

數據查詢的最佳拍檔，INDEX和MATCH函數珠聯璧合

高可用+存儲+索引+查詢+複製+可擴展+優化：全網最全的MySQL剖析

數據庫——SELECT 查詢

數據庫——LIKE 查詢

數據庫——BETWEEN 查詢、TOP查詢、count 查詢

利用字典實現雙條件，結果唯一查詢

02.27 利用VBA字典實現單條件，結果多值查詢

02.27 單條件，結果多值查詢的字典實現

記錄ES基本操作（增、刪、改、查）

vlookup+Indirect函數就是這麼強，讓你輕鬆合併12個月數據

從架構，建表，查詢，索引...全方位講解SQL優化

Web功能測試之表單、搜索測試

Django——models 查詢

高性能數據庫集群-分庫分表

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"