經典搜索核心算法：BM25及其變種

2017-11-18 12:05:18 小鳥編程

週一我們講了 TF-IDF 算法和它的四個變種，相對於 TF-IDF 而言，在信息檢索和文本挖掘領域，BM25 算法則更具理論基礎，而且是工程實踐中當仁不讓的重要基線（Baseline）算法。BM25 在 20 世紀 70 年代到 80 年代被提出，到目前為止已經過去二三十年了，但是這個算法依然在很多信息檢索的任務中表現優異，是很多工程師首選的算法之一。

今天我就來談談 BM25 算法的歷史、算法本身的核心概念以及 BM25 的一些重要變種，幫助你快速掌握這個信息檢索和文本挖掘的利器。

BM25 的歷史

BM25，有時候全稱是 Okapi BM25，是由英國一批信息檢索領域的計算機科學家開發的排序算法。這裡的“BM”是“最佳匹配”（Best Match）的簡稱。

BM25 背後有兩位著名的英國計算機科學家。第一位叫斯蒂芬·羅伯遜（Stephen Robertson）。斯蒂芬最早從劍橋大學數學系本科畢業，然後從城市大學（City University）獲得碩士學位，之後從倫敦大學學院（University College London）獲得博士學位。斯蒂芬從 1978 年到 1998 年之間在城市大學任教。1998 年到 2013 年間在微軟研究院劍橋實驗室工作。我們之前提到過，美國計算機協會 ACM 現在每三年頒發一次“傑拉德·索爾頓獎”，用於表彰對信息檢索技術有突出貢獻的研究人員。2000 年這個獎項頒給斯蒂芬，獎勵他在理論方面對信息檢索的貢獻。BM25 可謂斯蒂芬一生中最重要的成果。

另外一位重要的計算機科學家就是英國的卡倫·瓊斯（Karen Spärck Jones）。週一我們在 TF-IDF 的文章中講過。卡倫也是劍橋大學博士畢業，並且畢生致力於信息檢索技術的研究。卡倫的最大貢獻是發現 IDF 以及對 TF-IDF 的總結。卡倫在 1988 年獲得了第二屆“傑拉德·索爾頓獎”。

BM25 算法詳解

現代 BM25 算法是用來計算某一個目標文檔（Document）相對於一個查詢關鍵字（Query）的“相關性”（Relevance）的流程。通常情況下，BM25 是“非監督學習”排序算法中的一個典型代表。

顧名思義，這裡的“非監督”是指所有的文檔相對於某一個查詢關鍵字是否相關，這個信息是算法不知道的。也就是說，算法本身無法簡單地從數據中學習到相關性，而是根據某種經驗法則來“猜測”相關的文檔都有什麼特質。

那麼 BM25 是怎麼定義的呢？我們先來看傳統的 BM25 的定義。一般來說，經典的 BM25 分為三個部分：

單詞和目標文檔的相關性
單詞和查詢關鍵詞的相關性
單詞的權重部分

這三個部分的乘積組成某一個單詞的分數。然後，整個文檔相對於某個查詢關鍵字的分數，就是所有查詢關鍵字裡所有單詞分數的總和。

我們先從第一部分說起，即單詞和目標文檔的相關性。這裡相關性的基本思想依然是“詞頻”，也就是 TF-IDF 裡面 TF 的部分。詞頻就是單詞在目標文檔中出現的次數。如果出現的次數比較多，一般就認為更相關。和 TF-IDF 不同，BM25 最大的貢獻之一就是挖掘出了詞頻和相關性之間的關係是非線性的，這是一個初看有違常理但細想又很有道理的洞察。

具體來說，每一個詞對於文檔相關性的分數不會超過一個特定的閾值。這個閾值當然是動態的，根據文檔本身會有調整。這個特徵就把 BM25 裡的詞頻計算和一般的 TF 區分開了。也就是說，詞頻本身需要“標準化”（Normalization），要達到的效果是，某一個單詞對最後分數的貢獻不會隨著詞頻的增加而無限增加。

那 BM25 裡詞頻的標準化是怎麼做的呢？就是某一個詞的詞頻，除以這個詞的詞頻加上一個權重。這個權重包含兩個超參數（Hyper-parameter），這些超參數後期是可以根據情況手動調整的。這個做法在非監督的排序算法中很普遍。同時，這個權重還包括兩個重要信息：第一，當前文檔的長度；第二，整個數據集所有文檔的平均長度。

這幾個因素混合在一起，我們就得到了一個新的詞頻公式，既保證單詞相對於文檔的相關度和這個單詞的詞頻呈現某種正向關係，又根據文檔的相對長度，也就是原始長度和所有文檔長度的一個比值關係，外加一些超參數，對詞頻進行了限制。

有了單詞相對於文檔的相關度計算公式作為基礎，單詞相對於查詢關鍵字的相關度可以說是異曲同工。首先，我們需要計算單詞在查詢關鍵字中的詞頻。然後，對這個詞頻進行類似的標準化過程。

和文檔的標準化過程唯一的區別，這裡沒有采用文檔的長度。當然，對於查詢關鍵字來說，如果需要使用長度，也應該是使用查詢關鍵字的長度和平均長度。但是，根據 BM25 經典公式來說，這一部分並沒有使用長度信息進行重新標準化。

接著我來談談最後一個部分，單詞權重的細節，通常有兩種選擇。

第一種選擇就是直接採用某種變形的 IDF 來對單詞加權。一般來說，IDF 就是利用對數函數（Log 函數）對“文檔頻率”，也就是有多少文檔包含某個單詞信息進行變換。這裡回顧一下週一講的內容，IDF 是“文檔頻率”的倒數，並且通過對數函數進行轉換。如果在這裡使用 IDF 的話，那麼整個 BM25 就可以看作是一個某種意義下的 TF-IDF，只不過 TF 的部分是一個複雜的基於文檔和查詢關鍵字、有兩個部分的詞頻函數。

第二種單詞的權重選擇叫作“羅伯遜 - 斯巴克 - 瓊斯”權重（Robertson-Spärck-Jones），簡稱 RSJ 值，是由計算機科學家斯蒂芬·羅伯遜和卡倫·瓊斯合作發現。我們剛才講過，這兩位都是重要的信息檢索學術權威。這個權重其實就是一個更加複雜版本的 IDF。一個關鍵的區別是 RSJ 值需要一個監督信息，就是要看文檔對於某個查詢關鍵字是否相關，而 IDF 並不需要。

對比以上兩種思路，在很多情況下，利用 IDF 來直接進行單詞權重的版本更加普遍。如果在有監督信息的情況下，RSJ 值也不失為一個很好的選擇。

通過這裡簡單的介紹，我們可以很容易地發現，BM25 其實是一個經驗公式。這裡面的每一個成分都是經過很多研究者的迭代而逐步發現的。很多研究在理論上對 BM25 進行了建模，從“概率相關模型”（Probabilistic Relevance Model）入手，推導出BM25 其實是對某一類概率相關模型的逼近。對這一部分我在這裡就不展開論述了。需要你記住的是，BM25 雖然是經驗公式，但是在實際使用中經常表現出驚人的好效果。因此，很有必要對這一類文檔檢索算法有所瞭解。

BM25 算法變種

由於 BM25 的情況，一方面是經驗公式，另一方面是某種理論模型的逼近，這樣就出現了各式各樣的 BM25 變種。這裡我僅僅介紹一些有代表性的擴展。

一個重要的擴展是BM25F，也就是在 BM25 的基礎上再多個“域”（Field）文檔上的計算。這裡“域”的概念可以理解成一個文檔的多個方面。比如，對於很多文檔來說，文檔包括標題、摘要和正文。這些組成部分都可以認為是不同的“域”。那麼，如何結合不同的“域”，讓文檔的相關性能夠統一到一個分數上就是 BM25F 的核心內容。

具體來說，BM25F 對於 BM25 的擴展很直觀。那就是每一個單詞對於文檔的相關性是把各個域當做一個“小文檔”的加權平均。也就是說，我們先把每個域當做單獨的文檔，計算詞頻，進行標準化。然後集合每個域的值，進行加權平均，再乘以詞的權重（我們上面提到了，用 IDF 或者是 RSJ 值）。

另外一個重要的擴展就是把 BM25 和其他文檔信息（非文字）結合起來。這個想法是在“學習排序”（Learning To Rank）這一思路出現以前的一種普遍的做法，往往就是用線性加權的形式直接把各種信息相結合。例如，在 21 世紀初期比較流行的做法是用 BM25 和 PageRank 的線性結合來確定網頁的相關度。這裡面，BM25 是和某個查詢關鍵字有聯繫的信息，而 PageRank 則是一個網頁的總體權重。

小結

今天我為你講了文檔檢索領域或者說搜索領域裡最基本的一個技術：BM25。我們可以看到，BM25 由三個核心的概念組成，包括詞在文檔中相關度、詞在查詢關鍵字中的相關度以及詞的權重。BM25 是一個長期積累的經驗公式，也有很深的理論支持，是一個強有力的非監督學習方法的文本排序算法。

一起來回顧下要點：第一，簡要介紹了 BM25 的歷史。第二，詳細介紹了 BM25 算法的三個主要組成部分。第三，簡要地介紹了 BM25 的一些變種。

最後，給你留一個思考題，雖然 BM25 是非監督的排序方法，並且我們提到其中有一些超參數，那麼是否可以通過機器學習的手段來學習到這些超參數的最佳取值呢？

分享到:

閱讀更多 小鳥編程 的文章

關鍵字: 信息檢索算法變種

疫情還沒結束，又一場“災難”逼近！算法，終究吞噬了人的智商

中文數字一二三+算法——多個數連續加計算方法

它用“算法+紅娘”模式幫小鎮青年找對象，一年拿下4000萬用戶

我們還有一場更為關鍵的戰役要打，這就是人和“算法”的鬥爭！

人和“算法”的鬥爭！人類又一場災難來襲！

老坑南齊！皮殼起油，大面積開窗不變種。肉質細膩、膠感足！

PS教程：高低頻磨皮其實很簡單，高低頻原理的超詳細說明

賣得很好的產品，銷量莫名下降怎麼辦？

常用算法之滑動窗口

一個著名的最貪心也最厲害的算法——Dijkstra算法

拼多多店鋪如何快速提升銷量和排名？

更新後的掃地機有多了哪些功能

洪量老師：企業是企業家帶著一群人做一件有意義的事情

稱球問題的通用解法

快速求出淘汰賽中輪空場次-最簡單的算法

如何分配社會悲劇

巧算79764168÷7986

終於有人把數據、信息、算法、統計、概率和數據挖掘都講明白了！

生產成本控制：減少消除控制法，如何控制生產中兩類減少三類消除

銅排計算方法、折彎經驗計算表、銅排載流量，銅排截面積計算公式

一文了解刀具和刀具半徑補償，想不看都難！

算法“急轉彎”——燃香計時

為什麼有的身份證號末位數字是“X”的，有什麼特殊的含義嗎？

樑鋼筋算量的基本方法

「坐在馬桶上看算法」算法6：只有五行的Floyd最短路算法

最快最簡單的排序——桶排序

永動機“成功”案例，不可思議的“永動”

火爆刷單界的“凌晨單”，到底是什麼邏輯？

十大經典圖算法PageRank

懂你背後的苦

變種「校園貸」已捲土重來，該如何防範

限流算法：漏桶與令牌桶

崔永元最新發文，看這四個傻逼，不知道吃了誰拉岀來的優越感

《天賦異稟》第二季里德超能力覺醒，實力足以毀滅整個城市

09.26 學術動態：單繞組無軸承開關磁阻電機的繞組開路故障容錯控制策略

08.30 終於有人把數據、信息、算法、統計、概率和數據挖掘都講明白了！

08.13 超全的人工及材料用量算法造價人員都在用！

06.22 教孩子最快速算法

這種特性爲一些好事者提供了一種創造新病毒的捷徑

05.15 限流算法之令牌桶算法、漏桶算法

05.07 自建房鋼筋算量不求人，記住各部位鋼筋計算公式，自己也能做預算

04.30 聚類算法之凝聚聚類

04.24 目前最快最簡單的神速排序算法——桶排序

02.18 算法——遞歸（以漢諾塔為例）

02.02 即使不背九九乘法表也能用畫線數點法來計算乘法

01.26 “兒童邪典片”肆虐，算法“價值中立”論最該批！

頭條年底上頭條的方式竟然是這樣的！

盤點！那些載入史冊的計算機病毒

人臉識別算法的巔峯之際，爲什麼需求最痛的安防行業還是無法大規模應用？

沈巍先生雜談（358）說好的快手不倒，陪伴到老呢？個個都是戲精

轉念一想，這種看似不正常的狀態才是正常的，隨著時間的推移，很多過去迷迷糊糊的人慢慢就看清了，是進是退跟著內心走就好，別管什麼善始善終，不要被這種論調道德綁架，過段時間，你覺得可以，再回來就行，開關在你自己手裡，一秒鐘就能完成進退。

出海奮鬥是有膽識後浪的更優選項

東南亞11國，除去東帝汶，其他10國組成東盟。東南亞有多熱，從很多國際資本的快速湧入都有目共睹。養老產業：泰國、越南、菲律賓、馬來西亞、印尼都是大受歐美日韓退休人士歡迎的亞洲養老目的地。

甲有5套房，不上班，收房租；乙有1套房，上班賺工資；丙租房子.

每逢佳節被相親，單身青年看這裡！

“非常戰疫

為珠峰“量身高”，為啥要人上去？

6日，2020珠峰高程測量行動測量登山隊舉行出發儀式，30多名計劃登頂的測量登山隊員當日從海拔5200米的珠峰登山大本營向更高海拔出發，計劃抓住近日的天氣窗口，擇日登頂測量。如果成功，這將成為我國專業測繪人員首次登頂珠峰測高。

我省獲國家局通報表揚

湖南名字最尷尬的城市，90%的人都會想歪，當地人：思想有問題！

湖南省作為中國中南地區的一個省份，經濟強勁，地位獨特，有著十足的發展後勁。湖南經濟總量在全國排名第九。湖南也是華夏文明的發祥地，境內的炎帝陵，成為華夏兒女尋根祭祖的重要場所。南嶽衡山就在湖南衡陽。湖南張家界景區成為馳名中外的旅遊景點。湖南湘西鳳凰古鎮成為中國馳名十大古鎮之一。

超六成前浪點贊《後浪》，全球白手起家90後富豪人均財富190億

再不來一場精緻野餐，我就要被開除中產籍了

《新週刊》創刊於1996年8月18日，由南方出版傳媒股份有限公司主管、主辦，以“中國最新銳的生活方式週刊”為定位，推出過一系列極具影響力的專題報道，是中國期刊市場最具代表性和影響力的雜誌之一，享有“話題策源地”的美譽。

工程師我只服中國，曾經放生到三峽的1萬條魚，如今怎麼樣了？

每一個大項目其實都會面臨一個問題，那就是生態環境，因為所涉及的範圍實在太廣了，所以需要考慮的問題都是多方面的，三峽就是我國早期的一個超大體量的工程，而三峽所涉及的問題也很多。三峽其實一直都是我國的驕傲，但是關於三峽的質疑聲，其實也一點都不少，特別是關於三峽環境方面的質疑聲。

後疫情時代的五個營銷啟示

現象級白酒——李渡高粱酒，作為沉浸式/場景化營銷的開創者，早在幾年前就使用互聯網工具助力，疫情爆發後一系列的操作自然遊刃有餘了，銷量同比增加170%，線上銷量更是增加400%。

丘北縣雙龍營鎮人民政府普者黑村委會、矣則村委會太陽能路燈採購安裝項目競爭性談判公告

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了金子一直是我們中國人比較喜歡投資的一個東西，黃金飾品也是中國女性非常喜歡購買的東西，大家都知道，金子具有保值的功能，所以很多人既喜歡在銀行購買金條用於投資，又喜歡去一些金店購買黃金飾品。

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了大家都會知道，每到夏天，我們的沿海地區都是一個多風多雨的季節，這時候我們出門也是需要隨時帶上雨具，避免突然有暴風雨這些天氣的出現。

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了每次一到假期，就非常害怕到達火車站，可以說是基本上都是人山人海的感覺。很多人會為了方便去選擇去乘坐動車和高鐵。現在我們無論是出差還是去旅遊也都是會選擇去坐動車，又快又方便，主要還會很舒服。

肖戰視頻專訪：眼裡帶著故事，請不要聽說他，這一次，請他說

這是肖戰春節後，經歷過這麼多事後首次參加採訪。視頻中他依然是面帶微笑，依舊是少年的樣子。但是眼裡到這故事，說話也變得小心謹慎，談吐措辭也是越來越嚴謹了。

秦山核電應急行動水平優化項目招標公告

從中國電力集採招標網（www.dljczb.

巴基斯坦SK水電站消防及火災報警系統設備採購招標招標公告

從中國電力集採招標網（www.dljczb.

中煤能源新疆鴻新煤業葦子溝煤礦瓦斯抽採機械設備採購招標公告

從中國電力集採招標網（www.dljczb.

縣域社區團購，在平臺發展上有哪些優勢？

社區團購的迅速發展，已經不再侷限於各大城市中的小區。漸漸的擴大範圍，發展到一些城市邊緣的縣城鄉鎮。像是興盛優選、十薈團、食享會、考拉精選、美家買菜等月流水上億的社區團購頭部企業，都很重視下沉市場的佈局和開拓。

和王為念離婚，與“假奶奶”常香玉對簿公堂，55歲小香玉生活如詩

戲曲是以古代故事以及現代經典故事為題材的藝術表演，也是歷史悠久的綜合舞臺藝術樣式，表演戲曲難度很高，但戲曲人才依舊人才輩出，說起在戲曲圈中的佼佼者，陳百玲必是其一。

眼力測試：由4字組成的白菜，1秒看出4個字的智商都很高

這是一幅白菜圖，由4字組成的，1秒看出4個字的智商都很高！你看出來了嗎？

看圖猜字：這個不簡單，你能猜對幾個？全猜對眼力非凡

這福圖上的圖你能猜對幾個？全猜對眼力非凡，猜對3個眼力160，猜對3個是近視眼！你能猜對幾個字？

眼力測試：火焰中藏了4個字，看出3個算達標，全看出眼力200

熊熊火焰中藏了4個字，看出3個算達標，全看出眼力200！你能全部看出來嗎？

小米硬剛德國雙立人，400年非洲灌木做家用砧板，不發黴砍不壞

民以食為天。

眼力測試：美女圖中藏了5個漢字，全部看出來的眼力超群

這幅美女圖中藏了5個漢字，你能不能看出來是哪幾個漢字呢？全部看出來的眼力超群！

最萌Hodler，剛出生就收到比特幣大學教育基金的寶寶

作為比特幣愛好者，Izabella的父母在她出生當日於《泰晤士報》刊登了一則附帶比特幣地址的小廣告，希望廣大讀者能夠捐出小部分比特幣給他們女兒作為大學教育基金。

《瞭望大灣區》：全國中高風險區域今日“清零”

《晨會解讀》：中山證券投資顧問楊立華：連續上漲過後注意把握好操作節奏

孫鬆峰：幸福生活唱出來

河南市場安全網訊（www.hnscjgw.com）

衡水：守護一湖碧水打造生態之城

長城網衡水訊（記者張梅勝

英國小夥第一次體驗中國網吧，就被電腦屏幕嚇到直言：這是個啥

網吧其實不管是對於哪個國家的人來說，都是極具吸引力的，而在中國對於八九四年的年輕人和學生來說，網吧簡直就是快樂源泉，但是也是老師家長中的眼中釘，肉中刺。相信很多人小時候可能都有過被家長從網吧裡揪出來的不甚美好的回憶。

微商到底多能吹牛！哈哈哈哈哈千萬別屏蔽，每天都是快樂源泉

雖然有的時候在朋友圈裡有很多微商不停的發朋友圈，讓大家覺得有些困擾和煩悶，有一種私生活被侵擾的感覺。但是不要忙著屏蔽他們，有的時候這些總是吹得天花亂墜的微商也能給人們帶來快樂的源泉。

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度

5月6日，2020珠峰高程測量登山隊伍出發儀式正式舉行，30多名隊員當日從海拔5200米的登山大本營向更高海拔出發，開啟珠峰衝頂測量。隊員們力爭抓住近日的天氣窗口，擇日登頂測量。如果成功，這將是我國專業測繪人員首次登頂珠峰測高。

“十大沂蒙工匠”齊玉祥：鋼花璀璨照亮青春之路

一支焊槍、一面防護罩，鋼花白晝繁星，在刺耳的噪聲中點亮四壁，焊工齊玉祥用13年的青春，打磨出了人生最璀璨的鋼花。2007年，齊玉祥畢業後進入山東華源鍋爐有限公司工作。剛進公司沒多久，由於工作需要，他被分配到了焊接崗位。

日本的丈母孃，賣萌發嗲也是蠻有技術的

國內這點估計是比不過了

消費水平最高的5座城市，北上廣深均在列，另一座你知道是哪嗎？

我們都知道在地大物博的中國，擁有很多城市，而它們之間的等級劃分也都是不同的，等級越高，往往消費就會越高，那麼說起國內消費水平最高的幾座城市，夥伴們都知道是哪裡嗎？接下來就讓小編帶大家去了解一下吧，看看有沒有你心中的那個。

德國愛他美怎麼樣？"斷貨王"愛他美值得買嗎？

哈哈。每次都會用iGepir 姐姐推薦來的，小寶從6個月混養喝起，現在快1歲半了，一直喝愛他美，不上火，購入量大，也算全心全意支持國際媽咪了

廣東有望合併的3座城市：合併成功後，將誕生一座千萬人口的城市

相信大家都知道，目前廣東是中國經濟實力最強的城市，哪怕是國內富有的浙江和江蘇，在經濟上也被廣東牢牢按住。你要知道廣東可是中國唯一有一線城市的省份，而且還是兩座。光靠這一點就能讓全國所有的省份羨慕，但比較遺憾的是，廣東的經濟發展似乎並不平衡。

國外奶粉怎麼樣？去哪買靠譜？線下實體店一定比網店安全嗎？

之前買的一直是國際媽咪的海外倉，但是疫情的緣故怕被吧斷糧所以在海外倉直郵了一箱又在自貿倉補了一箱，反正奶粉是消耗品，不擔心吃不完hhh。自貿倉物流速遞還是很快的，重慶保稅區發貨，4天到達。

四川潛力大的城市：還是重要的恐龍化石產地，被譽為“恐龍之鄉”

對此有的網友說:很多人可能不知道，其實我們自貢還有飛機制造，汽車製造，新能源汽車，及新能源電池研發與製造產業，雖然剛起步，但未來可期!

00後，吾輩當自強

當記者採訪她時，她說了一句讓人永生難忘的話:“其實我們並不是什麼逆行者，只不過是一些普通人在堅守自己的使命。

“我來！”

十天，我應該可以讀完一本《百年孤獨》，應該可以學會用吉他彈一首歌，還應該可以追完一部電視劇《慶餘年》。

東北唯一新一線城市：被譽為“東方魯爾”，經濟卻不如省內地級市

眾所周知這幾年東北的經濟，確實沒有以前增長得那麼快了。原因相信大家也很清楚，簡單點說就是南方更適合發展經濟。因此中國的經濟重心向南移動，所以在未來的幾年甚至幾十年裡面，中國南方的經濟都會比北方強。特別是廣東省跟浙江省的經濟水平，目前已經超越世界上大部分國家了。

人生有尺，做人有度

“救命錢”變“唐僧肉” 扶貧最後一公里處“蠅貪”頻現！

家境殷實的90後海歸女為何“沉迷”偷快遞？

青春洋溢，不加過分修飾，真實的少女感，你喜歡嗎？

4名網友預謀綁架一董事長，匯合後劇情突變……

江蘇的第二個“蘇州”，並非南京和無錫，而是這座低調的城市

說起蘇州的大名，相信是無人不知，無人不曉的，作為我國名副其實的最強地級市，蘇州近些年屬實為人們帶來了很大驚喜，甚至在經濟發展上也已經遠超省會南京，而今天小編要為大家帶來的則是江蘇境內的“第二個蘇州”，發展潛力巨大，並非南京和無錫，而是這座十分低調的城市。

經典搜索核心算法：BM25及其變種

相關文章:

疫情還沒結束，又一場“災難”逼近！算法，終究吞噬了人的智商

中文數字一二三+算法——多個數連續加計算方法

它用“算法+紅娘”模式幫小鎮青年找對象，一年拿下4000萬用戶

我們還有一場更為關鍵的戰役要打，這就是人和“算法”的鬥爭！

人和“算法”的鬥爭！人類又一場災難來襲！

老坑南齊！皮殼起油，大面積開窗不變種。肉質細膩、膠感足 ！

PS教程：高低頻磨皮其實很簡單，高低頻原理的超詳細說明

賣得很好的產品，銷量莫名下降怎麼辦？

常用算法之滑動窗口

一個著名的最貪心也最厲害的算法——Dijkstra算法

拼多多店鋪如何快速提升銷量和排名？

更新後的掃地機有多了哪些功能

洪量老師：企業是企業家帶著一群人做一件有意義的事情

稱球問題的通用解法

快速求出淘汰賽中輪空場次-最簡單的算法

如何分配社會悲劇

巧算79764168÷7986

終於有人把數據、信息、算法、統計、概率和數據挖掘都講明白了！

生產成本控制：減少消除控制法，如何控制生產中兩類減少三類消除

銅排計算方法、折彎經驗計算表、銅排載流量，銅排截面積計算公式

一文了解刀具和刀具半徑補償，想不看都難！

算法“急轉彎”——燃香計時

為什麼有的身份證號末位數字是“X”的，有什麼特殊的含義嗎？

樑鋼筋算量的基本方法

「坐在馬桶上看算法」算法6：只有五行的Floyd最短路算法

最快最簡單的排序——桶排序

永動機“成功”案例，不可思議的“永動”

火爆刷單界的“凌晨單”，到底是什麼邏輯？

十大經典圖算法PageRank

懂你背後的苦

變種「校園貸」已捲土重來，該如何防範

限流算法：漏桶與令牌桶

崔永元最新發文，看這四個傻逼，不知道吃了誰拉岀來的優越感

《天賦異稟》第二季里德超能力覺醒，實力足以毀滅整個城市

09.26 學術動態：單繞組無軸承開關磁阻電機的繞組開路故障容錯控制策略

08.30 終於有人把數據、信息、算法、統計、概率和數據挖掘都講明白了！

08.13 超全的人工及材料用量算法 造價人員都在用！

06.22 教孩子最快速算法

這種特性爲一些好事者提供了一種創造新病毒的捷徑

05.15 限流算法之令牌桶算法、漏桶算法

05.07 自建房鋼筋算量不求人，記住各部位鋼筋計算公式，自己也能做預算

04.30 聚類算法之凝聚聚類

04.24 目前最快最簡單的神速排序算法——桶排序

02.18 算法——遞歸（以漢諾塔為例）

02.02 即使不背九九乘法表也能用畫線數點法來計算乘法

01.26 “兒童邪典片”肆虐，算法“價值中立”論最該批！

頭條年底上頭條的方式竟然是這樣的！

盤點！那些載入史冊的計算機病毒

人臉識別算法的巔峯之際，爲什麼需求最痛的安防行業還是無法大規模應用？

沈巍先生雜談（358）說好的快手不倒，陪伴到老呢？個個都是戲精

出海奮鬥是有膽識後浪的更優選項

甲有5套房，不上班，收房租；乙有1套房，上班賺工資；丙租房子.

每逢佳節被相親，單身青年看這裡！

為珠峰“量身高”，為啥要人上去？

我省獲國家局通報表揚

湖南名字最尷尬的城市，90%的人都會想歪，當地人：思想有問題！

超六成前浪點贊《後浪》，全球白手起家90後富豪人均財富190億

再不來一場精緻野餐，我就要被開除中產籍了

工程師我只服中國，曾經放生到三峽的1萬條魚，如今怎麼樣了？

後疫情時代的五個營銷啟示

丘北縣雙龍營鎮人民政府普者黑村委會、矣則村委會太陽能路燈採購安裝項目競爭性談判公告

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了

肖戰視頻專訪：眼裡帶著故事，請不要聽說他，這一次，請他說

秦山核電應急行動水平優化項目招標公告

巴基斯坦SK水電站消防及火災報警系統設備採購招標招標公告

中煤能源新疆鴻新煤業葦子溝煤礦瓦斯抽採機械設備採購招標公告

縣域社區團購，在平臺發展上有哪些優勢？

和王為念離婚，與“假奶奶”常香玉對簿公堂，55歲小香玉生活如詩

眼力測試：由4字組成的白菜，1秒看出4個字的智商都很高

看圖猜字：這個不簡單，你能猜對幾個？全猜對眼力非凡

眼力測試：火焰中藏了4個字，看出3個算達標，全看出眼力200

小米硬剛德國雙立人，400年非洲灌木做家用砧板，不發黴砍不壞

眼力測試：美女圖中藏了5個漢字，全部看出來的眼力超群

最萌Hodler，剛出生就收到比特幣大學教育基金的寶寶

《瞭望大灣區》：全國中高風險區域今日“清零”

《晨會解讀》：中山證券投資顧問楊立華：連續上漲過後注意把握好操作節奏

老坑南齊！皮殼起油，大面積開窗不變種。肉質細膩、膠感足！

08.13 超全的人工及材料用量算法造價人員都在用！

衡水：守護一湖碧水打造生態之城

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度