一文簡單理解“推薦系統”原理及架構

2020-02-06 19:17:25 運營增長

：本文主要介紹什麼是推薦系統，為什麼需要推薦系統，如何實現推薦系統的方案，包括實現推薦系統的一些常見模型，希望給讀者提供學習實踐參考。

為什麼需要推薦系統

對於信息消費者，需要從大量信息中找到自己感興趣的信息，而在信息過載時代，用戶難以從大量信息中獲取自己感興趣、或者對自己有價值的信息。

對於信息生產者，需要讓自己生產的信息脫穎而出，受到廣大用戶的關注。從物品的角度出發，推薦系統可以更好地發掘物品的長尾（long tail）。

長尾效應是美國《連線》雜誌主編 Chris Anderson 在 2006 年出版的《長尾理論》一書中指出，傳統的 80/20 原則（80% 的銷售額來自於 20% 的熱門品牌）在互聯網的加入下會受到挑戰。互聯網條件下，由於貨架成本極端低廉，電子商務網站往往能出售比傳統零售店更多的商品。這些原來不受到重視的銷量小但種類多的產品或服務由於總量巨大，累積起來的總收益超過主流產品的現象。

主流商品往往代表了絕大多數用戶的需求，而長尾商品往往代表了一小部分用戶的個性化需求。推薦系統通過發掘用戶的行為，找到用戶的個性化需求，從而將長尾商品準確地推薦給需要它的用戶，幫助用戶發現那些他們感興趣但很難發現的商品。

推薦系統的任務在於：

一方面幫助用戶發現對自己有價值的信息。
另一方面讓信息能夠展現在對它感興趣的用戶面前，從而實現信息消費者和信息生產者的雙贏。

推薦系統的本質

通過一定的方式將用戶和物品聯繫起來，而不同的推薦系統利用了不同的方式。

推薦系統就是自動聯繫用戶和物品的一種工具，它能夠在信息過載的環境中幫助用戶發現令他們感興趣的信息，也能將信息推送給對它們感興趣的用戶。

評價指標

從產品的角度出發，評價一個推薦系統可以從以下維度出發：

用戶滿意度：用戶作為推薦系統的重要參與者，其滿意度是評測推薦系統的最重要指標。但是，用戶滿意度沒有辦法離線計算，只能通過用戶調查或者在線實驗獲得。
預測準確度：預測準確度度量一個推薦系統或者推薦算法預測用戶行為的能力。這個指標是最重要的推薦系統離線評測指標，從推薦系統誕生的那一天起，幾乎 99% 與推薦相關的論文都在討論這個指標。在計算該指標時需要有一個離線的數據集，該數據集包含用戶的歷史行為記錄。然後，將該數據集通過時間分成訓練集和測試集。最後，通過在訓練集上建立用戶的行為和興趣模型預測用戶在測試集上的行為，並計算預測行為和測試集上實際行為的重合度作為預測準確度。
覆蓋率：覆蓋率（ coverage ）描述一個推薦系統對物品長尾的發掘能力。覆蓋率有不同的定義方法，最簡單的定義為推薦系統能夠推薦出來的物品佔總物品集合的比例。
多樣性：用戶的興趣是廣泛的，為了滿足用戶廣泛的興趣，推薦列表需要能夠覆蓋用戶不同的興趣領域，即推薦結果需要具有多樣性。
新穎性：新穎的推薦是指給用戶推薦那些他們以前沒有聽說過的物品。在一個網站中實現新穎性的最簡單辦法是，把那些用戶之前在網站中對其有過行為的物品從推薦列表中過濾掉。
驚喜度：與新穎性不同，如果推薦結果和用戶的歷史興趣不相似，但卻讓用戶覺得滿意，那麼就可以說推薦結果的驚喜度很高，而推薦的新穎性僅僅取決於用戶是否聽說過這個推薦結果。
信任度：對於基於機器學習的自動推薦系統，同樣存在信任度（ trust ）的問題，如果用戶信任推薦系統，那就會增加用戶和推薦系統的交互。同樣的推薦結果，以讓用戶信任的方式推薦給用戶就更能讓用戶產生購買慾，而以類似廣告形式的方法推薦給用戶就可能很難讓用戶產生購買的意願。度量推薦系統的信任度只能通過問卷調查的方式，詢問用戶是否信任推薦系統的推薦結果。
實時性：推薦系統需要實時地更新推薦列表來滿足用戶新的行為變化，推薦系統需要能夠將新加入系統的物品推薦給用戶。這主要考驗了推薦系統處理物品冷啟動的能力。
健壯性：任何一個能帶來利益的算法系統都會被人攻擊，這方面最典型的例子就是搜索引擎。搜索引擎的作弊和反作弊鬥爭異常激烈，而健壯性（即 robust，魯棒性）指標衡量了一個推薦系統抗擊作弊的能力。

基於用戶行為推薦

用戶行為

用戶行為可以分為顯性反饋行為（explicit feedback）和隱性反饋行為（implicit feedback）。

顯性反饋行為：指用戶明確表示對物品喜好的行為，主要方式就是評分和喜歡/不喜歡。

常見的顯性反饋行為可以參考如下表格：

隱性反饋行為（implicit feedback）：指的是那些不能明確反應用戶喜好的行為。最具代表性的隱性反饋行為就是頁面瀏覽行為。用戶瀏覽一個物品的頁面並不代表用戶一定喜歡這個頁面展示的物品，比如可能因為這個頁面鏈接顯示在首頁，用戶更容易點擊它而已。

相比顯性反饋，隱性反饋雖然不明確，但數據量更大。在很多網站中，很多用戶甚至只有隱性反饋數據，而沒有顯性反饋數據。

基於用戶行為數據設計的推薦算法一般稱為協同過濾算法。學術界對協同過濾算法進行了深入研究，提出了很多方法。

比如基於鄰域的算法（neighborhood-based）、隱語義模型（latent factor model）、基於圖的隨機遊走算法（random walk on graph）等。

下面主要展開介紹基於領域的算法和隱語義模型算法。

基於領域的算法

基於鄰域的方法是最著名的、在業界得到最廣泛應用的推薦算法，主要包含下面兩種算法：

基於用戶的協同過濾算法(UserCF)。
基於物品的協同過濾算法(ItemCF)。

算法涉及的基本步驟如下：

收集用戶偏好，把用戶對物品的偏好轉換成可量化的綜合評分值。
找到相似的用戶或物品。
計算推薦。

相似度計算

計算相似度主要有以下 3 種計算方式：

①歐氏距離（Euclidean Distance）

向量歐式距離：

相似度：

②皮爾遜相關係數（Pearson Correlation Coefficient）

協方差，用來衡量 2 個向量的變化趨勢是否一致：

標準差：

皮爾遜相關係數：

皮爾遜相關係數使用協方差除以 2 個向量的標準差得到，值的範圍[-1，1]。

③Cosine 相似度（Cosine Similarity，餘弦距離）

Cosine 相似度其實就是求 2 個向量的夾角。3 種計算相關係數的算法中，皮爾遜相關係數在生產中最為常用。

鄰居的選擇

通過相似度計算出若干個最相似的鄰居後，如何選擇鄰居？主要有以下方式：

基於固定數量的鄰居：該方式直接選擇固定數量的鄰居，有可能把相似度較小的對象也引入。
基於相似度門檻的鄰居：該方式先用相似度門檻篩選出鄰居的一個集合，再從集合裡面挑選出相似度較大的鄰居。可以避免把相似度較小的對象引入，效果更好。

基於用戶的協同過濾算法(UserCF)

簡單而言，就是給用戶推薦和他興趣相似的其他用戶喜歡的物品。

在一個在線個性化推薦系統中，當一個用戶 A 需要個性化推薦時，可以先找到和他有相似興趣的其他用戶，然後把那些用戶喜歡的、而用戶 A 沒有聽說過的物品推薦給 A 。這種方法稱為基於用戶的協同過濾算法。

用戶 A 與用戶 C 的興趣比較相似，用戶 C 喜歡了物品 4，所以給用戶 A 推薦物品 4。

數學實現如下圖：

已知用戶評分矩陣 Matrix R（一般都是非常稀疏的），推斷矩陣中問號處的評分值。

UserCF 模型存在問題：

對於一個新用戶，很難找到鄰居用戶。
對於一個新物品，所有最近的鄰居都在其上沒有多少打分。

基礎解決方案：

相似度計算最好使用皮爾遜相似度。
計算用戶相似度考慮共同打分物品的數目。比如乘上，n 為共同打分的商品數，N 為指定閾值，這樣可以讓 2 個用戶的共同打分的商品數越少，相似度越小。
對打分進行歸一化處理，比如把原來分數值範圍是[0，10]，歸一化後變成[0，1]。
設置一個相似度閾值。

基於用戶的協同過濾不流行的原因：

數據稀疏問題，數據存取困難。
數百萬用戶計算，用戶之間兩兩計算相似度，計算量過大。
人是善變的。

基於物品的協同過濾算法(ItemCF)

基於物品的協同過濾算法（簡稱 ItemCF）就是給用戶推薦那些和他們之前喜歡的物品相似的物品。比如，該算法會因為你購買過《數據挖掘導論》而給你推薦《機器學習》。

不過，ItemCF 算法並不利用物品的內容屬性計算物品之間的相似度，它主要通過分析用戶的行為記錄計算物品之間的相似度。該算法認為，物品 A 和物品 B 具有很大的相似度是因為喜歡物品 A 的用戶大都也喜歡物品 B。

物品 1 和物品 3 都被用戶 A 和用戶 B 喜歡，所以認為是相似物品，所以當用戶 C 喜歡物品 1，就給用戶 C 推薦物品 3。

算法主要步驟如下：

計算物品之間的相似度。
根據物品的相似度和用戶的歷史行為給用戶生成推薦列表。

數學實現思路如下圖：

需要用戶 5 對物品 1 的評分 r_15，由於物品 3、物品 6 是與物品 1 最為相似的 2 個物品，取相似度作為權重，所以 r_15 可以預測如下：

模型優勢：

計算性能高，通常用戶數量遠大於物品數量，實際計算物品之間的相似度，可以只選擇同一個大分類下的類似物品來計算，以此減少計算量。
可預先保留結果，物品並不善變。

UserCF 和 ItemCF 綜合比較

UserCF 給用戶推薦那些和他有共同興趣愛好的用戶喜歡的物品，而 ItemCF 給用戶推薦那些和他之前喜歡的物品類似的物品。

從這個算法的原理可以看到：

UserCF 的推薦結果著重於反映和用戶興趣相似的小群體的熱點。
ItemCF 的推薦結果著重於維繫用戶的歷史興趣。

換句話說：

UserCF 的推薦更社會化，反映了用戶所在的小型興趣群體中物品的熱門程度。
ItemCF 的推薦更加個性化，反映了用戶自己的興趣傳承。

基於用戶標籤推薦

推薦系統的目的是聯繫用戶的興趣和物品，這種聯繫需要依賴不同的媒介。

目前流行的推薦系統基本上通過 3 種方式聯繫用戶興趣和物品：

基於用戶推薦 UserCF：利用和用戶興趣相似的其他用戶，給用戶推薦那些和他們興趣愛好相似的其他用戶喜歡的物品。
基於物品推薦 ItemCF：給用戶推薦與他喜歡過的物品相似的物品。
基於特徵：這裡的特徵有不同的表現方式，比如可以表現為物品的屬性集合（比如對於圖書，屬性集合包括作者、出版社、主題和關鍵詞等），也可以表現為隱語義向量（latent factor vector）。

標籤相關問題

標籤的定義

根據維基百科的定義，標籤是一種無層次化結構的、用來描述信息的關鍵詞，它可以用來描述物品的語義。

根據給物品打標籤的人的不同，標籤應用一般分為兩種：

一種是讓作者或者專家給物品打標籤。
另一種是讓普通用戶給物品打標籤，也就是 UGC（User Generated Content，用戶生成的內容）的標籤應用 UGC 的標籤系統是一種表示用戶興趣和物品語義的重要方式。

當一個用戶對一個物品打上一個標籤，這個標籤一方面描述了用戶的興趣，另一方面則表示了物品的語義，從而將用戶和物品聯繫了起來。因此下面主要討論 UGC 的標籤應用，研究用戶給物品打標籤的行為，探討如何通過分析這種行為給用戶進行個性化推薦。

用戶為什麼要打標籤

從產品的角度，我們需要理解用戶打標籤的行為，為什麼要打標籤，只有深入瞭解用戶的行為，我們才能基於這個行為設計出令他們滿意的個性化推薦系統。

用戶這個行為背後的原因主要可以從 2 個維度進行探討：

社會維度，有些用戶標註是給內容上傳者使用的（便於上傳者組織自己的信息），而有些用戶標註是給廣大用戶使用的（便於幫助其他用戶找到信息）。
功能維度，有些標註用於更好地組織內容，方便用戶將來的查找，而另一些標註用於傳達某種信息，比如照片的拍攝時間和地點等。

用戶打什麼樣的標籤

用戶常打的標籤如下：

表明物品是什麼。
表明物品的種類。
表明誰擁有物品，比如很多博客的標籤中會包括博客的作者等信息。
表達用戶的觀點，比如用戶認為網頁很有趣，就會打上標籤 funny（有趣），認為很無聊，就會打上標籤 boring（無聊）。
用戶相關的標籤，比如 my favorite（我最喜歡的）、my comment（我的評論）等。
用戶的任務，比如 to read（即將閱讀）、 job search（找工作）等。

為什麼要給用戶推薦標籤

用戶瀏覽某個物品時，標籤系統非常希望用戶能夠給這個物品打上高質量的標籤，這樣才能促進標籤系統的良性循環。因此，很多標籤系統都設計了標籤推薦模塊給用戶推薦標籤。

一般認為，給用戶推薦標籤有以下好處：

方便用戶輸入標籤，讓用戶從鍵盤輸入標籤無疑會增加用戶打標籤的難度，這樣很多用戶不願意給物品打標籤，因此我們需要一個輔助工具來減小用戶打標籤的難度，從而提高用戶打標籤的參與度。
提高標籤質量，同一個語義不同的用戶可能用不同的詞語來表示。這些同義詞會使標籤的詞表變得很龐大，而且會使計算相似度不太準確。而使用推薦標籤時，我們可以對詞表進行選擇，首先保證詞表不出現太多的同義詞，同時保證出現的詞都是一些比較熱門的、有代表性的詞。

如何給用戶推薦標籤

用戶 u 給物品 i 打標籤時，我們有很多方法可以給用戶推薦和物品 i 相關的標籤。

比較簡單的方法有 4 種：

給用戶 u 推薦整個系統裡最熱門的標籤（這裡將這個算法稱為 PopularTags），這個算法太簡單了，甚至於不能稱為一種標籤推薦算法。
給用戶 u 推薦物品 i 上最熱門的標籤（這裡將這個算法稱為 ItemPopularTags）。

用戶 u 推薦他自己經常使用的標籤（這裡將這個算法稱為 UserPopularTags）。
前面兩種的融合（這裡記為 HybridPopularTags），該方法通過一個係數將上面的推薦結果線性加權，然後生成最終的推薦結果。

一個最簡單的算法

基本步驟如下：

統計每個用戶最常用的標籤。
對於每個標籤，統計被打過這個標籤次數最多的物品。
對於一個用戶，首先找到他常用的標籤，然後找到具有這些標籤的最熱門物品推薦給這個用戶。

對於上面算法，用戶 u 對於物品 i 的興趣公式如上：

是用戶 u 打過的標籤集合。
是物品 i 被打過標籤的集合。
是用戶 u 打過標籤 b 的次數。
是物品 i 被打過標籤 b 的次數。

某用戶使用過“幽默”標籤 10 次，“搞笑”標籤 3 次，“諷刺”標籤 6 次。這 3 個標籤被物品 A 使用的次數分別的 4、7、2。

由此計算用戶對物品的興趣值為：

上面的計算公式會傾向於給熱門標籤對應的熱門物品很大的權重，因此會造成推薦熱門的物品給用戶，從而降低推薦結果的新穎性，還有數據稀疏性的問題，可以通過計算結果除以懲罰項來進行修正。

系統冷啟動問題

問題簡介

系統冷啟動（cold start）問題主要在於如何在一個新開發的網站上（還沒有用戶，也沒有用戶行為，只有一些物品的信息）設計個性化推薦系統，從而在網站剛發佈時就讓用戶體驗到個性化推薦服務這一問題。

主要可以分為 3 類：

用戶冷啟動：用戶冷啟動問題主要在於如何給新用戶做個性化推薦。當新用戶到來時，我們沒有他的行為數據，所以也無法根據他的歷史行為預測其興趣，從而無法藉此給他做個性化推薦。
物品冷啟動：物品冷啟動問題主要在於如何解決將新的物品推薦給可能對它感興趣的用戶。
系統冷啟動：系統剛剛新上線，用戶、物品數據較少。

解決思路

針對上述 3 類冷啟動問題，一般來說，可以參考如下解決方案：

提供非個性化的推薦：非個性化推薦的最簡單例子就是熱門排行榜，我們可以給用戶推薦熱門排行榜，然後等到用戶數據收集到一定的時候，再切換為個性化推薦。這也是最常見的解決方案。
利用用戶註冊時提供的年齡、性別等數據做粗粒度的個性化。
要求用戶在首次登錄時提供反饋，比如輸入感興趣的標籤，或感興趣的物品。收集用戶對物品的興趣信息，然後給用戶推薦那些和這些物品相似的物品。
對於新加入的物品，可以利用內容信息，將它們推薦給喜歡過和它們相似的物品的用戶。
在系統冷啟動時，可以引入專家的知識，通過一定的高效方式迅速建立起物品的相關度表。

評估指數

令

是根據用戶在訓練集上的行為給用戶作出的推薦列表，

是用戶在測試集上的行為列表。

準確率

用於度量模型的預測值與真實值之間的誤差。

召回率

用於度量有多個正例被分為正例，這裡是正確推薦的數量佔測試集合上用戶行為列表的比例。

覆蓋率

用戶衡量推薦的物品佔全部商品的比例，一般我們推薦的物品希望儘可能覆蓋更多類別。

常見有 2 種計算方法：

通過推薦的商品佔總商品的比例：

或者通過推薦物品的熵值得到覆蓋率，熵值越大，覆蓋率越大：

多樣性

用於衡量每次推薦裡面的推送的物品佔所有可能性的比率，多樣性越大，每次推薦的物品越豐富。

實際上，不同的平臺還有不同的衡量標準，例如用戶滿意度，廣告收益，需要結合實際業務情況做策略調整。

系統架構

基於特徵的推薦系統

再次回顧一下上面提到的推薦系統聯繫用戶和物品的 3 種途徑。

將這 3 種方式都抽象一下就可以發現，如果認為用戶喜歡的物品也是一種用戶特徵，或者和用戶興趣相似的其他用戶也是一種用戶特徵，那麼用戶就和物品通過特徵相聯繫。

用戶特徵種類特別多，主要包括以下幾類：

用戶註冊屬性：年齡、性別、國籍等。
用戶行為特徵：瀏覽、點贊、評論、購買等。

系統整體架構

由於推送策略本身的複雜性，如果要在一個系統中把上面提到的各種特徵和任務都統籌考慮，那麼系統將會非常複雜，而且很難通過配置文件方便地配置不同特徵和任務的權重。

因此，推薦系統需要由多個推薦引擎組成，每個推薦引擎負責一類特徵和一種任務，而推薦系統的任務只是將推薦引擎的結果按照一定權重或者優先級合併、排序然後返回。

這樣做有 2 個好處：

可以方便地增加/刪除引擎，控制不同引擎對推薦結果的影響。對於絕大多數需求，只需要通過不同的引擎組合實現。
可以實現推薦引擎級別的用戶反饋。每一個推薦引擎其實代表了一種推薦策略，而不同的用戶可能喜歡不同的推薦策略：

有些用戶可能喜歡利用他的年齡性別作出的推薦。
有些用戶可能比較喜歡看到新加入的和他興趣相關的視頻。
有些用戶喜歡比較新穎的推薦。
有些用戶喜歡專注於一個鄰域的推薦。
有些用戶喜歡多樣的推薦。

我們可以將每一種策略都設計成一個推薦引擎，然後通過分析用戶對推薦結果的反饋瞭解用戶比較喜歡哪些引擎推薦出來的結果，從而對不同的用戶給出不同的引擎組合權重。

推薦引擎架構

推薦引擎使用一種或幾種用戶特徵，按照一種推薦策略生成一種類型物品的推薦列表，基本架構如下圖：

如上圖，推薦引擎架構主要包括 3 部分：

用戶行為數據模塊：圖中 A 部分，該部分負責從數據庫或者緩存中拿到用戶行為數據，通過分析不同行為，生成當前用戶的特徵向量。不過如果是使用非行為特徵，就不需要使用行為提取和分析模塊了。該模塊的輸出是用戶特徵向量。
物品數據模塊：圖中 B 部分，該部分負責將用戶的特徵向量通過特徵-物品相關矩陣轉化為初始推薦物品列表。
最終結果生成模塊：圖中 C 部分，該部分負責對初始的推薦列表進行過濾、排名等處理，從而生成最終的推薦結果。

其中，有幾個模塊需要特別介紹一下：

候選物品集合：特徵-物品相關推薦模塊還可以接受一個候選物品集合。候選物品集合的目的是保證推薦結果只包含候選物品集合中的物品。它的應用場合一般是產品需求希望將某些類型的電視劇推薦給用戶。比如有些產品要求給用戶推薦最近一週加入的新物品，那麼候選物品集合就包括最近一週新加的物品。
過濾模塊：在得到初步的推薦列表後，還不能把這個列表展現給用戶，首先需要按照產品需求對結果進行過濾，過濾掉那些不符合要求的物品。一般來說，過濾模塊會過濾掉以下物品：

用戶已經產生過行為物品，因為推薦系統的目的是幫助用戶發現物品，因此沒必要給用戶推薦他已經知道的物品，這樣可以保證推薦結果的新穎性。
候選物品以外的物品，候選物品集合一般有兩個來源，一個是產品需求。比如在首頁可能要求將新加入的物品推薦給用戶，因此需要在過濾模塊中過濾掉不滿足這一條件的物品。另一個來源是用戶自己的選擇，比如用戶選擇了某一個價格區間，只希望看到這個價格區間內的物品，那麼過濾模塊需要過濾掉不滿足用戶需求的物品。
某些質量很差的物品，
為了提高用戶的體驗，推薦系統需要給用戶推薦質量好的物品，那麼對於一些絕大多數用戶評論都很差的物品，推薦系統需要過濾掉。這種過濾一般以用戶的歷史評分為依據，比如過濾掉平均分在 2 分以下的物品。

排名模塊：經過過濾後的推薦結果直接展示給用戶一般也沒有問題，但如果對它們進行一些排名，則可以更好地提升用戶滿意度。實際進行排名時，可以基於新穎性、多樣性、用戶反饋進行排名優化。

總結

除了本文介紹的模型算法，基於用戶行為推薦還有隱語義模型，基於圖的模型比較常見，還有的基於上下文、社交網絡推薦。實際有一些常見的算法庫可以實現推薦系統運算，包括 LibRec，Crab 等。

分享到:

閱讀更多 運營增長 的文章

關鍵字: 伴隨成長的中國味品牌長尾架構

公章被搶、被盜怎麼辦？誰有權聲明公章作廢？蓋章、簽字、摁手印哪個最有用？一文看懂有關“公章”那些事！

拜讀魏永寧老師《民歌不放棄——訪甘谷縣民歌手張金錄》一文

一文詳解2019年燃料電池汽車發展概況

一文講解清楚質量成本—全面質量成本管理培訓教材

【科普】一文帶你讀懂電價體系

一文速覽科技抗疫最新進展

科普｜你瞭解電價嗎？一文帶你讀懂電價體系

解析《鮑某明涉嫌性侵養女》一文，網友評論：現代版“揚州瘦馬”

一文讀懂985、211、華東五校、國防七子、兩財一貿

小楷節錄北溪字義一文

評“請外貿人不要賤賣中國的防疫物資”一文

圖文並茂，一文看懂：舊村改造可研如何做項目分析

乾貨︱一文讀懂戴爾科技流數據平臺

應修得——《飽含中國深情傳播中國大愛》一文題

我們應從“法官對公安辦案弱點評判”一文中得到什麼啟示

精益管理簡圖，一文讀懂精益落地路徑

03.06 精益管理簡圖，一文讀懂精益落地路徑

12.20 一文讀懂伺服運動控制器

一文讀懂——浪潮網絡智慧校園白皮書

危險源辨識及風險控制，一文讀懂

10.10 「中級實操」一文看懂：中級消防設施操作員實操考試

精益管理簡圖，一文讀懂精益落地路徑「精益管理」

評《于丹被北師大免職！跌落“神壇”……》一文

一文看懂電梯電氣電路圖，實用！

中科大學報《費米實驗室繆子實驗概況》一文數據錯誤，請勘誤！

懟死鄒小櫻 02號作品｜回覆《陳綺貞的中年危機》一文

懟死鄒小櫻 03號作品｜回覆《陳綺貞的中年危機》一文

仟邦資都資訊：一文看懂：貸款利息、罰息與滯納金的區別

應收票據、應收賬款、其他應收款、預付賬款傻傻分不清？一文讀懂

變頻器知識大全，一文講解變頻器的安裝、外部線路、參數設定

「過壓脫扣式」斷路器——簡介、原理、接線

「欠壓脫扣式」斷路器——簡介、原理、接線

「報警輔助觸頭」斷路器——簡介、原理、常開常閉點

「輔助觸頭」斷路器——簡介、原理、常開常閉點

「分勵脫扣式」斷路器——簡介、原理、注意事項、接線

「漏電保護式」斷路器——（斷路器+漏電裝置）簡介、原理、詳解

「乾貨收藏」一文讀懂高低壓開關櫃製造與檢驗

故事選《金蟬》

液位繼電器——原理、運用、接線

《新華文摘》全文轉載任翔教授在我刊發表的《閱讀的力量》一文

互感器知識詳解，一文全搞定！

增值稅稅控設備，這10個問題您清楚嗎？一文讀懂

一文「吃」透7月30日杭州網紅餐飲

如何看待7月25日《章文，停止你的侵害！！！！》一文？

因曾出席伊朗學術活動赴美參與SIGIR被拒，知名信息檢索教授怒寫「開放的科學」一文

駁某安《和這種男人交往，最可怕》一文

駁斥「押注面板業務 TCL陣痛過後能否重生？」一文

乾貨｜一文讀懂編碼器（推薦收藏）

如何評價觀察者網《我問你答，真有許多女孩更喜歡老外》一文

沈巍先生雜談（358）說好的快手不倒，陪伴到老呢？個個都是戲精

轉念一想，這種看似不正常的狀態才是正常的，隨著時間的推移，很多過去迷迷糊糊的人慢慢就看清了，是進是退跟著內心走就好，別管什麼善始善終，不要被這種論調道德綁架，過段時間，你覺得可以，再回來就行，開關在你自己手裡，一秒鐘就能完成進退。

出海奮鬥是有膽識後浪的更優選項

東南亞11國，除去東帝汶，其他10國組成東盟。東南亞有多熱，從很多國際資本的快速湧入都有目共睹。養老產業：泰國、越南、菲律賓、馬來西亞、印尼都是大受歐美日韓退休人士歡迎的亞洲養老目的地。

甲有5套房，不上班，收房租；乙有1套房，上班賺工資；丙租房子.

每逢佳節被相親，單身青年看這裡！

“非常戰疫

為珠峰“量身高”，為啥要人上去？

6日，2020珠峰高程測量行動測量登山隊舉行出發儀式，30多名計劃登頂的測量登山隊員當日從海拔5200米的珠峰登山大本營向更高海拔出發，計劃抓住近日的天氣窗口，擇日登頂測量。如果成功，這將成為我國專業測繪人員首次登頂珠峰測高。

我省獲國家局通報表揚

湖南名字最尷尬的城市，90%的人都會想歪，當地人：思想有問題！

湖南省作為中國中南地區的一個省份，經濟強勁，地位獨特，有著十足的發展後勁。湖南經濟總量在全國排名第九。湖南也是華夏文明的發祥地，境內的炎帝陵，成為華夏兒女尋根祭祖的重要場所。南嶽衡山就在湖南衡陽。湖南張家界景區成為馳名中外的旅遊景點。湖南湘西鳳凰古鎮成為中國馳名十大古鎮之一。

超六成前浪點贊《後浪》，全球白手起家90後富豪人均財富190億

再不來一場精緻野餐，我就要被開除中產籍了

《新週刊》創刊於1996年8月18日，由南方出版傳媒股份有限公司主管、主辦，以“中國最新銳的生活方式週刊”為定位，推出過一系列極具影響力的專題報道，是中國期刊市場最具代表性和影響力的雜誌之一，享有“話題策源地”的美譽。

工程師我只服中國，曾經放生到三峽的1萬條魚，如今怎麼樣了？

每一個大項目其實都會面臨一個問題，那就是生態環境，因為所涉及的範圍實在太廣了，所以需要考慮的問題都是多方面的，三峽就是我國早期的一個超大體量的工程，而三峽所涉及的問題也很多。三峽其實一直都是我國的驕傲，但是關於三峽的質疑聲，其實也一點都不少，特別是關於三峽環境方面的質疑聲。

後疫情時代的五個營銷啟示

現象級白酒——李渡高粱酒，作為沉浸式/場景化營銷的開創者，早在幾年前就使用互聯網工具助力，疫情爆發後一系列的操作自然遊刃有餘了，銷量同比增加170%，線上銷量更是增加400%。

丘北縣雙龍營鎮人民政府普者黑村委會、矣則村委會太陽能路燈採購安裝項目競爭性談判公告

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了金子一直是我們中國人比較喜歡投資的一個東西，黃金飾品也是中國女性非常喜歡購買的東西，大家都知道，金子具有保值的功能，所以很多人既喜歡在銀行購買金條用於投資，又喜歡去一些金店購買黃金飾品。

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了大家都會知道，每到夏天，我們的沿海地區都是一個多風多雨的季節，這時候我們出門也是需要隨時帶上雨具，避免突然有暴風雨這些天氣的出現。

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了每次一到假期，就非常害怕到達火車站，可以說是基本上都是人山人海的感覺。很多人會為了方便去選擇去乘坐動車和高鐵。現在我們無論是出差還是去旅遊也都是會選擇去坐動車，又快又方便，主要還會很舒服。

肖戰視頻專訪：眼裡帶著故事，請不要聽說他，這一次，請他說

這是肖戰春節後，經歷過這麼多事後首次參加採訪。視頻中他依然是面帶微笑，依舊是少年的樣子。但是眼裡到這故事，說話也變得小心謹慎，談吐措辭也是越來越嚴謹了。

秦山核電應急行動水平優化項目招標公告

從中國電力集採招標網（www.dljczb.

巴基斯坦SK水電站消防及火災報警系統設備採購招標招標公告

從中國電力集採招標網（www.dljczb.

中煤能源新疆鴻新煤業葦子溝煤礦瓦斯抽採機械設備採購招標公告

從中國電力集採招標網（www.dljczb.

縣域社區團購，在平臺發展上有哪些優勢？

社區團購的迅速發展，已經不再侷限於各大城市中的小區。漸漸的擴大範圍，發展到一些城市邊緣的縣城鄉鎮。像是興盛優選、十薈團、食享會、考拉精選、美家買菜等月流水上億的社區團購頭部企業，都很重視下沉市場的佈局和開拓。

和王為念離婚，與“假奶奶”常香玉對簿公堂，55歲小香玉生活如詩

戲曲是以古代故事以及現代經典故事為題材的藝術表演，也是歷史悠久的綜合舞臺藝術樣式，表演戲曲難度很高，但戲曲人才依舊人才輩出，說起在戲曲圈中的佼佼者，陳百玲必是其一。

眼力測試：由4字組成的白菜，1秒看出4個字的智商都很高

這是一幅白菜圖，由4字組成的，1秒看出4個字的智商都很高！你看出來了嗎？

看圖猜字：這個不簡單，你能猜對幾個？全猜對眼力非凡

這福圖上的圖你能猜對幾個？全猜對眼力非凡，猜對3個眼力160，猜對3個是近視眼！你能猜對幾個字？

眼力測試：火焰中藏了4個字，看出3個算達標，全看出眼力200

熊熊火焰中藏了4個字，看出3個算達標，全看出眼力200！你能全部看出來嗎？

小米硬剛德國雙立人，400年非洲灌木做家用砧板，不發黴砍不壞

民以食為天。

眼力測試：美女圖中藏了5個漢字，全部看出來的眼力超群

這幅美女圖中藏了5個漢字，你能不能看出來是哪幾個漢字呢？全部看出來的眼力超群！

最萌Hodler，剛出生就收到比特幣大學教育基金的寶寶

作為比特幣愛好者，Izabella的父母在她出生當日於《泰晤士報》刊登了一則附帶比特幣地址的小廣告，希望廣大讀者能夠捐出小部分比特幣給他們女兒作為大學教育基金。

《瞭望大灣區》：全國中高風險區域今日“清零”

《晨會解讀》：中山證券投資顧問楊立華：連續上漲過後注意把握好操作節奏

孫鬆峰：幸福生活唱出來

河南市場安全網訊（www.hnscjgw.com）

衡水：守護一湖碧水打造生態之城

長城網衡水訊（記者張梅勝

英國小夥第一次體驗中國網吧，就被電腦屏幕嚇到直言：這是個啥

網吧其實不管是對於哪個國家的人來說，都是極具吸引力的，而在中國對於八九四年的年輕人和學生來說，網吧簡直就是快樂源泉，但是也是老師家長中的眼中釘，肉中刺。相信很多人小時候可能都有過被家長從網吧裡揪出來的不甚美好的回憶。

微商到底多能吹牛！哈哈哈哈哈千萬別屏蔽，每天都是快樂源泉

雖然有的時候在朋友圈裡有很多微商不停的發朋友圈，讓大家覺得有些困擾和煩悶，有一種私生活被侵擾的感覺。但是不要忙著屏蔽他們，有的時候這些總是吹得天花亂墜的微商也能給人們帶來快樂的源泉。

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度

5月6日，2020珠峰高程測量登山隊伍出發儀式正式舉行，30多名隊員當日從海拔5200米的登山大本營向更高海拔出發，開啟珠峰衝頂測量。隊員們力爭抓住近日的天氣窗口，擇日登頂測量。如果成功，這將是我國專業測繪人員首次登頂珠峰測高。

“十大沂蒙工匠”齊玉祥：鋼花璀璨照亮青春之路

一支焊槍、一面防護罩，鋼花白晝繁星，在刺耳的噪聲中點亮四壁，焊工齊玉祥用13年的青春，打磨出了人生最璀璨的鋼花。2007年，齊玉祥畢業後進入山東華源鍋爐有限公司工作。剛進公司沒多久，由於工作需要，他被分配到了焊接崗位。

日本的丈母孃，賣萌發嗲也是蠻有技術的

國內這點估計是比不過了

消費水平最高的5座城市，北上廣深均在列，另一座你知道是哪嗎？

我們都知道在地大物博的中國，擁有很多城市，而它們之間的等級劃分也都是不同的，等級越高，往往消費就會越高，那麼說起國內消費水平最高的幾座城市，夥伴們都知道是哪裡嗎？接下來就讓小編帶大家去了解一下吧，看看有沒有你心中的那個。

德國愛他美怎麼樣？"斷貨王"愛他美值得買嗎？

哈哈。每次都會用iGepir 姐姐推薦來的，小寶從6個月混養喝起，現在快1歲半了，一直喝愛他美，不上火，購入量大，也算全心全意支持國際媽咪了

廣東有望合併的3座城市：合併成功後，將誕生一座千萬人口的城市

相信大家都知道，目前廣東是中國經濟實力最強的城市，哪怕是國內富有的浙江和江蘇，在經濟上也被廣東牢牢按住。你要知道廣東可是中國唯一有一線城市的省份，而且還是兩座。光靠這一點就能讓全國所有的省份羨慕，但比較遺憾的是，廣東的經濟發展似乎並不平衡。

國外奶粉怎麼樣？去哪買靠譜？線下實體店一定比網店安全嗎？

之前買的一直是國際媽咪的海外倉，但是疫情的緣故怕被吧斷糧所以在海外倉直郵了一箱又在自貿倉補了一箱，反正奶粉是消耗品，不擔心吃不完hhh。自貿倉物流速遞還是很快的，重慶保稅區發貨，4天到達。

四川潛力大的城市：還是重要的恐龍化石產地，被譽為“恐龍之鄉”

對此有的網友說:很多人可能不知道，其實我們自貢還有飛機制造，汽車製造，新能源汽車，及新能源電池研發與製造產業，雖然剛起步，但未來可期!

00後，吾輩當自強

當記者採訪她時，她說了一句讓人永生難忘的話:“其實我們並不是什麼逆行者，只不過是一些普通人在堅守自己的使命。

“我來！”

十天，我應該可以讀完一本《百年孤獨》，應該可以學會用吉他彈一首歌，還應該可以追完一部電視劇《慶餘年》。

東北唯一新一線城市：被譽為“東方魯爾”，經濟卻不如省內地級市

眾所周知這幾年東北的經濟，確實沒有以前增長得那麼快了。原因相信大家也很清楚，簡單點說就是南方更適合發展經濟。因此中國的經濟重心向南移動，所以在未來的幾年甚至幾十年裡面，中國南方的經濟都會比北方強。特別是廣東省跟浙江省的經濟水平，目前已經超越世界上大部分國家了。

人生有尺，做人有度

“救命錢”變“唐僧肉” 扶貧最後一公里處“蠅貪”頻現！

家境殷實的90後海歸女為何“沉迷”偷快遞？

青春洋溢，不加過分修飾，真實的少女感，你喜歡嗎？

4名網友預謀綁架一董事長，匯合後劇情突變……

江蘇的第二個“蘇州”，並非南京和無錫，而是這座低調的城市

說起蘇州的大名，相信是無人不知，無人不曉的，作為我國名副其實的最強地級市，蘇州近些年屬實為人們帶來了很大驚喜，甚至在經濟發展上也已經遠超省會南京，而今天小編要為大家帶來的則是江蘇境內的“第二個蘇州”，發展潛力巨大，並非南京和無錫，而是這座十分低調的城市。

一文簡單理解“推薦系統”原理及架構

相似度計算

鄰居的選擇

基於用戶的協同過濾算法(UserCF)

數學實現如下圖：

UserCF 模型存在問題：

基礎解決方案：

基於用戶的協同過濾不流行的原因：

基於物品的協同過濾算法(ItemCF)

數學實現思路如下圖：

模型優勢：

UserCF 和 ItemCF 綜合比較

標籤的定義

用戶為什麼要打標籤

用戶打什麼樣的標籤

為什麼要給用戶推薦標籤

如何給用戶推薦標籤

相關文章:

公章被搶、被盜怎麼辦？誰有權聲明公章作廢？蓋章、簽字、摁手印哪個最有用？一文看懂有關“公章”那些事！

拜讀魏永寧老師《民歌不放棄——訪甘谷縣民歌手張金錄》一文

一文詳解2019年燃料電池汽車發展概況

一文講解清楚質量成本—全面質量成本管理培訓教材

【科普】一文帶你讀懂電價體系

一文速覽科技抗疫最新進展

科普｜你瞭解電價嗎？一文帶你讀懂電價體系

解析《鮑某明涉嫌性侵養女》一文，網友評論：現代版“揚州瘦馬”

一文讀懂985、211、華東五校、國防七子、兩財一貿

小楷節錄北溪字義一文

評“請外貿人不要賤賣中國的防疫物資”一文

圖文並茂，一文看懂：舊村改造可研如何做項目分析

乾貨︱一文讀懂戴爾科技流數據平臺

應修得——《飽含中國深情傳播中國大愛》一文題

我們應從“法官對公安辦案弱點評判”一文中得到什麼啟示

精益管理簡圖，一文讀懂精益落地路徑

03.06 精益管理簡圖，一文讀懂精益落地路徑

12.20 一文讀懂伺服運動控制器

一文讀懂——浪潮網絡智慧校園白皮書

危險源辨識及風險控制，一文讀懂

10.10 「中級實操」一文看懂：中級消防設施操作員實操考試

精益管理簡圖，一文讀懂精益落地路徑「精益管理」

評《于丹被北師大免職！跌落“神壇”……》一文

一文看懂電梯電氣電路圖，實用！

中科大學報《費米實驗室繆子實驗概況》一文數據錯誤，請勘誤！

懟死鄒小櫻 02號作品｜回覆《陳綺貞的中年危機》一文

懟死鄒小櫻 03號作品｜回覆《陳綺貞的中年危機》一文

仟邦資都資訊：一文看懂：貸款利息、罰息與滯納金的區別

應收票據、應收賬款、其他應收款、預付賬款傻傻分不清？一文讀懂

變頻器知識大全，一文講解變頻器的安裝、外部線路、參數設定

「過壓脫扣式」斷路器——簡介、原理、接線

「欠壓脫扣式」斷路器——簡介、原理、接線

「報警輔助觸頭」斷路器——簡介、原理、常開常閉點

「輔助觸頭」斷路器——簡介、原理、常開常閉點

「分勵脫扣式」斷路器——簡介、原理、注意事項、接線

「漏電保護式」斷路器——（斷路器+漏電裝置）簡介、原理、詳解

「乾貨收藏」一文讀懂高低壓開關櫃製造與檢驗

故事選《金蟬》

液位繼電器——原理、運用、接線

《新華文摘》全文轉載任翔教授在我刊發表的《閱讀的力量》一文

互感器知識詳解，一文全搞定！

增值稅稅控設備，這10個問題您清楚嗎？一文讀懂

一文「吃」透7月30日杭州網紅餐飲

如何看待7月25日《章文，停止你的侵害！！！！》一文？

因曾出席伊朗學術活動赴美參與SIGIR被拒，知名信息檢索教授怒寫「開放的科學」一文

駁某安《和這種男人交往，最可怕》一文

駁斥「押注面板業務 TCL陣痛過後能否重生？」一文

乾貨｜一文讀懂編碼器（推薦收藏）

如何評價觀察者網《我問你答，真有許多女孩更喜歡老外》一文

沈巍先生雜談（358）說好的快手不倒，陪伴到老呢？個個都是戲精

出海奮鬥是有膽識後浪的更優選項

甲有5套房，不上班，收房租；乙有1套房，上班賺工資；丙租房子.

每逢佳節被相親，單身青年看這裡！

為珠峰“量身高”，為啥要人上去？

我省獲國家局通報表揚

湖南名字最尷尬的城市，90%的人都會想歪，當地人：思想有問題！

超六成前浪點贊《後浪》，全球白手起家90後富豪人均財富190億

再不來一場精緻野餐，我就要被開除中產籍了

工程師我只服中國，曾經放生到三峽的1萬條魚，如今怎麼樣了？

後疫情時代的五個營銷啟示

丘北縣雙龍營鎮人民政府普者黑村委會、矣則村委會太陽能路燈採購安裝項目競爭性談判公告

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了

衡水：守護一湖碧水打造生態之城

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度