AI必備知識：推薦系統

2018-06-20 11:28:24 人人都是產品經理

本文作者詳細介紹了AI推薦系統，並提出了自己的想法。跟著作者思路一起來了解一下吧！

一、好的推薦系統

1. 什麼是好的推薦系統——用戶視角

什麼是推薦系統?

當你心理產生一個需求的時候，能通過這個工具順利實現對這個需求的搜索，並獲得符合心理預期的產品列表，這個工具我們就稱之為——推薦系統。

那麼，什麼樣的推薦系統是好的推薦系統呢？

1.1 用戶層面：對用戶真正有價值的推薦

1.1.1 符合用戶的預期

推薦結果精準，能較大概率的覆蓋用戶的需求；用戶搜索詞與推薦物品有較高的匹配度，這裡通常用召回率和準確率來衡量上述指標。

召回率：正例在實際總的正例中被預測正確的概率
準確率：正例被預測正確的概率

1.1.2 讓用戶產生驚喜

在滿足精準性的情況下，推薦系統能挖掘人性需求，幫用戶拓展眼界探索未知，產生驚喜。

其體現在推薦結果的多樣性，物品間知識關聯性等。比如用戶搜索古典音樂類書籍，可以在列表中增加與此類型音樂相配的古典舞蹈、茶藝等書籍.

另外，推薦物品不能和用戶所購買物品物理綁定。比如用戶購買紅樓夢上，系統推薦紅樓夢下，這個推薦對用戶來說並不存在真正心理需求

1.2 系統層面：技術

對用戶而言，對推薦結果的預期、反饋的時間、推薦物品更新的頻率、系統容錯機制等，都會直接影響用戶體驗。因此在系統層面，一個優秀的推薦系統需具備但不限於：

強大抵禦並處理噪聲數據（例如刷單產生的無效數據）的能力
高效數據計算及傳輸能力
穩定的存儲機制
算法的精準性

1.3 不斷完善與優化

就像人一樣，只有不斷的學習，才能完善自身的知識體系以及對世界的認知，系統亦然。

好的推薦系統一定具備自我學習的能力，通過建立反饋機制和用戶進行交互，從而不斷優化對用戶群體的認知，最終能實現對用戶群體的精準聚類，為每類群體建立模型，物品精準投放。

1.4 讓用戶信服的推薦理由

好的推薦系統勢必會讓用戶產生強烈的信任與依賴感，給用戶提供物品推薦的依據——推薦理由。

推薦理由可以體現出系統是如何判斷物品進入用戶的興趣範圍的。常用的推薦理由大概分為以下四類：

熱門商品；推薦系統通常都會賦予部分熱門商品一定的權重，由於感興趣的人基數非常大，所以系統判斷目標用戶感興趣的概率也較大
目標用戶的好友同時也喜歡此類物品
喜歡某類物品的用戶同時也喜歡這類物品
與某類物品內容有極大的關聯性；這裡關聯性可以逐步細化，比如基於知識體系的推薦，即不同領域的匹配，或同一領域的梯度匹配等

1.5 實現雙贏

好的推薦系統不僅能讓用戶找到目標物品，也能讓商家發現目標/潛在的用戶群體，實現共贏。

2.什麼是好的推薦系統——產品視角

推薦系統都會有一個明確的目的，無論是為了突破技術壁壘還是基於商業目的，最終都會根據目標，通過特定的用戶行為數據來判斷成功與否。

因此我們可以選與系統最終目標最匹配的用戶行為，也就是在這個過程中用戶付出代價最大的行為作為主要的判斷依據，比如購買成功，對此行為賦予相對較大的權重。

二、推薦系統架構

通過上面的介紹，大家應該對推薦系統有一個初步的認識了，那麼推薦系統是由哪幾部分構成呢，在這一部分，我將逐一解答。

大部分推薦系統都是由前臺展示頁面、後臺日誌系統和推薦算法系統三部分構成。

1. 前臺展示頁面

前臺展示頁面是直觀展示給用戶的界面，通過UI與用戶交互，交互產生的用戶行為數據將存儲在後臺日志系統中，開發者根據推薦算法對日誌系統中的數據進行處理及分析，最終生成推薦結果。

那麼，交互產生的用戶行為數據包括哪些呢？

用戶自身基礎屬性；即性別、年齡、學歷、職業、所在地等，通常來源於用戶註冊信息或是其他平臺數據。
用戶行為：瀏覽網頁、點擊、收藏、購買、點贊、關注等行為。
用戶行為結果：產生的話題、搜索關鍵詞及反饋（評論/打分）等。

2. 後臺日誌系統

日誌系統主要是用來記錄系統運行的軌跡，在記錄的同時，跟蹤分析錯誤，審計系統運行的流程。

日誌記錄的內容通常分為兩大類，一是面向用戶，二是面向開發者，這裡我們更多關注第一類。

用戶行為都會存儲在日誌數據庫中，由於用戶產生的數據量巨大且速度快，為了保證數據傳輸的穩定性，可以嵌入高吞吐量分佈式消息系統——Kafka。

同時為了提高數據處理效率，通常會設定日誌內容邊界對檢測出的無效數據源（例如刷單數據）先做過濾。當然經過篩選後的數據也並非規整，這就需要對數據進行一定層級的分級分類和格式規範了。

比如用戶點擊行為，會生成相應的點擊日誌，用戶的每次查詢會生成一個展示日誌，與此同時會有一個並行的程序將歸併點擊日誌與展示日誌。

3. 推薦系統算法

有了前端展示後和後端數據之後，那麼如何實現他倆的交互呢，這中間需要一個連接的橋樑——推薦系統算法。

推薦系統算法可以抽象為一個規則，只有把這個規則定義好，前端才知道哪些數據該展示並如何展示，後端數據庫也知道哪些數據有價值。否則，如果將所有日誌內容輸出，不僅會增大用戶信息檢索的困難，系統也就失去了自身意義。

總的來說，推薦系統的實質就是一個用戶行為特徵與物品特徵匹配的過程。

用戶端特徵包含用戶自身、用戶行為和用戶行為結果三部分；物品特徵包含標籤、內容（關鍵詞）等。

推薦結果均是基於用戶特徵及物品特徵原始數據，在不同維度（時間、多樣性、流行度等）上，根據用戶需求賦予權重並進行處理（篩選、排序等）後的結果。即遵循用戶—特徵—物品過程。當推薦系統生成初始結果後，在通過過濾、排名算法生成最終推薦結果和推薦理由。

推薦引擎可抽象成一種特徵，每種特徵對應成一種推薦策略，結合不同用戶需求，調整每個具體特徵上所賦予的權重，最終生成特徵物品-特徵映射{item：Userfeature}，Userfeature為多個特徵權重相加後的最終值。

三、常用推薦系統算法

1. 常用系統原理介紹

我們從推薦系統具體要解決什麼問題以及如何解決問題來剖析原理。

首先，推薦系統要解決的最核心的兩個關鍵點是

：如何發現用戶感興趣的物品和如何確定物品之間的關係。其次，每個問題分別如何解決呢？

1.1 如何發現用戶感興趣的物品

1.1.1 用戶主動告訴系統對哪些類型感興趣

用戶自行選定感興趣的關鍵詞標籤，系統將找到與此標籤匹配的物品。

1.1.2 通過分析用戶行為數據

利用用戶在平臺的歷史瀏覽記錄獲取能代表用戶的關鍵詞，或導入社交數據，獲取用戶好友列表，從而基於用戶好友喜愛物品生成推薦列表。

1.2 如何確定物品與物品間的關係——相似度

相似度計算原理：所有相似度的計算都是基於矩陣的運算。

1.2.1 基於內容（關鍵詞/標籤）

大部分物品都會多維度特徵，通過特徵從而實現與用戶的期望得以匹配，常用的是通過物品內容關鍵詞或是給物品打標籤的形式來匹配。

1.2.2 協同過濾

協同過濾也是推薦系統中常用的算法，其分為兩種，基於用戶和基於物品。

那什麼是基於用戶呢？

就是找到和你相似的一個小群體，小群體裡面喜歡的東西都是你喜歡的，你獲得的推薦結果就是這個小群體喜愛的物品集合。

那什麼基於物品呢？

基於用戶興趣交集計算物品間的相似度，即喜歡物品i的用戶有多少也喜歡物品j，通常用來表示物品間的相似度，同時結合用戶歷史行為生成推薦列表；用戶的歷史行為對物品間的相似性也具有一定的貢獻度。

這樣看來，基於物品的推薦系統，更加個性化同時也一定程度上反映了用戶的興趣傳承。

2. 如何實現更加精準的分類

僅僅通過用戶間興趣交集生成推列表往往是不夠的，在內容、標籤的分類以及人群之間的關係上，如何進行深度挖掘？下面幾種方法提供了一些優化思路。

2.1 混合推薦

在實際的案例中，單個的推薦模型大多都無法滿足預期，所以通常從系統、算法、結果、處理流程上採用不同的混合策略。

例如基於內容增強協同過濾（The content-boosted collaborative filtering recommender），此算法融合了協同過濾和基於內容的算法思想，和基於內容或協同過濾的單個模型相比，它預測能達到比較高的精度，同時它也能解決了數據稀疏和冷啟動問題。

2.2 隱語義模型

2.2.1 隱語義概念

類似於協同過濾中基於物品的方法；在每個具體分類中，以用戶行為（興趣）作為物品權重的分配依據。

2.2.2 與協同過濾不同之處（優化點）：

物品可以有多個分類維度；基於用戶行為決定每個類中物品的權重（eg:如果某類用戶群體都對某一物品特別感興趣，在這類中這個物品的權重就非常大）
分類粒度更加細化；比如關於《深入理解OpenCV》這本書原來被劃分為【計算機】類，細化之後可以分為【圖像處理】類；

2.3 文本精準匹配

為量化文本間的關聯度，引入一個概念——TF-idf，通過比對搜索關鍵詞與物品庫單個物品的關鍵詞或標籤的相似性，從而生成推薦列表。

TF-idf值越大，說明相關性越大，反之；這裡對TF-idf公式原理做簡要說明加強理解：

計算公式：TF-idf = f(t,d) x idf(t,D)

TF：頻率；搜索詞在特定文檔中出現的頻率：

Idf：搜索詞在其他文檔中出現的次數：

在文檔搜索中，不僅要考慮搜索關鍵詞在目標文檔出現的頻率，也要考慮關鍵詞在其他文檔出現的頻率。

如果搜索詞是大眾詞語，那麼搜索的結果完全不具備參考價值，比如搜索詞為the；在idf公式中，分子為所有文檔的個數，分母為包含這個關鍵詞的文檔個數，如果是大眾詞語，則：idf=0，TF-idf=0，物品（關鍵詞）間沒有相關性。

2.4 利用社交網絡數據

社交網絡中包含大量的用戶數據，能更好的反映用戶間的關係，用戶關係通常有三種：

互為好友（Facebook）
單向關注（Twitter）
興趣小組模式（豆瓣小組）

利用社交網絡數據進行推薦通常都將用戶間的熟悉程度和興趣相似度作為最主要的兩個判別指標。

用戶間熟悉程度，即通過用戶共同好友數量計算；興趣相似度，即通過兩個用戶喜愛物品的重合度進行衡量。

弊端：用戶數據量巨大，數據庫讀取消耗時間太長。

優化方法：

減少數據量；
重構數據庫；

2.5 時間特徵

在日常生活中，物品迭代速度非常快，人們的近期行為通常比遠期行為更加符合目前自身興趣需求，因此在系統滿足精準性的情況下，需要考慮推薦系統的時效性，根據不同推薦內容賦予時間權重。

例如新聞與經典書籍，新聞更新頻繁具有較高的時效性，而經典書籍例如紅樓夢，社會對它的需求已經處於平穩，因此時效性不高。

如何將時間權重賦予物品：

物品的生命週期：物品生命週期的長短決定了物品的時效性。一個物品隨著流行度的增長，在線時長（一個物品在某天被用戶產生過行為）也隨之增加，斜率越大說明具有較低的時效性生命週期較長（如wikipedia)，斜率越小說明具有較高的時效性生命週期較短（如nytimes）。所以物品生命週期越長，與時間相關性越低。
人的興趣愛好會隨著時間而改變，不同階段所感興趣的物品差異較大，時間相隔越久，用戶對物品產生的行為權重越低，近期行為賦予較高權重。

除此之外，不同物品推薦的時間點也是需要考慮因素之一，比如用戶在工作時間，儘可能推送與工作相關的資訊或資料，與工作內容不相關的信息做降權，下班時間再適當調整權重。

但是同時也要考慮不同崗位工作狀態存在不一致的情況，具體推送情況可以通過每個用戶大量的行為數據來判斷。

2.6 環境特徵

環境特徵通常可以與時間特徵配合。用戶在不同的時間與地點的需求差異可能會很大甚至完全不同，或是在特定的時間與地點，對某種信息的需求會急速上升。

例如用戶在紐約旅遊，關注點會大量集中在紐約的衣食住行，但如果這個時候推薦系統推薦的信息都是倫敦的，那麼結果可想而知。

四、實戰篇——如何維護用戶數據

當用戶數據量太大，例如引入社交網絡或是新聞實施推薦，此時如果每次更新都讀取一次數據庫，那麼效率會大幅下降導致用戶體驗不佳。

目前常用的有兩種方案：

1. 消息隊列

為每個用戶維護一個消息隊列，裡面包含用戶的基本屬性（如年齡、性別、職業等）、喜愛的物品、朋友圈等。每當這個用戶產生新的動作（搜索），系統將根據特定的規則，賦予消息隊列中每部分數據的權重。最終獲得推薦列表。

這裡科普一下什麼是消息隊列。顧名思義，就是把傳輸的消息放在隊列裡，隊列，可以抽象為一個容器，所以消息隊列，就是一個用作保存傳輸中的消息容器。

在這個基礎上，這個容器可以跨平臺、語言提供可靠的、持久的異步通訊機制。

可靠是指：有且只有一次；有序。
異步是指：發送方和接收方可以不同時在線。

另外，通過消息隊列還能實現系統解耦，這使得各個系統間可以相對獨立運行。

2. 建立喜好詞關鍵表

在數據庫中，我們為每個用戶維護一個map，也就是建立“key-value”鍵值對，key對應用戶喜好詞，value對應喜好程度。

每個新聞會有對應的關鍵詞和Tf-idf值。當用戶瀏覽一篇新聞時，系統會將這篇新聞的關鍵詞和Tf-idf值插入到用戶喜好此列表裡。如果用戶瀏覽了包含與原有相同關鍵詞的新聞，Tf-idf值會自動相加並更新原有值。同時考慮數據庫存儲問題，根據具體需求為關鍵詞量設定一個上限。

當然，除了存儲問題，這裡還有一個新問題：用戶興趣是否會變化呢？

比如在某某手機的發佈會前或是世界盃，用戶只在這段時間集中關注某一話題，但之後可能完全不在意了，那麼在喜好詞列表裡，如何體現用戶興趣遷移呢？

這裡引入一個新概念——衰減機制。每一個Tf-idf值乘上一個衰減因子，同時在喜好列表中設定一個閾值L，當Tf-idf減少到小於L的時候，關鍵詞直接刪除。

五、未來思考

一個人在群體中的重要性和影響力以及人與人之間一直是難以通過幾個參數或幾個模型就能判別的，它們均是一個不規則的非線性模型。

平臺數據對於深度挖掘人與人之間的關係來說其實是微不足道的，在現實生活中，人與人之間的關係本來就難以定論，存在著表層關係與深層關係。

表層關係具體是指社會賦予你們的關係，比如同事、上下屬、同學等，深層關係則是指你們除了是同事以外，可能私下裡是有著相同的興趣愛好的朋友。

表層關係通常可以用數據挖掘定義，比如兩個人的通話記錄（這裡不是指通話內容，而是打電話的時間、時長等）、位置信息等，但是外部信息數據通常會根據個人習慣而產生誤差。

其實，對推薦系統的理解等價於對人性的理解；挖掘人與人的關係、人與物的關係、物與物的關係。

除了人們主動表達的需求，我認為最重要的，其實是人性的慾望。所謂道生一，一生二，三生萬物，萬物由道生出，而慾望乃道的其中一個產物。所以慾望通常不會平白無故的產生，慾望與慾望之間也不會毫無關聯，個人的成長經歷及生活環境造就了一個人的性格，讓他養成了一些習慣。

習慣通常是有形無意識表達，而慾望通常是無意識無形表達。我在想，是否把習慣與慾望結合起來，是否就是對人性的建模。大數據時代，通過大量的用戶成長數據與環境數據或許可以適當挖掘其中規則，但更加深入的，其實是要推導因果的關係。

參考文獻：

[1] 新聞推薦系統：基於內容的推薦算法——TFIDF、衰減機制

[2]《推薦系統實戰》；

[3]《日誌系統設計》

[4]《消息隊列應用場景》

[5] 推薦系統的混合加權技術研究

[6] Xiaoyuan Su and Taghi M. Khoshgoftaar, “A Survey of Collaborative Filtering Techniques”,Advances in Artificial Intelligence,2009.

題圖來自 Unsplash ，基於 CC0 協議

分享到:

閱讀更多 人人都是產品經理 的文章

關鍵字: 需求 Facebook 圖像處理

沈巍先生雜談（358）說好的快手不倒，陪伴到老呢？個個都是戲精

轉念一想，這種看似不正常的狀態才是正常的，隨著時間的推移，很多過去迷迷糊糊的人慢慢就看清了，是進是退跟著內心走就好，別管什麼善始善終，不要被這種論調道德綁架，過段時間，你覺得可以，再回來就行，開關在你自己手裡，一秒鐘就能完成進退。

出海奮鬥是有膽識後浪的更優選項

東南亞11國，除去東帝汶，其他10國組成東盟。東南亞有多熱，從很多國際資本的快速湧入都有目共睹。養老產業：泰國、越南、菲律賓、馬來西亞、印尼都是大受歐美日韓退休人士歡迎的亞洲養老目的地。

甲有5套房，不上班，收房租；乙有1套房，上班賺工資；丙租房子.

每逢佳節被相親，單身青年看這裡！

“非常戰疫

為珠峰“量身高”，為啥要人上去？

6日，2020珠峰高程測量行動測量登山隊舉行出發儀式，30多名計劃登頂的測量登山隊員當日從海拔5200米的珠峰登山大本營向更高海拔出發，計劃抓住近日的天氣窗口，擇日登頂測量。如果成功，這將成為我國專業測繪人員首次登頂珠峰測高。

我省獲國家局通報表揚

湖南名字最尷尬的城市，90%的人都會想歪，當地人：思想有問題！

湖南省作為中國中南地區的一個省份，經濟強勁，地位獨特，有著十足的發展後勁。湖南經濟總量在全國排名第九。湖南也是華夏文明的發祥地，境內的炎帝陵，成為華夏兒女尋根祭祖的重要場所。南嶽衡山就在湖南衡陽。湖南張家界景區成為馳名中外的旅遊景點。湖南湘西鳳凰古鎮成為中國馳名十大古鎮之一。

超六成前浪點贊《後浪》，全球白手起家90後富豪人均財富190億

再不來一場精緻野餐，我就要被開除中產籍了

《新週刊》創刊於1996年8月18日，由南方出版傳媒股份有限公司主管、主辦，以“中國最新銳的生活方式週刊”為定位，推出過一系列極具影響力的專題報道，是中國期刊市場最具代表性和影響力的雜誌之一，享有“話題策源地”的美譽。

工程師我只服中國，曾經放生到三峽的1萬條魚，如今怎麼樣了？

每一個大項目其實都會面臨一個問題，那就是生態環境，因為所涉及的範圍實在太廣了，所以需要考慮的問題都是多方面的，三峽就是我國早期的一個超大體量的工程，而三峽所涉及的問題也很多。三峽其實一直都是我國的驕傲，但是關於三峽的質疑聲，其實也一點都不少，特別是關於三峽環境方面的質疑聲。

後疫情時代的五個營銷啟示

現象級白酒——李渡高粱酒，作為沉浸式/場景化營銷的開創者，早在幾年前就使用互聯網工具助力，疫情爆發後一系列的操作自然遊刃有餘了，銷量同比增加170%，線上銷量更是增加400%。

丘北縣雙龍營鎮人民政府普者黑村委會、矣則村委會太陽能路燈採購安裝項目競爭性談判公告

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了金子一直是我們中國人比較喜歡投資的一個東西，黃金飾品也是中國女性非常喜歡購買的東西，大家都知道，金子具有保值的功能，所以很多人既喜歡在銀行購買金條用於投資，又喜歡去一些金店購買黃金飾品。

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了大家都會知道，每到夏天，我們的沿海地區都是一個多風多雨的季節，這時候我們出門也是需要隨時帶上雨具，避免突然有暴風雨這些天氣的出現。

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了每次一到假期，就非常害怕到達火車站，可以說是基本上都是人山人海的感覺。很多人會為了方便去選擇去乘坐動車和高鐵。現在我們無論是出差還是去旅遊也都是會選擇去坐動車，又快又方便，主要還會很舒服。

肖戰視頻專訪：眼裡帶著故事，請不要聽說他，這一次，請他說

這是肖戰春節後，經歷過這麼多事後首次參加採訪。視頻中他依然是面帶微笑，依舊是少年的樣子。但是眼裡到這故事，說話也變得小心謹慎，談吐措辭也是越來越嚴謹了。

秦山核電應急行動水平優化項目招標公告

從中國電力集採招標網（www.dljczb.

巴基斯坦SK水電站消防及火災報警系統設備採購招標招標公告

從中國電力集採招標網（www.dljczb.

中煤能源新疆鴻新煤業葦子溝煤礦瓦斯抽採機械設備採購招標公告

從中國電力集採招標網（www.dljczb.

縣域社區團購，在平臺發展上有哪些優勢？

社區團購的迅速發展，已經不再侷限於各大城市中的小區。漸漸的擴大範圍，發展到一些城市邊緣的縣城鄉鎮。像是興盛優選、十薈團、食享會、考拉精選、美家買菜等月流水上億的社區團購頭部企業，都很重視下沉市場的佈局和開拓。

和王為念離婚，與“假奶奶”常香玉對簿公堂，55歲小香玉生活如詩

戲曲是以古代故事以及現代經典故事為題材的藝術表演，也是歷史悠久的綜合舞臺藝術樣式，表演戲曲難度很高，但戲曲人才依舊人才輩出，說起在戲曲圈中的佼佼者，陳百玲必是其一。

眼力測試：由4字組成的白菜，1秒看出4個字的智商都很高

這是一幅白菜圖，由4字組成的，1秒看出4個字的智商都很高！你看出來了嗎？

看圖猜字：這個不簡單，你能猜對幾個？全猜對眼力非凡

這福圖上的圖你能猜對幾個？全猜對眼力非凡，猜對3個眼力160，猜對3個是近視眼！你能猜對幾個字？

眼力測試：火焰中藏了4個字，看出3個算達標，全看出眼力200

熊熊火焰中藏了4個字，看出3個算達標，全看出眼力200！你能全部看出來嗎？

小米硬剛德國雙立人，400年非洲灌木做家用砧板，不發黴砍不壞

民以食為天。

眼力測試：美女圖中藏了5個漢字，全部看出來的眼力超群

這幅美女圖中藏了5個漢字，你能不能看出來是哪幾個漢字呢？全部看出來的眼力超群！

最萌Hodler，剛出生就收到比特幣大學教育基金的寶寶

作為比特幣愛好者，Izabella的父母在她出生當日於《泰晤士報》刊登了一則附帶比特幣地址的小廣告，希望廣大讀者能夠捐出小部分比特幣給他們女兒作為大學教育基金。

《瞭望大灣區》：全國中高風險區域今日“清零”

《晨會解讀》：中山證券投資顧問楊立華：連續上漲過後注意把握好操作節奏

孫鬆峰：幸福生活唱出來

河南市場安全網訊（www.hnscjgw.com）

衡水：守護一湖碧水打造生態之城

長城網衡水訊（記者張梅勝

英國小夥第一次體驗中國網吧，就被電腦屏幕嚇到直言：這是個啥

網吧其實不管是對於哪個國家的人來說，都是極具吸引力的，而在中國對於八九四年的年輕人和學生來說，網吧簡直就是快樂源泉，但是也是老師家長中的眼中釘，肉中刺。相信很多人小時候可能都有過被家長從網吧裡揪出來的不甚美好的回憶。

微商到底多能吹牛！哈哈哈哈哈千萬別屏蔽，每天都是快樂源泉

雖然有的時候在朋友圈裡有很多微商不停的發朋友圈，讓大家覺得有些困擾和煩悶，有一種私生活被侵擾的感覺。但是不要忙著屏蔽他們，有的時候這些總是吹得天花亂墜的微商也能給人們帶來快樂的源泉。

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度

5月6日，2020珠峰高程測量登山隊伍出發儀式正式舉行，30多名隊員當日從海拔5200米的登山大本營向更高海拔出發，開啟珠峰衝頂測量。隊員們力爭抓住近日的天氣窗口，擇日登頂測量。如果成功，這將是我國專業測繪人員首次登頂珠峰測高。

“十大沂蒙工匠”齊玉祥：鋼花璀璨照亮青春之路

一支焊槍、一面防護罩，鋼花白晝繁星，在刺耳的噪聲中點亮四壁，焊工齊玉祥用13年的青春，打磨出了人生最璀璨的鋼花。2007年，齊玉祥畢業後進入山東華源鍋爐有限公司工作。剛進公司沒多久，由於工作需要，他被分配到了焊接崗位。

日本的丈母孃，賣萌發嗲也是蠻有技術的

國內這點估計是比不過了

消費水平最高的5座城市，北上廣深均在列，另一座你知道是哪嗎？

我們都知道在地大物博的中國，擁有很多城市，而它們之間的等級劃分也都是不同的，等級越高，往往消費就會越高，那麼說起國內消費水平最高的幾座城市，夥伴們都知道是哪裡嗎？接下來就讓小編帶大家去了解一下吧，看看有沒有你心中的那個。

德國愛他美怎麼樣？"斷貨王"愛他美值得買嗎？

哈哈。每次都會用iGepir 姐姐推薦來的，小寶從6個月混養喝起，現在快1歲半了，一直喝愛他美，不上火，購入量大，也算全心全意支持國際媽咪了

廣東有望合併的3座城市：合併成功後，將誕生一座千萬人口的城市

相信大家都知道，目前廣東是中國經濟實力最強的城市，哪怕是國內富有的浙江和江蘇，在經濟上也被廣東牢牢按住。你要知道廣東可是中國唯一有一線城市的省份，而且還是兩座。光靠這一點就能讓全國所有的省份羨慕，但比較遺憾的是，廣東的經濟發展似乎並不平衡。

國外奶粉怎麼樣？去哪買靠譜？線下實體店一定比網店安全嗎？

之前買的一直是國際媽咪的海外倉，但是疫情的緣故怕被吧斷糧所以在海外倉直郵了一箱又在自貿倉補了一箱，反正奶粉是消耗品，不擔心吃不完hhh。自貿倉物流速遞還是很快的，重慶保稅區發貨，4天到達。

四川潛力大的城市：還是重要的恐龍化石產地，被譽為“恐龍之鄉”

對此有的網友說:很多人可能不知道，其實我們自貢還有飛機制造，汽車製造，新能源汽車，及新能源電池研發與製造產業，雖然剛起步，但未來可期!

00後，吾輩當自強

當記者採訪她時，她說了一句讓人永生難忘的話:“其實我們並不是什麼逆行者，只不過是一些普通人在堅守自己的使命。

“我來！”

十天，我應該可以讀完一本《百年孤獨》，應該可以學會用吉他彈一首歌，還應該可以追完一部電視劇《慶餘年》。

東北唯一新一線城市：被譽為“東方魯爾”，經濟卻不如省內地級市

眾所周知這幾年東北的經濟，確實沒有以前增長得那麼快了。原因相信大家也很清楚，簡單點說就是南方更適合發展經濟。因此中國的經濟重心向南移動，所以在未來的幾年甚至幾十年裡面，中國南方的經濟都會比北方強。特別是廣東省跟浙江省的經濟水平，目前已經超越世界上大部分國家了。

人生有尺，做人有度

“救命錢”變“唐僧肉” 扶貧最後一公里處“蠅貪”頻現！

家境殷實的90後海歸女為何“沉迷”偷快遞？

青春洋溢，不加過分修飾，真實的少女感，你喜歡嗎？

4名網友預謀綁架一董事長，匯合後劇情突變……

江蘇的第二個“蘇州”，並非南京和無錫，而是這座低調的城市

說起蘇州的大名，相信是無人不知，無人不曉的，作為我國名副其實的最強地級市，蘇州近些年屬實為人們帶來了很大驚喜，甚至在經濟發展上也已經遠超省會南京，而今天小編要為大家帶來的則是江蘇境內的“第二個蘇州”，發展潛力巨大，並非南京和無錫，而是這座十分低調的城市。

AI必備知識：推薦系統

一、好的推薦系統

1. 什麼是好的推薦系統——用戶視角

1.1 用戶層面：對用戶真正有價值的推薦

1.2 系統層面：技術

1.3 不斷完善與優化

1.4 讓用戶信服的推薦理由

1.5 實現雙贏

2.什麼是好的推薦系統——產品視角

二、推薦系統架構

1. 前臺展示頁面

2. 後臺日誌系統

3. 推薦系統算法

三、常用推薦系統算法

1. 常用系統原理介紹

1.1 如何發現用戶感興趣的物品

1.2 如何確定物品與物品間的關係——相似度

2. 如何實現更加精準的分類

2.1 混合推薦

2.2 隱語義模型

2.3 文本精準匹配

2.4 利用社交網絡數據

2.5 時間特徵

2.6 環境特徵

四、 實戰篇——如何維護用戶數據

1. 消息隊列

2. 建立喜好詞關鍵表

五、未來思考

相關文章:

沈巍先生雜談（358）說好的快手不倒，陪伴到老呢？個個都是戲精

出海奮鬥是有膽識後浪的更優選項

甲有5套房，不上班，收房租；乙有1套房，上班賺工資；丙租房子.

每逢佳節被相親，單身青年看這裡！

為珠峰“量身高”，為啥要人上去？

我省獲國家局通報表揚

湖南名字最尷尬的城市，90%的人都會想歪，當地人：思想有問題！

超六成前浪點贊《後浪》，全球白手起家90後富豪人均財富190億

再不來一場精緻野餐，我就要被開除中產籍了

工程師我只服中國，曾經放生到三峽的1萬條魚，如今怎麼樣了？

後疫情時代的五個營銷啟示

丘北縣雙龍營鎮人民政府普者黑村委會、矣則村委會太陽能路燈採購安裝項目競爭性談判公告

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了

肖戰視頻專訪：眼裡帶著故事，請不要聽說他，這一次，請他說

秦山核電應急行動水平優化項目招標公告

巴基斯坦SK水電站消防及火災報警系統設備採購招標招標公告

中煤能源新疆鴻新煤業葦子溝煤礦瓦斯抽採機械設備採購招標公告

縣域社區團購，在平臺發展上有哪些優勢？

和王為念離婚，與“假奶奶”常香玉對簿公堂，55歲小香玉生活如詩

眼力測試：由4字組成的白菜，1秒看出4個字的智商都很高

看圖猜字：這個不簡單，你能猜對幾個？全猜對眼力非凡

眼力測試：火焰中藏了4個字，看出3個算達標，全看出眼力200

小米硬剛德國雙立人，400年非洲灌木做家用砧板，不發黴砍不壞

眼力測試：美女圖中藏了5個漢字，全部看出來的眼力超群

最萌Hodler，剛出生就收到比特幣大學教育基金的寶寶

《瞭望大灣區》：全國中高風險區域今日“清零”

《晨會解讀》：中山證券投資顧問楊立華：連續上漲過後注意把握好操作節奏

孫鬆峰：幸福生活唱出來

衡水：守護一湖碧水 打造生態之城

英國小夥第一次體驗中國網吧，就被電腦屏幕嚇到直言：這是個啥

微商到底多能吹牛！哈哈哈哈哈千萬別屏蔽，每天都是快樂源泉

2020珠峰高程複測出發儀式今日舉行 小米10全程助力丈量世界新高度

“十大沂蒙工匠”齊玉祥：鋼花璀璨照亮青春之路

日本的丈母孃，賣萌發嗲也是蠻有技術的

消費水平最高的5座城市，北上廣深均在列，另一座你知道是哪嗎？

德國愛他美怎麼樣？"斷貨王"愛他美值得買嗎？

廣東有望合併的3座城市：合併成功後，將誕生一座千萬人口的城市

國外奶粉怎麼樣？去哪買靠譜？線下實體店一定比網店安全嗎？

四川潛力大的城市：還是重要的恐龍化石產地，被譽為“恐龍之鄉”

00後，吾輩當自強

“我來！”

東北唯一新一線城市：被譽為“東方魯爾”，經濟卻不如省內地級市

人生有尺，做人有度

“救命錢”變“唐僧肉” 扶貧最後一公里處“蠅貪”頻現！

家境殷實的90後海歸女為何“沉迷”偷快遞？

青春洋溢，不加過分修飾，真實的少女感，你喜歡嗎？

4名網友預謀綁架一董事長，匯合後劇情突變……

江蘇的第二個“蘇州”，並非南京和無錫，而是這座低調的城市

四、實戰篇——如何維護用戶數據

衡水：守護一湖碧水打造生態之城

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度