協同過濾推薦算法

2020-02-12 22:26:53 gongyouliu

作者在《推薦系統產品與算法概述》這篇文章中簡單介紹了協同過濾算法。協同過濾算法是在整個推薦系統發展史上比較出名的算法，具備舉足輕重的地位，甚至在當今還在大量使用。

本篇文章作者會詳細講解協同過濾推薦算法的方方面面，這裡所講的也是作者基於多年推薦系統研究及工程實踐經驗的基礎上總結而成，希望對大家學習協同過濾推薦算法有所幫助，提供一些借鑑。

本文會從協同過濾思想簡介、協同過濾算法原理介紹、離線協同過濾算法的工程實現、近實時協同過濾算法的工程實現、協同過濾算法應用場景、協同過濾算法的優缺點、協同過濾算法落地需要關注的幾個問題等7個方面來講述。希望讀者讀完本文，可以很好地理解協同過濾的思路、算法原理、工程實現方案，並且具備基於本文的思路自己獨立實現一個在真實業務場景中可用的協同過濾推薦系統的能力。

在正式講解之前，先做一個簡單定義。本文用”

操作過“這個詞來表示用戶對標的物的各種操作行為，包括瀏覽、點擊、播放、收藏、評論、點贊、轉發、評分等等。

一、協同過濾思想簡介

協同過濾，從字面上理解，包括協同和過濾兩個操作。所謂協同就是利用群體的行為來做決策(推薦)，生物上有協同進化的說法，通過協同的作用，讓群體逐步進化到更佳的狀態。對於推薦系統來說，通過用戶的持續協同作用，最終給用戶的推薦會越來越準。而過濾，就是從可行的決策(推薦)方案(標的物)中將用戶喜歡的方案(標的物)找(過濾)出來。

具體來說，協同過濾的思路是通過群體的行為來找到某種相似性(用戶之間的相似性或者標的物之間的相似性)，通過該相似性來為用戶做決策和推薦。

現實生活中有很多協同過濾的案例及思想體現，除了前面提到的生物的進化是一種”協同過濾“作用外，我認為人類喜歡追求相親中的“門當戶對”，其實也是一種協同過濾思想的反射，門當戶對實際上是建立了相親男女的一種“相似度”(家庭背景、出身、生活習慣、為人處世、消費觀、甚至價值觀可能會相似)，給自己找一個門當戶對的伴侶就是一種“過濾”，當雙方”門當戶對“時，各方面的習慣及價值觀會更相似，未來幸福的概率也會更大。如果整個社會具備這樣的傳統和風氣，以及在真實”案例“中”門當戶對“的夫妻確實會更和諧，通過”協同進化“作用，大家會越來越認同這種方式。我個人也覺得”門當戶對“是有一定道理的。

協同過濾利用了兩個非常樸素的自然哲學思想：“群體的智慧”和“相似的物體具備相似的性質”，群體的智慧從數學上講應該滿足一定的統計學規律，是一種朝向平衡穩定態發展的動態過程，越相似的物體化學及物理組成越一致，當然表現的外在特性會更相似。雖然這兩個思想很簡單，也很容易理解，但是正因為思想很樸素，價值反而非常大。所以協同過濾算法原理很簡單，但是效果很不錯，而且也非常容易實現。

協同過濾分為基於用戶的協同過濾和基於標的物(物品)的協同過濾兩類算法。下面我們對協同過濾的算法原理來做詳細的介紹。

二、協同過濾算法原理介紹

上面一節簡單介紹了協同過濾的思想，基於協同過濾的兩種推薦算法，核心思想是很樸素的”物以類聚、人以群分“的思想。所謂物以類聚，就是計算出每個標的物最相似的標的物列表，我們就可以為用戶推薦用戶喜歡的標的物相似的標的物，這就是基於物品(標的物)的協同過濾。所謂人以群分，就是我們可以將與該用戶相似的用戶喜歡過的標的物推薦給該用戶(而該用戶未曾操作過)，這就是基於用戶的協同過濾。具體思想可以參考下面的圖1。

圖1：”物以類聚，人以群分“的樸素協同過濾推薦

協同過濾的核心是怎麼計算標的物之間的相似度以及用戶之間的相似度。我們可以採用非常樸素的思想來計算相似度。我們將用戶對標的物的評分(或者隱式反饋，如點擊、收藏等)構建如下用戶行為矩陣(見下面圖2)，矩陣的某個元素代表某個用戶對某個標的物的評分(如果是隱式反饋，值為1)，如果某個用戶對某個標的物未產生行為，值為0。其中行向量代表某個用戶對所有標的物的評分向量，列向量代表所有用戶對某個標的物的評分向量。有了行向量和列向量，我們就可以計算用戶與用戶之間、標的物與標的物之間的相似度了。具體來說，行向量之間的相似度就是用戶之間的相似度，列向量之間的相似度就是標的物之間的相似度。

為了避免誤解，這裡簡單解釋一下隱式反饋，只要不是用戶直接評分的操作行為都算隱式反饋，包括瀏覽、點擊、播放、收藏、評論、點贊、轉發等等。有很多隱式反饋是可以間接獲得評分的，後面會講解。如果不間接獲得評分，就用0、1表示是否操作過。

在真實業務場景中用戶數和標的物數一般都是很大的(用戶數可能是百萬、千萬、億級，標的物可能是十萬、百萬、千萬級)，而每個用戶只會操作過有限個標的物，所以用戶行為矩陣是稀疏矩陣。正因為矩陣是稀疏的，會方便我們進行相似度計算及為用戶做推薦。

圖2：用戶對標的物的操作行為矩陣

相似度的計算可以採用cosine餘弦相似度算法來計算兩個向量

(可以是上圖的中行向量或者列向量)之間的相似度：

計算完了用戶(行向量)或者標的物(列向量)之間的相似度，那麼下面說說怎麼為用戶做個性化推薦。

1.基於用戶的協同過濾

根據上面算法思想的介紹，我們可以將與該用戶最相似的用戶喜歡的標的物推薦給該用戶。這就是基於用戶的協同過濾的核心思想。

用戶u對標的物s的喜好度sim(u,s)可以採用如下公式計算，其中U是與該用戶最相似的用戶集合(我們可以基於用戶相似度找到與某用戶最相似的K個用戶)，

是用戶

對標的物s的喜好度(對於隱式反饋為1，而對於非隱式反饋，該值為用戶對標的物的評分)，

是用戶

與用戶u的相似度。

有了用戶對每個標的物的評分，基於評分降序排列，就可以取topN推薦給用戶了。

2.基於標的物的協同過濾

類似地，通過將用戶操作過的標的物最相似的標的物推薦給用戶，這就是基於標的物的協同過濾的核心思想。

用戶u對標的物s的喜好度sim(u,s)可以採用如下公式計算，其中S是所有用戶操作過的標的物的列表，

是用戶u對標的物

的喜好度，

是標的物

與s的相似度。

有了用戶對每個標的物的評分，基於評分降序排列，就可以取topN推薦給用戶了。

從上面的介紹中我們可以看到協同過濾算法思路非常直觀易懂，計算公式也相對簡單，並且後面兩節我們也會說明它易於分佈式實現，同時該算法也不依賴於用戶及標的物的其他metadata信息。協同過濾算法被Netflix、Amazon等大的互聯網公司證明效果也非常好，也能夠為用戶推薦新穎性內容，所以一直以來都在工業界得到非常廣泛的應用。

三、離線協同過濾算法的工程實現

雖然協同過濾算法原理非常簡單，但是在大規模用戶及海量標的物的場景下，單機是難以解決計算問題的，我們必須藉助分佈式技術來實現，讓整個算法可以應對大規模數據的挑戰。在本節，我們基於主流的Spark分佈式計算平臺相關的技術來詳細講解協同過濾算法的離線(批處理)實現思路，供大家參考(讀者可以閱讀參考文獻1、2、3、4瞭解協同過濾算法原理及工業應用)，同時會在下一節講解在近實時場景下怎麼在工程上實現協同過濾算法。

在這裡我們只講解基於標的物的協同過濾算法的工程實現方案，基於用戶的協同過濾思路完全一樣，不再贅述。

為了簡單起見，我們可以將推薦過程拆解為2個階段，先計算相似度，再為用戶推薦。下面分別介紹這兩個步驟怎麼工程實現。

1.計算topK相似度

本步驟我們計算出任意兩個標的物之間的相似度，有了任意兩個標的物之間的相似度，那麼我們就可以為每個標的物計算出與它最相似的K個標的物了。

假設有兩個標的物

，它們對應的向量(即圖2中矩陣的列向量，分別是第i列和第j列)如下，其中n是用戶數。

那麼

的相似度計算，我們可以細化如下：

公式1：計算

相似度

我們仔細看一下上述公式，公式的分子就是下圖矩陣中對應的i列和j列中同一行中的兩個元素(紅色矩形中的一對元素)相乘，並且將所有行上第i列和第j列的元素相乘得到的乘積相加(這裡其實只需要考慮同一行對應的i列和j列的元素都非零的情況，如果只要第i列和第j列中有一個為零，乘積也為零)。公式中分母是第i行與第i行按照上面類似的方法相乘再相加後開根號的值，再乘以第j行與第j行按照上面類似的方法相乘再相加後開根號的值。

圖3：計算兩個列向量的cosine餘弦可以拆解為簡單的加減乘及開根號運算

有了上面的簡單分析，就容易分佈式計算相似度了。下面我們就來講解，在Spark上怎麼簡單地計算每個標的物的topK相似度。在Spark上計算相似度，最主要的目標是怎麼將上面巨大的計算量(前面已經提到在互聯網公司，往往用戶數和標的物數都是非常巨大的)通過分佈式技術實現，這樣就可以利用多臺服務器的計算能力，解決大計算問題。

首先將所有用戶操作過的標的物”收集“起來，形成一個用戶行為RDD，具體的數據格式如下：

其中uid是用戶唯一識別編碼，sid是標的物唯一識別編碼，R是用戶對標的物的評分(即矩陣中的元素)。

對於

中的某個用戶來說，他操作過的標的物

和

，一定在該用戶所在的行對應的列i和列j的元素非零，根據上面計算

相似度的公式，需要將該用戶對應的

的評分乘起來。這個過程可以用下面的圖4來說明。

圖4：對用戶U來說，將他所有操作過的標的物做笛卡爾積

當所有用戶都按照圖4的方式轉化為標的物對及得分(圖4中右邊的

)時，我們就可以對標的物對Group(聚合)，將相同的對合並，對應的得分相加，最終得到的RDD為：

這樣，公式1中分子就計算出來了(上式中的Score即是公式1中的分子)。現在我們需要計算分母，這非常簡單，只要從上面的RDD中將標的物sid1等於標的物sid2的列過濾出來就可以了, 通過下圖的操作，我們可以得到一個map

。

圖5：從

中過濾出

的元素，用於計算公式1中的分母

最多含有標的物的數量(m)個的元素，相對來說不大，我們可以將

廣播(broadcast)出去。

方便我們按照公式1除以分母，最終得到

的相似度。

通過上面這些步驟，公式1中的分子和分母基本都很容易計算出來了，我們通過下圖的代碼(下面的broadcast即是

)，就可以計算出每組

對的相似度，最終得到的RDD為：

，其中Sim為sid1和sid2的相似度。

圖6：計算每組

的相似度

有了上面的準備，下面我們來說明一下怎麼計算每個標的物的topK最相似的標的物。

具體的計算過程可以用如下的Spark Transformation來實現。其中第三步的TopK需要我們自己實現一個函數，求

這樣的列表中評分最大的TopK個元素，實現也是非常容易的，這裡不贅述。

如果我們把每個標的物最相似的K個標的物及相似度看成一個列向量的話，那麼我們計算出的標的物相似度其實可以看作如下矩陣，該矩陣每列K個非零元素。

圖7：標的物相似度矩陣

到此為止，我們通過Spark提供的一些Transformation操作及一些工程實現上的技巧計算出了每個標的物topK最相似的標的物。該計算方法可以橫向拓展，所以再大的用戶數和標的物數都可以輕鬆應對，最多可能需要多加一些服務器。

2.為用戶生成推薦

有了1中計算出的標的物topK最相似的標的物，下面我們來說明一下怎麼為用戶生成個性化推薦。生成個性化推薦有兩種工程實現策略，一種是看成矩陣的乘積，另外一種是根據第二節2中”基於標的物的協同過濾“中的公式來計算，這兩種方法本質上是一樣的，只是工程實現上不一樣。下面我們分別講解這兩種實現方案。

(1) 通過矩陣相乘為用戶生成推薦

上面圖2中的矩陣是用戶行為矩陣，第i行第j列的元素代表了用戶i對標的物j的偏好/評分，我們將該矩陣記為

，其中n是用戶數，m是標的物數。圖7中的矩陣是標的物之間的相似度矩陣，我們將它記為

，這是一個方陣。

和

其實都是稀疏矩陣，我們通過計算這兩個矩陣的乘積(Spark上是可以直接計算兩個稀疏矩陣的乘積的)，最終的結果矩陣就可以方便用來為用戶推薦了：

。其中的第i行

代表的是用戶i對每個標的物的偏好得分，我們從這個列表中過濾掉用戶操作過的標的物，然後按照得分從高到低降序排列取topN就是最終給用戶的推薦。

(2) 通計算公式為用戶生成推薦

標的物相似度矩陣

是稀疏矩陣，最多

個非零元素(因為每個標的物只保留K個最相似的標的物)，一般K取幾十或者上百規模的數值，m如果是十萬或者百萬量級，存儲空間在1G左右(例如，如果m=100萬，K=100，相似度為雙精度浮點數，那麼

非零元素佔用的空間為100萬*100*8Byte=763M)，完全可以通過廣播的形式將

broadcast到每個Spark計算節點中。我們先將相似矩陣轉化為下圖的Map結構，再廣播出去，方便利用公式計算相似度。

圖8：標的物的topK相似列表利用Map數據結構來存儲

有了標的物之間的相似度Map，為用戶計算推薦的過程可以基於用戶行為RDD，在每個Partition中，針對每個用戶u計算u與每個標的物之間的偏好度(利用第二節2基於標的物的協同過濾中的公式)，再取topN就得到該用戶的推薦結果了。由於用戶行為採用了RDD來表示，所以整個計算過程可以分佈式進行，每個Partition分佈在一臺服務器上進行計算。具體的計算邏輯可以用下面的代碼片段來實現。

圖9：為每個用戶計算topN推薦

講到這裡，基於Spark平臺離線實現協同過濾算法的工程方案就講完了。該實現方案強依賴於Spark的數據結構及分佈式計算函數，可能在不同的計算平臺上(比如Flink、Tensorflow等)具體的實現方式會不一樣，但是基本思路和原理是一樣的，有興趣並且平時使用這些平臺的讀者可以在這些計算平臺上獨自實現一下，算是對自己的一個挑戰。

四、近實時協同過濾算法的工程實現

上面第三節中的協同過濾工程實現方案適合做離線批量計算，比較適合標的物增長較緩慢的場景及產品(比如電商、視頻、音樂等)，對於新聞、短視頻這類增量非常大並且時效性強的產品(如今日頭條、快手等)是不太合適的。那麼我們是否可以設計出一套適合這類標的物快速增長的產品及場景下的協同過濾算法呢？實際上是可以的，下面我們來簡單說一下怎麼近實時實現簡單的協同過濾算法。

我們的近實時協同過濾算法基於Kafka、HBase和Spark Streaming等分佈式技術來實現，核心思想跟第三節中的類似，只不過我們這裡是實時更新的，具體的算法流程及涉及到的數據結構見下面圖10。下面我們對實現原理做簡單介紹，整個推薦過程一共分為4步。

圖10：近實時基於標的物的協同過濾算法流程及相關數據結構

獲取用戶在一個時間窗口內的行為

首先Spark Streaming程序從kafka讀取一個時間窗口(Window)(一般一個時間窗口幾秒鐘，時間越短實時性越好，但是對計算能力要求也越高)內的用戶行為數據，我們對同一個用戶U的行為做聚合，得到上面圖中間部分的用戶行為列表(用戶在該時間窗口中有k次行為記錄)。

順便說一下，因為是實時計算，所以用戶行為數據會實時傳輸到Kafka中，供後續的Spark Streaming程序讀取。

基於用戶在時間窗口W內的行為及用戶行為記錄表更新標的物關聯表CR

基於(1)中獲取的用戶行為記錄，在這一步，我們需要更新標的物關聯表CR，這裡涉及到兩類更新。首先，用戶U在時間窗口W內的所有k次行為

，我們對標的物兩兩組合(自身和自身做笛卡爾積)並將得分相乘更新到CR中，比如

組合，它們的得分

相乘

更新到CR表中rowkey為

的行中。

的得分score更新為score+

)。其次，對於用戶U在時間窗口W中的行為還要與用戶行為表UAction中的行為兩兩組合(做笛卡爾積)採用前面介紹的一樣的策略更新到CR表中，這裡為了防止組合過多，我們可以只選擇時間在一定範圍內(比如2天內)的標的物對組合，從而減少計算量。

這裡說一下，如果用戶操作的某個標的物已經在行為表UAction中(這種情況一般是用戶對同一個標的物做了多次操作，昨天看了這短視頻，今天刷到了又看了一遍)，我們需要將這兩次相同的行為合併起來，具體上我們可以將這兩次行為中得分高的賦值給行為表中該標的物的得分，同時將操作時間更新為最新操作該標的物的時間。同時將時間窗口W中該操作行為剔除掉，不參上面提到的時間窗口W中的操作行為跟UAction表中同樣的操作行為的笛卡爾積計算。

更新用戶的行為記錄HBase表：UAction

基於(1)獲取中的用戶行為記錄，當(2)處理完之後，將行為記錄插入用戶行為表UAction中。為了計算簡單方便及保留用戶最近的行為，用戶行為表中我們可以只保留最近N條(可以選擇的參數，比如20條)行為，同時只保留最近一段時間內(比如5天)的行為。

為用戶生成個性化推薦

有了上面(1)、(2)、(3)步的基礎，最後一步是為用戶做推薦了，我們對計算過程簡單說明如下：

用戶U對標的物的評分

可以採用如下公式計算。

其中t是用戶操作過的標的物，

是該用戶對標的物t的得分(即圖10中UAction數據結構中的評分r)，

是標的物t和標的物s之間的相似度，可以採用如下公式計算，這裡

就是標的物關聯表CR中(t,s)對應的得分，

和

類似。

當我們計算完了用戶U跟所有標的物的得分之後，通過對得分降序排列取topN就可以作為U的推薦了。當標的物量很大(特別是新聞短視頻類產品)時，實時計算還是壓力非常大的，這時我們可以採用一個簡單的技巧，我們事先從CR表中過濾出跟用戶行為表中至少有一個標的物t有交集的標的物s(即標的物對

得分不為零)，只針對這部分標的物計算

，再從這些標的物中選擇得分最大的topN推薦給用戶。為什麼可以這麼做呢？因為如果某個標的物s與用戶行為標的物集合無交集，那麼根據計算

的公式，

一定為0，這時計算出的

也一定為0。

上面針對一個用戶怎麼實時計算協同過濾做了講解，那麼在一個時間窗口W中有若干個用戶都有操作行為，這時可以將用戶均勻分配到不同的Partition中，每個Partition為一批用戶計推薦。具體流程可以參考下面圖11。為每個用戶計算好推薦後，可以插一份到HBase中作為一個副本，另外還可以通過Kafka將推薦結果同步一份到CouchBase集群中，供推薦Web服務為用戶提供線上推薦服務。

圖11：在同一時間窗口W中為多個用戶生成個性化推薦

近實時的協同過濾主要用於對時效性要求比較高的產品形態，比如新聞、短視頻等應用。這些應用標的物更新快，用戶消耗一個標的物(讀一篇文章、看一段短視頻)所花的時間較短，這類應用一般是用於填補用戶的碎片化時間的。而對於電商、視頻等產品，近實時的協同過濾不是必須的。

上面我們講解的只是近實時協同過濾的一種實現方案，其實近實時協同過濾有很多可行的實現方案，我們的實現方案跟參考文獻6中的covisitation counts方案思路本質上是一致的。讀者也可以閱讀參考文獻5，騰訊給出了另外一個利用Storm來實時實現協同過濾的方案，思路是非常值得借鑑的。另外參考文獻6中Google實現了一個新聞的協同過濾算法，通過MinHash算法基於用戶行為來近實時計算用戶相似度，最終通過類似基於用戶的協同過濾的算法來為用戶推薦。參考文獻7、8也對怎麼增量做協同過濾給出了獨特的方法和思路。

五、協同過濾算法的應用場景

協同過濾是非常重要的一類推薦算法，我們在第三、第四節介紹了批處理(離線)協同過濾和近實時協同過濾的工程實現方案，相信大家對怎麼基於Spark及HBase技術實現協同過濾有了比較清晰的認知。那麼協同過濾算法可以用於哪些推薦業務場景呢？它主要的及延伸的應用場景有如下3類：

1.完全個性化推薦(範式)

完全個性化推薦是為每個用戶推薦不一樣的標的物推薦列表，我們在第二節中所講解的兩類協同過濾算法即是完全個性化推薦的方法，所以協同過濾可以用於該場景中。我們在第三、第四節中也非常明確地給出了從工程上實現完全個性化推薦的思路。

下圖是電視貓電影猜你喜歡推薦，這是一類完全個性化推薦範式，這類推薦可以基於協同過濾算法來實現。

圖12：電視貓完全個性化推薦：電影猜你喜歡

2.標的物關聯標的物推薦(範式)

雖然第二節沒有直接講標的物關聯標的物的算法，但是講到了怎麼計算兩個標的物之間的相似度(即圖2中評分矩陣的列向量之間的相似度)，我們利用該相似度可以計算某個標的物最相似的K個標的物(在第三節1中我們給出了實現標的物相似性的工程實現，在第四節4中我們也給出了近實時計算標的物相似度的實現方案)。那麼這K個最相似的標的物就可以作為該標的物的關聯推薦。

下圖是電視貓相似影片推薦，是一類標的物關聯標的物推薦範式，這類推薦可以基於協同過濾算法中間過程中的標的物topN相似度計算來實現。

圖13：電視貓標的物關聯標的物推薦：相似影片

3.其他應用形式及場景

在協同過濾算法的講解中，我們可以將用戶或者標的物用向量表示(用戶行為矩陣中的行向量和列向量)，有了用戶和標的物的向量表示，我們就可以對用戶和標的物做聚類了。

對用戶聚類後，當然可以用於做推薦，將同一類中其他用戶操作過的標的物推薦給該用戶就是一種可行的推薦策略。同時，用戶聚類後，也可以用於做lookalike類的商業化(如廣告)嘗試。

對標的物聚類後，也可以用於做標的物關聯推薦，將同一類中的其他標的物作為關聯推薦結果。另外，標的物聚類後，這些類可以作為專題供編輯或者運營團隊來作為一種內容分發的素材。

六、協同過濾算法的優缺點

前面對協同過濾算法做了比較完備的講解，也提到了協同過濾算法的一些特點，這裡我們簡單羅列一些協同過濾算法的優缺點，方便大家更進一步深入瞭解協同過濾算法。

1.優點

協同過濾算有很多優點，總結下來最大的優點有如下幾個：

(1) 算法原理簡單、思想樸素

從前面的幾節講解中不難看出，協同過濾算法的實現非常簡單，只要懂簡單的四則混合運算，瞭解向量和矩陣的基本概念就可以理解算法的原理。估計在整個機器學習領域，沒有比這個算法更直觀簡單的算法了。

協同過濾的思想是簡單的”物以類聚“、”人以群分“的思想，相信大家都可以理解，正因為思想樸素，所以算法原理簡單。

(2) 算法易於分佈式實現、可以處理海量數據集

我們在第三、第四節分別講解了協同過濾算法的離線和實時工程實現，大家應該很容易看到，協同過濾算法可以非常容易利用Spark分佈式平臺來實現，因此可以通過增加計算節點很容易處理大規模數據集。

(3) 算法整體效果很不錯

協同過濾算法是得到工業界驗證過的一類重要算法，在Netflix、Google、Amazon及國內大型互聯網公司都有很好的落地和應用。

(4) 能夠為用戶推薦出多樣性、新穎性的標的物

前面講到協同過濾算法是基於群體智慧的一類算法，它利用群體行為來做決策。在實踐使用中已經被證明可以很好的為用戶推薦多樣性、新穎性的標的物。特別是當群體規模越大，用戶行為越多，推薦的效果越好。

(5) 協同過濾算法只需要用戶的行為信息，不依賴用戶及標的物的其他信息

從前面的算法及工程實踐中大家可以知道，協同過濾算法只依賴用戶的操作行為，不依賴具體用戶相關和標的物相關的信息就可以做推薦，往往用戶信息和標的物信息都是比較複雜的半結構化或者非結構化的信息，處理起來很不方便。這是一個極大的優勢，正因為這個優勢讓協同過濾算法在工業界大放異彩。

2.缺點

除了上面介紹的這些優點外，協同過濾算法也存在一些不足的方面，具體來說，在下面這些點，協同過濾算法存在軟肋，有提升和優化的空間。

(1) 冷啟動問題

協同過濾算法依賴用戶的行為來為用戶做推薦，如果用戶行為少(比如新上線的產品或者用戶規模不大的產品)，這時就很難發揮協同過濾算法的優勢和價值，甚至根本無法為用戶做推薦。這時可以採用基於內容的推薦算法作為補充。

另外，對於新入庫的標的物，由於只有很少的用戶操作行為，這時相當於用戶行為矩陣中該標的物對應的列基本都是零，這時無法計算出該標的物的相似標的物，同時，該標的物也不會出現在其他標的物的相似列表中，因此無法將該標的物推薦出去。這時，可以採用人工的策略將該標的物在一定的位置曝光，或者強行以一定的比例或者概率加入推薦列表中，通過收集該標的物的行為解決該標的物無法被推薦出去的問題。

在第七節我們會更加詳細介紹協同過濾的冷啟動解決方案。

(2) 稀疏性問題

對於現代的互聯網產品，用戶基數大，標的物數量多(特別是新聞、UGC短視頻類產品)，一般用戶只對很少量的標的物產生操作行為，這是用戶操作行為矩陣是非常稀疏的，太稀疏的行為矩陣計算出的標的物相似度往往不夠精準，最終影響推薦結果的精準度。

七、協同過濾算法落地到業務場景需要關注的問題

協同過濾算法雖然簡單，但是在實際業務中，為了讓它有較好的效果，最終對業務產生較大的價值，我們在使用該算法時需要注意如下問題。

1.是採用基於用戶的協同過濾還是採用基於標的物的協同過濾

在互聯網產品中一般會採用基於標的物的協同過濾，因為對於互聯網產品來說，用戶相對於標的物變化更大，用戶是增長較快的，標的物增長相對較慢(這也不是絕對的，像新聞、短視頻類應用標的物也是增速巨大的)，利用基於標的物的協同過濾算法效果更穩定。

2.對時間加權

一般來說，用戶的興趣是隨著時間變化的，越是久遠的行為對用戶當前的興趣貢獻越小，基於該思考，我們可以對用戶的行為矩陣做時間加權處理。將用戶評分加上一個時間懲罰因子，對久遠的行為進行一定的懲罰，可行的懲罰方案可以採用指數衰減的方式。例如，我們可以採用如下的公式來對時間做衰減，我們可以選擇一個時間作為基準值，比如當前時間，下式中的n是標的物操作時間與基準時間相差的天數(n=0時，w(0)=1)。

3.關於用戶對標的物的評分

在真實業務場景中，用戶不一定對標的物評分，可能只有操作行為。這時可以採用隱式反饋的方式來做協同過濾，雖然隱式反饋的效果可能會差一些。

但同時，我們是可以通過一些方法和技巧來間接獲得隱式反饋的評分的，主要有如下兩類方法，通過這兩類方法獲得評分，是非常直觀的，效果肯定比隱式反饋直接用0或者1好。

雖然很多時候用戶的反饋是隱式的，但用戶的操作行為是多樣化的，有瀏覽、點擊、點贊、購買、收藏、分享、評論等等，我們可以基於用戶這些隱式行為的投入度(投入的時間成本、資金成本、社交壓力等，投入成本越大給定越高的分數)對這些行為人為打分，比如瀏覽給1分，點贊給2分，轉發給4分等等。這樣我們就可以針對用戶不同的行為生成差異化的評分。

對於像音樂、視頻、文章等，我們可以記錄用戶在消費這些標的物上所花的時間來計算評分。拿視頻來說，如果一個電影總時長是100分鐘，如果用戶看了60分鐘就退出了，那麼我們就可以給用戶打6分(10分制，因為用戶看了60%，所以打6分)。

4.相似度計算

我們在前面講解協同過濾算法時需要計算兩個向量的相似度，本文前面採用的是cosine餘弦相似度。其實，計算兩個向量相似度的方式非常多，cosine餘弦是被證明在很多場景效果都不錯的一個算法，但並不是所有場景cosine餘弦都是最好的，需要針對不同場景做嘗試和對比。在這裡，我們簡單羅列一些常用的相似度計算的方法，供大家參考。

(1) cosine餘弦相似度

前面已經花了很大篇幅講解了cosine的計算公式，這裡不贅述。需要提一點的是，針對隱式反饋(用戶只有點擊等行為，沒有評分)，向量的元素要麼為1要麼為0，直接用cosine餘弦公式效果不是很好，參考文獻5針對隱式反饋給出了一個更好的計算公式(見下面圖14)，其中

是用戶u對標的物p的評分(對於隱式反饋，評分是0或者1，但是參考文獻5針對用戶不同的隱式反饋給出了不同的評分，而不是一律用1，比如瀏覽給1分，收藏給3分，分享給5分等，

取用戶u對標的物p所有的隱式反饋行為中得分最高的)。

圖14：一種優化後的計算隱式反饋相似度的公式，類似cosine餘弦公式

(2) 皮爾森相關係數(Pearson correlation coefficient)

皮爾森相關係數是一種線性相關係數。皮爾森相關係數是用來反映兩個變量線性相關的程度的統計量。具體計算公式如下面圖15，其中

和

是兩個向量，

和

是這兩個向量的均值。參考文獻9中有對怎麼利用皮爾遜相關係數做協同過濾的介紹，感興趣的讀者可以參考學習。

圖15：皮爾遜相關係數的計算公式

(3) Jaccard coefficient

Jaccard係數用於計算兩個集合之間的相似度，也比較適合隱式反饋類型的用戶行為，假設兩個標的物

，操作過這兩個標的物的用戶分別為：

和

，

那麼Jaccard係數的計算公式如下：

5.冷啟動問題

前面在講協同過濾算法的缺點時講到協同過濾算法會存在嚴重的冷啟動問題，主要表現在如下3個方面：

(1) 用戶冷啟動

所謂用戶冷啟動就是新用戶沒有太多的行為，我們無法為他計算個性化推薦。這時可行的推薦策略是為這類用戶推薦熱門標的物、通過人工編排篩選出的標的物。或者用戶只有很少的行為，協同過濾效果也不好，這時可以採用基於內容的推薦算法補充。

(2) 標的物冷啟動

所謂標的物冷啟動就是新的標的物加入系統，沒有用戶操作行為，這時協同過濾算法也無法將該標的物推薦給用戶。可行的解決方案有三個：

首先，這類標的物可以通過人工曝光到比較好的推薦位(如首頁)上，在盡短的時間內獲得足夠多的用戶行為，這樣就可以“啟動”協同過濾算法了。這裡有個比較大的問題是，如果該標的物不是主流的標的物、不夠熱門的話，放在好的位子不光佔用資源同時對用戶體驗還不好。

其次，在推薦算法上做一些策略，可以將這類新的標的物以一定的概率混雜在用戶的推薦列表中，讓這些標的物有足夠多的曝光，在曝光過程中收集用戶行為，同時該方法也可以提升用戶推薦的多樣性。

最後，這類標的物也可以通過基於內容的推薦算法來分發出去，作者在《基於內容的推薦算法》中已經講過內容推薦，這裡不再贅述。

(3) 系統冷啟動

所謂系統冷啟動，就是該產品是一個新開發不久的產品，還在發展用戶初期階段，這時協同過濾算法基本無法起作用，最好採用基於內容的推薦算法或者直接利用編輯編排一些多樣性的優質內容作為推薦備選推薦集。

總結

至此，協同過濾推薦算法基本講完了，在最後我們做一個簡單總結。本文對協同過濾算法原理、工程實踐進行了介紹，在工程實踐上既講解了批處理實現方案，同時也講解了一種近實時實現方案。並且對協同過濾的產品形態及應用場景、優缺點、在落地協同過濾算法中需要注意的問題進行了介紹。希望本文可以幫助讀者更深入地瞭解協同過濾推薦算法。參考文獻中的材料從學術上、工業界都對協同過濾算法原理、實踐從不同視角及場景進行了論述，具有非常大的參考價值，值得大家閱讀學習。

參考文獻

Item-based collaborative filtering recommendation algorithms
item-based top-n recommendation algorithms
Collaborative filtering for implicit feedback datasets
Amazon.com reecommendations: Item-to-item collaborative filtering
TencentRec- Real-time Stream Recommendation in Practice
Google news personalization: Scalable online collaborative flitering
Forgetting mechanisms for incremental collaborative filtering
Scalable collaborative filtering using incremental update and local link prediction
GroupLens：An Open Architecture for Collaborative Filtering of Netnews
An algorithmic framework for performing collaborative filtering
A survey of collaborative filtering techniques
[2011] Collaborative filtering recommender systems

分享到:

閱讀更多 gongyouliu 的文章

關鍵字: 美好，一直在身邊過濾推薦技術

商湯提出基於空間修剪的 NAS 算法

Learning To Rank 算法 RankNet

【算法】排序算法之基數排序

【算法】排序算法之桶排序

【算法】排序算法之計數排序

【算法】排序算法之堆排序

數據結構與算法：算法

【算法】位運算與經典八皇后問題

什麼是算力？算法？一文看懂算法學習拓撲圖

查找-hash 算法

爭取能讓大家都能看懂的 DFA 算法

視頻分析與對象跟蹤-CamShift 算法

史上最全GAN綜述2020版：算法、理論及應用

人工智能的靈魂——算法

阿里2020年內部PPT全棧分享：架構、大數據、算法

深入理解 React diff 算法

03.03 史上最全GAN綜述2020版：算法、理論及應用

圖像分割實戰-分水嶺分割方法和GrabCut 算法

03.02 分佈式系統ID的生成方法之UUID、數據庫、算法、Redis、Leaf方案

02.25 《GANs生成式對抗網絡綜述：算法、理論與應用》最新論文

Python 算法 10 -- 廣度優先搜索（BFS）

一文讀懂 MD5 算法

Python 算法 09 -- 散列表

Python 算法 08 -- 快速排序

淺顯介紹“二進制枚舉”算法

分佈式系統ID的生成方法之UUID、數據庫、算法、Redis、Leaf方案

01.20 Python 算法 08 -- 冒泡排序及其優化

01.17 Python 算法 06 --“又愛又恨”的遞歸算法

01.16 Python 算法 05 -- 3+4*5-6=？在棧中的調用

Python 算法 01--二分查找

C++基礎知識-算法

palindrome(迴文)算法

12.07 面試又被問到一致性 Hash 算法？這樣回答秒殺面試官

算法--我的紅黑樹學習過程

用講故事的辦法幫你理解 SMO 算法

漫畫說什麼是 LRU 算法？

算法--平衡二叉樹AVL原理分析以及代碼實現

算法-二叉查找樹BST

10.12 CPK的“另類”算法

「分佈式」看完這個動畫秒懂 Raft 算法

貝葉斯個性化排序(BPR)算法

01.10 路徑規劃之 A* 算法

算法：時間複雜度+二分查找法(Java

算法：加權輪詢算法

算法：分治算法

06.29 「算法」如何判斷鏈表有環

06.19 算法——初級排序算法

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

剛剛:剛剛工作的畢業生，一個月只有2000多，是不是太少了？根據你城市消費水平來看啊，還有你從事的工作，假如你在二三線城市做一份事業單位或者是編制類的工作，薪資水平是隨著你工作年限逐年增長的，而且在年終也有很多福利補貼待遇等等，算下來收入也是可觀的，再舉一個例:-畢業生 2000

為什麼只有edg賺錢？

電競行業作為一個新興產業，這幾年發展勢頭越來越好，IG戰隊，FPX戰隊先後奪得了s8-s9世界賽的冠軍，據俱樂部知情人士透露，除了國內的幾家豪門俱樂部之外，其他俱樂部基本都是虧錢在做的，當然EDG也是:-edg 賺錢:為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

20000:網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？天貓旗艦店，或者淘寶旗艦店，或者京東旗艦店肯定包真，質量好，再說可以官方驗證啊，不能圖那十塊五塊的便宜，畢竟一個充電寶要用好久呢，一兩年沒問題的。:-羅馬仕馬仕毫安

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

沒有取得房抄產證的房子可以轉讓。但如果確定無法取得房產證的，房產轉讓不受法律保襲護。一般情況下，只有取得房產證的房屋才能確定房屋產權人，才具有轉讓的條件。但如果房屋是合法取得的，以百後可以依法辦理度房:-轉賣房產證商品房拿到:我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

鋒利突厥人你這樣說只能說明你對歷史非常不瞭解，我先用一句話概括突厥被大唐雄兵打的有多慘：三次滅國，背井離鄉，遠赴西亞，打不過，俺躲著你還不行嗎？突厥的意思是中間慫起的頭盔。其來歷已經不可靠，可能有著匈奴、鮮卑或:-復國大唐:為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

小高層 60:小高層16層高樓間距60米哪一層比較好？首先需要明白，選擇層數居住與樓間距毫無關係，住在哪一層，肉眼看對面樓的距離，是相差不大的。設定樓間距60米，純粹是混淆視聽。其實，一幢樓的樓層總數確定的情況下，到底哪一層最佳？很簡單，取總層數乘以黃金:-樓間距層高

金銀花盆栽好養嗎？怎麼養？

金銀花可以盆栽，很好養的！金銀花，是忍冬科的常綠纏繞灌木，枝條柔韌修長，多攀爬或匍匐生長。金銀花生性強健，在我國的很多南方省份野外很多地區都能看到它的身影，葉子常年翠綠，到夏季開花，飄香四溢。所以，有:-金銀花盆栽:金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

長城真的無用嗎？在今天許多人認為長城無用，古代國家舉國之力建造的長城不過只是文物，就連康熙都曾作詩諷刺，原文如下：萬里經營到海涯，紛紛調發逐浮誇。當時用盡生民力，天下何曾屬爾家。-康熙但真的如此嗎？小:-匈奴抵禦長城:長城對於抵禦古代匈奴和蒙古人起到了多大作用？蒙古人

什麼樹可以嫁接臘梅？

臘梅只能嫁接在不同品種的臘梅上，其他的樹種不行！臘梅的繁殖可以用播種，壓條，嫁接，分株等繁殖方法。播種法因不易保持花卉的原有優良特性，且播種的優點是在於大量繁殖，而臘梅大都只需培植少量幾株，故一般都不:-臘梅嫁接:什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

堪憂五一假期:行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？事實上，因為教育培訓都是預收費用的模式。但凡有一點點規模的培訓機構老師。在上半年，帶課量是可以得到保證。:-課時量

在農村“立夏節”都有哪些民間習俗？

民間習俗農村:在農村“立夏節”都有哪些民間習俗？在農村“立夏節”都有哪些民間習俗一、農村立夏常見的習俗風俗活動：1、吃雞蛋“立夏吃蛋”習俗由來已久，俗話說“立夏吃了蛋，夏天不疰夏”。據說立夏開始天氣越來越熱，村裡小孩兒會有身體疲勞四肢無力的感覺，吃:-立夏節

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

失望分手看法:男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？你的這個問題特別的有趣，我覺得你先不要看你要怎麼做才讓他才能讓他對你的印象有所改變，你要去看為什麼是兩個月之後可以在一起，這兩個月他會用來做什麼，為什麼會有這兩個月？例如他的身體碰到了什麼樣的問題嗎？:-答應我

工程分包乙方人員傷殘誰承擔？

承擔:工程分包乙方人員傷殘誰承擔？分包乙方分包致人傷殘責任誰承擔？嚴格來說，需要了解更多傷殘原因才能區分的，作為非專業人士，自己發表一點淺見供題主參考：1、如果甲方是央企的話，他們合同中的責任、義務等條款內已經將自己的責任全部撇開了，更會:-乙方傷殘

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

實際上:有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？歷史人物聯繫這個詞貌似太寬泛了，就好像有一個調皮的答案說的，胡亥和溥儀相隔2000多年，牽強的找，也有聯繫：都是亡國之君不是。我想題主的意思是兩個看起來應該風馬牛不相及的人物，在歷史上居然是熟悉或是一個時代的:-毫不相關

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

法系車不保值，如果準備常開可以入手，性價比高，價格應該在二至三萬之間，二手車一車一況，一況一價，居體價格看車況。:-錢能水泡:13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？世嘉自動擋

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

17年駕駛證二手:22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？建議買日系二手車，開順了賣了，買新車，昂克賽拉無法再次出手時獲得好價格，而且也不省油，開完日系車直接換德系:-昂克賽拉

如何騎車去臺灣騎行？

騎車在臺灣沒有迴歸內地前，最好不要去臺灣，一是國內政策不允許你去臺灣，因為已停止了臺灣個人遊。二是你偷著去臺灣旅遊，安全沒有保障，偷渡客在哪裡也沒有安全保障的。以後內地政策允許個人去臺灣旅遊了，建議那時再:-騎行臺灣:如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

預算:本人預算5萬左右，想買一輛二手法系車！求推薦？ 5萬預算5萬元左右，想買一輛二手法系車？推薦東風標緻老款308車型。1 5萬元可以買標緻308車況好的，沒大事故呢，年限15年左右，公里數3萬左右，手動檔車型。2 標緻308車型，底盤調教紮實，跑高速穩定:-法系二手

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

道奇你好，好高興回答你的問題！14年進口馬自達5和10年月道奇酷威個人感覺馬自達5比較划算。新車價馬5報價29.99萬，酷威19.38萬兩款車都是原裝進口，馬5屬於日系，酷威屬於美系。兩款車不屬於同類車型:-酷威馬自達 14年:14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

特殊津貼高校人才就要重視，河南省高校人才更要重視，這個人才不是評出了的，而是推薦出來的，沒有推薦，連參評的資格都沒有。國務院特殊津貼人員推薦，不推薦是百分百沒希望，推薦了希望就非常，那麼是什麼是國務院特殊津貼:-河南大學並列 2020年:2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

李老貓說車為你非專業解答各種選車用車問題本田crv定位於一款緊湊級suv產品，主要對飈豐田榮放，日產奇駿，這款車整體市場表現非常突出，2019年全年累計銷量為18.44萬臺，平均月銷1.5萬以上，其深:-舒適版本田油耗:本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

1.世界經濟遭到重創疫情影響之下，各行各業基本屬於停工停產的狀態，在世界經濟趨於一體化的今天，停工停產勢必會造成一系列的連鎖反應，最後導致的結果可能會引發金融危機。2.世界格局可能發生改變美國仍是世界:-頭腦風暴控制:國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？疫情國外

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

如果有15萬元的預算，讓你選擇一臺空間和動力都很不錯的小型SUV，我覺得很多的讀者都會想到本田XRV這款車型。因為本田XRV確實太出色了，和同級別的其他盒子SUV車型相比，這款車在空間和動力上都有優勢:-xrv 自動:本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？本田豪華版

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

何去何從:現在存款有14萬，借了5萬還沒收回來，該做什麼好？續租存款利息率較低，可以投資較高收益的項目，比如投資基金，一般情況下可獲得6%一10%的回報。如果行情好可達到50%以上收益，去年不少基金超過這目標。目前受疫情影響，股市在低位震盪，也是基金投資的機會。一:-存款 2300

2070super和5700xt買哪個比較好？

如果是玩遊戲毫無疑問選擇n卡，也就是2070 suep。如果追求性價比可以選擇a卡，也就是5700xt. 為什麼遊戲選n卡呢？首先遊戲廠商針對n卡優化比較多，然後就是功耗小，然後N卡架構執行效率極高，:-:2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

二胎我是兩個孩子的媽媽，曾經的我和你一樣，生完寶寶我也抑鬱了，我知道抑鬱症真的很痛苦，產後的那段日子我整天都不開心，做什麼事也沒積極性，誰也不想搭理，別人給我說話我就覺得很煩。忍不住衝家人發脾氣。每當一個:-生完抑鬱:生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？發火

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

感覺:人這一生遇到的人和事為什麼感覺都像是必然的經歷？正所謂有因必有果，所以你今天的因，就會產生明天的果。所以這一切你就會覺得是必然的。生活中大部分是普通人大家的生活規律，生活方式，大致相同。當你看到別人家庭的果，自己家也產生同樣的果，你就會覺得這一切是:-人和經歷

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

校內:現在校內校外到底教的是美式英語還是英式英語還是混搭英語？校外英式答案肯定是不唯一的！美式英語現在是主流，少量英式發音也個別存在！但對於孩子來說，肯定是混搭英語，因為孩子肯定不是一直一位老師教下去，肯定會換老師！而老師的發音肯定是既有英式的，也有美式的！就連一些英語:-美式英語

上有老下有小，我們真的跳不出這個人生循環了嗎？

上有老魔咒:上有老下有小，我們真的跳不出這個人生循環了嗎？的確如此，儘管現在不結婚，晚婚的人很多，但是從人類繁洐生息的歷史和大多數人來看，成家立業，生兒育女，家庭仍是主流，一個人的生理，心理和生存需求決定了生存狀態，生兒育女，瞻養父母即是義務責任，也是生活動:-下有小

如果外面正在下小雨，你會突然想起了誰？

想起:如果外面正在下小雨，你會突然想起了誰？我最不忘，還是秋日的雨夜，天又涼了幾分，已經需要披上一件薄薄的外套了。臨窗而望，眼見窗臺上的幾株小植物，葉片上沾了幾滴小雨珠，我總喜歡，用小手電去照它們，這樣的小水滴看起來晶瑩晶瑩的，有一種清清涼涼的:-小雨

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

初中同學:初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？吃飯許久未見，意思就是交情不怎麼樣，無功不受祿，人家憑什麼那麼熱情，難道真的是多年一來忘不了咱們之間的同學情誼，倍感想念了嗎，不是請幫忙、做業務、就是借錢，十有八九十借錢。我建議還是不要去的好，大家都很忙:-許久未見

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

出口心理:現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？愛你更多的是心裡問題，可能對方還沒有優秀到你滿意的程度，更沒有到那種離不開的地步！愛情最終還是要回歸生活，而生活離不開兩個人的相處，父母終究會老，孩子終究會飛，所以選擇自己的伴侶尤為重要，你現在覺得噁心更:-喜歡你

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

再見王瀝川好看:劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？《遇見王瀝川》吧，高以翔的王瀝川太招人稀罕了。長相，身材，家世，人品，才能樣樣好，簡直完美，挑不出任何毛病，實在要說一個缺點的話，那就是太tm完美，天妒英才、才讓他飽受病魔折磨。偶像劇、深情帥氣的男主:-何以笙簫默

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

學歷是求職必備條件。有了工作不能停止對知識的探索。更高的學歷，可以讓你有更專業的技術能力和學習能力，可以讓你拓展自己的交際圈，可以讓你更知名。總之，活到老，學到老，學習對人總是有好處的，技多不壓身嘛！:-字節跳動:計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？讀研計算機專業

生完二胎的你們，現在有什麼感想？

二胎家庭日常是什麼樣的？是不是覺得家裡多了一個小人兒，溫馨多了？不存在的！生二胎根本是媽媽們的渡劫磨礪！以前週末睡到自然醒，現在全年無休，時刻警醒著，能睡一次懶覺跟過年似的，黑眼圈不說，頭髮呼啦啦地掉:-生完二胎感想:生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華北適合種植蠶豆，種蠶豆的面積大，在西北，華北，都在種植蠶豆，蠶豆莖稈根部有根瘤菌是種植其它農作物的好茬地，特別是土壤培養和防病蟲害起到作用。:-蠶豆種植適合:華北適合種植蠶豆嗎？華北

華為手機更新EMUI10.1系統後效果咋樣？

大家知道現在智能手機的性能不僅僅跟智能手機的硬件有關，還跟智能手機的系統軟件息息相關，在國產智能手機操作系統裡，小米的MIUI系統跟華為的EMUI系統都是比較優秀的操作系統。最近小米推出了小米MIUI:-咋樣華為華為手機更新:華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

蜜蜂爬到:大熱天蜜蜂老是爬到箱外結群正常嗎？盜蜂現在正是夏季，很多地方蜜源稀少，蜂群中可能缺蜜，也是胡蜂猖獗的時間，所以蜂群中是非常容易發生盜蜂的。在蜂群中發生盜蜂的時候，蜂群守衛蜂會增多，但是這種情況引發的蜜蜂在蜂箱外一般不會結團，只是蜜蜂來:-大熱天

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

最佳期霧都山客來回答您的問題。最近山客家鄉的村民正在進行辣椒移栽，確實有像題主提到的情形，辣椒苗移栽前長勢蔥蔥，嫩綠喜人，但是移栽後幾天內就出現萎蔫現象，細心觀察也不是被病蟲害危害。那究竟是什麼原因導致辣椒:-苗蔫辣椒咋回事:辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

最近這幾年手機在電子產品行業裡可謂是發展速度非常快，蘋果和華為兩大公司可以說也是，明爭暗鬥，產品一次比一次有賣點，前一段時間華為和蘋果還都推出了手機新品，兩家都在大力宣傳強調著拍照功能，像iPhone:-形態相機手機最終:手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

5寸手機支持:華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？很高興回答你的問題，刷頭條刷出來的問題，看到很多人回答，感覺還有一些觀點沒有寫出，所以我來回答一下。首先，華為為什麼不出小尺寸全面屏手機？其實並不只有華為一家沒有出小屏手機，放眼近期各大手機廠商發佈的:-華為

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

胡蘿蔔蔬菜:生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？第一種，黃瓜。這個瓜，可不是菜市場中堆放滿滿的青瓜。各位可要睜大眼睛看清楚了，這個黃瓜，青中帶黃，品種屬以前鄉下農戶少量種植的，形態上面來看這種瓜矮、短、圓，表面覆蓋有比較淡的細毛，經水輕輕沖洗之後整:-山芋

為什麼馬鈴薯不宜過早過遲播種？

不宜:為什麼馬鈴薯不宜過早過遲播種？播種過早為什麼馬鈴薯不宜過早過遲播種？馬鈴薯的種植主要是由於氣候條件的限制，過早出苗後容易遇到低溫被凍死，種植晚了容易遇到乾旱和高溫，影響產量。馬鈴薯種植時間的早晚必須根據種植地方的氣候條件來確定。馬鈴薯生長:-馬鈴薯

疫情愈發嚴重，原油為何反而大漲？

原油愈發:疫情愈發嚴重，原油為何反而大漲？疫情愈發嚴重和原油大漲沒有必然關係。但是資金總是從高處流向低處，原油價格跌的越多，投資價值越明顯，相對於其他產業更有投資價值。舉個例子：深圳南山房價均價大約6萬左右，寶安均價5萬左右，如果南山房價漲到:-疫情

生菜球很好吃，怎麼種植才能高產呢？

種植:生菜球很好吃，怎麼種植才能高產呢？高產對環境條件的要求、1.溫度生菜球為喜冷涼、忌高溫作物，種子在4度以上可發芽、以15～20度為發芽適溫。幼苗能耐較低溫度，日平均溫度12度時生長壯健，葉球生長最適溫度為13～16度。不過目前有些結球生菜:-生菜

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？

看下這個戶型三房改四房，改一個小房間，應該沒有問題。△原戶型圖這個戶型改四房，能改的方案比較多，但是修改以後是否好用，是一件值得考慮的事情。一、主臥室變為兩個臥室可以將主臥室改為兩個臥室，但是這樣的改動佔:-房改 122:裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？ 144

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

房子:大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？這個戶型砸牆，當然可以砸牆，但是在砸牆之前，要搞清楚為什麼要砸牆，砸牆以後有什麼優劣。△原戶型原戶型圖上的白色牆體部分不是承重牆，理論上說否可以砸掉。但是外牆和與旁邊戶型或者是公共區域的共用牆體和圖上:-幫忙

意蜂夏季喝什麼水降溫？

降溫意蜂夏季喝什麼水降溫？氣溫高，蜂巢溫度高的情況下，蜜蜂是通過採水的辦法掛在蜂箱的四壁來蒸發帶走熱量，降低蜂巢溫度同時也能幫助蜂群維持正常的溼度。在平常的情況下，蜜蜂是在室外採自然水的。夏季消耗的水量:-意蜂夏季:意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

黃瓜種子:黃瓜種子催芽後種植需要打底水嗎？你好很高興回答這個問題。答案：不用。1-2天可出芽。黃瓜種子催芽：選用飽滿的種子，用30℃水浸泡4小時後催芽。也可用100倍福爾馬林溶液浸泡種子10-20分鐘，洗淨後清水浸種3-4小時，然後於25-3:-催芽黃瓜打底

書友們展示一下自我感覺發揮較好的作品，一起學習？

自我較好這幅作品是參賽的，色彩的搭配，紙張的拼接都是自己設計完成的，一如既往的清新淡雅感覺。書體用的魏碑中楷書，增加了書寫的趣味性。:-書友展示:書友們展示一下自我感覺發揮較好的作品，一起學習？