大數據的推薦算法真的很厲害嗎?

我在做畢設


現在許多平臺都使用大數據的推薦算法來向用戶推薦更適合的內容,那麼這個算法本身真的很厲害麼?

A 推薦算法的核心——分類器

一個平臺上的內容何止千萬,如何才能準確地找到你喜歡的那幾條呢?

  • 把用戶分類

通過你的點贊/轉發/停留/評論/不喜歡這此操作,為你打上標籤,把你分類到某一類別的用戶中。

關鍵點在於如何設計這些用戶操作和記錄的“機制”,讓用戶做最少的動作就能獲得最有效的信息,準確地把你分類到一個集中。

  • 把內容分類

對每個視頻/文章/問答/圖片打上標籤,這時會用到AI的一些算法,去準確地識別內容並分類。

B 推薦算法的難點

  • 數據量

這裡並不是說數據量越大越好,其實數據量過多也是算法的難處之一,涉及到如何存儲/如何處理/如何解析等等,能很好地處理龐大的數據的算法是非常不容易的。

  • 計算能力

手機上的軟件就那麼大,手機計算能力就那麼點,信息處理的能力非常有限,大部分計算是網站後臺服務器實現的,可是如何能夠利用每一臺手機這些小小地處理器,將部分信息進行預處理,也是很厲害的。

  • 自淨化能力

如果單純是喜歡看什麼,就讓什麼火,那後果是非常嚴重的,如果那樣,網絡上恐怕會充斥著黃色/暴力/低俗這些內容了。

所以推薦機制有一個很重要的能力,準確地識別的這些內容,並把它最快速度扼殺掉。

總結一下

大數據的推薦算法還真的是挺厲害的,想要做一個非常好的推薦機制,需要考慮的維度非常之多,需要處理的數據量非常之大,需要計算能力非常之強。


科技千里眼


當然,馬上要厲害到遠超你的想象。不過這些技術實際應用估計還要五年以上的時間。


Victor19901028


當然,信不信如果阿里巴巴的數據庫讓我管理,我能知道你穿什麼顏色的內褲,哪怕你沒有在淘寶上買過內褲!


我認識150020683


現在的大數據是互通的,你的資料在大數據裡是透明的,每個平臺都知道一清二楚


分享到:


相關文章: