26萬條抖音數據背後的推薦邏輯:女性是男性的3倍

26萬條抖音數據背後的推薦邏輯:女性是男性的3倍

本篇文章採集了抖音的26W條數據,得出了以下分析結論,希望你感興趣:

15s不一定是最好的,可以試試10s;

男女比例嚴重失調,小哥哥的視頻更受喜愛;

“生活化”是抖音內容的主體,年輕人樂於表達愛和喜歡;

一些精細化運營的小技巧。

1

數據洞察

1、數據介紹

數據區間是2018年2月1日—5月10日,歷時兩個月,累計260968條。

採集過程中,對作者做了去重處理,也就是說每個作者只取了TA的一條視頻數據。

這也代表著我們擁有26W個作者的數據。

另外,數據均為前端可見數據,未使用任何違規操作。

2、首次推薦分水嶺是5000,請把贊“刷”到100+

做過今日頭條自媒體賬號的人應該瞭解,頭條的推薦算法是先把文章做小範圍推薦,查看文章在該部分人中的閱讀數據。

如果閱讀數據良好,則會擴大文章的推薦範圍。數據越好,推薦範圍則越大。

既然抖音是頭條系產品,那肯定採用了同樣的推薦邏輯。

26萬條抖音數據背後的推薦邏輯:女性是男性的3倍

即便這個結果在測試中得到了驗證,但是我卻不能給出實錘結論。

其次,與整體的樣本量相比,這部分數據只佔不到1%,沒有達到統計分析的樣本數要求。

3、看似紅紅火火,但瓶頸似乎已經到來

作者數據包含了賬號的註冊時間,我把作者的註冊時間按照月份統計,發現抖音用戶的增長似乎在放緩:

26萬條抖音數據背後的推薦邏輯:女性是男性的3倍

從上面的用戶註冊時間分佈來看,抖音用戶在2018年1月份達到頂峰,隨後開始逐月遞減,4月份已經只有3月份的一半!

實際上,這個數據仍然存在一些漏洞。

畢竟存在一種可能,就是新註冊的用戶不喜歡發佈視頻,而是在註冊一段時間後才開始發佈。

或者,新註冊用戶的視頻因為還未得到系統的推薦,被我們採集到的概率也隨之降低。

如果賬號的創建時間不能說明問題,我們來看另一組數據。

26萬條抖音數據背後的推薦邏輯:女性是男性的3倍

或許是因為視頻越來越堵,用戶已經麻木,但無論如何,早期的紅利在逐漸降低,想上車的要趕緊了。

4、拍滿15s不是最好的,10s更受用戶歡迎

目前抖音未公佈獲得視頻超過15s時長權限的機制,但至少我們知道“優質”是選拔的重要條件,所以在分析視頻時長時,我去掉了時長超過15s的視頻。

26萬條抖音數據背後的推薦邏輯:女性是男性的3倍

數據並不支持我們把視頻拍滿15s,10s是最好的,13s也不錯,甚至11s都優於15s。

由於超過15s的視頻數量僅6866條,在樣本中佔比太少,我就不再給出分析。在相同數量級下(均少於100條),39s、42s、50s和58s看上去效果不錯。

5、男女比例嚴重失調,小哥哥的視頻更受歡迎

統計26W個作者的性別,我發現抖音用戶中女性用戶數量接近男性的3倍!

顯然是嚴重失調。

26萬條抖音數據背後的推薦邏輯:女性是男性的3倍

(注:“無”代表用戶沒有填寫性別信息)

從用戶組成來看,就很容易理解為什麼抖音的帶貨能力這麼強了。

從購物能力來看,女性購買力更強,畢竟大部分錢都掌握在女性的手裡。

26萬條抖音數據背後的推薦邏輯:女性是男性的3倍

難不成是因為女性用戶多於男性,異性相吸?

6、生活化的內容是抖音的主流,年輕人願意表達愛與喜歡

使用新浪微輿情的文本分析功能,把視頻的描述文字做了詞性和情感方面的分析,發現生活化的內容是抖音的主體。

26萬條抖音數據背後的推薦邏輯:女性是男性的3倍

對視頻描述文本的詞性分析,動詞方面除了“喜歡”和“愛”以外,生活化的“想”、“拍”、“吃”是出現頻率最高的詞;

形容詞方面“快樂”、“開心”、“好看”和“可愛”是抖音用戶最喜歡錶達的感情;

名詞上“小哥哥”和“小姐姐”顯然已經成為發抖音的固定搭配。

26萬條抖音數據背後的推薦邏輯:女性是男性的3倍

整體詞頻方面,除了“小哥哥”、“小姐姐”以及“抖音小助手”以外,具備強烈生活色彩的“爸爸”、“我媽”、“弟弟”、“老公”、“我家”這些詞同樣被高頻率使用。

2

福利:一些抖音小技巧

1.精細化運營,一些小細節很重要

我們來看下面兩個視頻截圖,你發現什麼差別了麼?

26萬條抖音數據背後的推薦邏輯:女性是男性的3倍

如果兩個視頻都需要視頻描述來完善視頻的內容,那麼後一個視頻的效果會更好,因為相比於白色視頻背景,純黑色可以非常清晰的把底部的視頻描述凸顯出來。

2.能不能繞過機器篩選直接被推薦到更大的流量池?

隨著監管制度的完善,純機器算法篩選和推薦已經不能滿足用戶對高質量內容的需求,於是今日頭條引入了大量人工審核團隊。

這些人工除了審核內容是否違規外,還承擔發現優質內容、使其提前進入推薦隊列的職責(我猜的)。

如果我猜對了,那麼,如果視頻能跨過機器的迭代推薦,直達人工,豈不是會更快速的火起來?

這個方法就是在視頻描述里加入一些機器識別不準確的敏感詞,你們如果膽大可以試一試。

歡迎評論區留言,與大家分享哦。


分享到:


相關文章: