02.28 知乎數據分析調研:利用python爬取知乎讀者男女生愛好

本次對話題進行分析的重點在於:

男、女性用戶的話題關注差異話題頻繁項集和關聯規則挖掘用Word2vec量化話題之間的關聯性

話題分析

在社會化媒體中,話題是指一個有影響力的事件或者活動。而在知乎上,話題是由內容(問題和回答)和人(提問者、回答者和關注者)構成的,而且話題之間存在著父子級關係。

知乎上的“話題”有別於其他社會化媒體上的“標籤”,並非由用戶自由創建、自由使用。如果話題被合理的添加到問題上,就意味著根據社區的共識和使用習慣,一些可能相似的內容被聯繫在了一起。

本質上,話題的作用是連接人和問題,它描述的是一個領域。一類有共同主題或屬性的問題可以歸類到一個話題下。這些基於話題的聯繫和分組能夠幫助用戶方便、快速的發現某個主題的內容。

在知乎這個社會化媒體上,話題是用戶活動的基礎,用戶的信息創造、傳播、組織必須依賴於話題。因此,對知乎上“數據分析”相關用戶群體的話題偏好分析很有必要,它可以從宏觀上把握用戶的內容需求。

(1)男、女性用戶的話題關注差異

經統計,女性關注的話題數量有28727個,男性用戶關注的話題數量是 35774個,從關注話題豐富度上來看,男性用戶明顯要多於女性用戶。

二者關注話題的交併集情況如下所示:

知乎數據分析調研:利用python爬取知乎讀者男女生愛好


最後,小編想說:我是一名python開發工程師,

整理了一套最新的python系統學習教程,

想要這些資料的可以關注私信小編“01”即可(免費分享哦)希望能對你有所幫助


分享到:


相關文章: