02.28 知乎数据分析调研:利用python爬取知乎读者男女生爱好

本次对话题进行分析的重点在于:

男、女性用户的话题关注差异话题频繁项集和关联规则挖掘用Word2vec量化话题之间的关联性

话题分析

在社会化媒体中,话题是指一个有影响力的事件或者活动。而在知乎上,话题是由内容(问题和回答)和人(提问者、回答者和关注者)构成的,而且话题之间存在着父子级关系。

知乎上的“话题”有别于其他社会化媒体上的“标签”,并非由用户自由创建、自由使用。如果话题被合理的添加到问题上,就意味着根据社区的共识和使用习惯,一些可能相似的内容被联系在了一起。

本质上,话题的作用是连接人和问题,它描述的是一个领域。一类有共同主题或属性的问题可以归类到一个话题下。这些基于话题的联系和分组能够帮助用户方便、快速的发现某个主题的内容。

在知乎这个社会化媒体上,话题是用户活动的基础,用户的信息创造、传播、组织必须依赖于话题。因此,对知乎上“数据分析”相关用户群体的话题偏好分析很有必要,它可以从宏观上把握用户的内容需求。

(1)男、女性用户的话题关注差异

经统计,女性关注的话题数量有28727个,男性用户关注的话题数量是 35774个,从关注话题丰富度上来看,男性用户明显要多于女性用户。

二者关注话题的交并集情况如下所示:

知乎数据分析调研:利用python爬取知乎读者男女生爱好


最后,小编想说:我是一名python开发工程师,

整理了一套最新的python系统学习教程,

想要这些资料的可以关注私信小编“01”即可(免费分享哦)希望能对你有所帮助


分享到:


相關文章: