此次數據爬取我們參考了之前其他文章中對於貓眼數據的爬取方法,調用其接口,每次取出部分數據並進行去重,最終得到上萬條評論,代碼如下:
私信小編007即可獲取數十套PDF哦!
數據分析
我們看一下所得到的數據:
數據中我們可以得到用戶的暱稱,方便後面進行去重。後面的部分主要圍繞評分、城市、評論展開。
首先看一下,評論分佈熱力圖:
在評論數量最多的二十個城市中,評分前七名的城市中東北獨佔四席,而分數相對較低的城市中武漢、合肥、鄭州都屬於中部地區,可見不同地區的觀眾對影評的認可程度有著一定差異。
較高區域:
較低區域:
不知道大家的想法如何,至少在我看到了這樣的詞雲,搞笑、笑點、值得、開心、不錯,甚至是哈哈都會激起我強烈的看片慾望。同時,沈騰也被大家反覆提起多次,可以預見其在片中有著非常不錯的表演,也會一定程度上激發大家看片的慾望。
我們看一下兩部影片前三天的走勢: