用Python盤點那些豆瓣評分低於3.0的奇葩電影!

最近刷抖音,刷到一部抄襲《X戰警》電影海報的電影。 連電影海報都需要抄襲,這得是什麼爛片!

嘗試百度了一下,果然讓人哭笑不得,連雷神的麒麟臂都一起抄了。

《女媧日記》絕對刷新你的認識

看了一下它的豆瓣評分,竟然是2分。

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

縱橫觀影界那麼多年,看到的至少也是3分起步的電影,現在居然還有2分的電影

豆瓣評分最低打一星,換算成分數就是2分,因此豆瓣電影理論上的最低分不是0分,而是2分。

看來豆瓣對於某些電影還是挺照顧的。

感興趣的朋友可以去看下這部電影,感受下吐槽的樂趣。

好了,進入搬磚模式,今天就來爬取下豆瓣評分在3分一下的那些神片,看看有沒有你踩過的坑!

1

數 據 爬 取

| 頁面分析

由於頁面單次並不顯示所有的電影信息,加載電影是URL也沒有任何變化。 需要進一步研究頁面,找出真實需要爬取的URL信息。

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

通過該URL可以發現該頁面電影的詳細信息:

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

| 數據抓取

通過點擊加載更多,可以發現一些 規律:

真實URL中參數start會每次增加20,新的URL中呢也會相應的存儲對應的20部電影的信息。

掌握這些規律之後,就可以用代碼實現抓取了。

<code>for i in range(0,481,20):
url = "https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=%E7%94%B5%E5%BD%B1&start={頁面}&genres=%E5%89%A7%E6%83%85&countries=%E7%BE%8E%E5%9B%BD".format(頁面 = i)
data = requests.get(url,headers = headers).text
dicts = json.loads(data)
df = pd.DataFrame(dicts["data"])
if i == 0:
total_df = df
else:
total_df = pd.concat([total_df,df],axis = 0)/<code>

然後將爬取好的電影數據存入文件即可完成。後臺回覆 豆瓣電影 即可獲取。

2

數 據 概 況

爬取數據時爬取了所有的低分電影,但是電影基本集中在2000年往後,2000年之前的電影基本沒有低於3分的電影,可能因為這部分電影在這之前的評分方式不一致。 根據標籤爬取的低評分(評分在2-3區間內)電影總量在550部左右。

電影名稱,評分情況,電影信息和演職人員等信息截圖如下:

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

這裡面評分人數最多的是一部國產片《天機·富春山居圖》,孫健君導演、劉德華和志玲姐姐的作品,很不幸地看過這部電影,emmm......一言難盡。

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

金掃帚獎-最令人失望的影片也是實至名歸,非常好的爛片!

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

3

低 分 電 影 分 析

| 最近十年爛片數量變化

最近十年爛片數量節節攀升(當然電影總量也在上升),18年數量比較少,可能是因為爬取得不夠全,或者時間關係,部分電影還沒有收錄。 (19年數據不全,暫時未放進來)

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

如果看這幾年的爛片數量佔比的話,最近幾年的爛片佔比在上升,從爛片佔比這一個指標來說,影片質量下降明顯。

用Python盤點那些豆瓣評分低於3.0的奇葩電影!


| 不同地區的爛片數量

在獲取的500多部低評分電影中,最多的是中國的電影,其次是美國的電影,當然雖然這兩個地方的低分電影多,並不能說明我們或者美國的電影質量不好。

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

如果我們去看美國所有電影的評分分佈情況,雖然美國的爛片比較多,但是他們的總量電影也非常多,而且不同評分的電影數量分佈基本上滿足標準的良性正態分佈的關係。

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

這一次爬取了足夠多的的電影,這裡暫時不過多地深入了。 下一次會出個嚴肅的電影質量分析,敬請期待哈。

| 爛片中不同電影類型分佈

在獲取到的這些低評分電影中,最多標籤就是動作片、劇情和喜劇。

不會拍好作品的尬拍動作片

不知道叫什麼標籤的取個劇情片肯定錯不了

打喜劇標籤的主要是那些好聲音之為你轉身類綜藝大電影

一把把鐮刀揮向韭菜,瘋狂收著智商稅。

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

4

電 影 推 薦

評論人數較多的幾部爛片如下,看看有沒有你踩過的坑,反正我是看過排名第一的《天機·富春山居圖》。 (因為這是截止到18年的數據,所以《上海堡壘》僥倖躲過一劫)

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

仔細看了下這幾部電影的簡介,第二部也是個神片,感興趣的趕緊搜索看一下。

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

出於好奇搜了一下你們的女神,趙老師的幾部電影,果然都很出色。

一瞬間,青春期的那幾部電影吸引了眼球,現在回想起來還有點上頭。

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

看過富春山居圖,知道趙奕歡,看過這個榜單後整個人都不大好了,我簡直是爛片收割機本人。

用Python盤點那些豆瓣評分低於3.0的奇葩電影!

好了,我去面壁思過會。加群領取完整項目代碼哦:850591259


分享到:


相關文章: