從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖


從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖


前言

文的文字及圖片來源於網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯繫我們以作處理。

PS:如有需要Python學習資料的小夥伴可以加點擊下方鏈接自行獲取t.cn/A6Zvjdun

前一陣子,由於肖戰的“227事件”微博和朋友圈都被刷屏,起因在與肖戰的粉絲髮現在AO3作品庫平臺收錄關於肖戰的同人作品,認為該部作品影響了肖戰的形象,遂向有關部門舉報,最終告知知名同人網站A03(Archive of our own)作品庫無法被訪問。

這也對愛好同人作品的讀者與作者都造成了不可逆轉的傷害。隨即,他們聯合其他路人便組成227大團結,共同抵制肖戰及其粉絲,一時間與肖戰緊密聯繫的品牌商家紛紛撤換其代言人與品牌形象大使。

從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖

從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖


​小編並不是肖戰的粉絲,對其出演的作品看的也不多,這次就從爬蟲以及數據可視化的角度(數據來源是微博上肖戰的評論粉絲)來為大家呈現肖戰粉絲的人群畫像。

爬蟲邏輯分成三步:

01採集肖戰的所有微博

首先獲取明星發的所有的微博ID,在有了這些ID之後,便可以拼接成了微博評論的第一頁的URL


從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖

另外在翻頁的操作時,微博評論的下一頁鏈接的參數通常在本頁的末尾,所以在每次爬取時,也要記得抓取下一頁鏈接的重要參數

從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖


02採集肖戰微博底下的所有評論粉絲ID

由於時間有限,小編就沒有做轉發與點贊粉絲ID獲取的開發,但是原理類似。評論粉絲的ID獲取相對容易,在xpath的指引之下,


從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖

03爬取粉絲的微博主頁,並進行數據清洗

用戶基本信息頁面的鏈接通常為: “https://weibo.com/用戶id/info”,所以我們只要獲取用戶的id就可以拿到他的公開基本信息

從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖

當然每個用戶的設置不盡相同,一般來說,公開信息中包括,所在地、性別、生日以及標籤等等。

粉絲的人群畫像

01粉絲的地域分佈

從肖戰粉絲的地域分佈來看,廣東省、江蘇、四川以及浙江省這四個省份是其粉絲最為集中的四個省份,小編將粉絲的地域分佈投射到完整的地圖上,我們可以發現的是中部也有幾個省份,比如湖北、湖南兩省以及河南,也有不少粉絲喜愛著肖戰。

從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖

02粉絲的年齡分佈與星座

從粉絲的年齡分佈來看,大多數的粉絲年齡都集中在20歲以下的00後,以及20-25歲的90後的女性,而在30歲以上的粉絲群體則佔到了極少數,


從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖

拋開年齡,我們看星座,天秤座的粉絲是最多的佔到了15%,而天蠍座與射手座的粉絲數量位居其次,接近有9%的比重。不同的年齡階段以及不同的星座,對應著不同的性格特徵與喜好,或許商家品牌方在做廣告以及市場營銷的時候可以針對自己的目標人群精準推銷以提升產品的銷量

從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖

03粉絲的標籤

從粉絲自己選擇屬於自己的標籤來看,她們愛美食,是一個典型的吃貨;她們熱愛旅遊,想要去看一下外面的世界;她們或許也比較的,空餘的時間會選擇宅在家裡,聽聽歌,看看電影與動漫;她們中的大多數都是00後甚至是90後的學生,喜歡自由與無拘無束的生活。


從爬蟲數據可視化的角度來為大家呈現“227”後,肖戰粉絲數據圖

從肖戰的“227”事件當中,我們能夠看出的是整個圈子當中存在的畸形文化,粉絲在追星過程當中,對粉的人與事都傾注了太多的情感,他們希望自己的想法與觀點能夠被他人所接受與認同,所以在情緒高漲之時,難免會有過激的語言與舉止。同時在互聯網的海量信息之下,年輕又不諳世事的粉絲又很難做到理性的分析與判斷。

但是,處於這個萬物聯網時代下的圈層之中,因為某種情感投入和熱愛而聚集到一起的,喜歡參與又渴望被認可的,希望別人鴉雀無聲的,又何止是這些追逐明星的狂熱粉絲呢?

如果你處於想學Python或者正在學習Python,Python的教程不少了吧,但是是最新的嗎?說不定你學了可能是兩年前人家就學過的內容,在這小編分享一波2020最新的Python教程。獲取方式,私信小編 “ 資料 ”,即可免費獲取哦!


分享到:


相關文章: