本文共計3025字,建議閱讀時長8分鐘
為了避免枯燥,會有很多案例,大家耐心看
開始寫數據分析,就剎不住了,因為數據分析的點太多了,不是一篇就能說完的,估計這個得是系列文章了,那麼第一篇就先寫寫數據概況和數據思路。不僅是PM產品經理,很多工作崗位跟數據分析都有或多或少的關係,那麼首先需要明確一個問題:
什麼是數據分析(Data Analysis)?
A:數據分析就是分析數據唄。
B:就是會用excel。
C:是不是要用一些高深的工具,比如SPSS、Python、數據庫之類的?
D:數據分析的本質就是統計學。
E:數據分析?就是數據的分析啊!
沒錯,就是數據的分析,以上都是不同人遇到上述問題的回答,其實大家實際上理解的數據分析就是有數據分析思路,然後通過分析得出一些符合邏輯的結論。
核心點
【數據】:先有對應的數據
我們通常理解的數據,都是阿拉伯數字的組合,但廣義的數據還應包括很多內容信息,比如國家人口數據(每個人的資料)、每年上映的電影(以及電影的具體標籤簡介等)、今日頭條每天更新的資訊,都是數據。
【分析】:通過一些既定的方法或思路來分析數據,得出結論或解決方案。
數據分析的幾大流程,而在以下各個流程都有一大批公司在做對應的事。
1. 數據收集/採集
2. 數據整理
3. 數據存儲
4. 數據分析
5. 數據結論
本文重點說一下數據分析思路
1.數據收集/採集、數據整理
首先得有數據,才能進行分析,而往往數據收集和數據整理經常是一個體系,這部分也是整個流程最雜最累的一部分工作。
舉個例子:
百度地圖裡如果搜索路線,往往會顯示下車步行347m之類的數據提示,這些剛開始都是通過人工測量收集,然後與購買的第三方數據或者定位數據不斷做數據校準得出的最後數據。
再比如:
用戶的APP使用數據,通過需要統計的地方進行數據埋點,當有用戶操作該功能時,給服務端發送一個請求,數據量+1。
此環節涉及到
數據抓取
爬蟲工具
人工收集數據
數據抓取、爬蟲工具:如果需要做一個資訊信息整合平臺,那麼首先得抓取資訊數據,就是梳理好特定要抓取的數據網站,然後技術抓取對應的數據。
很多人覺得金融行業高大上又賺錢,真正高大上的是投行這些,而做金融基礎數據收集的那可相當苦逼了~
2.數據存儲&數據處理
數據收集過來了,總要存儲起來才能用,就是數據庫,目前最常用的就是MySQL數據庫。存起來之後要進行數據的歸類處理和整理,如果數據量很大,就涉及到大數據的處理方法,目前通用的Hadoop集群來快速處理數據,中間經過MapReduce、HDFS等等環節來對數據進行歸類的整理。(就像把各個文件整理在文件夾和文件櫃裡一樣)。PS:以上環節內容後面有機會再跟大家詳細剖析。
3.數據分析
A:機器數據分析:建立數據模型,機器自動學習來給出結論,涉及到模型、算法等等,應用的語言C++、Python、R語言等。
B:人工根據數據現象,進行詳細分析得出結論。
產品經理做數據分析,首先要確定的是數據的準確性且符合邏輯,如果數據都不準確,那麼後續一連串的分析都沒有意義。
比如:
“統計表明:睡眠時間越短的人,收入越高。”
那我們都不用睡覺了?數據沒有邏輯。
再比如:
“移動端第一大用戶需求是 小說”(想不到吧?)
以上數據是否準確?第一大需求的統計指標是什麼?(最後發現指標是人均時長)
劃重點1
要想培養數據思維,首先就是遇到數據只要有不確定的點,都要分析清楚是什麼意思,保證數據準確以及符合邏輯。
再舉個例子:
“錘子手機的市場滲透率是10%”
當看到上述這句話你的第一反應是什麼?
A:錘子手機還不錯啊,至少還有10%的人在用
B:錘子手機用的人還是少
C:市場滲透率怎麼統計的?
如果你的第一反應是C,那麼恭喜你,有了基本的數據思路,首先要確保準確性,什麼是市場滲透率?這裡解釋一下,一般是第三方數據平臺給出的,原因是第三方數據公司不能完全獲取該數據,只能通過抽樣調查的數據中得出這個市場滲透率,而具體調查了多少數據,並不知道,如果只抽樣調查了10個人,其中有一個人用,那麼市場滲透率也是10%,那麼這數據準麼?好好想一想。
劃重點2
得有數據敏銳度,看到一個數據得有其關聯數據的思路,比如:
一家麵館一天客流量200人
給到你,你會怎麼分析?
關聯數據思路:
這200人的數量,和附近其他麵館比是多是少?
這200人的數量比昨天多還是少?
200人的實際總消費,及消費均值?
麵館外的人流是多少?
與周圍其他快餐店的數據對比是怎樣?
當然只有200人這一個數據是分析不出結論的,關聯出來的數據一起分析能得出結論,重點是得有這些關聯數據的思路,然後一步步挖掘數據來進行分析。
劃重點3
比率或比例是關鍵分析點之一
“訂單量昨天下降了1000”
從以上數據能看出什麼?如果直觀來看,是不覺得怎麼下降這麼多?但實際上呢?不知道,因為沒給任何別的數據,如果一天的訂單量在100萬以上,那麼下降1000單就可能是正常波動,沒有任何影響。
再舉個例子:
“11月投放的廣告展現量比10月份少了30%”
上面數據相比第一個例子來說就清晰了許多,緊接著來分析為什麼11月投放的廣告展現量少了這麼多?
分析:
在其他指標都不變的情況下,初步分析是由於雙十一各大電商網站投放廣告強勢,導致展現量下降。此期間,轉化率由於購物節的影響也會受到一定程度的降低。
解決方案:
1.當下尋找其他渠道
2.狂歡購物節期間,提前明確相應渠道及影響
3.藉助購物節熱點,做線上運營活動拉新
劃重點4
有效的分析結論是通過對比來得出的。
如上述表格,當我們在評估一個渠道的好壞,應該有與其對比的數據,否則沒有衡量具體效果的意義,如果按照以上表格,那麼得出的簡單初步分析數據如下:
註冊
轉化率
購買
轉化率
渠道1
30.82%
6.29%
渠道2
42.15%
7.38%
渠道3
62.20%
3.94%
1)渠道2購買轉化率最高
2)渠道3註冊轉化率最高
3)為什麼渠道3註冊轉化率最高,但購買轉化率最低?
以上是由數據看出的現象,在這裡強調一下:
現象不是結論,結論是經過分析得出的有指導意義的落地點或者解決方案。
分析思路:
① 三個渠道的優缺點特徵對比
② 廣告投放方式
③ 註冊流程問題
④ 註冊到引導購買的問題
結論:自己先想,下期揭曉。
PS:
互聯網產品應用最廣泛的對比實驗方法就是A/Btest,其實不止ABtest,還可以多個實驗同時test,比如ABCDE test,這就是不同變量在不同實驗同時驗證,而同一變量還是在其中兩個實驗中,確保對比效果。ABtest要細開來說就是一個大篇章,後面單獨來剖析。
劃重點5
未完待續…
說到這,發現最基礎的產品數據指標沒有說…汗…因為數據分析的點太多了,這篇就先給大家剖析一下思路,下期數據分析再詳細講一下產品數據指標。
閱讀更多 一盞課堂 的文章