優秀的數據分析師有哪些特質(二)?

上一期我們講到了第一個特質,即優秀的數據分析師對業務具有深刻的洞察,進而從更高更廣闊的視角定義要解決的問題。既然定義了問題,那就要定位產生問題的原因,本篇文章我們就著重分享原因定位的方法論!

优秀的数据分析师有哪些特质(二)?

我們先來回顧下解決問題的流程圖(左圖,改編自書籍《如何用數據解決實際問題》),以及數據分析師的能力框架(右圖,百度DA的晉升能力體系)。

我們可以看到,如果要解決一個問題,首先我們要準確地定義這個問題(按照上期所講,這個需要有深刻的業務洞察能力),然後通過一系列的數據分析,定位原因,最後討論並實施對策(即實現項目影響)。左右兩個圖對比,我們可以看到,數據分析的能力框架並不是天馬行空想出來的,它是從解決問題的流程中提煉出來的。

优秀的数据分析师有哪些特质(二)?

你們覺得這四大核心能力中,哪個能力最能體現數據分析師的價值呢?

在我看來,無疑是原因定位(這也是我把原因定位放在最中間的原因)。為什麼呢?我先給大家講個故事。

據說,有一次,美國一個大公司,電機發生了故障,把公司所有內行人請來也找不出癥結所在。沒有辦法,只好派人乘專機將一個德國專家請來,德國專家問了業務人員電機以往的使用情況,看了下相關的數據,然後圍著像一間房大的電機轉了起來,他一會兒敲敲這,一會兒聽聽那……大約一個小時後,專家拿起粉筆在電機上最不起眼的部位劃了一道線,對在場的工人說,把這裡打開……

電機被打開了,故障,原來真在這裡!

德國工程師索要1萬美元費用。周圍的人不理解,問道,用粉筆劃了這麼一道線,就一萬美元,我們辛辛苦苦幹一個月才幾千元?工程師見他們不理解,就笑著對他們說,我拿粉筆劃這一道線,只有一元錢,可是我知道在哪裡去劃,要9999美元。

看完這個故事,大家再想想就應該明白了。無論是業務洞察還是數據分析,都是服務於原因定位。而當原因定位好之後,如果和你配合的業務人員足夠優秀,實現項目影響自然也是順理成章的事情(就像故事裡的工人,在看到故障後不需要專家指導自然就知道如何維修)。

01

接下來我們就詳細討論下原因定位的方法論。 當我們接到一個問題的時候,最忌諱的就是不經思考直接去看各種數據,迷失在數據的海洋裡,糾結於不重要的數據細節中。我們要做的是先對問題進行拆解,把分析思路梳理清楚了,才能有的放矢。

拆解問題有兩種方法:一種叫假設拆解(諮詢公司叫做假設樹),另一種稱為邏輯拆解(諮詢公司叫做議題樹)。

假設拆解,顧名思義,就是對問題的原因列出一個個的假設。這種拆解問題的方法門檻比較低,無論是業務小白,還是資深大咖,當面臨一個業務問題時,大家自然而然都能提出一系列的原因假設,進而通過數據分析驗證真偽。

舉個例子(案例和數據都是示例,非真實情況),微信的數據分析師小明發現,從9月11日左右開始,每日成功發送紅包的總金額(即紅包被搶了且成功轉賬的金額)逐步下跌,在此之前,這個指標一直都比較平穩。

优秀的数据分析师有哪些特质(二)?

看到這個現象,大家可能有很多假設:

  • 微信內部上線了某些新功能(比如發紅包的上限從200元降低到100元,用戶更多的使用轉賬),對紅包功能有負面影響。
  • 暑假結束開學了,學生黨花銷變少了,所以家長給孩子,以及學生黨之間發的紅包變少了。
  • 競對(比如支付寶)的紅包功能開發了新玩法,對微信紅包有負面影響。

假設拆解方法的優點是,如果對業務瞭解深刻且幸運的話,可能提出的第一個假設就是問題的核心,又快又準地定位原因;風險是人們建立假設時,很容易依賴工作中的常識、自身的經驗或直覺,可能會無意識地排除一些重要的假設。

如果這些遺漏的假設恰好是問題的根源,就會陷入假設-》證偽-》再假設-》再證偽….的死循環中,這樣只是花費了大量的精力排除掉錯誤的假設,真正的原因卻遲遲找不到。

邏輯拆解方法能很好地降低遺漏。互聯網產品中常用的邏輯拆解方法,包括漏斗拆解和指標拆解。如下圖,就是按照用戶發送以及對方接收紅包的操作路徑來拆解。

优秀的数据分析师有哪些特质(二)?

下圖是指標拆解,即運用“四則運算”將指標拆分成具有業務代表意義的n個具體指標,再結合重要的維度進行拆解分析。

优秀的数据分析师有哪些特质(二)?

我們可以看到,定位原因最好的方法論是邏輯拆解和假設拆解配合使用。邏輯拆解的最大好處是不重不漏,能幫助我們快速地定位問題的核心要素。這個時候運用假設拆解法,提出可能影響這個要素的假設,我們找到核心原因的成功率就會大大提升。

好啦!方法論講完了。有些讀者可能會說,其實這些沒那麼難,我早就知道了。可是,世界上最難做的事情就是知行合一,從知到行還遠著呢。我們每個人都知道飯前洗手,你想想你每次都能做到嗎?嘿嘿!

02

除了原因定位的方法論,我還有兩個重要建議提給大家。

(1)越重大的問題,越要使用邏輯拆解

正如上述提到,假設拆解是門檻很低的方法,所有人都能對問題提出幾個假設。我在面試應屆生架空分析題目的時候,80%的候選人都是用假設拆解法,很少有人有邏輯拆解的意識。

同樣的,在我們遇到一個重大的問題時候(比如電商GMV下降),關心這個問題的人也會很多,通常大家就會七嘴八舌提出自己的想法,而這些想法會侷限在他們自己所負責的範疇。比如技術同學擔憂是不是推薦算法不好,推薦的商品用戶不喜歡, 供應鏈同學擔心是不是貨品不夠全面,運營同學擔心是不是優惠力度不如競對,甚至有時候大佬們也會拋出一兩個假設。

每個業務方都緊張兮兮,都想請你用相關數據證明問題的核心不在他們。如果你被他們的假設牽著鼻子走,最終可能就是幫他們排除掉了一個個與他們相關的假設,但真正核心的原因還是沒有找到, 老闆肯定不會滿意。

你總不能和老闆說:“老闆,我們花了3天時間,做了大量的數據分析,最後我們排除掉了以下10種可能性。”

老闆一句“那原因是什麼呢?”就能把你懟的體無完膚。

記住,原因定位永遠是以找到正確的原因為最終成果,排除一系列潛在原因不是交差的正確姿態。所以,越是重大的問題,越要採用邏輯拆解,這樣你才能快速地定位關鍵因素,為找到最終原因奠定好的基礎。

(2)除了海量的數據分析,別忘了用戶調研!

為什麼在這裡著重提到用戶調研,主要是由於數據分析師的兩個認知誤區。

誤區一:進入大數據時代後,有時候我們會過度依賴用戶的行為數據,例如點擊、觀看、使用時長等,卻忽略了這些行為背後的用戶需求。好的產品,都是以滿足用戶的核心需求為目的。異常的產品使用行為數據背後,都應該有一個合理的用戶需求解釋。 否則知其然而不知其所以然,怎麼能有好的業務對策呢?

誤區二:在實際工作中,很少會遇到所需數據全都擺在眼前的情況,用戶調研能從另一種角度提供所需的信息。

舉個例子,在工作中,最讓我頭疼的就是留存下降的分析。留存下降,說白了就是用戶不像以前一樣喜歡你的產品了。這就像你的男/女朋友說不愛你了一樣,潛在的可能原因或者干擾因素太多了。

當我做切片分析的時候,我希望能從年齡、註冊時間、職業、地域、教育水平、收入水平、工作繁忙程度等各個因素進行分析,甚至希望對比他們的競對使用數據。但是很可惜,我想要的數據大部分都是沒法獲得的。

即便這樣,也不應該根據“現有數據”來開始所有的工作。只在“現有數據”的範圍內進行分析,最有可能的結果就是找不到原因,陷入分析困境。這個時候,通過線上的調查問卷,或者與用戶一對一訪談,能給我們提供想要的信息,甚至是行為數據裡挖掘不出來的insight。

看多了百萬、千萬數據的分析師可能會質疑,幾百個用戶的問卷能具有代表性嗎?

在大數據流行之前甚至現在,知名的諮詢公司仍舊採用問卷或者訪談的形式,輔助解決了很多複雜問題。

很多時候,以點撬面,以深度換廣度,也是解決問題的一個思路。

本篇文章到此結束啦!下一期,我們將一起討論數據分析的本質和常見誤區!點擊關注,不迷路奧!

題圖來自Unsplash,基於CC0協議


分享到:


相關文章: