09.09 數據忽悠無處不在,你肯定中招過!

數據忽悠已經成為一種公害了,新聞報道,職場報告,融資數據到處都有數據忽悠的地方。先從一組媒體報道開始,下面是同一天某個地方的媒體報道。初步一看,貌似三家媒體的結論有些矛盾異常的地方。

数据忽悠无处不在,你肯定中招过!

出於職業的敏感性,我肯定不會被標題黨忽悠到,一定會找到文章的出處詳細閱讀。

數據源:2011年貴陽市的住房月租金每平方米均價為21.21元,2016年6月租金每平方米均價為23.44元。5年多隻上漲了10.51%(貴州商報數據出處,下稱貴商)。2011年貴陽市住宅按套計月租金為每套均價1216.5元,2016年6月每套均價為1435.27元,5年多隻上漲了17.98%(貴州都市報數據出處,下稱貴都)。5年間,租金歷史最高是在2014年,月租金每平方米均價為24.82元,2015年月租金每平方米均價下降為23.65元,2016年6月,月租金每平方米均價已經下滑至23.44元(貴州晚報數據出處,下稱貴晚)。

經常看我微博微信的朋友知道,我經常揭露一些數據忽悠的事情。從數據源來看,三家媒體的標題數據都沒有問題,沒有忽悠人。反倒是把這三張報紙放在一起對比的媒體,有故意挑事兒的嫌疑。

不過,這三份報紙真的沒有忽悠嗎?其實有,他們在選擇不同的結論。貴商和貴都選擇了突出漲,貴晚選擇報道主題是跌。不過總體上三家媒體都是在報道事實。

回到今天的主題,企業數據分析層面上來。做數據分析的都知道,選擇不同的數據、指標定義、權重值、區間都會產生不一樣的結論。很多企業老大們看到的數據其實是被分析師或業務人員“篩選”後的優質數據,所以我經常說數據分析是良心行業。數據是客觀的,數據背後的人是主觀的。

舉幾個栗子來說明,以下所有數據均為虛擬,如有雷同那就巧合了。

1、不同的數據源不同的結論

前面租金的案例其實就是這點的最好證明,選取不用的數據源結論自然就不一樣了。大家可能還記得去年好幾個手機廠商都說自己的市場份額第一,有的公司用金額計算市場份額(單價高的公司就會佔便宜),有的公司用出貨臺數算市場份額(這有利於單價低的公司),有的公司說自己在細分市場份額第一(比如白領市場份額第一,學生群體市場份額第一,高端機市場份額第一等)

不同數據源不同的結論是很多公司忽悠消費者的有力武器。

2、同一組數據不同的指標

二戰中某7人雷達小組,雷達小組軍官一再向上級機關請求加強力量,增加1-2人,可是一直沒有得到批准。但當其中一名成員的神經崩潰時,這位軍官改變了策略,他的申請報告是這樣寫的:“14%的人員由於過重的負擔而變得精神恍惚,甚至出現神經錯亂的現象。”結果是由於這份報告,這位軍官得到了比他原本能得到的多得多的人員。

最初他用的是絕對人數這個指標,後來改成百分比這個相對指標效果就大不同。

3、同一組數據不同的指標定義

做銷售幾乎都知道庫存週轉率這個指標,它一般是用來衡量企業營銷人員管理水平的一個指標,在一定標準內一般越大越好。但你可知道,用來衡量下屬的這個指標可能被他們“合理”的用來忽悠過你!

公式如下:

庫存週轉率=(某個銷售週期內的)銷售金額 ÷ 平均庫存金額

週轉率的分母是平均庫存,常規用法是(期初庫存+期末庫存)/2,但是如果改變指標定義的話卻有提高庫存週轉率的功效。

某個公司下面的某個區域期初庫存200萬元,當年共銷售了2000萬元商品,如果進貨金額實際是2300萬元,意味著期末庫存是500萬元。

用前面公式期初期末平均庫存的算法得出來的庫存週轉率是5.7次。

假如進貨銷售節奏如下圖,用月平均庫存算庫存週轉率是6.3次(每月進、銷數據不同,計算結果會有差異,不一定都是6.3),高於第一種算法。

数据忽悠无处不在,你肯定中招过!

數據沒變,僅僅是調整了平均庫存的算法庫存週轉率就由5.7升到了6.3,其實再換一種算法庫存週轉率會更高。如下圖,將每月的月庫存週轉率相加得到年庫存週轉率,值為6.8。

数据忽悠无处不在,你肯定中招过!

這就是傳說中的孫悟空的72變,哪種指標定義好看就用那種。在測試一下,大家看看下題:

某個部門共有20名員工(該部門編制員工數25名),本月這20名員工全部辭職了,月中新入職10人。請問該部門離職率是多少:

答案1| 離職率67%

答案2| 離職率80%

答案3| 離職率100%

答案4| 離職率133%

答案5| 離職率200%

你選哪個?請在評論中說出理由!

4、同一組數據不同的權重值

小張是某公司的HR總監,今年公司要評選一個上半年的優秀銷售團隊出來,可供參考的指標如下:

数据忽悠无处不在,你肯定中招过!

如果從平均值來說B團隊無疑就應該是最佳銷售團隊,但是小張有點私心,希望C團隊獲獎,怎麼辦呢?這難不倒小張,調權重唄。

如果用平均值C團隊排在第三,如果按0.4-0.3-0.3來分配三項指標的權重的話C團隊還是第三,不行。權重改成0.3-0.3-0.4時C團隊排在第二名,還是不行。最後小張用了0.3-0.2-0.5的權重分佈,成功讓C團隊變成了第一名。

数据忽悠无处不在,你肯定中招过!

我想說的是:權重是非常好的耍流氓的手段。別告訴我你沒有耍過哦。

5、同一組數據不同的業務背景

小王是一個零售公司的銷售經理,7月31日剛過,他就迫不及待的讓下屬給自己本月同店同比的增長數據,下屬告訴他今年7月比去年同店同比增長了1.0%。小王懸著的一顆心終於放下來了。因為上個月老闆給了他一個死命令,7月如果同店同比數據不能增長的話就讓他下崗。

不過最後小王還是下崗了,因為老闆說他的同店同比數據是負增長,沒有達到預期值。小王覺得自己比竇娥還冤枉,明明同店同比是1.0%的增長啊。老闆給出來的理由是因為去年7月只有4組週六日,今年7月有5組週六日,根據零售企業的規律,多一組週六日銷售就應該增加4.6%才算打平(不同的企業這個值會不一樣,一般在3-5%,可以根據企業歷史數據算出來的)。

這就是同樣數據但是在不同的業務背景下的解讀差異。

為了不被別人忽悠我們每個人都需要練成一雙火眼金睛,在拿到數據報告的時候先問對方的數據來源是什麼?指標定義是什麼?儘量多問幾個問什麼,只有完全的理解了數據之後才可能減少被忽悠的幾率。

咋了?你以為你看到的就是你看到的麼?有些人就喜歡看你明明知道在忽悠你卻找不到忽悠證據的樣子。

來,加入我的微博《數說》會員,讓我教你如何預防數據忽悠:


分享到:


相關文章: