lvningwei
【乾貨】數據分析師工作實戰
在這個依靠數據競爭和精細化運營的年代,數據分析師,作為日前炙手可熱的大數據技術的前端落地職業,在企業的發展壯大和輔助決策支持方面發揮著重要作用。在日常的工作中,數據分析可以分為兩部分工作。
01 常規工作
1.定期的日、周、月報
這類工作是每日必做的常規工作,要當成是能力積累的工作來做。
(1)每日看生產經營指標,保持職業敏感度,從業務變化數據分析原因。
(2)每週進行復盤。一是思考新策略效果,二是按周進行趨勢分析。
(3)每月進行總結。一是每月進行指標分析,評估目標階段性達成情況;二是提出決策建議。
注意:
(1)多用自動化。建設報表系統,自動生成日、周、月報,機器人發送報告……簡單繁雜的工作都通過系統自動化完成。
(2)突出價值點。日常工作往往很繁雜,價值點是對報告的解讀和提出決策建議。不能陷入雜事,要善於從雜事中找到價值點。
(3)多尋求領導幫助。數據分析涉及問題較多,比如雜事太多可以請領導協助抵禦一下,比較敏感的決策分析可以先與領導探討一下等。
2.臨時報表提數
這類工作是技術含量和價值都較低的工作,要儘量減少精力的投入。
(1)管理層需要
這類需求要優先處理,但儘量要少接。
注意事項:
1)要深入瞭解背景,理解真實需求。
2)務必仔細,保證彙報結果準確無誤。
3)彙報成果簡明扼要,直擊領導最關心的部分。
4)不要馬上就反饋,要體現出技術含量,給領導留下較好印象。
(2)一般人員需要
這類工作儘量不接。
注意事項:
1)找到核心人員、瞭解核心需求,避免做無用功。
2)針對需求形成一套完整方案和系統,然後教會業務人員自己運行,脫離反覆的糾纏。
02 專題分析工作
這是數據分析工作的價值所在,也是技術提升最快的工作,要高度重視。考核數據分析師能力的核心指標就是看專題分析的數量和質量,質量指標最重要的是看分析建議有多少能夠落地。
主要步驟包括:
1.需求解讀
要透過現象看本質,首先要學習業務,將業務問題轉換為數據問題。然後要不惜用大量時間挖掘出真實的業務需求,一定要當面的溝通。核心是界定問題。
(1)找到主要問題:
應用二八定理,找到關鍵問題。主要方法包括:一是先列出所有問題進行頭腦風暴,二是根據最大概率法則,選擇重要問題,期間可以找leader或業務人員集思廣益。
(2)問題的拆解方法:
原則是MECE,不重複不遺漏。
實戰技巧:一是先快速按照理解進行拆解,先不用管重複和遺漏的問題。二是將拆解結果先找業務人員核對一次。三是將第二步的完善思維導出給自己的leader審核修改一次。四是將leader的意見修改完後,就可以給業務方或大領導彙報了。這個時候不會有大問題了,否則也不是你的問題。
2.取數和數據預處理。
(1)三類方法獲取數據
一是從一些有公開數據的網站上覆制/下載,比如統計局網站,各類行業網站等,通過搜索引擎可以很容易找到這些網站。
二是通過一些專門做數據整理打包的網站/api來下載,如果你要找金融類的數據,這種方法比較實用。其他類型的數據也有人做,但通常要收費。另外,淘寶上有很多幫人抓數據的店……
三是自行收集所需數據,比如用爬蟲工具爬取點評網站的商家評分、評價內容等,或是直接自己人肉收集(手工複製下來),亦或是找一個免費問卷網站做一份問卷然後散發給你身邊的人,都是可以的。這種方式受限制較少,但工作量/實現難度相對較大。
(2)數據預處理
1)數據清洗:排除異常值、空白值、無效值、重複值、缺失值等預處理。通過爬蟲等方式得來的數特別需要進行清洗,提取核心內容,去掉網頁代碼、標點符號等無用內容。
2)數據標準化:排除量綱。
(3)數據整理
一般用Excel來完成這一工作。
如果你的數據已經是表格形式,那麼計算一些二級指標就好,比如用今年銷量和去年銷量算出同比增長率。
如果你收集的是一些非數字的數據,比如對商家的點評,那麼你進行下一步統計之前,需要通過“關鍵詞-標籤”方式,將句子轉化為標籤,再對標籤進行統計。
3. 數據分析和建模
建立邏輯樹進行數據分析。在整個專項活動的過程中,還可以分為活動前、活動中、活動後多層次、多維度的分析。
數據分析主要分為兩類:
(1)描述分析,這類分析比較簡單
描述統計分為兩大部分:數據描述和指標統計。
數據描述:用來對數據進行基本情況的刻畫,包括:數據總數、時間跨度、時間粒度、空間範圍、空間粒度、數據來源等。如果是建模,那麼還要看數據的極值、分佈、離散度等內容。
指標統計:用來作報告,分析實際情況的數據指標,可粗略分為四大類:變化、分佈、對比、預測。
• 變化:指標隨時間的變動,表現為增幅(同比、環比等);
• 分佈:指標在不同層次上的表現,包括地域分佈(省、市、區縣、店/網點)、用戶群分佈(年齡、性別、職業等)、產品分佈(如動感地帶和全球通)等;
• 對比:包括內部對比和外部對比,內部對比包括團隊對比(團隊A與B的單產對比、銷量對比等)、產品線對比(動感地帶和全球通的ARPU、用戶數、收入對比);外部對比主要是與市場環境和競爭者對比;這一部分和分佈有重疊的地方,但分佈更多用於找出好或壞的地方,而對比更偏重於找到好或壞的原因;
• 預測:根據現有情況,估計下個分析時段的指標值。
描述分析的產出是圖表。
(2)建模分析
主要流程包括:選擇變量和重構變量、選擇算法建立模型、設定參數、檢驗指標、模型計算和落地、迭代優化、開展分析和形成結論。
4.成果展現和彙報。
這一步是數據報告的核心,也是最能看出數據分析師水平的部分。
一個完整的數據報告,應至少包含以下六塊內容:
(1)報告背景
(2)報告目的
(3)數據來源、數量等基本情況
(4)本頁結論以及支撐的分頁圖表論據
(5)各部分小結及最終總結
(6)下一步策略或對趨勢的預測
(7)落地建議,要非常具體:有人、時間、效果
其中,背景和目的決定了你的報告邏輯(解決什麼問題);數據基本情況告訴對方你用了什麼樣的數據,可信度如何;分頁內容需要按照一定的邏輯來構建,目標仍然是解決報告中的問題;小結及總結必不可少;下一步策略或對趨勢的預測能為你的報告加分。在所有的數據結論和落地項中,有1-2個真正應用了,這份報告就非常有含金量。
建議:
(1)多用圖表,多使用可視化工具,減少大段的文字描述。
(2)金字塔結構,邏輯層次清晰,先講結論,然後展開分析。
(3)講故事,報告用於簡練,通過設問等方式緊緊抓住讀者興趣。
科技爸
數據分析師分佈在不同行業中,專門從事行業數據的蒐集、整理、分析,並依據數據做出行業研究、評估和預測。數據分析師需要敏銳的數字洞察力,因此,統計、會計、保險、工程經濟、金融、數學、計算機等專業的同學對這個行業有明顯優勢,但其他行業的同學如果對這個職業感興趣,通過日常學習,掌握一些統計必備技能,亦可以從事此類工作.
主要工作領域:
1、從事投資項目審核審批和招商引資、項目評估、投資決策等工作的政府機構、企業的相關領導以及從業人員。
2、在銀行或非銀行金融機構、投資管理公司、投資管理顧問公司從事風險投資、產業投資、信貸和投資管理等方面工作的專業從業人員。
3、會計師事務所、資產評估事務所及稅務師事務所、律師相關專業人員。
4、學習財務、統計、投資、金融和企業管理等相關專業的在校應屆學生。
5、在企事業單位從事市場調查與宣傳工作的人士以及具有策劃與決策工作職能要求的人士。
6、在不同領域嘗試創業以及在投資、金融、資本運營、房地產和企業管理領域發展的各界人士。
數據分析師的工作內容分為四個層面:
1、處理臨時需求:解決業務一次性,臨時性的數據需求。
2、報表開發:根據業務需要,與開發工程師討論進行相關報表開發。
3、數據分析與挖掘:與業務同事一起溝通,分析業務問題,提供建議;根據業務需要建立各類挖掘模型。
4、數據產品化:通過數據產品化方式解決結構化業務問題。
數據分析師的基本要求:
1、懂得建立目標
數據分析是為了解決問題而去分析,不是單純為分析而分析。數據分析是有目的性的。比如:一季度ABC產品的銷售情況,是按月份為橫座標建立各部門的圖表;各產品線ABC在一季度的銷售情況,是按部門為橫座標建立對應的圖表。
2、針對不同人群提供不同的結論報告
數據分析要有結論報告,不同的人群報告的側重點不同。比如管理層,看的是趨勢和異常點;營銷人員看的是ROI((Return On Investment)產出比率和高用戶質量的導入情況;業務人員看的是產品對用戶的活躍度等。
3、掌握數據分析工具
如果是互聯網數據分析,可以從google GA入門,EXCEL輔助,瞭解數據分析的基本算法。至於SAS,SPSS這些高級工具不一定需要。
4、不同時期要有不同的KPI(KeyPerformance Indicator,關鍵績效指標)
不斷的調整目標和發現問題是數據分析精細化的必經過程。