零售數據觀(一):如何花30分鐘成爲一個標籤設計「達人」

內容摘要:幫助數據相關工作者結合零售業務

(1)如何識別目前業務中的大數據場景

(2)如何構建符合企業自身的的 "標籤"

序言:是否碰到大量的人力投入基於流程管理的信息化系統建設,也運行了好幾年了,同時大數據也熱了好幾年了,但企業IT部門還是無從下手,既不確信大數據是否可以真的帶來業務價值也不清楚從哪著手更容易推動大數據項目落地,本文就是通過“標籤”,一種基於具體業務場景但同時又是業務人員看的懂的數據的方式,幫助企業從點做起,循序漸進,讓大數據真正落地。

一、認識OLP

什麼是OLP模型

OLP是Object-Link-Perperty的縮寫,Object代表業務場景中的實體,可以是“人”(如會員、零售商)也可以是“物”(如商品、店鋪);Link 是代表業務場景中的“關係”,關係分為行為關係和事實關係,用戶“購買”商品,其中“購買”就是一種行為關係,貨架“屬於”門店,其中“屬於”是一種事實關係;而Perperty則代表實體和關係上的屬性,如“會員”(人)有年齡、手機號、性別等屬性,“門店”(物)有地址、所在城市等屬性,“購買”(關係)有支付時間,支付形式等屬性。

零售數據觀(一):如何花30分鐘成為一個標籤設計“達人”

(OLP示意圖)

企業往往可以根據自身業務系統的建設情況逐步完善OLP模型,它是識別大數據場景和標籤設計的基礎。

二、如何識別大數據場景

什麼是大數據場景

大數據場景目前分兩類,一類是優化原來的業務流程,提高效率,變得更加智能(如讓信息推送變為“智能”,做到個性化推送,從而提升ROI),第二類是創造新的業務流程,讓以前不敢嘗試的業務可以實現(如小額貸款,以前是因為風險無法得知從而不敢嘗試,通過採購商或零售商的數據化然後建模就可以逐步嘗試)。此篇文章中的大數據場景識別僅針對第一類情況。

如何識別

既然是優化原來的業務流程,那就重點關注可以產生變化的“關係”(人和物無法改變),主要判斷OLP模型的“行為關係”看是否能從時間或空間維度用大數據的能力進行優化,如上圖中所描述的“購買”和“上架”行為關係。那“購買”是否是大數據場景,答案是“否”,因為從時間維度可以通過對商品通過RFID的技術做到無人門店從而改善用戶的購買效率,但所用技術並不是大數據範疇。但,是否讓“上架”變的更加智能,答案是“是”,從時間維度,不同城市,不同門店類型,對於什麼商品什麼時間上架完全可以基於大數據的智能決策,是可以幫助門店或零售商合理的安排庫存結構,同時還可以對“上架”進行空間維度的優化,如商品的擺放位置,具體這裡就不展開了。接下來我們讓上圖的OLP模型變的更加複雜一點。

零售數據觀(一):如何花30分鐘成為一個標籤設計“達人”

(OLP示意圖)

我們找出行為關係,從時間和空間維度上考慮是否可以是大數據場景

1)購買:不是

2)上架:是,用數據來決策何時上架

3)推送:是,不同用戶推送不同的信息,智能推送

4)點擊:不是

5)存儲:不是

6)入庫:是,什麼商品何時入庫從而優化庫存結構

但是需要注意一點,脫離業務場景討論“關係”,看是否是大數據場景是不合理的,比如購買,如一服裝加盟商因某些原因,需要再次購買(採購)商品(中央庫存足夠的情況下),那什麼時候購買,就可以用上大數據的能力。有了數據場景,接下來討論下如何構建“標籤”。

三、如何構建標籤

什麼是標籤

標籤是業務人員看的懂的數據,可分為原始標籤、統計標籤和算法標籤。

如何構建

第一個原則,標籤設計是面向大數據場景的,比如上文提到中的“推送”,那現在就對“推送”關係相關聯的“活動”和“用戶”做為維度進行標籤設計, 這裡主要介紹以“用戶”做為舉例。實體和關係上的屬性是標籤設計的基礎。

零售數據觀(一):如何花30分鐘成為一個標籤設計“達人”

(簡化後的示意圖)

通過用戶的屬性所生成的標籤:性別、手機號;根據購買關係所生成的標籤:支付形式偏好、購買時間段偏好,消費金額,消費筆數;根據商品屬性所生成的標籤:風格偏好、材質偏好、顏色偏好;根據展架屬性所生成的標籤:商品擺放位置偏好;根據線下門店屬性所生成的標籤:所屬城市,在上面標籤設計過程,其實引入了第二個原則,實體和關係的屬性是可傳遞的,比如實體“線下門店”的屬性是可以來描述實體“用戶”的,這很關鍵,這樣的思維方式可以保證在設計標籤時,被描述的實體維度會足夠的完整。大家還會發現為啥標籤“商品擺放位置偏好”標註為灰色,因為根據原則一,它對“推送”場景沒有意義(目前是否有用,還是靠經驗,大家如果有其他想法可以一起來探討),有了這類標籤後,就可以對標籤進行業務上的“衍生”,比如,平均消費金額(消費金額/消費筆數)、消費水平(參考因子:所屬城市、消費金額、消費筆數等),最後在業務衍生的基礎上考慮時間維度:比如最新3個月消費金額,工作日消費金額,這是第三原則,可對標籤在業務上和時間上進行“衍生”。

各位還記得標籤的分類,那上面所描述的“性別”、”手機號“和“所屬城市”就屬於原始標籤(和業務數據庫存的一樣),“支付形式偏好”、“消費筆數”和“材質偏好”等就屬於統計標籤,“消費水平”就屬於算法標籤。

如何使用

在上文討論的“推送”場景下,店長就可以自由選擇標籤,通過設置各種標籤值範圍人群圈選,進行個性化推送,比如,最近上線幾款全棉的高端上衣,店長就可以在系統中設置條件(最近三個月消費金額>’2000’ and 材質偏好=‘棉’),可定義為"全棉高端消費人群”,然後進行短信或者公眾號對這類人群進行推送。業務人員通過標籤設置各種標籤值範圍我們常把這種操作為人群洞察。

總結

通過以上的介紹,相信各位對如何標籤設計有了個大致的理解(建議讀兩遍),但標籤設計非常考驗對業務的理解和對數據的感覺,需要日積月累,當然也可以加速這個過程,比如選擇

數瀾科技的數據諮詢服務^_^

作者簡介:鐵叫獸,10年+數據相關經驗,曾在電信、阿里從事過DBA,數倉,解決方案,目前從事零售行業的解決方案。


分享到:


相關文章: