資料分析師7大技能:構造標籤體系

和指標體系同等重要的技能:構造標籤(俗稱:打標籤)。打標籤能力,是區分真資料分析師和sqlboy 的重要能力

一、什麼是標籤?

標籤是對事物的概要性描述。就像商品標籤上會寫商品分類、主要原料一樣。雖然一件商品有很多屬性,但是我們只通過幾個有限的標籤,就能鎖定我們想要的商品,這就是標籤的作用。

二、有哪些標籤?

從複雜程度上看,標籤有四類:

1、

事實型標籤

。比如商品的顏色、人的性別。這些是事實描述,可以直接拿來用。

2、

規則型標籤

。比如把“消費1000元以上”定義為:高消費群體。規則類標籤,往往是基於一個數據指標,然後根據特定的規則進行分類。

3、

複合型標籤

。比如“高富帥”,就是一個典型複合型標籤,它基於N個指標,進行綜合計算,最後得出一個標籤結果。

4、

預測型標籤

。注意,以上三類標籤,用的都是已經發生的資料進行計算。預測型標籤則是對未來情況的估計。可以用演算法進行預測,也能人工預測。比如對使用者進行分類,然後打個標籤“預計流失使用者”,就是指該使用者會在未來XX時間內流失掉。

這四類標籤的複雜程度是不同的:預測型>複合型>規則型>事實型。相應的打標籤的難度也不一樣。

三、要怎麼打標籤?

打標籤是個通俗說法,它指的是生產標籤的過程。如果是簡單的事實型標籤,則直接拖過來用即可。其他三類,都得經過打標籤的動作,越複雜的標籤,生產起來越麻煩。

打標籤有四個標準步驟。

明確打標籤的物件

明確標籤的用途

明確標籤規則

明確標籤的名稱

舉個最簡單的例子:小熊妹還沒有男朋友,我想找個高富帥。

高富帥,就是個複合型標籤,按四步走:

1、打標籤物件:

男人,活的

2、明確用途:

選個潛在藍盆友

3、明確規則:

這是最複雜的一步,因為高富帥有三個維度。首先得一個維度一個維度,單獨講清楚,然後再想辦法綜合。

這裡,高相對容易,看身高然後給個標準即可。

帥,也相對容易,看到照片自己覺得還行,手工打個標籤即可。

富,就很糾結了。有的人掙得多,可也花得多呀。不能光看收入,還得看負債。

這樣,先對三個維度各自打標籤,再進行綜合(如下圖)。

資料分析師7大技能:構造標籤體系

綜合的方法,可以用優先順序排序,或者做綜合評分(如下圖):

資料分析師7大技能:構造標籤體系

看起來綜合評分似乎更科學,但實際決策時候並不是!比如我,看到帥哥就走不動道了,管他富不富呢。

綜合評分有可能選出來平庸的個體

,這個要注意哦。

4、明確標籤的名稱:

高富帥、非高富帥

搞掂!

可以看出,在生產標籤的過程中,明確規則是最麻煩的一步。但實際上,麻煩不限於此。

四、打標籤,難在哪?

看完上邊的小例子,很多人會覺得:“打標籤很簡單呀,我一個上午能打1000個出來”。如果只是往資料庫裡新增1000個新欄位,確實很容易。

但是,這1000個欄位:

有幾個能被業務部門用起來?

用完以後能提升業務表現?

還有多少業務想要的標籤,沒有在其中?

這才是真正的難題。

反正我是見過,供應商傻乎乎的打了幾百個標籤,結果除了上線彙報ppt外,業務部門看都不看一眼的,更不要提用了。

一個好的標籤,一定是:

業務高頻使用

指向明確動作

產生明顯效果

就像小熊妹一聽人介紹“高富帥”,就會頂著週五熬夜煲劇的黑眼圈起床化妝倆小時出門一樣。這才是高頻使用,有驅動力,產生明顯效果的標籤!

肯定有小夥伴問,業務上有沒有這種標籤,當然有,比如我個人很喜歡的:促銷敏感型使用者(是/否),這個標籤。專門區分:沒有促銷不買,有促銷高機率買的薅羊毛體制使用者。拿來解釋日常消費轉化率,事前預計活動效果,事後覆盤達成情況,都好用(先賣個關子,之後專門分享這個)。

實際業務問題經常很複雜,很難用一個標籤描述情況,因此需要圍繞一個業務場景。構造若干個標籤,形成標籤體系,驅動業務工作。

知識星球歷史已上傳相關資料概覽:

資料分析師7大技能:構造標籤體系

資料分析師7大技能:構造標籤體系

報告僅做分享交流,文章開頭已註明來源,如有侵權,請聯絡刪除;

TAG: 標籤高富帥明確1000規則