文章從數(shù)據(jù)產(chǎn)品層面出發(fā),對如何從0到1建設(shè)用戶畫像體系進行了梳理分析,主要是4個步驟:業(yè)務(wù)需求分析、建設(shè)標(biāo)簽體系、建設(shè)畫像系統(tǒng)和畫像應(yīng)用,供大家一同參考和學(xué)習(xí)。
從PC到移動互聯(lián)網(wǎng),一批搭乘流量紅利快車的互聯(lián)網(wǎng)產(chǎn)品,曾極速崛起。而如今,流量紅利消失,一個瘋狂的、傳奇般的流量時代,已然結(jié)束。增量乏力,存量市場競爭更加激烈的環(huán)境下催生了精細化運營,結(jié)合大數(shù)據(jù),對用戶進行分群,針對不同群體的用戶采用不同的營銷策略。
兵法云:“知己知彼,百戰(zhàn)不殆”,在整個精細化運營過程中,用戶畫像體系的搭建起到不可或缺的作用。前面草帽小子介紹了埋點數(shù)據(jù)采集、指標(biāo)體系搭建、數(shù)倉和OLAP分析等數(shù)據(jù)基礎(chǔ)層建設(shè),接下來我們來研究如何從0-1搭建用戶畫像體系,以及用戶畫像的應(yīng)用場景。
用戶畫像的概念,最早由交互設(shè)計之父Alan Cooper提出,是對產(chǎn)品或服務(wù)的目標(biāo)人群做出的特征刻畫。
在早期,用戶數(shù)據(jù)的來源渠道比較少,數(shù)據(jù)量也相對比較小的時期,用戶畫像的研究主要基于統(tǒng)計分析層面,通過用戶調(diào)研來構(gòu)建用戶畫像標(biāo)簽。
后來,加利福尼亞大學(xué)的Syskill和Webert,通過手動收集網(wǎng)站用戶對頁面的滿意度,然后通過統(tǒng)計分析逐漸構(gòu)建出用戶興趣模型。
再隨著互聯(lián)網(wǎng)及信息采集技術(shù)的發(fā)展,加州管理大學(xué)開發(fā)了Web Watcher,可以通過數(shù)據(jù)采集器,記錄互聯(lián)網(wǎng)上用戶產(chǎn)生的各種瀏覽行為以及用戶的興趣偏好,實現(xiàn)對用戶興趣模型的構(gòu)建,并隨著數(shù)據(jù)的不斷累積,擴大更新系統(tǒng)模型,用戶畫像標(biāo)簽也更加豐富。
近年來,隨著互聯(lián)網(wǎng)海量數(shù)據(jù)的爆炸式增長,眾多企業(yè)的用戶畫像研究有了新的機遇,基于用戶的屬性、行為、興趣愛好等數(shù)據(jù)標(biāo)簽,運用算法對特征進行分析建模,從而抽象出用戶的全貌,成為了產(chǎn)品人員的關(guān)注重點。
例如對于路飛而言,其用戶畫像可簡單描述為18-25歲中二少年,15億身價,愛吃肉,愛炫酷機器人,沖動性消費人群,若某電商網(wǎng)站提前得知了該用戶信息,就可以根據(jù)其偏好特征,給其推送肉類以及高科技商品,促進路飛在平臺上完成購買。
這個過程中,用于描繪用戶畫像的關(guān)鍵性因素就是標(biāo)簽,通常不同應(yīng)用場景下,標(biāo)簽分類不同。
例如騰訊廣告對標(biāo)簽的分類,可分為:
按阿里電商對標(biāo)簽的分類,可分為:
整個畫像體系包含標(biāo)簽建模、畫像系統(tǒng)、畫像應(yīng)用,那從數(shù)據(jù)產(chǎn)品層面來看,如何0-1建立用戶畫像體系呢?接下來我們按照如下結(jié)構(gòu)進行展開:
用戶畫像體系的建設(shè)不能憑空捏造,需要以經(jīng)濟建設(shè)為中心,根據(jù)實際的業(yè)務(wù)需求,考量畫像系統(tǒng)能為業(yè)務(wù)帶來的價值,所以我們第一步要做的是分析業(yè)務(wù)需求。
明確用戶畫像服務(wù)于企業(yè)的對象,如產(chǎn)品、用戶運營、活動運營、市場、風(fēng)控等部門;再根據(jù)業(yè)務(wù)方需求,明確未來產(chǎn)品建設(shè)目標(biāo)和用戶畫像分析之后的預(yù)期效果。
就公司整體而言,他的目標(biāo)是提升平臺整體的收益,過程中會驅(qū)動產(chǎn)品、運營、數(shù)據(jù)分析、市場、客服等同事協(xié)同工作,畫像會更加關(guān)注如何進行精細化運營,提升公司營收上;
就運營人員娜美而言,她的目標(biāo)是提升轉(zhuǎn)化率,過程中會采用內(nèi)容的個性化推送的策略、用戶精準(zhǔn)觸達,畫像會更加關(guān)注用戶個人行為偏好上;
就數(shù)據(jù)分析人員羅賓而言,她的目標(biāo)是做用戶的流失預(yù)警,做針對性的精準(zhǔn)營銷,那過程中就需要分析用戶行為特征,用戶的消費偏好;
在需求分析階段,我們需要分析業(yè)務(wù)過程,各部門核心關(guān)注點、部門KPI、組織結(jié)構(gòu)、用戶行為路徑、功能流程圖。此處分析過程跟埋點業(yè)務(wù)需求分析類似,詳情可查看埋點業(yè)務(wù)需求分析,此處不做展開。
從數(shù)據(jù)產(chǎn)品建設(shè)標(biāo)簽體系來看,可以根據(jù)標(biāo)簽的統(tǒng)計方式,將標(biāo)簽分為3類:統(tǒng)計類標(biāo)簽、規(guī)則類標(biāo)簽、預(yù)測類標(biāo)簽;
用戶畫像最為基礎(chǔ)常見的標(biāo)簽,統(tǒng)計類標(biāo)簽值統(tǒng)計用戶相關(guān)數(shù)值、客觀描述用戶狀態(tài)的標(biāo)簽,這類數(shù)據(jù)通常可以從用戶注冊數(shù)據(jù)、用戶訪問、消費統(tǒng)計中可以得出。
例如對于某個用戶來說,其性別、年齡、城市、星座、近7日活躍天數(shù)、近7日活躍次數(shù)、累計購買金額、累計購買次數(shù)、月均消費金額等字段,
基于用戶行為及確定的規(guī)則產(chǎn)生,在實際開發(fā)畫像的過程中,根據(jù)業(yè)務(wù)的需要,由運營人員和數(shù)據(jù)人員共同協(xié)商制定,包含活躍度標(biāo)簽、RFM標(biāo)簽等。例如,對平臺上“交易活躍”這一口徑的定義為“近90天交易次數(shù)>3”。
下面由草帽小子來介紹,常用的用戶活躍度標(biāo)簽、RFM標(biāo)簽的劃分方法。
(1)用戶活躍度標(biāo)簽
實際業(yè)務(wù)場景中會涉及根據(jù)用戶的活躍情況,給用戶打上高活躍、中活躍、低活躍、流失等標(biāo)簽。
那這個過程中高中低的時間范圍是如何劃分的呢?
在這里,路飛的拍腦門可行不通,標(biāo)簽的建設(shè)講究定義有依據(jù),建設(shè)有方法。
首先劃分用戶的流失周期,通常有2種方法:
一是拐點理論:X軸上數(shù)值的增加會帶來Y軸數(shù)值大幅增益(減益),直到超過某個點之后,當(dāng)X增加時Y的數(shù)據(jù)增益(減益)大幅下降,即經(jīng)濟學(xué)里面的邊際收益的大幅減少,那個點就是圖表中的“拐點”。
比如圖中流失周期增加到5周的時候,用戶回訪率的縮減速度明顯下降,所以這里的5周就是拐點,我們可以用5周作為定義用戶流失的期限,即一個之前訪問/登錄過的用戶,如果之后連續(xù)5周都沒有訪問/登錄,則定義該用戶流失。
二是統(tǒng)計用戶最后一次訪問與倒數(shù)第二次訪問之間的時間間隔,可認為大于這個時間間隔的用戶基本不會再訪問,即用戶已流失。查看歷史數(shù)據(jù)可以了解到用戶最后一次訪問與倒數(shù)第二次訪問間隔30日以上的用戶不足10%,可以認為大于這個時間間隔的用戶為“流失用戶”。
劃分完流失周期之后,根據(jù)用戶的活躍情況進一步將其劃分高中低活躍。對歷史數(shù)據(jù),按照二八原則進行劃分。
例如分析得出活躍次數(shù)10次以上的用戶占近30日訪問用戶量的20%,則這批為“高活躍用戶”;進一步把活躍5-10次的用戶劃分為“中活躍用戶”;把活躍1-5次的用戶劃分為“低活躍用戶”。
(2)RFM標(biāo)簽
RFM模型主要由3個基礎(chǔ)指標(biāo)組成:最近一次消費時間、消費頻率、消費金額。根據(jù)歷史數(shù)據(jù),查看用戶量的占比,可按照二八原則進行劃分,得到細分標(biāo)簽。
基于用戶的屬性、行為、位置和特征,運用決策樹算法、回歸算法等挖掘用戶的相關(guān)特征,挖掘其潛在需求,針對這些潛在需求,給用戶打標(biāo)簽,配合不同的營銷策略,進行推送。
例如,根據(jù)一個用戶的消費習(xí)慣判斷,他對商品的偏好程度;根據(jù)用戶的退差評等行為,預(yù)測其風(fēng)險程度。
一般統(tǒng)計類和規(guī)則類標(biāo)簽即可滿足應(yīng)用需求,在開發(fā)過程中占有較大比例。機器學(xué)習(xí)挖掘類標(biāo)簽多用于預(yù)測場景,如判斷用戶風(fēng)險、用戶購買商品偏好、用戶流失意向等,其開發(fā)周期長、開發(fā)成本高。
例如,今日頭條上積累了大量與數(shù)據(jù)產(chǎn)品主題相關(guān)的文章、帖子等文本數(shù)據(jù),由于歷史原因,這些文章沒有做內(nèi)容分類,也沒有打上相應(yīng)的標(biāo)簽,不便于對內(nèi)容進行管理?,F(xiàn)在需要對帖子打上相應(yīng)的主題標(biāo)簽。
一是根據(jù)已經(jīng)劃定的文章類型,將為做過分類的文章自動劃分到相應(yīng)類型下
二是支持文章的集約化管理,根據(jù)文章內(nèi)容自動為每篇文章打賞與其主題相關(guān)的標(biāo)簽
(1)特征選取及開發(fā)流程
數(shù)據(jù)分類:人工對一批文檔進行準(zhǔn)確標(biāo)注,作為訓(xùn)練集樣本,未進行標(biāo)注的一批文檔作為測試集
數(shù)據(jù)預(yù)處理:對測試集和訓(xùn)練集文本進行分詞處理,建立詞料庫,去掉停用詞、語氣詞等
樸素貝葉斯分類:從精度、召回率、F-測度值3方面來劃分文章分類
(2)計算標(biāo)簽權(quán)重
用戶在平臺上的不同行為,在用戶標(biāo)簽層面權(quán)重不同,比如用戶購買某商品的行為權(quán)重要比用戶添加購物車、收藏某商品、瀏覽某商品行為權(quán)重依次要高。
在標(biāo)簽制定過程中用戶畫像建模人員與業(yè)務(wù)人員需要密切溝通,結(jié)合業(yè)務(wù)場景制定不同行為類型和權(quán)重。常用的確定權(quán)重的方法有TF-IDF詞空間向量、時間衰減系數(shù)。
1)TF-IDF詞空間向量
TF-IDF是一種統(tǒng)計方法,用以評估一個字或詞相對于一個文件集或一個語料庫中其他詞的重要程度。字詞的重要性與它在文件集中出現(xiàn)的次數(shù),成正比;與它在語料庫中出現(xiàn)的次數(shù)成反比。
2)時間衰減系數(shù)
當(dāng)用戶數(shù)據(jù)達到足夠密集的程度后,用戶身上打的標(biāo)簽對應(yīng)的屬性會表現(xiàn)出較高的穩(wěn)定性,這種穩(wěn)定性與用戶長期行為形成的個人特征相匹配。
用戶標(biāo)簽權(quán)重=行為類型權(quán)重*時間衰減*用戶行為次數(shù)*TF-IDF計算標(biāo)簽權(quán)重
畫像系統(tǒng)作為支撐系統(tǒng),主要目標(biāo)用戶是市場、運營、產(chǎn)品、數(shù)據(jù)分析師等人員,滿足其用戶分析、標(biāo)簽查詢、營銷活動對接的需求。所以畫像系統(tǒng)的設(shè)計需要考慮功能上的用戶分析需求,以及非功能上的接口開發(fā)需求。
功能上可劃分為:首頁畫像數(shù)據(jù)、標(biāo)簽管理、用戶查詢、用戶分群等。
添加分群時通常會配置人群名稱、滿足的條件,計算覆蓋的人群數(shù)量,推送到消息通知、電子郵件、短信。
非功能性需求主要包含接口需求,保障畫像系統(tǒng)數(shù)據(jù)與各系統(tǒng)之間打通,如push推送系統(tǒng)、營銷系統(tǒng)、廣告系統(tǒng)、推薦系統(tǒng)、BI等平臺,并且保證各系統(tǒng)數(shù)據(jù)的實時更新,避免同源不同數(shù)的問題。
標(biāo)簽體系和用戶畫像系統(tǒng)都搭建完成了,那用戶畫像具體在哪用、怎么用,能給業(yè)務(wù)帶來哪些價值呢?
在廣告投放、電商等領(lǐng)域,用戶畫像常用來作為精準(zhǔn)營銷、推薦系統(tǒng)的基礎(chǔ)性工作,主要應(yīng)用場景包含3類:精準(zhǔn)營銷、用戶分析、個性化推薦。
根據(jù)歷史用戶特征,運營人員可以分析產(chǎn)品的潛在用戶和用戶的相關(guān)需求,針對特定群體提供個性化營銷服務(wù)。常用的有短信、郵件、站內(nèi)信、push消息的精準(zhǔn)推送,客服針對用戶的不同話術(shù)、針對高價值用戶的極速退款退貨等VIP服務(wù)。
短信/郵件/push營銷
日常生活中會從多個渠道收到營銷信息,一條關(guān)于紅包到賬的短信消息推送,可能會促使用戶打開很久沒訪問的app,一條關(guān)于心愿單內(nèi)的降價消息,可能會刺激用戶打開推送鏈接,直接購買。
借助畫像系統(tǒng)進行營銷需要注意的有:
短信敏感度:有的用戶對營銷短信的敏感度較差,比如從歷史數(shù)據(jù)來看,推送其10次短信,只打開過1次或從未打開過??紤]到短信渠道需要營銷成本,可以把這批用戶排除掉,并減少對用戶的干擾。
無效手機號:對于平臺上隨意填寫非自己的手機號、手機號已經(jīng)作廢/更換,接收到短信回復(fù)了“TD”的用戶來說,短信無法接收,屬于短信黑名單,這類用戶也需要排除
對營銷商品感興趣的用戶:近期曾多次瀏覽、收藏或是加購、下單行為的用戶,是某累商品的潛在意向用戶,可以通過滿減優(yōu)惠券或是紅包的方式進行營銷。
客服話術(shù)
當(dāng)我們在向某平臺的客服部門投訴、咨詢或反饋意見時,客服人員可以準(zhǔn)確的說出我們在平臺的購買情況,上一次咨詢問題的處理結(jié)果等信息,針對性的提出解決方法,對于高價值用戶提供VIP客服通道等專項服務(wù)。
應(yīng)用的運營者,可以通過個推用戶畫像中的性別、年齡段、興趣愛好、瀏覽購買行為等標(biāo)簽,給用戶推薦不同的內(nèi)容。如今日頭條上的個性化文章內(nèi)容推薦、抖音上基于用戶畫像做的個性化視頻內(nèi)容推薦、淘寶上基于用戶瀏覽行為等畫像數(shù)據(jù)做的個性化商品推薦等。
用戶畫像的標(biāo)簽可應(yīng)用于各類分析,包含用戶分析、訂單分析、漏斗分析、人群特征分析等。
本文主要從數(shù)據(jù)產(chǎn)品層面來看,如何0-1建設(shè)用戶畫像體系??催^草帽小子之前寫的埋點、指標(biāo)體系文章的朋友可能已發(fā)現(xiàn),畫像體系搭建跟埋點、指標(biāo)建設(shè)一樣,也是遵循普通的產(chǎn)品設(shè)計流程,從需求分析、到標(biāo)簽/指標(biāo)設(shè)計、后臺設(shè)計,最終再應(yīng)用于業(yè)務(wù)。
正所謂萬變不離其宗,就像路飛的技能看起來千變?nèi)f化,其核心點都是在用橡膠能力做各種變化。數(shù)據(jù)產(chǎn)品的各種變化形式,其核心在于業(yè)務(wù)。
作者:草帽小子
來源:草帽小子(luckily304)
136 0806 8886【加微信請注明來意】
四川省成都市高新區(qū)天府三街1599號(天府三街與南華路交匯處)