如果您是用戶,在使用抖音、今日頭條時,如果平臺向您推薦的內(nèi)容是您感興趣的,可以為您節(jié)省大量搜索內(nèi)容的時間。
如果你是商家,當你投放廣告時,如果平臺推送的用戶都是你的潛在買家,那么你可以花更少的錢,帶來更大的收益。
【資料圖】
兩者背后有一個共同的技術(shù):用戶畫像。本文將從用戶畫像的基本概念、使用場景、構(gòu)建流程和技術(shù)等方面向您揭示用戶畫像構(gòu)建的全過程。
用戶畫像,又稱用戶畫像,是勾畫目標用戶、連接用戶需求和設(shè)計方向的有效工具。用戶畫像是與用戶相關(guān)的數(shù)據(jù)的直觀呈現(xiàn),即用戶信息的標簽。
用戶畫像可以理解為海量數(shù)據(jù)的標簽。根據(jù)用戶的目標、行為和觀點,將用戶分為不同類型。然后從每種類型中提取典型特征,并指定名稱、照片和一些人口統(tǒng)計元素。場景等描述構(gòu)成了人物原型(personas)。
用戶畫像中常見的屬性包括:人口屬性、會員屬性、行為屬性、交易屬性、消費屬性。
建立用戶畫像數(shù)據(jù)后,我們可以從各個維度為各行業(yè)提供個性化推薦、精準營銷、智能風控等數(shù)據(jù)應(yīng)用開發(fā)。
用戶畫像的使用場景可以從宏觀和微觀兩個層面進行描述。
宏觀層面:建立具體認知和戰(zhàn)略戰(zhàn)術(shù)方向,探索用戶足跡、市場細分和用戶分組,并以此作為市場導向。微觀層面:勾勒用戶,連接用戶需求和產(chǎn)品設(shè)計,方便解構(gòu)場景中的用戶。各種數(shù)據(jù)應(yīng)用:作為推薦/搜索/風控等的重要組成部分而存在。定性與定量方法相結(jié)合、數(shù)據(jù)化運營與用戶分析相結(jié)合的載體。精準營銷、精準投放,讓產(chǎn)品的服務(wù)對象更加集中、針對性強。用戶畫像的常見應(yīng)用主要有四種場景:
用戶特征洞察:
用戶標簽輔助用戶分析和用戶洞察,可以幫助業(yè)務(wù)人員快速了解用戶,進而發(fā)現(xiàn)用戶的顯著特征,獲得一些業(yè)務(wù)靈感。
加強數(shù)據(jù)分析:
標簽還可以豐富數(shù)據(jù)的維度。我們對業(yè)務(wù)數(shù)據(jù)進行更深入的對比分析,從分析洞察中獲得的靈感可以輔助業(yè)務(wù)落地。
精細化運營:
一方面,可以將用戶群體切分為更細粒度的群體,使操作從粗放走向精細,采用多種不同的手段和渠道觸達,如短信、推送通知、郵件、等帶動或召回用戶,達到事半功倍的效果。
數(shù)據(jù)產(chǎn)品應(yīng)用:
另一方面,除了驅(qū)動人工業(yè)務(wù)外,用戶標簽還可以成為其他數(shù)據(jù)產(chǎn)品的基礎(chǔ),比如個性化推薦系統(tǒng)、廣告系統(tǒng)、CRM等系統(tǒng)。自動化業(yè)務(wù)系統(tǒng)可以更有效地利用這些用戶標簽,從而發(fā)揮更大的威力。
用戶畫像的構(gòu)建可分為立項、標簽發(fā)布、標簽匯聚、數(shù)據(jù)整合、標簽擴展、用戶理解、標簽挖掘等過程。
項目啟動階段:確定用戶畫像建設(shè)的目標和使用場景。
劃分標簽發(fā)布階段:對用戶畫像進行標簽設(shè)計和劃分,確定用戶標簽的計算邏輯、開發(fā)上線范圍和迭代節(jié)奏。
標簽收斂階段:收斂標簽的覆蓋范圍,劃分標簽的重要程度和可信度。
數(shù)據(jù)集成階段:將用戶行為數(shù)據(jù)集成到系統(tǒng)中,計算處理成用戶標簽,與用戶畫像服務(wù)集成。
應(yīng)用拓展階段:將固化后的用戶畫像標簽應(yīng)用到更廣泛的應(yīng)用中。
用戶理解階段:總結(jié)用戶畫像標簽在不同應(yīng)用中的使用結(jié)果,評估用戶在不同應(yīng)用中的使用偏好,細化用戶畫像的刻畫,增強對用戶的理解。
標簽挖掘和其他過程:挖掘和擴展現(xiàn)有的用戶標簽系統(tǒng)。
用戶畫像的構(gòu)建過程需要一個閉環(huán),在挖掘和滿足業(yè)務(wù)需求、收集和計算基礎(chǔ)數(shù)據(jù)、構(gòu)建和完善用戶畫像之間不斷迭代改進。
用戶畫像構(gòu)建流程
在構(gòu)建用戶畫像、設(shè)計和開發(fā)用戶畫像標簽的過程中,可以參考上圖劃分的步驟。
用戶畫像構(gòu)建成功后,需要責任到人,迭代優(yōu)化。
在構(gòu)建用戶畫像的過程中,我們利用分層的思想,借助平臺和大數(shù)據(jù)技術(shù)來接入和分析數(shù)據(jù)。上圖描述了一個用戶畫像系統(tǒng)的整體圖。
1. 基礎(chǔ)設(shè)施:
大數(shù)據(jù)基礎(chǔ)設(shè)施就是數(shù)據(jù)的訪問、存儲、計算和查詢。
實時數(shù)據(jù)處理:通常采用Kafka-Flink-對象存儲技術(shù)。離線數(shù)據(jù)處理:通常采用對象存儲技術(shù)上的Spark+Hive。 2、數(shù)據(jù)層
包括實時流、離線統(tǒng)一數(shù)據(jù)、第三方數(shù)據(jù)。我們來說說離線統(tǒng)一數(shù)據(jù):
過去更多關(guān)注的是線下數(shù)據(jù),但隨著App越來越多,各端的線下數(shù)據(jù)口徑和埋點不一致,這就帶來了非常大的挑戰(zhàn)。尤其是成熟的公司在做用戶畫像的時候,會發(fā)現(xiàn)這個領(lǐng)域是最重要的。需要耗費很大的精力,因為所有的數(shù)據(jù)口徑都需要整理。因此,未來我們希望有一套統(tǒng)一的線下數(shù)據(jù)來支撐上層整體的用戶畫像應(yīng)用。
3、用戶理解層
在數(shù)據(jù)層之上,我們會構(gòu)建自己的用戶理解層,基于數(shù)據(jù)來理解用戶。主要包括行為和標簽。
行為:因為有些行為具有強烈的意圖,所以我們希望具有強烈意圖的行為可以直接積累并直接應(yīng)用于上游。行為主要包括實時會話行為和關(guān)鍵行為。實時會話行為:基于會話,可以挖掘更多上游意圖,并基于會話進行在線調(diào)整,應(yīng)用于精細化操作和推薦。關(guān)鍵行為:需要積累良好,對上游應(yīng)用或精細化運營有非常大的應(yīng)用場景。這個關(guān)鍵行為可以在有業(yè)務(wù)需要時直接復(fù)用?;谶@個行為,我們會深入挖掘標簽體系或者用戶畫像。 Tags:對于標簽來說,主要包括4類: 事實標簽:一些比較事實性的標簽,比如用戶是什么級別。規(guī)則標簽:通過一定的規(guī)則計算出的標簽。模型標簽和實時標簽:通過模型挖掘。標簽,以及可能服務(wù)于特定業(yè)務(wù)的實時標簽。 4.服務(wù)層
在用戶了解的基礎(chǔ)上,我們可以提供多種服務(wù):統(tǒng)一的用戶畫像服務(wù)、標簽管理(利用標簽元信息來管理標簽)、用戶了解平臺(主要面向算法工程師和分析師,用于監(jiān)控標簽的質(zhì)量、調(diào)整標簽結(jié)果)。
5、應(yīng)用層
各種用戶畫像和用戶畫像標簽的具體應(yīng)用。
上述用戶理解層主要由產(chǎn)品經(jīng)理和算法工程師主導,利用各種方法和算法來完善用戶標注體系和標注準確率。
上述服務(wù)層通過抽象出一個“標簽工廠”,可以將用戶標簽的管理和開發(fā)抽象為一個獨立的項目,進行跨部門協(xié)作進行開發(fā)、管理、質(zhì)量監(jiān)控和優(yōu)化。
本文從用戶畫像的基本概念出發(fā),介紹了使用場景、構(gòu)建流程、涉及技術(shù)以及如何迭代完善用戶畫像,描述了構(gòu)建用戶畫像系統(tǒng)的完整流程。用戶畫像系統(tǒng)的建設(shè)是一個巨大的跨團隊工程,需要營銷、運營、產(chǎn)品、大數(shù)據(jù)、算法團隊的充分協(xié)作才能完成。用戶畫像系統(tǒng)搭建完成后,需要驗證用戶標簽的正確性并迭代完善。
指標體系相關(guān)
指標體系構(gòu)建的實施流程——大數(shù)據(jù)團隊實踐分享(https://www.toutiao.com/article/7194229231637840445/)如何構(gòu)建指標體系? OSM+ARGO+金字塔原理(https://www.toutiao.com/article/7193851943209452070/)基于開源可視化數(shù)據(jù)探索平臺Superset的指標體系構(gòu)建(https://www.toutiao.com/article/7157336903145357824/)數(shù)據(jù)架構(gòu)相關(guān)
云流批一體化架構(gòu)設(shè)計與實踐——大數(shù)據(jù)團隊實踐分享(https://www.toutiao.com/article/7195709449506472487/)數(shù)據(jù)治理相關(guān)
數(shù)據(jù)管理成熟度模型(https://www.toutiao.com/article/7133058428549464606/)數(shù)據(jù)質(zhì)量成熟度記分卡-數(shù)據(jù)管理成熟度模型系列(https://www.toutiao.com/article/7133831970345370127/)數(shù)據(jù)倉庫相關(guān)
數(shù)據(jù)倉庫-處理緩慢變化維度的7種方法(https://www.toutiao.com/article/7201281170535924257/?log_from=f8eb8b86ffc15_1676762298413)開源技術(shù)相關(guān)
從源碼一步一步教你如何安裝Dolphin Scheduler作業(yè)調(diào)度系統(tǒng)(https://www.toutiao.com/article/7143945605298192935/)Dolphin Scheduler:從Shell工作流程到代碼解析任務(wù)之間的依賴關(guān)系(https://www.toutiao.com/article/7145296029645193765 /) 從源碼一步一步教你如何安裝Data Ease開源數(shù)據(jù)可視化分析工具(https://www.toutiao.com/article/7144529676512281129/)