新用戶登錄后自動創(chuàng)建賬號
登錄基于消費行為的用戶特征分析在網(wǎng)絡營銷領域得到廣泛關注。大數(shù)據(jù)環(huán)境背景下,將傳統(tǒng)領域的成熟方法提煉改進后應用于新場景,能夠更好地滿足網(wǎng)絡營銷領域應用的需求。
本文基于數(shù)據(jù)分析對用戶特征進行量化,采用分批迭代的方法并在此基礎上對該方法進行拓展,通過各種指標進行獨立和組合研究,實現(xiàn)用戶價值度量,使其結(jié)果能夠有效地適用于多種網(wǎng)絡營銷領域的應用。
用戶價值度量指標概述
對用戶特征進行分析,是為了深入了解用戶,可以從用戶的人口統(tǒng)計特征、消費行為特征等多個角度完成。而基于消費行為的用戶特征分析廣泛應用于網(wǎng)絡營銷領域,其主流分析思路和技術(shù)是基于數(shù)據(jù)分析的用戶特征分析。基于數(shù)據(jù)分析的方法可以對用戶特征進行量化,量化結(jié)果可以準確有效地指導營銷領域的應用,這個過程可以通過度量用戶價值來實現(xiàn)。首先需要選取和確定衡量用戶價值的指標,常用的指標包括:
第一,用戶最近消費時間:用戶在某個周期內(nèi)最近一次消費的時間。
第二,用戶消費頻率:用戶在某個周期內(nèi)所消費的次數(shù)。
第三,用戶消費總金額:用戶在某個周期內(nèi)消費的金額。
第四,用戶消費最高單價:用戶在某個周期內(nèi)消費的商品最高價格。
第五,特價商品消費比重:用戶在某個周期內(nèi)消費的特價商品的金額在其消費總金額中的比重。
第六,高單價商品消費比重:用戶在某個周期內(nèi)高單價商品消費數(shù)量占其消費商品總數(shù)量的比重。
用戶價值可以通過上述指標進行單項分析,也可以組合在一起進行綜合分析,盡可能多角度全面地度量用戶價值。本文結(jié)合應用場景和數(shù)據(jù)基礎,選取前三個指標進行單項和組合研究。
用戶價值度量方法分析
(一)用戶價值度量基礎
以用戶的最近消費時間(R)、消費頻率(F)、消費總金額(M)為例,若考察單項指標,用戶的最近消費時間最短、消費頻率最高、消費總金額最大代表用戶的價值越大;若考察指標組合,需要通過確定各指標權(quán)重計算綜合值,來度量用戶的價值。對于權(quán)重的確定,以往研究多采用層次分析法,但此方法受到專業(yè)主觀因素的影響。吉林大學段書勇從數(shù)據(jù)出發(fā),提出通過數(shù)據(jù)分批迭代計算指標權(quán)重的方法,客觀合理度量了用戶價值。
該方法的核心思想是:
1.以消費總金額為參考標準確定最有價值用戶。將某年度第六個月的消費用戶按照消費總金額劃分為3個等級,處于最高等級的用戶為最有價值用戶。
2.計算過去某段時間內(nèi)不同等級消費用戶占最有價值用戶的比例。將某年度前五個月的消費用戶按照消費金額分為7個等級,對每個等級用戶再按消費頻率分為7個等級,這樣前五個月消費用戶被分為49個等級。計算最有價值用戶在49個等級中的比例。按照此方法確定最近消費時間、消費頻率和消費總金額對最有價值用戶的影響程度。
3.依據(jù)最近消費時間、消費頻率和消費總金額對最有價值用戶的影響程度。采用數(shù)據(jù)分批迭代方法計算指標權(quán)重a、b、c,再根據(jù)公式計算用戶價值:RFM_SCORE=a×R_SCORE+b×F_SCORE+c×M_SCORE。其中,RFM_SCORE為用戶價值;R_SCORE、F_SCORE、M_SCORE為用戶在最近消費時間、消費頻率和消費總金額指標上的等級;a、b、c為指標權(quán)重。
本文關于用戶價值的度量需要結(jié)合實際場景和應用,才能有效和準確的對用戶價值度量,需要在借鑒該方法的基礎上進行拓展,包括:第一,定義多個角度的最有價值用戶的標準,除消費總金額外,也分別選擇消費頻率、最近消費時間以及三者組合作為標準,從不同的角度對用戶價值進行度量。第二,面對不同類型的商品,用戶的消費特征不同,由此產(chǎn)生的用戶價值可能不同。因此,需要針對不同類型、不同層次商品的消費,對用戶價值進行深入評價和度量。
(二)用戶價值度量路徑
1.定義最有價值用戶標準,確定最有價值用戶群。
確定最有價值用戶群,要對指標數(shù)據(jù)進行離散化,有兩種方式:
第一,獨立式離散化。按照最近消費時間(R_14) 對用戶進行降序排列并按數(shù)量進行等分,比如等分為3份。對于消費頻率(F_14)和消費總金額(M_14)兩個指標也分別采用降序排列和等分的方法將用戶等分,這樣可以得到在最近消費時間(R_14)、消費頻率(F_14)和消費總金額(M_14)指標下的用戶等級。
第二,嵌套式離散化。先按照最近消費時間(R_14)將用戶等分為3份;在此基礎上,對3份用戶中的每1份用戶按照消費頻率(F_14)再劃分為3份,得到9份用戶集合;在此基礎上,對9份用戶中的每1份用戶再按消費總金額(M_14)劃分為3份,最終得到27份用戶集合。
在本文中采用獨立式離散化方法,選取2014年1月某網(wǎng)站用戶群A的消費數(shù)據(jù),按照最近消費時間(R_14)、消費頻率(F_14)和消費總金額(M_14)指標對用戶群A數(shù)據(jù)分別進行離散化(得分分別用R_14_SCORE、F_14_SCORE、M_14_SCORE表示),將用戶劃分為“高”、“中”、“低”三個級別,用“3”、 “2”、 “1”標注。
數(shù)據(jù)離散化完成后,針對用戶群A,分別選擇最近消費時間(R_14)、消費頻率(F_14)和消費總金額(M_14)作為參考標準,定義最有價值用戶群*_MVU_A(依據(jù)參考標準不同,*代表R_14、F_14、M_14、RFM_14),如表1所示。
當以R_14作為參考標準,最有價值用戶群R_14_MVU_A為R_14_SCORE取值為“3”對應的用戶集合,即用戶群A中最近消費時間等級為3的用戶集合。
當以F_14作為參考標準,最有價值用戶群F_14_MVU_A為F_14_SCORE取值為“3”對應的用戶集合,即用戶群A中消費頻率等級為3的用戶集合。
當以M _14作為參考標準,最有價值用戶群M _14_MVU_A為M _14_SCORE取值為“3”對應的用戶集合,即用戶群A中消費總金額等級為3的用戶集合。
當以RFM_14作為參考標準,最有價值用戶群RFM_14_MVU_A為R_14_SCORE、 F_14_SCORE、 M_14_SCORE至少兩項取值為“3”對應的用戶集合,指的是:
{R_14_SCORE=3,F(xiàn)_14_SCORE=1,M_14_SCORE=3}{R_14_SCORE=3,F(xiàn)_14_SCORE=2,M_14_SCORE=3}、{R_14_SCORE=3,F(xiàn)_14_SCORE=3,M_14_SCORE=3}、{R_14_SCORE=2,F(xiàn)_14_SCORE=3,M_14_SCORE=3}、{R_14_SCORE=1,F(xiàn)_14_SCORE=3,M_14_SCORE=3}、{R_14_SCORE=3,F(xiàn)_14_SCORE=3,M_14_SCORE=1}、{R_14_SCORE=3,F(xiàn)_14_SCORE=3,M_14_SCORE=2}對應的用戶集合。
即用戶群A中滿足消費時間、消費頻率、消費總金額中有兩項等級為3的用戶集合;或用戶群A中消費時間、消費頻率、消費總金額中等級均為3的用戶集合。
2.確定用戶在最有價值用戶群中的比例。選取2013年1月-12月某網(wǎng)站用戶群B的消費數(shù)據(jù),按照最近消費時間(R_13)、消費頻率(F_13)和消費總金額(M_13)指標分別對用戶群B進行離散化(得分分別用R_13_SCORE、F_13_SCORE、M_13_SCORE表示),將用戶劃分為“高”、“中”、“低”三個級別,分別用“3”、“2”、“1”標注。對用戶群B,分別按照最近消費時間(R_13)、消費頻率(F_13)、消費金額(M_13)劃分的3個等級,計算處于不同等級的用戶群B中的用戶在最有價值用戶群*_MVU_A中出現(xiàn)的人數(shù)(#_Ct_BMA)占用戶群B人數(shù)(#_Ct_B)的比例(#_Res_Rate)。以最近消費時間(R_14)作為標準劃分的最佳用戶群R_14_MVU_A進行#_Res_Rate計算為例(依據(jù)劃分標準不同,#_代表R、F、M),計算要素如表2所示(其他參考標準的最有價值用戶群的#_Res_Rate計算,同理)。
3.確定各指標對最有價值用戶的影響程度。在表2中,對各等級的R_Res_Rate、F_Res_Rate、M_Res_Rate進行降序排列,等級為3的R_Res_Rate、F_Res_Rate、M_Res_Rate排列結(jié)果反映了R、F、M對最有價值用戶的影響程度。
4.確定指標權(quán)重,按照公式RFM_SCORE=a×R_SCORE+b×F_SCORE+c×M_SCORE計算用戶綜合價值。假定由(3)得到F_Res_Rate>R_Res_Rate>M_Res_Rate,按照RFM_SCORE=a×R_SCORE+b×F_SCORE+c×M_SCORE計算用戶綜合價值的方法步驟如下:
第一,將R_SCORE、F_SCORE、M_SCORE標準化。第二,計算a、b、c權(quán)重值。根據(jù)假定F_Res_Rate>R_Res_Rate>M_Res_Rate,得到b>a>c,并且a+b+c=1。那么,滿足這兩個條件的權(quán)重組合有:{a=0.2,b=0.7,c=0.1}{a=0.3,b=0.6,c=0.1}{a=0.4,b=0.5,c=0.1}{a=0.3,b=0.5,c=0.2}。第三,假定選擇最近消費時間(R_14)作為參考標準,找到同時出現(xiàn)在最有價值用戶群R_14_MVU_A和用戶群B中的用戶,應用第二步中的四組權(quán)重,計算RFM_SCORE,其結(jié)果按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、[0.75,1]分成4組。其中,[0.75,1]對應的用戶群人數(shù)記為Ct_RFM_MVU_A。第四,應用第二步中的四組權(quán)重計算用戶群B的RFM_SCORE,按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、 [0.75,1]分成4組。其中,[0.75,1]對應的用戶群人數(shù)記為Ct_RFM_MVU_B。第五,計算W_Rate=Ct_RFM_MVU_A/ Ct_RFM_MVU_B,最高值對應的權(quán)重組合為最佳權(quán)重。第六,按照公式RFM_SCORE=a×R_SCORE+b×F_SCORE+c×M_SCORE計算用戶綜合價值。
5.針對不同類型和層次的商品進行用戶價值計算。將商品分類,針對不同類型和層次商品對應的用戶集重復上述步驟,計算參考商品類別劃分的用戶價值。
用戶價值度量實驗
(一)實驗數(shù)據(jù)說明
根據(jù)用戶價值度量思路,選取某網(wǎng)站2014年1月用戶數(shù)據(jù)作為用戶群A,選取2013年1月-12月用戶數(shù)據(jù)作為用戶群B。結(jié)合商品分類,其對應的用戶群記錄數(shù)如表3所示。
(二)實驗結(jié)果與分析
1.基于不同最有價值用戶群針對單一類型商品的指標權(quán)重定義分析。本實驗選擇“日用百貨”類商品消費對應的用戶進行價值度量分析。依據(jù)度量思路,呈現(xiàn)其中兩個重要的結(jié)果:
一是計算Res_Rate。參照最有價值用戶群,計算Res_Rate,根據(jù)其結(jié)果判斷權(quán)重值a、b、c的大小關系。針對用戶群A,在商品分類情況下,以最近消費時間(R_14)做參考標準為例,確定最有價值用戶群R_14_MVU_A。針對用戶群B,按最近消費時間(R_13)、消費頻率(F_13)、消費總金額(M_13)計算R_Res_Rate、F_Res_Rate、M_Res_Rate。
從表4中得到:
等級3:F_Res_Rate(0.029)>R_Res_Rate(0.028)>M_Res_Rate(0.024)
等級2:F_Res_Rate(0.013)>R_Res_Rate(0.012)=M_Res_Rate(0.012)
等級1:M_Res_Rate(0.010)>F_Res_Rate(0.009)>R_Res_Rate(0.006)
選擇等級為3的結(jié)果作為判斷權(quán)重大小的標準,進而得到權(quán)重b>a>c,并且a+b+c=1,a、b、c取值步長定義為0.1。滿足上述條件的組合有{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}、{a=0.4,b=0.5,c=0.1}、{a=0.3,b=0.5,c=0.2}。
二是計算a、b、c權(quán)重值。以最近消費時間(R_14)作為參考標準,找到同時出現(xiàn)在最有價值用戶群R_14_MVU_A和用戶群B中的用戶,分別應用四組權(quán)重組合{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}、{a=0.4,b=0.5,c=0.1}、{a=0.3,b=0.5,c=0.2},計算RFM_SCORE,其結(jié)果按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、[0.75,1]分成4組。其中,[0.75,1]對應的用戶群人數(shù)記為Ct_RFM_MVU_A。
接下來,應用四組權(quán)重組合{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}、{a=0.4,b=0.5,c=0.1}、{a=0.3,b=0.5,c=0.2},計算用戶群B的RFM_SCORE,按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、 [0.75,1]分成4組。其中,[0.75,1]對應的用戶群人數(shù)記為Ct_RFM_MVU_B。
計算W_Rate=Ct_RFM_MVU_A/ Ct_RFM_MVU_B,最高值對應的權(quán)重組合為最佳權(quán)重,結(jié)果如表5所示。在表5中,從依據(jù)四組權(quán)重計算W_Rate的結(jié)果看到,{a=0.4,b=0.5,c=0.1}和{a=0.3,b=0.5,c=0.2}對應的W_Rate(0.032)相等并且大于{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}對應的W_Rate。因此,以{a=0.4,b=0.5,c=0.1}和{a=0.3,b=0.5,c=0.2}兩組平均值{a=0.35,b=0.5,c=0.15}作為最佳權(quán)重進行用戶價值的度量。
(三)基于不同最有價值用戶群針對不同類型商品的權(quán)重綜合比較分析
本實驗分別按照最近消費時間、消費頻率、消費金額及三項綜合指標定義最有價值用戶群,針對不分類商品和分類后的4類商品按照用戶價值度量思路,進行a、b、c權(quán)重計算,對權(quán)重進行綜合分析和比較,結(jié)果如表6所示。得到如下結(jié)論:
第一,無論是在商品分類還是不分類情況下,針對不同類型的最有價值用戶群,消費金額對最有價值用戶群的影響是最弱的。在20組權(quán)重比較結(jié)果中,有14組最近消費時間對最有價值用戶群的影響最大,消費頻率的影響次之。
第二,在商品不分類的情況下,針對不同類型最有價值用戶群,各指標的影響程度是一致的,即最近消費時間影響最大;消費頻率次之;消費金額最弱。
第三,在商品分類的情況下表現(xiàn)出如下特征:
一是針對不同類型最有價值用戶群,面向“電腦整機”和“家用電器”兩類商品的8組權(quán)重比較中,影響力排名第一的是最近消費時間;有7組顯示影響力排名第二的是消費頻率,只有1組消費金額影響力第二;有2組消費頻率和消費金額的影響力相同。
二是針對不同類型最有價值用戶群,面向“日用百貨”和“手機數(shù)碼”兩類商品的8組權(quán)重比較中,有7組影響力排名第一的是消費頻率;有6組顯示影響力排名第二的是最近消費時間。
結(jié)論
用戶價值度量滿足了網(wǎng)絡營銷領域?qū)谙M行為的用戶特征量化的需求。本文基于數(shù)據(jù)分析的方法對用戶特征進行量化,先用定性方式確定最近消費時間、消費頻率和消費總金額對用戶價值的影響程度;再用數(shù)據(jù)分批迭代的定量方式確定三個指標的權(quán)重值。并在此基礎上對其進行拓展,選擇不同最有價值用戶群作為參考標準,結(jié)合商品分類,從多個角度和層次對用戶價值進行度量,以得到最佳度量結(jié)果,使其結(jié)果能夠有效的適用于多種網(wǎng)絡營銷領域的應用。
*本文轉(zhuǎn)載自199IT互聯(lián)網(wǎng)數(shù)據(jù)中心(ID:i199it)。