秦宇
(廣東省外語藝術職業學院 廣東省廣州市 510620)
智能創新科技將引領電商產業數字化升級,人工智能技術正在為電商平臺獲取忠實用戶提供源源不斷的動力。隨著產業數字化步伐的加快,電商平臺依托互聯網、云數據、人工智能等數字技術升級的步伐也越來越快[1]。人工智能時代,電商平臺分析自身用戶的實際消費潛力,已經成為電商平臺獲取高額利潤的必要條件。針對電商平臺上架產品的數據分類,針對用戶群體的消費實力分類,針對消費者瀏覽行為、關注行為、消費行為的數據挖掘,有利于電商平臺獲取精準用戶畫像,從而完善消費引導或商品推送信息[2]。但是在電商大數據分類與挖掘的過程中,算法精準度偏低,成為阻礙電商發展的重要因素。為此,結合電商用戶數據特征識別,總結了用戶消費周期行為數據推導過程,現做如下分析。
簡單商品數據信息,是商家對商品信息的歸類,主要包括品類、價格,其他參數信息如顏色、尺寸、出產地、規格、重量等輔助參考信息,以商品參數(para-N)代表。商品信息,如表1所示。
除了商品信息之外,用戶數據信息時判斷電商市值和消費潛力的重要數據參考標準。用戶信息主要是年齡、性別、用戶等級。用戶信息,如表2所示。
電商平臺的用戶行為數據,是一種描述用戶消費行為,或者是瀏覽關注行為。當用戶在某日大量流量某一商品信息時潛在消費因素形成,后續出現收藏關注說明用戶已經將購買行為提上日程,上述行為的發生頻次越高說明用戶消費需求越大。用戶行為信息,如表3所示。
用戶訂單是完成消費動作之后,電商平臺后臺數據庫陳列的訂單數據信息。包括:用戶信息、商品信息、下單標識、訂單日期、訂單區域、訂單件數等。用戶訂單數據類型,如表4所示。
用戶評論信息,代表著用戶對于商家服務行為的滿意度,是電商與用戶良好溝通的基礎數據。用戶評論主要是好評、中評、差評,以及未作出評論的訂單。用戶評論信息,如表5所示。
從原始數據表中直接提取出原始特征后,從原始數據表中提取單數據表特征,如訂單時間特征、訂單計數特征、訂單金額特征、sku 參數特征、行為時間特征等。
(1)時間跨度特征,消費者從最后一筆訂單到當日訂單的時間間隔,從最后一次瀏覽頁面距今天的時間。其中,包括間隔時間均值、最大值、最小值、標準差值[3]。行為描述在于統計用戶的消費習慣,預測用戶是否已經離開本平臺前往其他電商平臺消費。

表1:商品信息列表

表2:用戶信息列表

表3:用戶行為信息列表

表4:訂單數據類型信息列表

表5:用戶評論信息列表
(2)訂單數,用于統計用戶在該時間段內的訂單比例,用于評估消費者對當前商品的需求程度和消費欲望[4]。單品類商品預測消費潛力時,以往銷售訂單量越高,未來預期銷量越高,可作為預測消費決策的參考數據。
(3)商品數,代表用戶在該類商品中瀏覽過、收藏過、消費過的商品數量[5]。商品總數、品類數、購買次數、目標品類的購買總數、日均購買數量。以此來判斷用戶對于購買此類產品的數量需求。

表6:描述統計量

表7:樣本數雙側檢驗結果
(4)訂單數與商品數結合,推算出用戶對于不同品類、不同價格、不同商品參數的消費偏好。訂單數與用戶行為結合,推算出用戶消費決策的行為過程。
以一個總體消費周期S,代表用戶在電商平臺內的消費行為滿足這一周期S時存在消費決策。設(a,b,c)分別代表一款產品,當用戶消費行為周期滿足假設序列(a,b,b,a,c,c,b)時,用戶對商品b存在購買意向,同時高于商品a的購買意向,對c商品可能僅作為對比。用戶最終收藏了商品b,消費意向更高于其他兩款商品。
單獨考慮消費觀察的周期頻率影響,以n代表商品i在消費瀏覽序列中出現的頻次,得到公式為:wi=n/N。單獨考慮時間間隔因素的影響,那么在S周期內的瀏覽序列行為標記為q,則長度為N,q序列自起始階段到終止存在(1,2,…,N)個序列編號,最終消費決策商品滿足集合序列p(q,i),那么時間間隔的影響效度函數表達式為:

綜合上述時間間隔影響因素和瀏覽頻率的影響因素,得到消費決策的函數表達式:

最終獲得多個關聯因素影響下,用戶消費決策行為對商品銷售的影響,并以此推斷未來某種商品在電商平臺可能存在巨大消費潛力,為電商平臺調整戰略布局提高數據參考。
以Oi代表第i個用戶消費決策的選擇,當Oi=1時消費決策成立,當Oi=0時消費決策不成立。N為電商平臺對消費者瀏覽行為的總體記錄數,限定N不高于5萬次。根據消費行為統計用戶在本季度內瀏覽商品數,并以S1代表消費者評價,限定用戶數不高于3萬人。從而得到S1評價指標:

進一步計算預測消費行為的準確率(accurate)和召回率(recall):

以TP代表消費商品的正確樣本特征數;FP代表消費商品的不正確樣本特征數;TN代表實際消費樣本特征數,FN代表未消費樣本特征數。
以某電商平臺具有代表性的31類商品消費者評價最高分100,最低分38,做為檢測樣本。以該電商平臺用戶消費瀏覽序列wi最高98次瀏覽同一款商品,最低瀏覽13次同款商品為對比序列。檢測數據樣本描述,如表6所示。
將上述檢測樣本帶入SPSS25.0統計學軟件,進行數理分析和檢驗,得到樣本數集合內的雙側檢驗結果,如表7所示。
由表7可知,accurate準確率檢測結果置信度在95%以上時,置信上限達到84.3652,置信下限也可以維持在70.7961,Sig值趨近于0,代表檢測結果可信度較高。進一步說明,通過對用戶以往消費決策的統計,可推算出可信度較高的預測結果,數據挖掘準確率高于70%。通過recall召回率檢測結果可知,置信度在95%以上時,置信上限達到75.9047,置信下限也可以維持在54.5091,Sig值趨近于0,代表檢測結果可信度較高。但是也能夠發現,用戶瀏覽次數對最終消費決策行為的影響并不高,瀏覽頻率智能作為挖掘用戶行為的輔助參考數據,而不能作為判斷決策數據。
綜上所述,人工智能時代,依靠算法獲得用戶精準畫像,建議電商平臺細分商品數據類型、用戶數據類型、用戶行為數據類型、用戶訂單數據類型、用戶評論數據類型,通過構建完整的數據庫分類獲取更為精準的原始數據信息。進一步優化針對用戶消費行為數據的精準測評算法,通過數據特征識別來測算用戶潛在的消費能力,并通過用戶消費周期行為數據推導,進一步明確用戶可能產生的消費總量。從而精準測算用戶特征測評指標,檢驗用戶消費潛力數據,做到實時精準推送商品信息,打造人工智能時代的高品質電商。