伍國飛 王和勇 * 曾斌
(1.華南理工大學 廣東廣州 510641; 2.廣州科技貿易職業學院 廣東廣州 511442)
隨著短視頻用戶規模快速增長,形成了用戶黏性 大、獲客成本低的短視頻平臺,為直播電商的高速發展營造了良好的外部環境[1]。在以短視頻平臺為基礎的直播電商產業鏈中,品牌企業、工廠等為產業鏈上游,主播達人、MCN機構為產業鏈中游,粉絲用戶為下游,位于中游的主播達人重構了當前交易模式的“人貨場”,以其個人魅力、信魅力、高度互動性、信任因素影響著粉絲群體的購買行為[2],進而提升了交易效率和品牌認知度。因此,在當前流量紅利逐漸見頂、消費需求放緩、企業競爭日益激烈的背景下,直播帶貨已成為企業在降低營銷成本、維持用戶增長,促進交易和維護品牌忠誠度等營銷管理上亟須開拓和探索的新模式。企業在直播帶貨營銷方面面臨著兩大問題:首先,面對短視頻平臺上海量的直播達人,企業如何篩選契合企業目標消費群體的優質達人,以獲取有效的用戶;其次,對于提供多品類的企業,如何圍繞客戶特點制訂跨產品線的產品組合營銷方案,向優質的達人投放合適的廣告,以促進用戶達成交易。
市場細分是實現精細化營銷活動中較為流行的策略模型。市場細分根據客戶的需求、行為、或某種特征將他們分類到相似的群體中,其過程有5個活動:細分市場、描述細分市場、評估細分市場的吸引力、選擇目標細分市場并將資源分配給細分市場以及尋找目標客戶。
目標群體指數(Target Group Index,TGI)是一種應用在媒體投放、覆蓋廣大目標群體的細分技術,反映某個目標群體在某項研究特征(如地理區域、人口統計、媒體受眾等)中偏好強弱程度,用來衡量某種品牌、產品或服務在特定目標群體中的知名度和吸引程度,例如:吳文瀚[3]基于搜索引擎數據,結合使用TGI 和關聯規則來發現年輕用戶的汽車需求。自組織映射(Self-Organizing Map,SOM)算法是一種聚類和高維可視化的無監督神經網絡學習算法,由芬蘭赫爾辛基大學教授Teuvo Kohonen 提出,SOM 是一個兩層前饋網絡,每個神經元學習識別一個特定的輸入模式。具有保持拓撲結構、自適應以及可視化上的特點,廣泛應用于分類聚類、數據降維,組合優化等眾多信息處理領域。例如:宋新平等人[4]基于SOM構建競爭對手識別模型,并根據模型結果識別酒店企業的競爭對手。
基于上述分析,考慮到短視頻平臺開放的直播達人粉絲群體畫像包括人口統計屬性(如性別、地理位置、使用手機品牌、年齡等),本文以市場細分為理論基礎,以人口統計屬性為細分維度,融合TGI和SOM細分技術,構建兩層的細分用戶群體,進而使營銷人員在主播達人篩選和產品投放過程中實現精細化管理。
TGI-SOM模型的構建流程共3步:首先,采集Q公司會員數據及訂單數據為原始數據,以人口統計屬性的細分維度構建用戶群體-產品服務的TGI矩陣M;其次,以TGI矩陣M作為SOM的輸入層,通過迭代更新每個樣本與神經元的權重,輸出競爭獲勝者,并映射在二維的拓撲關系平面陣;最后,使用KMean算法對用戶群體進行二次聚類,生成分組人群。
2.1.1 TGI矩陣
設A為相同特征(如購買某類產品的行為),B(B∈T)為目標群體(如使用某個手機品牌的人群),其中T表示總體人群,TGI計算公式[5]如下:
根據公式(1)構造一個TGI矩陣M,其中每一行代表一個人群分組,每一列代表產品服務類型。設矩陣M有m行及n列,其中元素cij(i=1,2,…,m;j=1,2,…,n)為第i個人群分組對第j個的產品服務類別的TGI值,如式(2)所示:
2.1.2 SOM算法過程
設TGI矩陣M為輸入層,c=(c1,c2,…,cn)是一個n維樣本,輸出層是有N個節點的二維網絡,wij是第i個輸入神經元節點與第j個輸出神經元節點之間的權值,該算法的訓練過程如下。
(1)將連接權重、學習效率以及鄰域初始化,wij選擇[0,1]之間數值作為隨機值,且隨機值互不相同。
(2)對樣本和連接向量進行歸一化,計算歸一化后輸入向量在到輸出節點的距離d(c,w),公式如下:
(3)選擇最小距離節點中的d(c,w)為最佳匹配節點,即神經元i為獲勝神經元。
(4)使用式(4)調整權值向量值:
式(4)中:η(t)是學習效率,0<η(t)<1,且隨著時間t而減少;h(t)是鄰域內第i個神經元和獲勝神經元j之間的拓撲距離的函數。
重復上述步驟,直到對M所有樣本學習后,學習效率α(t)<αmin時結束,最終將數據映射一個二維拓撲圖上。
在TGI指標分析中,當TGI=100時表示群體B對于特征A的傾向性正好為平均水平;當TGI>100 時表示傾向性高于平均水平;反之傾向性則低于平均水平。且通常當TGI>120 時表示某項特征具有正向顯著性;當TGI<80時表示某項特征具有負向顯著性。
在SOM算法中,組件平面圖(Component Plane Diagram)是常用分析聚類結果的可視化工具,展示了聚類結果中每個神經元在不同的特征維度上的分布情況,如果兩個特征在相同的神經元上有較強的響應,則它們之間可能存在較強的相似性。TAO X 等人[6]通過應用SOM 組件平面圖更好地理解不同形態的礫石在自組織映射模型中的分布情況,并進一步探索不同類型之間的相似性和差異性。
TGI-SOM 模型構建所需要的數據來自于Q 公司(一家會員制特權電商平臺企業,為消費者提供出行、美容、餐飲、住宿、購物、玩樂等多項產品服務)。原始數據包括該平臺企業2019—2021 年間注冊用戶數據及其用戶在2022年前平臺上消費的訂單數據,其中注冊用戶數據包括其注冊地省份、注冊地所在城市等級、使用手機品牌,以及性別等用戶屬性,訂單數據包含十二大產品服務類型。該模型采用MATLAB R2022b 軟件下的SOM Toolbox 2.0工具包來訓練SOM。
考慮到TGI 為比例類型數據,為避免少量的數據對實驗效果的影響,因此剔除掉注冊用戶數匯總后不足25 000的分組數據,最終生成TGI矩陣,如表1所示。

表1 用戶人群屬性-產品服務的TGI矩陣表(部分數據)
3.3.1 選擇SOM訓練算法
SOM 有兩種訓練算法:序列訓練算法(Sequential training)和批訓練算法(Batch training),其區別在于更新權向量時前者是每當處理完一個輸入樣本后就更新而后者則是等到所有的輸入樣本都處理完后才更新。考慮到批訓練算法訓練的SOM 具有較好的一致性和更快的訓練速度,因此采用批訓練算法訓練SOM。
3.3.2 確定SOM數據標準化方法及網絡結構大小
SOM 網絡采用歐幾里得距離來度量矢量的距離,為避免SOM 訓練結果的影響,加快模型訓練速度,需要對輸入數據進行規范化處理,常用的SOM規范化處理的方法有4 種:正態標準化、線性標準化、邏輯回歸標準化和對數標準化。
評估SOM 訓練結果有3 個重要的評估指標:量化誤差(Quantization Error)、拓撲誤差(Topographic Error)和綜合誤差(Combined Error)。其中,量化誤差表示聚類中心和最近的數據點之間的距離誤差,即樣本點到其所屬聚類中心的歐幾里得距離,量化誤差越小,表示聚類效果越好;拓撲誤差表示聚類結果在拓撲結構上的誤差,即相鄰聚類之間在輸入空間中的距離,拓撲誤差越小,表示聚類結果在輸入空間中的拓撲結構越好;綜合誤差則是量化誤差和拓撲誤差的加權和,值越小越好。
最后,參考Vesanto 建議的公式S=m×5 對SOM的二維網絡結構大小進行估計,得S= 353×5≈94。
根據表2可以看出,當采用線性化標準化方法、二維網絡結構大小取值為12×8=96時,拓撲誤差和綜合誤差值最小,分別為0.389和0.006,量化誤差值(0.253)也較小,表明訓練輸出的SOM 網絡結構是可靠且較優的[7]。

表2 不同標準化方法、不同網絡結構大小所對應的SOM的量化誤差、拓撲誤差和綜合誤差
3.3.3 確定SOM聚類數目
由于SOM 算法本身只能將數據點映射到二維網格結構中,無法對數據點進行實際的聚類操作,需要使用K-Means 算法對SOM 算法得到的聚類結果進行二次聚類。同時,確定聚類結果的最佳的分類數目需要引入聚類效果的評估指標,最佳的聚類效果是使得分類后的類內數據間的距離最小而類間的距離最大。常用的聚類評估指標有輪廓系數、Calinski-Harabaz 指數和Davies-Bouldin Index(戴維森堡丁指數)等,本文采用戴維森堡丁指數來確定最佳分類數。由圖1 來看,當數據聚類成6類時,戴維森堡丁指數值最小,聚類效果最優。

圖1 不同聚類數目對應戴維森堡丁指數
3.4.1 細分人群屬性特征-產品服務偏好分析
以細分人群的標簽為維度,統計6 個細分人群下人口屬性特征,考慮到每個樣本數據數量級不一致的問題,如一線城市只有4 個,但新一線城市有15 個,單純統計其出現的次數會出現數據偏差問題,因此以每個樣本的激活數為計算指標,匯總其每個樣本對應的數量并生成詞云圖見圖2。對6大細分人群在12個產品服務TGI偏好值進行描述性統計,生成箱線圖,具體見圖3。結合圖2 與圖3,匯總各細分群組對應的產品服務的偏好結果如表3所示。

圖2 細分人群屬性特征的詞云圖
從表3可以得出以下內容。
(1)產品服務4和產品服務6呈現明顯的性別差異特征,且6個細分群組明顯劃分了性別屬性,其中男性標簽人群(分群2、分群3、分群4)對產品服務4顯著正向偏好,同時對產品服務6 顯著弱偏好;而女性(分群1、分群2、分群6)標簽人群則與之相反。
(2)分析分群5的偏好產品服務,其不存在任何正向偏好的產品服務,且存在較多負向偏產品服務,同時結合其他具有三線以上的細分人群的產品偏好,結果顯示Q 公司所銷售的產品服務,其目標消費群體主要集中在一線、新一線、二線以及三線城市。
3.4.2 產品服務相似性分析
將TGI 矩陣M 映射在SOM 的組件平面圖上(見圖4),可以清晰地分析各個產品類別間的相似性。其中黑色表示TGI 偏好值越高,白色的表示TGI 偏好值越低。從圖4發現:產品服務1、產品服務6、產品服務10在左下角區域有較強的響應,它們具有較強的相似性;產品服務2、產品服務5、產品服務7、產品服務9 和產品服務11在下部中間區域有較強的相似性;同時產品服務3集中在偏右下角區域,與之有部分相似;產品服務4、產品服務12在右側中部位置有較強的相似性;產品服務8集中在左側中上區域,相對獨立。

圖4 由SOM生成的各產品服務TGI偏好值組件平面圖
根據以上的結果,將12類產品服務按相似性劃分成4類,制訂標準的產品組合營銷方案,同時為企業建立科學合理的管理組織結構。
基于TGI-SOM構建的細分群體模型,為企業在直播帶貨中實現精細化營銷提供了數據決策支持。首先,在匹配企業的優質達人選擇上,營銷人員可以根據模型輸出各細分人群下不同產品類型消費偏好的分析結果,了解企業的目標消費群體的特點和潛在需求,聚焦企業核心目標群體(三線城市以上),結合短視頻平臺開放的直播達人粉絲群體畫像,將廣告和有限的資源投放到合適的達人,進而為企業獲取有效的用戶群體;其次,在優質的達人投放合適的產品組合營銷方案上,營銷人員可以根據模型輸出四類產品型相似性結果,為合適的用戶群體提供切實所需的產品服務,以增加平臺的吸引力和用戶黏性,更好地滿足不同用戶群體的需求,實現管理和運營的分離,提高經營策略以及提升服務體驗。