常尚鵬



摘 要:直播營銷以視頻傳播為媒介,以展現產品效果為核心,基于此達到更高效的產品銷售能力。后疫情時代基于互聯網的直播營銷模式的出現不僅豐富了互聯網的內容表現形式,還拓展了傳統的商業營銷模式,推動國民經濟高質量發展。文章以微博平臺關于直播營銷熱議的內容作為主要分析內容,爬取了從2023年1月7日至1月11日的數據,綜合利用知網停用詞詞庫對數據進行了預處理,然后采用聚類算法建立了基聚類器,最后再對基聚類器的數據進行了綜合分析。實驗結果表明,在后疫情時代,群眾有很多熱議焦點討論,這些討論也會隨著時間的推移影響著熱點話題和輿情的發展與演變。因此,準確判斷網民對熱點話題的態度傾向,有助于相關部門進行相應的輿論引導。
關鍵詞:直播營銷;后疫情時代;熱議焦點;
中圖分類號:F713.3 文獻標識碼:A 文章編號:1005-6432(2023)18-0000-00
1 引言
微博作為中國熱門的網絡社交軟件及信息甲流平臺,自創建以來積累了大量用戶,根據《2020微博用戶發展報告》顯示,在活躍用戶數方面,新浪網微博月活躍用戶5.11億,日活躍用戶2.24億[1]。隨著淘寶、京東、拼多多等以現場直播的方法進行銷售的電商平臺日益興起,“直播營銷”進入了大眾視線。其中一位新疆的帶貨主播阿里木因為“你這背景太假了”這一話題沖上微博熱搜,其賬號“疆域阿力木”也徹底火出了圈,并且在一夜之間漲粉40余萬,其直播間中新疆特產的帶貨量也直線上升。由此可知,直播營銷充分顯示了其打破地域空間限制的優勢,對各行各業在疫情后的復業復工起到了積極作用。除此之外在政策層面上“直播營銷”完美契合扶貧政策,促進了國家有針對性的扶貧戰略的實施,對電商發展有著重要的戰略支撐作用。
我國在線營銷已成為繼廣告之后又一重要經濟增長點。近年來,直播平臺呈現爆發式增長態勢,直播帶貨行業體量增速迅猛。疫情爆發后的隔離居家舉措,促進直播行業成為了給人民群眾帶來生活文娛的主要平臺與工具,不論是政府官方信息的宣發或是粉絲線上的直播帶貨活動,都使得直播行業受眾群體急劇增長,以電商直播為代表的“直播+”行業也迎來了爆發。2022年12月以來,國家疫情政策進一步調整,將于2023年1月8日將新型冠狀病毒感染從“乙類甲管”調整為“乙類乙管”,這是自2020年1月20日我國開始實施嚴格的流行癥甲類防控措施后,疫情防控政策的又一次重大調整,后疫情時代開始到來[2]。在后疫情時期,電商與直播趨勢不減,直播-體育,直播-文化的服務方式也日益被催生發展,而5G時代也將以更高的數據傳輸速率,催生出更多的直播服務方式。
綜上所述,研究后疫情時代網民對“直播營銷”熱議焦點是十分必要的。文章采用機器學習方法對微博評論內容進行數據分析,形成數據化、語義化的特征詞,同時生成詞向量矩陣,并對擁有共同特征的群體進行聚類劃分,不僅了解網民對熱點話題的態度傾向,而且緊密跟蹤、精準分析不同類別網民的情感特征,從而進行相應的輿論引導。分析熱點話題的演化趨勢對研究相似事件有很強的借鑒意義,比如在同類事件發生時,可以快速預測話題的情感發展趨勢。
2 文獻綜述
當前,學術界較多學者以電子商務視頻推廣方式對網民的熱議焦點進行了研究。在視頻營銷概念方面,許一婷、林穎等(2021)[3]對網絡直播銷售推動網民消費的內在機制展開分析,認為網絡直播銷售可有效地引導消費者注意力,進而推動消費。陶安等(2021)[4]則通過雙渠道視角實證剖析了直播電子商務用戶行為的形成機理,認為場景氛圍、主播專業技術以及消費者信任感知對用戶的信賴感和消費都有明顯積極作用。這些專家還針對感知價值在電子商務直播活動與顧客購物意愿之間存在何種關系展開討論。閆秀霞等人(2021)[5]就直播活動中帶貨對顧客購物行為產生的作用進行研究,認為顧客的購物行為主要受直播特性的影響,個性化服務是關鍵因素,而感知價值則在二者之間具有了橋梁功能。賈曉峰(2019)[6]通過實證研究,發現主播社會的存在與其他買家社會存在對顧客購物意愿具有間接正向作用,且對娛樂價值、功利價值以及融入意愿具有部分重要意義。
3 研究模型與框架
該方法主要包含了兩個方面,首先利用中文分詞第三方數據庫對微博采集的信息加以預處理;然后將和方法結合,構建詞向量,統計每個詞語的權值,將文本轉為詞頻矩陣[7],獲取特征詞和向量矩陣;最后利用機器學習聚類算法獲得聚類結果。具體用到的模型如下所示。
3.1
類主要統計每一段文本中每個單詞出現的頻率[8],然后把文本中的詞轉化為的矩陣,每一行表示一段文本的詞頻統計結果。與詞袋模型類似,其基本原理是將所有單詞在不考慮語義和單詞出現的順序的情況下先將文本中每個出現過的詞匯單獨視為一列特征裝進一個袋子里,構成一個詞匯表[8],并且認為每個單詞都是獨立的部分。
如果只想要特定的詞匯,而忽略其他的詞匯,則可以在()指定詞匯,產生的結果是少了該詞的頻率和的數值。
3.2
是一種統計方法,用來評估某個字詞對某種文字語言集或文章語句庫中的另一類文章的重要性水平[9]。字詞的重要性將隨著其在數據庫中出現的頻率呈反比例上升,也將會隨著其在數據庫中出現的次數呈反相關減少。加權的各種方式也作為對文章和用戶之間檢索結果的相關性水平的衡量或評估。的主要觀點是:假設某個單詞或者短語在某個篇章中出現的頻次高,而且在其他篇章中也極少出現[10],即為該單詞或短語具備了很高的級別劃分功能,因此可以用來排序。實際上是:。
3.3? 聚類算法
算法是聚類算法的一種代表形式,在實際聚類算法中十分普遍。一般情況下,算法首先對原型進行初始化,進而再對原型進行迭代優化計算。在計算中,簇的數量通常用表示,是一個超參數,需要人為輸入來確定。的核心工作便是按照一個已經確定了的,尋找出個最優的質心,并把距離這個質心最近的數據分別配置到由這個質心代表的簇中去[11]。
給定樣本集,算法針對聚類所得簇劃分最小化平方誤差
其中是簇的均值向量。E值在一定程度上刻畫了簇內樣本圍繞簇均值向量的緊密程度,其值越小則簇內樣本相似度越高。
3.4? 肘部法則
肘部法則對于算法的值確定起到指導作用。
簡要介紹一下肘部法則:軸為(誤差平方和),軸為的取值。隨著的增加,會隨之降低,當下降幅度明顯趨于平緩時[12],取該值為值。
算法將最小樣本的質點間距平方誤差作為目標函數,亦即各個簇的質點和簇內樣本點之間的平方間距誤差之和稱為畸變程度。對于每一個簇而言,它的畸變程度越低,就意味著簇內成員更密集;畸變程度越高,就意味著簇內組織結構越疏松。雖然畸變程度通常都會隨類別的增加而降低,但是針對具有一些區分度的資料來說[13],當超過某個臨界點時畸變程度就會獲得很大提高[14],隨后慢慢減少,而這些臨界點也可考慮用作聚集性能比較好的起點。
網民熱議焦點分析的研究框架主要包括數據采集與預處理、獲取熱議焦點特征詞與向量矩陣、聚類算法實現、熱議焦點主題聚類、結果分析5個部分。
4? 實驗分析
4.1? 數據預處理
文本數據預處理通常都要進行分詞方法,分詞之后就會進行雙向量化的方法。在啟動以前就必須要完成對中文文本的預處理過程,包含了文字清除、分詞并且去掉停用詞等的步驟。文字清除就是過濾掉所有中文文本中的無用文字。停用詞是指文本中沒有太大的實際意義但存在數量較多的功能詞。文章利用知網自然語言停用詞表作為停用詞庫,將微博文本與停用詞庫中的詞一一對應,刪除文本中與詞庫相匹配的詞。
分詞也影響著熱議焦點分析的結果,本文實驗中采用進行分詞。分詞是一個基于統計方法的分詞模式,庫的分詞原理是:首先通過對前綴字典中的詞圖掃描方法研究,得到句子中漢字所有可能成詞情況的全向無環圖,之后再利用動態分析尋找最大概率路徑,進而找到基于詞頻的最佳切分組合,而針對未注冊詞,則選擇基于漢字成詞方法的模式[15],最后再利用方法把關聯性大的漢字組合成詞組,實現分詞方法。
4.2? 獲取特征詞與向量矩陣
文本分析數據通常為以詞為單元的信息。利用文本模型將文字表示成矢量,就能夠把文本處理過程簡化為在矢量空間中的矢量操作了。將文字轉換成矢量空間后,文本的所有詞匯都對應著矢量的各個屬性項維度,所以各個文本中的詞匯所對應的維度構成了一個空間結構,而特征權值項就是指所有詞匯的每一維的取值。此外,由于文本中作為特征項的詞沒有重復,即因特征項互異,對文本的內部結構也無需考慮,所以特征項沒有先后順序。
計算機無法直接辨別中文文本,需將它轉化為機器可識別的結構化形態,詞向量訓練就是以向量描述中文文本的分詞結果。用高維向量表示詞,并將相似意義的詞置于相鄰的地方,而且所使用的都是實值矢量(不局限于整數)。
4.3? 聚類算法實現
聚類算法通常采用歐氏距離作為衡量數據間相似性的指標,相似性越大,距離越小。其核心思想是隨機設置個初始聚類中心,依據每個數據對象與聚類中心之間的相似程度,不斷地更新聚類結果,直至收斂。誤差平方和是衡量聚類算法中聚類劃分結果的精確度指標[16],計算公式為:
其中:為樣本點,為第個聚類中心,為樣本點到類的歐氏距離。誤差平方和越小,表明精確度越高,聚類效果越好[16]。根據這一評價指標,本文首先構造了從循環的聚類器,同時估計特征詞在該類文本中的擬合權重,計算出,同時繪制出以為軸,為軸的聚類曲線。如圖2所示,曲線有3個拐點,分別為時。當小于拐點值的時候,曲線下降較快;越過拐點值后,下降趨于平緩。結合聚類算法的應用場景,聚類結果應與曲線波動率呈正相關。
4.4? 獲取聚類結果
執行結果如上圖所示。文章依據肘部法則,發現曲線在處下降幅度較大,可以視為“肘部”。所以指定參數為10,創建分類器對象,用訓練器數據weight擬合分類器模型。
5 結果分析
根據上面得出的結果可以看出,隨著時間的推移,人們對于熱點話題的討論會出現明顯的起伏變化。結果較大的類別,其對應的特征詞大多都是當下熱度最高的,比如“直播帶貨”“品牌營銷”“互聯網經濟”等等。可以看出,網民熱議的焦點影響著熱點話題的發展和演變??缇畴娚唐脚_正作為全球電子消費市場的主要商業活動途徑,同時互聯網直播媒體也越來越被關注,作為企業品牌推廣宣傳的重要陣腳。直播營銷的主要表現形式是直播,核心內容仍然是營銷,直播內容質量的高低往往決定著直播營銷的成功與否。品牌應堅持輸出優質內容,創新直播形式,策劃創新直播流程和直播環節,提高內容質量,積極探索新的營銷策略,開發多元化和有深度的產品。品牌直播營銷內容的策劃要遵循平臺規則和國家政策,避免出現違禁詞和有爭議的產品,做到科學綠色直播。同時,要充分了解目標銷售國家或地區的文化和最新流行趨勢,打造相應的直播內容。
6 結論
微博熱門話題表示了網民們對現實生活問題的看法,通過識別微博熱門話題可以便于網絡輿情監控。對個人而言,為網絡熱點話題的有效監管提供了科學的分析研究方法和思路;對于國家,監管部門可以準確把握互聯網變化趨勢,正確引導網民態度傾向,實現精準預測、監控、引導微博輿情的目標。同時,通過跨境電商模式進行直播營銷,我國的許多品牌開始走出中國、走向世界。目前,國內外各大跨境電商平臺紛紛大力支持和發展直播營銷業務,我國也將借此契機,創新跨境電商直播營銷新模式,不斷擴大影響范圍。
參考文獻:
[1]郭越. 融合情感的微博熱點話題發現與演化分析[D].大連:大連理工大學,2021.
[2]陳芳,董瑞豐.新冠疫情防控近三年后為何回歸乙類管理[N].新華每日電訊,2022-12-27(003).
[3]許一婷,林穎.網絡直播營銷驅動消費行為的內在機理——沉浸傳播、身體媒介化與情感注入新視點[J].福建論壇(人文社會科學版),2021(12):111-117.
[4]陶安,王江濤,王京安.直播電商消費者消費行為產生機制研究——基于雙渠道影響視角[J].企業經濟,2021,40(11):64-71.
[5]閆秀霞,董友衡,張萌萌,喬靜.直播帶貨對消費者購買行為的影響研究——以感知價值為中介[J].價格理論與實踐,2021(6):137-140.
[6]賈曉鋒.電商直播平臺消費者購買及融入意愿研究[D].北京:北京郵電大學,2019.
[7]彭爭,唐東明.基于文本分類的農業種植信息集成推薦方法研究[J].西南民族大學學報(自然科學版),2018,44(1):69-74.
[8]黃琨,李建敦,何超,等.商品虛假評論的檢測及可視化研究[J].福建電腦,2021,37(9):15-18.
[9]李楚.基于TF-IDF算法的文本量化方法及作者識別應用[J].現代信息科技,2022,6(19).
[10]王心儀,程劍鋒,劉育君.基于TF-IDF加權樸素貝葉斯算法的ATP車載設備測試案例分類研究[J].鐵路計算機應用,2022,31(12).
[11]孫穎,張毅,丁衛平,等.基于近似骨架和混合蛙跳算法的方法及其在眼底病歷圖像中的應用[J].南通大學學報(自然科學版),2020,19(2):36-42.
[12]李賀,谷瑩,劉嘉宇.數據驅動下基于語義相似性的產品需求識別研究[J].情報理論與實踐,2022,45(5):99-106.
[13]張娟.基于聚類算法的5G終端客戶價值分析[J].電信快報,2020(9):29-33.
[14]蔡軍,謝航,謝濤,等.基于改進K-Means++分時電量聚類與行業用電行為分析[J].科學技術與工程,2021,21(27).
[15]劉為懷,才華,何東杰.一種基于中文分詞和數據聚合的餐飲行為特征挖掘方法[J].軟件產業與工程,2015(4).
[16]王惠惠,董永權,和文斌,等.基于聚類集成的學生群體畫像構建[J].江蘇師范大學學報(自然科學版),2022,40(3):46-50.