
摘要:在數(shù)字經(jīng)濟發(fā)展的背景下,電商直播為農(nóng)產(chǎn)品銷售模式帶來了創(chuàng)新變革,成為促進農(nóng)產(chǎn)品流通和鄉(xiāng)村振興的關(guān)鍵途徑。利用消費者在線評論數(shù)據(jù),采用文本挖掘和機器學(xué)習(xí)技術(shù)深入分析影響消費者滿意度的主要因素。結(jié)果表明,農(nóng)產(chǎn)品的品種、口味、價格、產(chǎn)地及直播間氛圍等因素對消費者滿意度有顯著影響,其中口味、商品品質(zhì)、價格和直播環(huán)境是提升滿意度的關(guān)鍵。對此,為直播電商平臺和從業(yè)者提供策略指導(dǎo),以增強農(nóng)產(chǎn)品市場競爭力、推動鄉(xiāng)村振興。
關(guān)鍵詞:助農(nóng)直播; 消費者滿意度; 影響因素; 文本挖掘; 機器學(xué)習(xí)技術(shù)
中圖分類號:F323.7;F724.6 文獻標識碼: 文章編號:1674-1161(2024)04-0128-03
近年來我國數(shù)字經(jīng)濟快速崛起,互聯(lián)網(wǎng)技術(shù)不斷進步。第53次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》指出,截至2023 年12 月,中國網(wǎng)民數(shù)量已超10.92億,互聯(lián)網(wǎng)普及率達77.5%。這為電商直播行業(yè)尤其是農(nóng)產(chǎn)品銷售領(lǐng)域,帶來了新的發(fā)展機會。在國家層面,“三農(nóng)”問題受到高度重視,黨和政府文件中多次強調(diào)要實施鄉(xiāng)村振興戰(zhàn)略,推動農(nóng)業(yè)和農(nóng)村現(xiàn)代化。在此背景下,“農(nóng)產(chǎn)品+電商直播”的銷售模式迅速興起,吸引了大量關(guān)注,顯著提升了銷量。
研究深入分析助農(nóng)直播成功的多個關(guān)鍵因素,包括主播素養(yǎng)、消費者數(shù)字素養(yǎng)、人才支持、品牌形象、產(chǎn)品質(zhì)量、技術(shù)支持、物流配送、政府支持和社會環(huán)境等。通過文本挖掘技術(shù),構(gòu)建LDA主題模型,探討消費者在線評論與滿意度之間的關(guān)系來揭示購買行為背后的驅(qū)動因素。結(jié)果表明,產(chǎn)品質(zhì)量、價格合理性、主播魅力、推薦度和客戶服務(wù)是影響消費者滿意度和再購意愿的主要因素。此外,討論文本挖掘在消費者行為研究中的應(yīng)用前景,強調(diào)其在分析大規(guī)模數(shù)據(jù)中的重要作用。通過結(jié)合機器學(xué)習(xí)和大數(shù)據(jù)分析,能夠更準確地預(yù)測消費者行為趨勢,為直播助農(nóng)平臺的運營和管理提供支持[1-2]。
1 數(shù)據(jù)來源與研究內(nèi)容
1.1 研究對象與數(shù)據(jù)來源
農(nóng)業(yè)是國家經(jīng)濟的重要支柱,對民眾生活水平有著直接影響。隨著互聯(lián)網(wǎng)技術(shù)進步,直播帶貨成為農(nóng)產(chǎn)品銷售的革新方式,成為促進農(nóng)民增收的有效手段。消費者評論映射了他們的真實感受與需求,分析這些數(shù)據(jù)能深入挖掘消費者心理。
抖音作為全球性短視頻平臺,為研究提供了豐富的數(shù)據(jù)源。為確保數(shù)據(jù)的全面性,選取多個高人氣直播視頻的評論作為樣本。利用Python自動化采集工具,能夠迅速獲取大量數(shù)據(jù),并自動整理進Excel以便初步處理。采集抖音數(shù)據(jù)時,需定位目標視頻地址和用戶Cookie信息,再嵌入代碼請求頭中,以實現(xiàn)模擬登錄等操作。此次采集涉及IP歸屬地、評論詳情、ID、時間、用戶昵稱和主頁鏈接等關(guān)鍵信息。
1.2 研究方法
采用文獻資料法、數(shù)據(jù)挖掘法和機器學(xué)習(xí)文本挖掘法3種研究方法。1) 文獻資料法。主要通過中國知網(wǎng)、萬方數(shù)據(jù)庫、百度學(xué)術(shù)等學(xué)術(shù)網(wǎng)站檢索關(guān)鍵詞“助農(nóng)電商直播”“評論”“滿意度”等,總結(jié)之前學(xué)者的研究成果,作為研究的理論基礎(chǔ)和參考,并確定研究方向和創(chuàng)新點。2) 數(shù)據(jù)挖掘法。利用Python爬蟲軟件收集抖音等助農(nóng)電商直播消費者評論數(shù)據(jù),采用統(tǒng)計分析、機器學(xué)習(xí)等方法分析影響消費者滿意度的因素。大量真實的用戶評價數(shù)據(jù)提升了研究的可信度。3) 機器學(xué)習(xí)文本挖掘法。利用算法和統(tǒng)計模型在無明確編程指導(dǎo)下執(zhí)行任務(wù)的研究領(lǐng)域。結(jié)合信息技術(shù)、統(tǒng)計學(xué)、模式識別等多學(xué)科技術(shù),從非結(jié)構(gòu)化文本數(shù)據(jù)中提取有價值的信息[3]。這一過程有助于挖掘出用戶可能認為新穎且有價值的未知知識。文本挖掘的核心目標是處理模糊和非結(jié)構(gòu)化的文本數(shù)據(jù),并要求綜合運用多種技術(shù)和方法進行數(shù)據(jù)處理和分析。主要流程包括文本數(shù)據(jù)采集、預(yù)處理、建模和評估。
1.3 數(shù)據(jù)預(yù)處理
共處理28 429條評論數(shù)據(jù)。具體步驟為:一是清洗數(shù)據(jù),剔除無效評論,標準化語言并去除特殊字符;二是分詞簡化文本復(fù)雜性;三是剔除低意義停用詞;四是進行語言潤色,提高表達清晰度。這樣可確保后續(xù)自然語言處理任務(wù)的準確性和深度。
2 研究結(jié)果與分析
2.1 高頻詞提取結(jié)果
高頻詞分析揭示了消費者對直播助農(nóng)項目的看法,有助于理解其滿意度和偏好。采用TF-IDF法提取高頻詞,可為優(yōu)化產(chǎn)品、服務(wù)及市場策略提供信息。TF-IDF 由詞頻(Inverse Document Frequency,IDF)和逆文檔頻率(IDF)組成。TF衡量詞在文檔中的頻率,而IDF 反映詞在整個文檔集合中的稀有程度。兩者相乘得到的權(quán)重值越大,詞在文檔中的重要性就越高。
利用jieba分詞的analyse.extract_tags函數(shù)計算詞語的TF-IDF值,從而提取關(guān)鍵詞。通過分析發(fā)現(xiàn),值低于0.003 2的詞匯代表性較弱。因此,設(shè)定這一閾值,篩選出64個高頻關(guān)鍵詞。在去除與主題不緊密相關(guān)的詞匯后,結(jié)合研究進展,對剩余高頻詞進行解讀。
高頻詞提取結(jié)果顯示,“土豆”“洋芋”“玉米”“品種”等反映農(nóng)產(chǎn)品多樣性;“好吃”“不好吃”“喜歡”等揭示消費者對口味的感受;“農(nóng)產(chǎn)品”“便宜”“價格”等指向消費者對定價的關(guān)注;“網(wǎng)紅”“直播”“助農(nóng)”等反映活動氛圍;“貴州”“湖南”等地名顯示產(chǎn)品地理來源。
綜合分析這些關(guān)鍵詞,能夠更清晰地理解消費者對助農(nóng)直播的滿意度。這些關(guān)鍵詞提供了關(guān)于消費者偏好和關(guān)注點的重要線索。
2.2 LDA 主題模型語義挖掘結(jié)果
為了深入探索影響助農(nóng)直播消費者滿意度的因素,對相關(guān)評論的主題語義進行挖掘、分類。經(jīng)過相關(guān)信息檢索可知當(dāng)下的主題語義模型有隱性語義分析(LSI)、概率隱性語義分析(PLSI)、潛在狄利克雷分布(LDA)等。研究所應(yīng)用的LDA模型是一種典型的概率生成性模型。LDA假設(shè)每個文檔由一組主題組成,每個主題又由一組詞語組成。LDA通過統(tǒng)計和概率推斷的方法進行文檔主題生成,是一種常見的無監(jiān)督機器學(xué)習(xí)技術(shù),主要應(yīng)用于識別在文檔中隱藏的主題信息。LDA主題模型中,多個詞匯按照一定規(guī)律混合成為一個主題,若干個主題共同構(gòu)成了整個文檔。LDA模型的基本思想是將文檔集中的每篇文檔視為一個詞頻向量,這些詞頻向量是由一組詞匯構(gòu)成的,而LDA的目標就是找到這組詞匯背后的主題結(jié)構(gòu)。具體來說,LDA假設(shè)文檔集中的每篇文檔都是由一定數(shù)量的主題按照一定比例混合而成的,而每個主題又是由一定數(shù)量的詞匯按照一定比例混合而成的。通過訓(xùn)練LDA模型,可以得到文檔—主題—詞匯分布,進而可以推斷出每篇文檔的主題分布及每個主題下的詞匯分布[4]。
利用Python中g(shù)ensim庫等可以進行LDA主題模型分類。LDA主題模型結(jié)果見表1。
由表1可知,從助農(nóng)直播消費者評論的LDA分析中,得出5個影響滿意度的主題:品種、口味、價格、直播氛圍和產(chǎn)地。這與高頻詞結(jié)果一致,直觀展示了消費者滿意度因素。
2.3 助農(nóng)直播消費者滿意度影響因素分析
市場趨勢和消費者偏好對于農(nóng)產(chǎn)品品種的選擇至關(guān)重要。分析顯示,“土豆”和“洋芋”這兩種受歡迎的蔬菜,因其在品種類別中占據(jù)高權(quán)重位置,體現(xiàn)了其在市場上的重要性。口味是決定農(nóng)產(chǎn)品受歡迎度的關(guān)鍵,“洋芋”和“土豆”在口味類別中的重要地位,顯示了其在消費者心中的重要性。電商平臺必須保證這些產(chǎn)品的口感和品質(zhì),并定期收集反饋以優(yōu)化產(chǎn)品。價格敏感的消費者會尋求經(jīng)濟實惠且質(zhì)量上乘的產(chǎn)品。電商平臺應(yīng)采取合理的定價策略,提供透明的價格和真實的評價以建立信任。直播銷售已成為強大的營銷工具,電商平臺應(yīng)與有影響力的“網(wǎng)紅”合作,通過直播推廣產(chǎn)品,以增強購物樂趣和緊迫性,提高品牌曝光率和銷售量。農(nóng)產(chǎn)品產(chǎn)地是消費者選擇的關(guān)鍵因素。電商平臺應(yīng)強化農(nóng)產(chǎn)品地理標識的展示和宣傳,明確標示產(chǎn)品產(chǎn)地,傳遞新鮮度和品質(zhì)保證。采用故事化營銷,講述農(nóng)產(chǎn)品的起源、生長歷程和生產(chǎn)者付出,以增加產(chǎn)品吸引力和情感價值。
3 結(jié)語
消費者購買決策受多方面因素影響,如追求性價比、口感決定購買行為、關(guān)注原產(chǎn)地、個性化需求增強、購物便捷性和效率受重視等,而直播營銷為消費者提供了新的購物體驗。今后直播助農(nóng)重點研究方向為:制定競爭性定價策略,提高產(chǎn)品性價比;重視產(chǎn)品品質(zhì)與多樣性,優(yōu)化購物體驗;突出產(chǎn)地特色與產(chǎn)品故事,加強品牌影響力。
參考文獻
[1] 陳智.大數(shù)據(jù)背景下農(nóng)產(chǎn)品可追溯信息對顧客滿意度的影響——產(chǎn)品知識的多群組分析[J].商業(yè)經(jīng)濟研究,2022(1):131-134.
[2] 劉子寒,符少玲.消費者滿意度綜述[J].商業(yè)經(jīng)濟研究,2023(23):61-64.
[3] 鄭霞忠,劉奕成,邵波,等.基于文本挖掘的水電工程施工物體打擊事故致因分析[J].中國安全科學(xué)學(xué)報,2024,34(4):50-57.
[4] 宋軍,肖超.上市公司年報風(fēng)險信息披露與市場風(fēng)險——基于LDA主題模型的文本研究[J].復(fù)旦學(xué)報:社會科學(xué)版,2024,66(2):165-176.