








摘要:以煙臺蘋果為研究對象,利用Python爬取相關商品下用戶的評論數據作為語料庫,引入百度AI平臺的自然語言處理技術,利用訓練好的模型對于評論文本進行情感分析,并構建LDA主題分類模型提取文本主題與關鍵詞,對在線評論進行文本挖掘與量化分析。結果表明,評論文本中,對于煙臺蘋果的正向評價占96.1%,中性評價占0.3%,負向評價占3.6%;根據主題一致性指標,評論文本內容可以聚類為品種認同、服務感知、產品質量、營銷感知以及物流質量5個主題。消費者對于煙臺蘋果的總體滿意度較高,加強消費者的品種認同是未來的重要改進方向,并為進一步提升消費者滿意度提出了建議。
關鍵詞:在線評論;農產品消費者滿意度;煙臺蘋果;情感分類;LDA
中圖分類號:F323.5;F724.6" " " " "文獻標識碼:A" " " " " "文章編號:0439-8114(2025)02-0214-06
DOI:10.14088/j.cnki.issn0439-8114.2025.02.034 開放科學(資源服務)標識碼(OSID):
Abstract: Taking Yantai Apple as the research object, the Python was used to crawl the user’s comment data under relevant products as the corpus, the natural language processing technology of Baidu AI platform was introduced, and the trained model was used to analyze the comment text. LDA theme classification model was built to extract text themes and keywords, and conduct text mining and quantitative analysis for online comments. The results showed that in the comment text, the positive evaluation for Yantai Apple accounted for 96.1%, neutral evaluation for 0.3%, and negative evaluation for 3.6%. According to the theme consistency index, the comment text content could be clustered into five themes: variety identification, service perception, product quality, marketing perception and logistics quality. Consumers’ overall satisfaction with Yantai Apple was high. Strengthening the variety identification of consumers was an important improvement direction in the future, and suggestions for further improving consumers’ satisfaction were put forward.
電子商務通過擴大消費者可選擇的產品范圍、促進競爭和提高購物便利性,正在改變人們的購物方式[1]。隨著冷鏈物流技術的不斷進步,電子商務在農產品領域也取得了顯著發展。2019年,新冠疫情在全球暴發,由于人們需要保持社交距離并確保安全購物,線上購買食品尤其是生鮮食品的行為顯著增加,特別是在中國等實施了嚴格封鎖措施的國家和地區[2,3]。事實上,隨著互聯網的發展,電子商務已成為推動中國農業產業結構升級的重要趨勢,并為解決“三農”問題提供了新的視角和助力。《中國電子商務報告(2021)》的數據顯示,2021年全國農村網絡零售額2.05萬億元,同比增長11.3%;全國農產品網絡零售額4 221億元,同比增長2.8%。然而,農業電子商務給中國農業發展帶來機遇的同時,也存在著風險與挑戰。市場信息的不對稱成為阻礙農業電子商務持續發展的重要原因,如何獲取市場上有指導性、針對性的顧客信息以提升消費者滿意度,成為領域內亟待解決的關鍵問題。目前,學者對于消費者購買農產品滿意度的研究方法主要集中于問卷調查。王冠寧[4]通過問卷分析,基于因子分析模型構建農產品滿意度影響因素體系,發現服務質量與產品質量是影響消費者滿意度的關鍵因素;李蕾等[5]通過調查問卷建立結構模型,探究顧客價值及服務質量對于消費者滿意度與忠誠度的影響機制;吳欣霞等[6]通過問卷調查數據,建立改進的ACSI模型,引入心理變量,以贛南臍橙為例分析消費者網購地理標志農產品滿意度的決定因素;李萬斌等[7]結合經典理論顧客滿意度指數模型(CCSI),通過因子分析對青州蜜桃的顧客滿意度進行實證分析。多數研究認為,消費者的質量感知與服務感知是影響其滿意度的關鍵因素。結合上述分析,現有學者對于農產品消費者網購滿意度分析的信息來源主要為問卷調查所得數據,而對于產品在線評論的分析較為缺乏。傳統的問卷分析方法存在信息反饋滯后、成本與準確性間不平衡等難以克服的缺陷[8],與之相比,在線評論作為消費者感受的直觀反映,對于不同商品的分析更加具有針對性,也有利于保證數據樣本搜集的大體量與全面性[9,10]。利用用戶直接回饋使用感知的渠道,基于在線評論進行文本挖掘,對于提取影響農產品顧客滿意度的相關因素具有重要意義[11]。本研究以京東電商平臺的煙臺蘋果在線評論文本作為數據源進行文本挖掘,通過機器學習的LDA主題學習與情感分析算法,探索影響消費者滿意度的相關因素。
1 資料與方法
1.1 數據來源
為了獲取進行研究的在線評論文本,利用Python爬蟲,以京東商城作為數據源,根據關鍵詞“煙臺蘋果”選擇銷量最高的9家店鋪,爬取其顧客評論文本。經過剔除“此用戶未填寫評價內容”等無意義文本與重復文本,共獲取有效評論9 480條。
1.2 研究方法
1.2.1 分詞與停用詞處理
在利用Python對文本進行同類詞合并處理的基礎上,使用Jieba分詞工具進行分詞,并借助哈爾濱工業大學停用詞表進行停用詞處理。
1.2.2 情感分析
引用百度AI開放平臺的自然語言處理(Natural language processing,NLP)技術[12],對所得評論文本進行情感傾向分析。該深度學習模塊的NLP技術包括情感分析、評論觀點抽取等,通過對電商評論進行情感傾向性分析,將不同用戶對同一商品的評論內容按情感極性予以分類展示[13]。通過利用Python軟件調用百度API,在NLP通用模型的基礎上,利用上傳的特定場景的正/負向語料文本對模型進行訓練,從而對經過處理后待評估的評論文本的情感極性及其置信度做出判斷。在此基礎上,對經過分類的正面情感文本與負面情感文本構建語義網絡圖,分別進行分析。
1.2.3 主題提取模型
LDA(Latent dirichlet allocation)主題提取模型是由“文檔-主題-詞”組成的三層貝葉斯概率模型,屬于無監督學習方法,由Blei等[14]于2003年首次提出。目前,LDA主題模型被廣泛應用于文本主題識別、文本分類等自然語言處理領域[15,16]。該模型認為,可以把每篇文檔表示為在不同主題上的概率分布,每一主題又可以看作詞語的概率分布,其形成的貝葉斯網絡模型如圖1所示。其具體過程[17]如下:①根據超參數[α],生成文檔在主題下的分布[θ],[θ]服從于以[α]為參數的迪利克雷分布;②根據超參數[β],生成詞語在主題下的分布[ψ],[ψ]服從于以[β]為參數的迪利克雷分布;③從文檔-主題多項分布中提取文檔單詞的主題分布[Z],基于主題分布和詞的多項分布,采樣生成最終的詞W;④將上述3步重復M次,生成長度為M的文檔;⑤將上述4步重復N次,生成N個文檔。
運用該模型時,主題數量K作為該模型中的一個重要參數,需要被預先設定。關于最優主題數量的確定,目前主要有兩種方法:困惑度(Perplexity)和主題一致性(Coherence value)。考慮到困惑度指標計算時,由于其隨著主題數量的增多逐漸減少,會出現過擬合的問題,本研究將主題一致性作為主要參考指標。
2 結果與分析
2.1 在線評論文本的高頻詞與詞頻
從表1可以看出,在線文本詞句中,剔除“蘋果” “水果”等無意義基礎詞匯后,“好吃”“包裝”“口感”等詞語出現頻率最高,體現了消費者對農產品品質的關注,結合表中其他高頻詞匯,可以看出消費者對產品品質的評定主要通過蘋果的包裝、外表以及口感三方面進行感知;“物流”“快遞”“發貨”等涉及物流服務的詞匯也在評論文本中經常出現,說明物流質量同樣是影響消費者對產品評價的重要因素。
2.2 煙臺蘋果在線評論情感分析
為了進一步探究消費者對該農產品的情感傾向與原因,采用基于深度學習的自然語言處理技術對所得評論文本進行情感分析。利用Python軟件,通過API接口引入百度AI開放平臺,基于自然語言處理技術的基礎模型,選取評論文本中正向與負向語料各200條對模型進行訓練。訓練結果顯示,優化后的模型準確率達97.62%。借助該模型得出的情感分析結果示例如表2所示,感情極性為2的表示正向,1表示中性,0表示負向,具體參數說明見表3。
利用優化后的模型,本研究得出了所有評論文本的情感分析結果,其描述性統計見表4。對于煙臺蘋果的正向評價占96.1%,中性評價占0.3%,負向評價占3.6%,說明消費者對于產品的總體滿意度較高。
在對評論文本進行情感分類的基礎上,分別針對正面與負面評論文本,利用Rost CM6軟件,在統計高頻詞的基礎上構建語義網絡圖。語義網絡圖利用放射圖中的節點代表高頻詞,節點間的連線表示詞語間的共線語義關系,將特征詞間的關系可視化[18,19]。如圖2所示,消費者對于產品正面評價的網絡圖以“蘋果”“京東”為核心向四周輻射,“口感”“水分”“包裝”“新鮮”“好吃”“個頭”以及“物流”等特征詞均屬于核心區域,具有較高的共線頻率,體現了消費者對于產品口感、外表、包裝以及物流四方面的關注,與前文得出的消費者關注的維度具有較高的一致性;其中包裝與物流因素存在一定的關聯性,對于蘋果外表因素的評價主要集中于其大小及表皮的均勻程度,對于口感因素的評價則更多地關注是否新鮮以及水分含量。而通過分析負面評論語義網絡圖(圖3),可得口感因素對于導致蘋果負面評論的作用并不顯著,致使消費者對于產品不滿的原因主要在于物流、包裝以及售后等服務因素,具體表現為包裝簡陋、運輸出現破損、售后處理不當等原因。在對于負面評論文本人工深度閱讀的基礎上,結合網絡圖中“上次”“這次”“超市”等關鍵詞,還可以發掘很大一部分消費者對于產品的不滿情緒來源于比較,即將本次購物經歷與先前網購經歷或與超市實體購物經歷進行比較,認為本次購物與之相比存在差距,而產生失望的情緒。
2.3 LDA主題分類
為了進一步對評論文本進行分析,采用無監督學習的LDA模型對評論文本進行主題分類,并提取各主題下的關鍵字。不同主題數目的一致性得分如圖4所示。可知主題數為5時一致性得分達到最大,所以將預先設定的分類的主題數定為5。
最終求得的主題分類及各主題前20個關鍵詞如表5所示,并使用pyLDAvis可視化,結果如圖5所示。評論文本的5個主題分別歸納為品種認同(占比21.9%),服務感知(占比21.1%),產品質量(占比21.1%),營銷感知(占比19.5%)以及物流質量(占比16.4%),5個主題在評論文本中的占比差異性較小。
結合各主題的關鍵詞,在品種認同主題下,消費者主要關注所購產品的產地、品種,以及產品的口感、色澤等特質是否符合自己已有的對于同種產品的認知,通俗而言即是否正宗問題;在服務感知主題下,除產品自身質量外,發貨速度、客服、快遞小哥等服務人員的態度都是影響消費者評價的主要因素;對于物流質量,考慮到果蔬的易損性,是否有泡沫填充等包裝問題成為消費者關注的重點,而相對削弱了對于送達速度的關注;在產品質量主題下,對于產品的外觀,消費者的主要評價維度為大小、重量以及色澤,對于產品的口感,消費者的主要評價維度為水分、甜度以及清爽度,同時消費者還會關注產品的氣味;在營銷感知主題下,商家的優惠活動、折扣的力度成為消費者關注的重點,結合原始文本還可以發現,疫情防控條件下,無法去實體水果店購買而被線上購物宣傳所吸引,成為消費者消費的重要原因。
基于LDA主題分類的結果,對隸屬于5個主題的評論文本分別進行情感分析,其負面評論文本比例如圖6所示。由圖6可知,5個主題中,消費者對于品種認同的消極情緒較為突出,對于服務感知的積極情緒較突出,另外3個主題的評論情感性質差異較小,但對于所有主題的評論總體趨向于正面。因而,加強消費者對于品種的認同是該產品商家的主要改進方向。
3 建議
基于上述分析,提出如下提升農產品消費者滿意度的建議。
1)打響招牌,建立與維護品牌與品種認同。地理標志與品種標志的信譽是吸引煙臺蘋果等農產品購買者的重要因素。對于已經形成區域品牌標志的產品,消費者往往具有較高的期望與積極的地理特質印象。煙臺蘋果由于其悠久的栽種歷史、品種質量的優越性,建立了廣泛的市場口碑。一方面,商家需要從源頭把控,保證產品的真材實料,使得產品符合消費者對于“煙臺蘋果”“富士品種”的預期認知,確保產品的“正宗”問題,并通過維持、提升產品質量,不斷鞏固品牌與品種聲譽;另一方面,電商平臺方、國家有關市場部門需要加強對網店的監管,加大對于假冒偽劣、產品侵權等擾亂市場秩序的不法行為的打擊力度,并通過建立溯源數據平臺、推廣防偽二維碼等行為為消費者提供購買保證,保護煙臺蘋果的品牌聲譽與消費者忠誠度。
2)提升服務與物流質量,改善消費者購物體驗。網店服務質量與物流質量是影響消費者購物體驗的重要因素。關于服務提升,除了清晰友好的門店頁面設計、禮貌專業的客服回復等通用要求,考慮到農蔬產品的特殊性質,損壞、腐壞現象難以避免,高效、符合消費者利益的售后處理成為提升消費者滿意度的關鍵手段;物流運輸方面,除了下單后的發貨與運送速度,例如店家是否用泡沫進行保護等對于蘋果外包裝的選擇也直接影響消費者對于本次購物的評價。
3)品質為先,質量為基。產品質量是支撐顧客滿意度的核心要素,對于煙臺蘋果質量的評定,外觀、口感、氣味都是消費者關注的重要維度。從產地抓起、從源頭抓起,實現對種植、采摘、運輸、包裝全過程管理,加強對產品質量的檢驗與監督。采取精細化種植,保證果實的自然成熟,積極推廣無公害綠色產品。面對不同消費者群體,采取明確的分級標準,并按照標準如實分類,杜絕小果、劣果偽冒充數行為,保證產品質量合格、數量達標。
4)找準市場定位,創新營銷形式。結合“脆甜多汁”“霜降成熟”“現摘現發”等產品特點與競爭優勢,制定相應的宣傳營銷策略,并通過商品標題、首頁圖片、文案介紹等方式將信息準確傳遞給目標消費者;與時俱進,適應網絡營銷新模式,利用網絡購物節、直播帶貨、大V推薦、免費試吃等方式,拓寬農產品營銷渠道,利用數字經濟為實體經濟發展賦能。
4 小結
隨著互聯網經濟的發展,電商平臺越來越成為農產品銷售的重要渠道。不同于傳統的線下銷售,電商平臺上龐大的在線評論文本數據不僅能夠為消費者的決策提供參考依據,而且為商家與其現實消費者間搭建起直接的交互渠道。商家可以利用評論文本獲取消費過的客戶的觀點與建議,從而改進產品的質量、完善門店的服務、提升自己的營銷策略,最終獲取更大利潤。本研究以京東電商平臺作為數據源,利用Python爬蟲技術爬取煙臺蘋果商品下用戶的評論數據作為語料庫。在對文本數據進行預處理的基礎上,引入百度AI平臺的自然語言處理技術,對于評論文本進行情感分析,并對分類好的正面評論文本與負面評論文本分別進行研究。結果表明,評論文本中,對于煙臺蘋果的正向評價占96.1%,中性評價占0.3%,負向評價占3.6%;同時,采用LDA主題提取模型,根據主題一致性指標,評論文本內容可以聚類為品種認同、服務感知、產品質量、營銷感知以及物流質量5個主題。消費者對于煙臺蘋果的總體滿意度較高,加強消費者的品種認同是未來的重要改進方向。總體而言,本研究為農產品電商銷售的顧客滿意度信息獲取提供了新的思路,且方法具有合理性與普適性。
參考文獻:
[1] SAPHORES J D, XU L. E-shopping changes and the state of E-grocery shopping in the US-Evidence from national travel and time use surveys[J]. Research in transportation economics,2021,87(C):1-13.
[2] MCGUIRT J T,JILCOTT PITTS S B,LABBAN J D,et al. Evidence of geospatial and socioeconomic disparities in access to online grocery shopping for fresh and frozen produce in North Carolina[J]. Journal of the academy of nutrition and dietetics, 2022,122(11): 2106-2114.
[3] ALAIMO L S, FIORE M, GALATI A. Measuring consumers’ level of satisfaction for online food shopping during COVID-19 in Italy using POSETs[J]. Socio-economic planning sciences, 2021, 82: 101064.
[4] 王冠寧.消費者網購生鮮農產品滿意度影響因素實證研究[J].商業經濟研究,2018(6):47-49.
[5] 李 蕾,林家寶,黃 士.農產品電子商務顧客滿意度和忠誠度的形成機制研究——基于感知價值和服務質量的視角[J].世界農業,2017(11):97-103.
[6] 吳欣霞,李連英.消費者網購地理標志農產品滿意度影響因素研究——以贛南臍橙為例[J].農村經濟與科技,2019,30(3):146-147,219.
[7] 李萬斌,郭瑾瑜,黃 鈺,等.農產品區域公用品牌顧客滿意度提升探究——以青州蜜桃為例[J].農業工程,2022,12(5):143-148.
[8] GROVES R M. Nonresponse rates and nonresponse bias in household surveys[J].Public opinion quarterly,2006,70(5):646-675.
[9] JIN J, LIU Y, JI P, et al. Review on recent advances in information mining from big consumer opinion data for product design[J].Journal of computing and information science in engineering,2019," " "19(1):010801.
[10] FAN Z P,CHE Y J,CHEN Z Y. Product sales forecasting using online reviews and historical sales data:A method combining the Bass model and sentiment analysis[J]. Journal of business research,2017,74(5):90-100.
[11] 徐德華,張心怡.基于網絡購物平臺的在線評論研究綜述[J].情報探索,2022(5):118-124.
[12] 百度大腦. 百度 AI 開發平臺[EB/OL]. https://ai.baidu.com,2021-02-01.
[13] 王 琴,劉 毅.基于網絡評論情感分析和QFD的產品改進設計[J].包裝工程,2021,42(24):169-174.
[14] BLEI D M, NG A Y, JORDAN M I. Latent dirichlet allocation[J]. Journal of machine learning research, 2003, 3(4-5):993-1022.
[15] 俞紅海,范思妤,吳良鈺,等.科創板注冊制下的審核問詢與IPO信息披露——基于LDA主題模型的文本分析[J].管理科學學報,2022,25(8):45-62.
[16] 曹樹金,曹茹燁.情報學論文創新性評價研究——LDA和SVM融合方法的應用[J].圖書情報知識,2022,39(4):56-67.
[17] 翟君偉,瞿 英,郭 菲,等.基于LDA主題模型的文獻特征項多重共現可視化方法[J].河北科技大學學報,2022,43(2):182-193.
[18] 張公讓,鮑 超,王曉玉,等.基于評論數據的文本語義挖掘與情感分析[J].情報科學,2021,39(5):53-61.
[19] 譚 熒,張 進,夏立新.語義網絡發展歷程與現狀研究[J].圖書情報知識,2019(6):102-110.
收稿日期:2023-04-11
基金項目:2020年度河南省哲學社會科學規劃辦公室決策咨詢項目(2020JC29)
作者簡介:丁健莉(2002-),女,河南南陽人,在讀本科生,專業方向為農業經濟,(電話)18262261735(電子信箱)2609783896@qq.com;通信作者,周青浮(1973-),男,河南內鄉人,教授,碩士,主要從事公司財務和區域經濟研究,(電話)13703458800(電子信箱)685099zhouqingfu@163.com。