鄭麗娟+李睿璇+張杰
摘 要:茶葉是我國的特色產業,其質量影響著茶葉的銷售量。隨著網絡零售的快速發展,越來越多的茶商開始利用互聯網銷售茶葉,該種銷售形式,由于無法觸及實體商品,消費者需要通過在線評論了解茶葉的質量。本文通過對在線評論的分析,進行茶葉質量的評價,首先獲取在線評論并構建語料庫,其次,引入情感分析技術,提取在線評論中的特征信息和情感信息,實現由消費者感知出發的茶葉質量的評價。本文借助在線評論,可以實現從消費者角度對茶葉主觀性質量的評價,可以幫助茶商和消費者更加全面、細致地了解所銷售和所購買的茶葉。
關鍵詞:在線評論;情感分析;茶葉質量;評價
一、引言
近年來,網絡零售業發展迅速、如火如荼,在降低流通成本、推動流通方式轉型、促進傳統產業升級等方面發揮了積極作用。隨著網絡零售的快速發展,越來越多的茶商開始利用互聯網銷售茶葉,消費者也開始通過網絡購買茶葉。網絡購物過程中,由于無法觸及實體的茶葉商品,消費者只能通過網絡口碑來了解茶葉的質量,良好的口碑已成為網絡零售商獲得市場空間的前提和保障,在線評論就是其中的一種重要口碑形式。
在線評論(online review)是消費者根據自己對“質量的感知”,從使用者的角度來描述和評價商品的特征和性能,體現了消費者對商品滿意與否。質量是客觀性和主觀性的統一體,客觀性質量指通過客觀指標進行衡量的質量特性,可以用技術手段規范和檢測,主觀性質量則指滿足人的心理需要的質量特性,需要從消費者的角度評判。在關于茶葉質量的已有研究中,多采用技術手段對客觀性質量進行檢測,而忽略了對茶葉主觀質量的評價,本文通過對在線評論的分析,可以有效解決這一問題,實現從消費者角度對茶葉主觀性質量的評價。
二、相關研究
1.茶葉質量評價
在茶葉的銷售中,質量是影響顧客滿意度的主要因素,而顧客滿意又是企業維持老顧客、保持競爭優勢的基石。因此,對于網絡零售商來說,茶葉的質量至關重要。謝艷云探討了如何借助大數據分析技術,精準地了解茶葉種植面積、氣候、濕度等多方面信息,從而判斷茶葉質量。郭燕茹分析了我國茶葉質量安全中存在的主要問題及原因,并提出完善茶葉質量安全保障體系的戰略對策。龔艷等運用典型調研法和定點監測法對湖北的茶葉種植、生產、監管等多環節開展了監測和調研,根據所獲取數據,明晰了茶葉的安全現狀。
2.在線評論分析
現有研究主要采用情感分析技術,探討評論中包含的商品特征和消費者情感信息。Lin等提出一種基于潛在狄利克雷分析(LDA)的主題情感聯合模型(Joint Sentiment-Topic, JST),在原有的三層LDA模型(主題層、文檔層和詞語層)基礎上添加了情感層,用于同時識別產品特征及其對應的觀點。王曉耘等基于Apriori算法和隸屬度算法提取產品特征和特征觀點詞對,并構建一種基于評論情感量化的商品綜合評分模型。Wang等(2016)提出一種中文在線評論的情感分析方法,對影響情感分析效果的各種因素進行了實驗研究。
3.研究綜述
已有茶葉質量的研究,重點集中在如何通過技術識別、監控茶葉質量,因此在客觀性質量的評價方面已取得顯著的進展,但由于數據來源的單一,對主觀性質量的評價存在不足。茶葉質量評價中所使用的數據,通常來自于相關部門的監測、檢測或調研,該方法本質上不是從“消費者感知的角度”收集的數據,因而不能很好地展開茶葉主觀性質量的評價。針對該問題,提出一種基于在線評論的茶葉質量評價方法,該方法可以很好地對茶葉主觀性質量進行評價。
三、基于在線評論的茶葉質量評價
在線評論中包含了關于茶葉質量的大量信息,主要包括“特征信息(特征詞)”和“情感信息(觀點詞)”,如表1所示,兩類信息體現了客戶對茶葉質量的某種特征(特征信息)的需求情況和滿意與否(情感信息)。對在線評論進行分析,提取評論中的兩類信息,可以實現由消費者感知出發的茶葉質量的評價。
1.在線評論的獲取與標注
為提取出在線評論中的特征信息和情感信息,首先需要對在線評論進行獲取和標注。步驟如下:(1)使用PHP語言實現網絡爬蟲,通過淘寶、京東等電子商務網站,下載關于茶葉的在線評論;(2)開發簡易的標注系統,以方便標注人員進行在線評論的標記;(3)對標注人員進行“多參數標記規范”的培訓,實現詞性、詞義以及詞語間語義關系等的標注,從而構建規范化的訓練語料庫。
2.在線評論中“特征觀點對”的抽取
抽取步驟如下:(1)對訓練語料庫中所標注的詞性、詞義以及詞語間語義關系進行統計,獲得最常見的、出現頻率最高的詞對形式(如表2所示,其中N代表名詞,A代表形容詞,V代表動詞),并采用“詞對”和“詞典Hownet”相結合的挖掘方法,實現茶葉質量的特征信息(特征詞)和情感信息(觀點詞)的提取,提取出的信息形成“特征-觀點序列”;(2)對“特征-觀點序列”進行統計,獲得特征觀點對的配對規則,從而實現在線評論中“特征觀點對”的抽取。
3.針對茶葉具體特征的質量評價
(1)采用[7]中的模糊統計方法,確定觀點詞的情感極性和情感強度。(2)根據“特征觀點對”配對結果,以及觀點詞的情感極性和情感強度,將所有觀點詞的情感強度相加后取其平均值,該平均值即為針對茶葉具體特征的情感強度值,即質量評價值。
四、結束語
從消費者角度對茶葉質量進行評價,可以幫助茶商更加全面、細致地了解所銷售茶葉的質量,為茶商制定科學、合理、有效的網絡營銷策略提供參考依據,也可以為客戶制定茶葉的網絡購買決策提供建議。
參考文獻:
[1]謝艷云.基于大數據分析的茶葉質量評估[J].福建茶葉,2016. 05,232-233.
[2]郭燕茹.我國茶葉質量安全現狀、問題及保障體系構建[J].林業經濟,2014.7,98-101.
[3]龔艷,顧寶根,邢美華.湖北省茶葉質量安全監管現狀與控制對策分析[J].農產品質量與安全,2016.6,11-14.
[4]Lin, C., He, Y.L., Everson R., Ruger S. Weakly supervised joint sentiment-topic detection from text [J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 815-824.
[5]王曉耘,史玲玲.基于網絡評論情感量化的商品綜合評分模型[J].杭州電子科技大學學報:社會科學版, 2016, 12(3), 8-15.
[6]Zheng L. J., Wang H.W. Sentimental feature selection for sentiment analysis of Chinese online reviews[J]. International Journal of Machine Learning and Cybernetics. 2015. First online. http://link.springer.com/article/10.1007/s13042-015-0347-4.
[7]鄭麗娟,王洪偉,郭愷強.基于情感詞模糊統計的網絡評論情感強度研究[J].系統管理學報,2014,23(3),324-330.
作者簡介:鄭麗娟,女,漢族,聊城大學商學院(質量學院)講師,博士,研究方向:在線評論與產品質量endprint