張蕓


摘要:[目的/意義]當今社會電子商務發展迅速,為輔助消費者更好的做出購買決策,幫助經銷商改進產品,在同行競爭中保持優勢,挖掘商品評論數據并進行情感分析顯得尤其重要。[方法/過程]本研究使用了爬蟲軟件一八爪魚采集器抓取“京東商城”iPhone X、HUAWEI P20兩款手機的商品評論數據,利用EXCEL、ROST軟件等實現對商品評論的切割、分類,構建限定詞庫。并且,抽取用戶關注的商品屬性和用戶對相應屬性的評價觀點,進一步對商品評價文本進行情感傾向性分析。[結果/結論]根據抓取的商品評論數據,可以定量且定性地判斷產品的主要特征及消費者的情感傾向。
關鍵詞:電商網站:商品評論:爬蟲程序:情感傾向
1 商品評論的情感傾向分析
本文進行情感傾向性分析選用的工具依然是ROSTCM 6(ROST Content Mining System(Version 6.0))。它可以實現詞頻統計、情感傾向性分析等功能。
1.1 詞須統計
商品評論數據進行準備和預處理之后,開展文本情感傾向性分析。首先,要對分詞的結果進行詞頻統計。蘋果iPhone X的相關詞頻統計結果如表1所示:
“手機”、“京東”、“蘋果”、“流暢”這幾個詞出現頻率很高,可以直觀的認為手機產品總體反饋較為積極。“物流”、“速度”、“很快”、“方便”的頻次也非常高表示京東自營物流得到大部分用戶好評。“屏幕”、“拍照”、“劉海”、“面部識別”、“攝像頭”用戶反應頻率也很高。
華為HUAWEI P20“手機”、“華為”、“京東”、“流暢”詞匯出現很高,與Whone X詞頻結果相似,總體反饋不錯。“國產”、“國貨”、“蘋果”高頻率出現,說明部分用戶具有將國產手機華為與蘋果手機進行比較的傾向。“速度火”、“很快”、“物流”高頻出現依然反映京東物流獲得認同。“拍照”、“照相”、“相機”在評價出現比例較大,可推測HUAWEI P20多媒體功能受到用戶極大關注,尤其拍照功能。
1.2 情感傾向性判斷
依然利用ROST軟件對評論數據進行情感分析,將情感劃分為積極情緒、中性情緒和消極情緒,并針對積極情緒和消極情緒根據分值不同設定三種不同的程度,一般,中度和高度,同時,根據評價內容所反映的情感傾向結果,繪制情感傾向可視化結果,分析iPhone X積極正面情緒達85.25%,在積極情緒中達到高度程度的也有32%,說明相當大一部分用戶對手機都非常滿意。HUAWEI P20積極正面情緒達85.59%,在積極情緒中達到一般程度的有33%,說明,相當大一部分用戶對手機一般滿意。
1.3 商品屬性的情感傾向分析
本文通過對商品評論文本中商品屬性和對應評價情感詞抽取,得到商品屬性和情感詞的修飾關系,確定情感詞修飾商品屬性時的情感傾向,進一步用來進行情感傾向性分析。從上面的分析結果中,我們選取了用戶比較關注的商品屬性,如拍照、屏幕、外觀、電池、質量等對其進行進一步分析。
iPhone X的屏幕負面評價比較多,符合常識,當時蘋果發布會的時候就有很多人表示接受不了小劉海。
同樣類似的分析方法,可以獲取HUAWEI P20的情感傾向分析結果。HUAWEI P20作為5.8英寸的大屏幕手機,3400毫安時的電池容量,顯然在某些用戶看來還是完全不夠用的。
總而言之,根據詞頻分析結果,用戶更多的關注手機的屏幕、拍照、電池、續航、與性價比等。另外,從王者、游戲、運行可以看出手機游戲運行能力也是用戶比較關心的。iPhone X與HUAWEI P20積極情緒都占很大比例,達到85%以上,說明這兩款手機都能得到絕大部分用戶的滿意。
2 總結
本研究采用八爪魚抓取系統,對商品的網站頁面進行分析,有效地實現了商品評論抓取功能。通過進行數據準備工作,采用比較刪除法進行文本去重和機械壓縮去重,用ROST對文本評價進行中文分詞。消費者可以客觀的了解商品,經銷商也可以較清晰地發現自己的優缺點和消費者的關注點,具有一定的應用價值。