張琰 朱燕翔 鄭桂玲
摘要:通過挖掘網購手機的中文評論,以知名電商網站手機銷售評論為研究對象,首先通過爬蟲軟件抓取銷量排名前十的手機網購評論,在文本數據預處理后使用改良的jieba分詞工具對評論進行分詞,并基于Python開發平臺采用TF-IDF算法計算網購中文評論中的手機屬性關鍵詞及修飾詞關鍵詞,通過關鍵詞詞頻分析找出用戶對特定型號手機的各屬性的消費評價,以便消費者了解不同手機屬性的優勢與劣勢,同時為商家改進商品功能提供建議。
關鍵詞:文本挖掘;網購評論;屬性評價
中圖分類號:F27文獻標識碼:Adoi:10.19311/j.cnki.16723198.2018.22.022
0引言
當下手機成為人們生活中必不可少的工具,手機除了實現通信功能外還提供休閑娛樂、移動支付、信息搜索等功能。由于手機類產品的標準化,越來越多的用戶選擇網上購買,并且網絡平臺還為用戶提供購買后評價功能,這使得手機質量、性能好壞,手機的各項屬性是否受用戶歡迎成為完全公開的信息。商家可以通過對評論進行分析,得出用戶的消費體驗,從而改進商品性能或服務質量。
1研究現狀綜述
本文擬從中文評論中挖掘關鍵詞的方式分析用戶評價,這一過程包含兩個主要步驟:首先,需要對大量中文評論進行分詞;其次,對分詞后的文本信息進行關鍵詞提取。使用比較多的是由張華平開發的NLPIR漢語分詞系統ICTCLAS2016。本文采用基于Python軟件開發環境的jieba分詞工具。
第二個步驟是關鍵詞提取,目前主要的研究方法有兩類:一是基于統計的方法;……