李迎輝 焦通
中國煙草總公司遼寧省公司 遼寧 沈陽 110062
近年來,隨著Web2.0的快速發展,消費者開始更多地傾向于在網絡上表達他們的產品使用感受。相對而言,消費者評論能更好地傳遞消費者的聲音,它能夠更真實反映某個產品令人滿意的一面與令人不滿意的一面[1]。由于消費者是基于切身感受而自愿書寫評論的,因此,從消費者評論中獲取的信息更加可靠。
隨著電子商務的發展,少數國內外學者已經開始關注基于在線評論的產品評價方法的研究。多準則妥協解排序法(VIKOR)是多屬性決策中的折中優化方法。卷煙品牌規格引入是一個復雜的多屬性決策問題。鑒于VIKOR法還未應用于卷煙品牌規格引入中,本文將VIKOR法引入基于在線評論的卷煙品牌規格引入決策中,以探索該方法在卷煙品牌規格引入中的應用價值,為煙草商業企業品牌規格優選與評價提供一種新的思路。
情感分析(Sentiment Analysis)是指通過自動分析商品、服務、人物等研究對象的相關評論文本內容,發現評論者對該研究對象的褒貶態度和意見[2-3]。
目前在網絡用戶情感分析領域進行的研究主要以三個層面中的一種來實現,即:文檔層面、語句層面和屬性層面。作為一個新興的研究領域,情感分析正逐漸受到計算機科學、經濟學、管理學、情報學等相關學科研究者的關注。相關研究已經在詞語級、句子級、篇章級情感分析方面進行了有益探索,并嘗試將其應用于市場預測、輿情監測、競爭情報獲取等多種任務中。
VIKOR(Vise Kriterijumsa Optimizacija I Kompromisno Resenje)方法是Opricovic等[4-5]提出的一種復雜系統多屬性優化決策的方法。目前已被廣泛應用于如供應商選擇、項目管理等多屬性決策問題(MCDM)。VIKOR法的核心內容是在確定正、負理想品牌規格的基礎上,通過計算最大群體效益值、最小個體遺憾值和利益比率值,比較各備選品牌規格與理想品牌規格之間的距離,最終對品牌規格的優劣進行排序。VIKOR法得到的折中選擇是帶有優先級的,更逼近于理想品牌規格。
從眾多的卷煙品牌規格中選擇需要引入的品規,首先要根據卷煙類型和煙支形式等不同條件對卷煙品牌規格進行初步篩選,以使其具有可比性。經過篩選得到符合篩選條件的備選卷煙品規。
2.2.1 收集評論。首先從網站上收集相關卷煙品規的在線評論,然后剔除在線評論中質量較低的評論,利用ROST內容挖掘系統進行分詞。
2.2.2 構建屬性詞典和情感詞詞典。根據以上收集的評論構建屬性詞典和情感詞詞典。屬性詞典包含了卷煙產品共有的重要屬性。在構建情感詞詞典過程中,首先對情感詞進行提取并分類,然后根據情感詞所表達情感強度的不同將情感詞賦予不同的數值。
2.2.3 構建代表評論者觀點的關鍵詞向量。參照上述構建的兩本詞典,將評論文檔轉化為代表消費者觀點的關鍵詞向量。在評論文檔中,如果屬性和情感詞出現在同一句中,那么該句評論則被視為消費者觀點,則賦予該屬性相應的評價值。

2.3.1 度量各屬性的評價值。首先對所有在線評論進行逐條挖掘,得到各評論中所有屬性的評價值。然后將各評論中的所有屬性的評價值進行線性組合。本文用在線評論中的屬性評價值總和來度量消費者對每個屬性的情感水平,度量如下:

2.3.2 度量各屬性的權重。本文采用了基于詞頻的加權方式對各屬性的權重進行度量。詞頻和屬性權重的計算關系式如下:

對在線評論的屬性評價值求和并確定各屬性的權重后,再對屬性的評價值標準化,使其值介于0和1之間。
不妨設有m個備選卷煙品牌規格表示為a1、a2,…,am,對于備選品規ai,第j個屬性評價值用fij表示,也就是說fij是備選品規ai第j個屬性的評價值,n是屬性的數量。VIKOR方法計算步驟如下:

2.4.2 計算各待選卷煙品規最大群體效益值和最小個體遺憾值(i=1,2,3...m)的值:


2.4.4 根據S,R,Q的值從小到大進行排序,并依據排序結果擇優確定引入品規。
為驗證所提方法的有效性,本文基于煙悅網(https://www.yanyue.cn)中卷煙在線評論信息,進行了卷煙品牌規格引入的實例分析,具體過程如下。
本文按照零售指導價220-230元/條的條件進行了篩選,經過篩選得到6種細支卷煙品規,分別是南京(金陵十二釵)、雙喜(硬祥云好日子)、泰山(好客細支)、貴煙(跨越)、利群(西湖戀)、云煙(84mm細支祥瑞)(記作:~)。
3.2.1 收集評論。利用爬蟲軟件從煙悅網上收集相應品規的在線評論,并進行整理,共收集337條關于以上6種卷煙品規的評論。
3.2.2 構建屬性詞典和情感詞詞典。經分析獲得口感、味道、性價比、吸阻、價格、包裝、煙氣、香氣、勁道等9種卷煙產品的重要屬性(記作:~)。在情感詞詞典構建過程中,形成了積極極性詞典、消極極性詞典、程度級別詞詞典和否定詞詞典。
3.2.3 構建代表評論者觀點的關鍵詞向量。基于以上構建的屬性詞典和情感詞詞典,利用評論分析工具(基于Python語言),分別對6種卷煙產品的9種屬性評價值進行計算。
對各屬性的評價值進行標準化,使其值介于0和1之間,同時,將評論中的屬性詞頻轉化為屬性權重。
根據公式(5)~(6)計算各待選卷煙品規最大群體效益S值和最小個體遺憾值R。
依據公式(7)計算各待選卷煙品規的利益比率值Q。然后根據S、R、Q值從小到大進行排序。
根據排序結果可知,當取不同的決策系數值時,得到的排序結果也不盡相同,如決策系數v=0.2時,以最小化遺憾原則進行卷煙品規排序的結果是:P1>P3>P5>P6>P4>P2;決策系數v=0.5時,以兼顧群體效益最大化和個體遺憾最小化的均衡折中原則進行卷煙品規排序的結果是:P1>P6>P3>P5>P4>P2;決策系數v=0.8時,以最大化群體效益原則進行卷煙品規排序的結果是:P6>P1>P5>P3>P4>P2。同時,本文進行靈敏度分析,結果如圖1所示。不難看出,無論決策系數v取何值,受決策系數v值變化的影響較小且始終排在前列,因此,卷煙品牌規格引入優選結果為。

圖1 靈敏度分析
本文基于在線評論和VIKOR法對卷煙品牌規格進行了優選,在賦予不同決策系數的情況下,最終優選結果為,說明本文所提出的方法在進行卷煙品牌規格引入決策時是可行和有效的。本文所提出的方法彌補了基于消費者評論數據的卷煙品牌規格引入決策的空白,同時,提高了煙草商業企業卷煙品規引入的效率和科學性。