江疆


【摘 要】社交網站具備快捷的信息反饋能力,形成了對社會輿論巨大的影響力,網絡言論一定程度上反映一個企業的社會認可度。如何通過對社交網站海量客戶評論進行識別和分析,從而判斷企業形象已經成為網絡時代背景下企業改善自身形象的重要挑戰和機遇。本研究以國內某電網公司為例,以用戶對電網相關的微博評論作為研究對象,采用文本挖掘技術和情感分析相結合的方法,構建基于微博情感分析的企業形象評分算法,為供電企業判斷自身形象并有針對性的采取解決措施提供技術手段。
【關鍵詞】社交網絡 情感分析 輿情挖掘 企業形象
1 引言
隨著互聯網和移動技術的廣泛應用,人們越來越多的在社交網站上發表自己對于企業產品和服務的觀點和看法,而這些言論的快速大范圍傳播不可避免的影響到相應企業的社會形象。如何通過對社交網站用戶言論的分析得到對企業形象的量化評價是本文的主要研究內容。現階段對于網絡言論的使用主要集中在抱怨處理[1],而沒有對這些網絡言論造成的企業形象的整體變化進行量化。本文提出一種基于微博情感分析的企業形象評價算法,通過獲取微博相關言論和傳播信息,計算一段時間內的企業形象得分,從而可以從宏觀上把握網絡輿論對企業形象造成的影響,了解企業在競爭同行中的位置,進一步的可以更深入的鉆取和判斷是哪些方面的因素造成的影響,為企業決策提供輔助支持[2]。在計算機領域,輿情挖掘和情感分析主要考察如何運用自然語言處理、文本挖掘、機器學習、人工智能、自動化內容分析等信息技術方法對社交網絡上個體評論信息進行情感分類及體系構建[3-5]。處于對企業日常工作指導的價值,這類研究針對的主要是客戶抱怨評論,通過加強對顧客抱怨信息的識別、搜集及反饋能力,優化企業決策。本文通過將用戶評論內容(正面與負面)與企業運營業務分類相關聯,獲取各業務關注點情感分值與對企業形象的貢獻度。
傳統的企業形象評價[6]一般采取問卷調查的方式進行企業形象評價。而隨著大數據時代的來臨,企業通過網絡獲取用戶行為數據變得越來越容易。因此,基于真實情境大樣本數據的實證分析更能夠對企業形象管理提供科學合理的優化策略啟示。對于不同產業和行業類型的企業來說,通常需要采取不同的企業形象管理策略,例如電信行業與能源行業對企業形象的關注點與管理策略是不同的。本文以國內某電網公司為例,以客戶對供電服務的微博評論作為研究對象,在構建客戶評論分類體系基礎上對進行企業形象評價算法的構建。
2 研究方法及算法
本文研究的主要目標為基于客戶微博言論構建企業形象評價,主要步驟為:(1)收集微博客戶信息;(2)構建電網相關微博關鍵詞庫;(3)計算微博情感分值并判斷微博言論情感傾向類型;(4)劃分微博言論類型,關聯匹配企業服務事件;(5)計算企業形象評分。
2.1 微博客戶信息收集
通過計算機爬蟲程序模擬人工搜索和瀏覽實現數據的自動抓取[7],所有抓取數據都是微博博主對外公開的信息,不涉及隱私信息。本文收集的微博客戶信息主要包括用戶身份、微博內容以及用戶行為信息。其中,用戶身份信息包括用戶名、用戶行業、用戶性別、賬號類別,微博內容數據包括微博發布時間和文本內容,用戶行為數據包括關注數、粉絲數、評論數量、轉發數量、點贊數量。
2.2 構建電網相關微博關鍵詞庫
關鍵詞庫即是客戶對電網相關評論的關鍵“詞語庫”,包括停電、來電、95598客服態度好、鋪設電纜擾民等,能夠在一定程度上反映對電網的評價。根據某電網業務范圍,在客戶重點關注領域構建微博關鍵詞庫。本文使用的關鍵詞庫主要包含以下方面:竊電、抄電表出錯、95598、營業廳人員、錯峰、詐騙、電壓不穩等21類。
2.3 獲取客戶言論情感分值
客戶評論情感傾向可以劃分為正面、負面和中立三類[4-7]。目前存在三種識別顧客評論情感傾向的方法:基于詞庫、基于語料和基于層面[5]。本文采取詞庫法[8]開展客戶評論情感傾向判斷,具體工作步驟為:隨機篩選部分相關微博,由供電服務專家進行人工分類和情感標定;隨機選取部分微博作為樣本,利用分詞技術和計算機統計算法初步建立情感詞庫,并賦予每個詞一定情感極性權重—權重分正負,越大表示正面感情越強烈,無感情則情感值為0;供電服務專家對詞庫中所有詞進行人工校對,確保準確性,減少評判誤差;一條微博包含詞庫中某類詞的權重之和為本條微博情感分值,當情感分值達到一定臨界值,則可以對客戶言論中包含的情感進行判別(正面或者負面)。
2.4 劃分微博言論類型
本文運用基于分詞技術的微博分類算法[9],將通過搜索關鍵詞庫獲取的微博經過分類關鍵詞識別,從而進一步判斷該條微博所描述內容的類別,將每條微博的類別對應到相應的業務分類能夠更精準的輔助業務提升。
2.5 計算企業形象評分
本文基于以下兩條假設形成企業形象評分算法。首先,每一條正面或負面的微博都從積極或消極的方面影響著一個企業的形象評分;其次,微博轉發、評論、點贊數和博主身份、粉絲數都對一條微博的影響力有著貢獻,而影響力越大對企業形象造成的波動也越大。因此,我們可以通過前一步驟獲取的每一條微博情感企業形象得分和微博影響力的大小計算企業形象得分,具體步驟如下:
(1)將情感分值歸一化。通過分析大量微博數據,發現所有微博情感分值為 的時候已經可以表達極強烈的正面和負面情緒,因此對任意一條情感分為 的微博,將其情感分歸一化為 。
(2)計算單條微博的影響力。單條微博影響力 的計算公式為: 。其中 為此微博博主身份,在本文中普通用戶設為1,VIP用戶設為10; 分別為粉絲數、評論數、轉發數和點贊數,權重 按經驗分別設為0.3,0.2,0.2,0.3。
(3)計算單條微博對企業的形象評價分值。 。
(4)計算一類微博對企業的形象評價分值。 ,為屬于類別j的所有微博形象評價分值之和經過歸一化之后的結果。
(5)計算企業形象評價分值。為所有微博形象評價分值之和經過歸一化后的結果,公式如下:
3 算法結果
3.1 樣本和數據收集
新浪微博是中國最受歡迎的社交網絡,截止2015年第三季度,新浪微博在中國網民中的注冊用戶已經超過4億用戶,日活躍用戶數達1億。本文以新浪微博客戶評論開展算法研究。本次計算時間區間為2015年10月07日至2015年11月03日共四周時間,共獲取6312個用戶的基礎信息,共計24167條微博。
3.2 結果分析
通過對某電網企業形象得分繪制隨時間變化曲線圖1所示,可以看到微博網絡言論主要以附件輿論為主,與人們對服務類企業的期望吻合。人們總是希望服務型企業能有更好的服務,因此在網絡上也主要是以抱怨等負面情緒為主。通過進一步對每類微博言論對企業形象評分的貢獻可以進一步分析出哪一類言論是對企業形象有負面影響的,這一類言論對應的業務是需要重點關注并改進的,哪一類言論是對企業形象有促進作用的,這一類言論對應的業務是可以更好的進行宣傳和擴散的。更進一步,各類微博中對企業形象分值影響較大的微博需要重點關注,一般這類微博博主影響力較大,傳播速度快、范圍廣,因此應單獨列出進行后續的處理,例如聯系微博博主了解情況、進行安撫等等。通過層層深入的挖掘,可以實現對某電網公司業務的精益化管理。
4 結語
本文以國內某電網公司為例,通過對微博言論進行分析構建企業形象評價指標,通過對該指標的監控可以總體把握企業輿論形象的變化情況,進一步的通過層層深入分析各類別言論貢獻度大小從而定位需要重點關注的業務類別,最終可以定位到影響力較大的單條微博,進行差異化的客戶服務與公關管理。后續需要進一步研究怎樣實時監控企業形象評價,從而對突發情況及時響應。
參考文獻:
[1] Johnston, R. & Mehra, S. Best-practice complaint management[J].Academy of Management Executive,2002(4):145-154.
[2] 郭秀英,劉先濤.企業形象評價方法研究[J].商業研究,2004(20):86-87.
[3] Liu, B. Sentiment Analysis and Opinion Mining[M].Morgan &Claypool Publishers,2012.
[4] 何建民,劉明星.面向特定主題的客戶抱怨文本分類識別方法[J].合肥工業大學學報(自然科學版),2010(12):1884-1888.
[5] 王洪偉,鄭麗娟,尹裴.基于句子情感分析的中文網絡評論的情感極性分類[J].管理科學學報,2013(9):64-74.
[6] 王紅杰.企業形象評價研究[D].河海大學,2000.
[7] 羅一紓.微博爬蟲的相關技術研究[D].哈爾濱工業大學,2013.
[8] Pang, B., L. Lee. Opinion mining and sentiment analysis[J]. Foundations and Trends in Information Retrieval,2008(1-2): 1-135.
[9] 韓忠明,張玉沙,張慧,等.有效的中文微博短文本傾向性分類算法[J].計算機應用與軟件,201210):89-93.