摘 要:近年來,博客與社交網絡已經為客戶關系管理、公共輿論追蹤和文本過濾等領域的研究提供了寶貴的資源。從社交網站(如Twitter和Facebook)獲得的數據對市場營銷公司、輿論組織以及其他研究者具有重要價值。本研究的數據來源于社交網站Twitter中的文本數據,隨機抽取了一段時期Twitter中的3516篇推文作為樣本評估消費者對全球16個知名品牌(如Nokia,IBM,KLM)的情感態度。研究使用專家預定義的詞典進行分析,詞典包括6800個已知態度傾向的種子形容詞。研究結果表明,消費者對其中幾個知名品牌持積極態度,通過消費者對品牌的情感態度分析可以為公司制定營銷策略提供可行性建議。文中運用的定性與定量相結合的分析方法,為品牌情感態度分析拓寬了深度。
一、研究背景意義
互聯網信息時代,社交媒體的發展使人們在社交網絡表達的意見在購買產品、股票市場波動和總統選舉等公眾輿論方面有很大影響力。最新的一項針對Twitter的研究發現,超過80%的用戶會發布自己日常的信息或轉發別人的信息,社交網絡成為人們表達意見或看法的重要途徑,因此分析社交網絡中的海量文本數據具有重要意義。
二、研究方法
情感分析法(sentiment analysis SA)被一些學者用來分析社交網絡中文本所表達的情感,這是一種自然語言處理程序,運用計算語言學和文本挖掘來識別文本情感,文本情感通常分為積極、中立與消極三種,這項技術在文本挖掘文獻中也被稱為情感極性分析(EPA)、意見挖掘、文獻挖掘或評價提取。情感分析法(SA)是一種自動化的知識發現技術,其目的是在大量的評論、博客或推文中找到一種隱藏模式,通過從文本中分析得出的情感與已有的詞典進行比較,確定情感強度,進而計算情緒得分,通過情感得分分布判斷總體的情感傾向。
三、研究內容
以往學者對情感分析法(SA)的應用研究大多集中于產品評論、電影評論、政治傾向分析和股票市場預測,比如從消費者對產品的評論中提取意見,將評論中的積極情感與消極情感分類,追蹤在線論壇討論的情感趨勢,發現網絡熱點等。但沒有運用此方法專門針對消費者對全球知名品牌做情感分析的研究,文章的研究彌補了這一空白,對社交網站品牌相關文本數據的分析試圖解決以下兩個問題:
1.社交網絡意見挖掘是否可以分析出消費者對全球品牌的情感傾向?
2.公司能否利用網絡博客有效制定營銷與廣告方案?
鑒于社交網站Twitter是最大、最受歡迎、用戶多且活躍度較高的社交網站,根據市場研究公司Semiocast.com(2012)的數據顯示Twitter大約有5億活躍用戶,代表性較強,因此筆者使用了從Twitter獲取的文本數據進行分析。文章數據來源于Twitter網站2012年7月18日至2012年8月17日的一組隨機帖子,包括16個品牌相關的3516篇推文,為了保證數據的代表性,樣本來自于不同的日期與一天中不同的時刻。情感分析法的關鍵一步是詞語分類,常用的有兩種情感傾向識別方法:一種是基于詞典,另一種基于語料,但基于語料的方法很少應用于情感傾向分析,因此使用基于詞典的方法。這兩種方法都需要一個預先定義的詞典或主觀詞匯語料庫,情感傾向識別是通過比較推文與詞典中專家定義的條目來確定。之前的研究通常是包括182個類別超過11000個手工編碼的單詞的手工編碼詞典,例如LIWC詞典,SentiWordNet,Q-wordnet或主觀性線索詞典。隨著研究的深入,現已有自動編碼的詞典,其中包括基于情感的詞典。論文借鑒了成功運用于此類研究的Hu and Liu (2004) 語料庫。語料庫包括大約6800個已知傾向的種子形容詞(2006個積極詞匯和4783個消極詞匯)。
將文本進行詞語分類后,運用QDA Miner4.0軟件對Twitter帖子的文本數據進行定性分析,分別顯示了詞頻表和基于多維縮放(MDS)技術構建的3-D概念圖。最后運用R軟件進行定量分析,計算整體的情感得分并顯示了品牌的情感得分分布。從品牌的得分分布中可以看出有些品牌的推文得分表現出積極情感,如Lufthansa和DHL,有些表現出消極情感,如T-Mobile,有些品牌則呈不對稱分布,并且大部分推文落在得分為0的區域或+1/-1的區域,這表明情感傾向為中性,沒有明確的積極或消極情感傾向。
基于大約20%的網絡博文提及品牌名稱的事實,在Twitter和其他社交媒體上管理品牌形象應該成為公司主動營銷策略的一部分,公司可以通過使用博客圈傳播客戶所需的信息,擴大品牌的影響力。使用社交網絡監控用戶和博主對其品牌的討論,及時與不滿意客戶進行溝通,通過用戶的博文信息為公司提供反饋信息便于改進產品和服務。
通過社交網絡文本數據分析消費者對品牌的情感傾向可能存在偏差,但大量的文本信息為正確反映消費者情感提供可能性。從互聯網獲得消費者數據,相對傳統的小組訪談和面對面市場調查節約了時間和成本。但需要注意的是,情感分析法(SA)也存在一些缺陷,運用此方法對用戶意見進行客觀分類的同時并不能揭示形成這些意見背后的原因,在未來的研究中,應該使用情感話題識別技術(STR)確定每種情感背后的最具代表性的話題,進而分析產生消極或積極情感的原因。另一方面,研究中所用方法只能識別出積極和消極基本情緒,并不能準確識別出在諷刺、挑釁等情況下的語言表達的情感狀態,在進一步的研究中還要在這方面做改進。最后,用戶在網絡上所表達的觀點可能受廠商的操縱,并沒有真正反映消費者的真實情緒,可以通過企業財務數據,如股價、利潤等進行檢驗。
作者簡介:
田少娟(1993-),女,山西長治人,碩士研究生,研究方向:經濟統計.