任碩實,符 琛
(1.河北政法職業學院,河北 石家莊 050061;2.寧夏大學,寧夏 銀川 750021)
美國語言學家菲爾墨提出的研究詞語意義和句法結構意義的理論方法,被稱為框架語義學①。這一理論源于經驗主義語義學傳統,并非形式語義學,它與形式語義學的主要區別在于前者強調語言與經驗之間的連續性,而形式語言學是不連續的②。框架語義學與形式主義之間并不矛盾,Fillmore認為,框架語義學應該是“在形式化之前的”,而不是“非形式化的”。
美國加州大學伯克利分校開發了一個英文的框架語義詞典Frame Net③。中文框架語義詞典研究開始于2004年,收詞數量不多。通過研究我們可以看出現有的框架語義詞典的構建沒有情感語義描述所需要的極性、情感強度等信息。對詞匯進行分類的結果,肯定詞和否定詞由于有共同的理解圖式和共同的框架元素集,可以被歸入同一個框架范疇。對于情感語義分析,顯然需要添加一些情感標簽。
本研究保留評論數超過5次的評論(2次/1000條,5次/5000條)。相似度:在同一框架下,將主題詞(后一詞)進行HowNet相似度計算,相似度大于0.8的適于歸為一類,所得結果有效比例各框架平均為88%(經人工判定屬于同一個評價主題的詞語/相似度為0.8以上的詞語)。但是受到HowNet詞典規模的限制,覆蓋面為75%,另有25%的主題詞不能計算。在初步處理的基礎上,運用層次聚類法的思想進行人工整理,確定評價體系。從以往特征抽取和分類的研究,注重特征詞(也就是我們說的主題詞),而忽略評價詞的語義。參看以下2個評論語句:
這個酒店有點貴。
酒店挺寬敞。
特征詞都是“酒店”,但第一句評價的主題是價格,第二句是空間,顯然不同。僅依據特征詞并不能準確表達這兩句的評價主題,評價詞(貴和寬敞)對評價主題有更重要的區分價值。正是因為這類現象的存在,許多特征提取的研究,結果往往是“整體”評價占了很大的比重。因為有很多評論句的主語(特征詞所在位置)為評價對象名稱,如本文酒店評論主語多數為“酒店”;有些研究的手機商品評論,主語多為“手機”。但事實上,整體的評價并沒有像研究所示比重那么大。
再看兩個評論句:
服務很好。
環境很好。
這兩句的評價詞一樣,都是“好”,但主語不一樣,一個是“服務”,一個是“環境”。這兩個詞對評價主題的確定更有區別價值。可見,單純依靠評價詞,也不能獲得準確的主題類別信息。我們采取的主題分類依據是主題詞加評價詞所在框架(即評價詞的語義)兩方面信息。
我們的顧客價值體系區分了實體和顧客價值要素。顧客價值作為一種心理體驗,與作為客觀存在的物體(評價對象或其某部分)是有區別的。例如,有的顧客價值研究,將酒店的位置作為一個顧客價值要素,但實際上“位置”本身是“酒店”的一個客觀存在的屬性,而顧客體驗到的位置是否便利,是否滿意,這些內容才是顧客的心理體驗。因此,就“位置”來說,真正能夠作為顧客價值要素的是位置的便利性、位置的滿意感等。描述為某某實體的某某屬性,為一條評價屬性。本研究以酒店服務質量評論為例,歸納為49個評價屬性,見表1。
在以上體系中,二、三、四級為實體部分,右面文字部分為屬性部分。實體部分根據事物自身的整體和部分關系劃分為層級體系,在體系劃分的時候,參照其他相關研究給出的指標體系。節點內容及其細化程度由在線評論內容決定。可以看出,有的實體層級多一些,內容比較繁雜,如客房及下位各部分。但有的實體層級少一些,如周邊狀況。這并不取決于客觀事物的結構如何,而是由在線評論內容決定的。也就是說,酒店顧客因為更多地關心客房內容的空間、設施等,因此,會評價比較細,而周邊狀況僅僅涉及環境和周邊餐飲等內容。右面的屬性部分,是針對實體所評價的屬性、方面。屬性既有對應實體上層的,如“酒店”、客房、服務,也有對應具體物的,如“設施”,甚至具體到“床”。屬性及其實體之間的關聯也完全取決于是否存在對應的評論句。有些實體雖然也有其他方面的屬性,但我們通過大規模評論句分析,未見對該屬性的評價,則不予構建。
與上層對應的評論語句往往是比較籠統地表達顧客整體上是否滿意,如“酒店挺好”“酒店不錯”等,甚至更簡略為“好”“很好”“贊”等。這種從整體上給出一個總體評價的情況很常見,從500條評論中統計,總體上表達對“酒店”整體的滿意感的,占299條。這類籠統的評價雖然從信息量上來看,并沒有具體評價的參考意義大,決策價值高。但我們始終采取評論語句為客觀依據,依據“存在即合理”的觀點,并且依據其出現次數定權重來確定。因此,這類總體評價不光存在,權重還會比較高。這也是為什么有些情感分析研究,將這類評價剔除后,研究結果是越好的產品,“有用”的評價數量越少。因為好產品,顧客就不再針對具體某方面評價了,而往往總體給一句“好”“不錯”這類的評價。因此,這些評價不能忽略,而且在統計上還比較重要。

表1 酒店服務質量實體評價屬性知識庫
在屬性中,“滿意感”指的是顧客對某實體或其組成部分給出的是否合意的評價,往往用“好、不錯、還可以”等表達,如“服務不錯”“設施還可以”。這種對“好”與“壞”的評價,實際上并沒有一個客觀標準,也無法測量。是顧客依據自己的經驗給出的,實際上也就是顧客感覺是否滿足自己的期待和要求。“滿意感”屬性幾乎在每個實體節點中都有,是最常見的評價屬性。其他屬性如“大小、高低、面積、新舊”等含信息量更多一些,它們所依據的評論語句在表達上更具體一些,如“床有點小”(大小),“家具挺新的”(新舊)等。
該知識庫不同于以往的電子商務客戶滿意度研究方法,知識庫提供的評價屬性體系將實體劃分為五個層次,其中一些屬性與特定商品密切相關,而建立這樣的評價體系十分重要④。
情感值是詞塊中情感框架的情感體現,價值范圍在0.0—1.0之間,與詞匯的情感值相同。然而,詞匯成分的情感價值是其意義的內在屬性,不隨語境的變化而變化。它的值在靜態字典中給出。語塊的情感價值是指整個語塊在特定語境中的屬性。一方面,當一些單詞獨立出現時,它們的極性值為0.5,即中性詞,例如“大”“低”“小”等,但具體到一定的上下文,卻有了褒貶傾向。例如,語塊“床大”,可能就比較符合顧客的需求,是褒義0.6;而語塊“噪聲大”,則又是貶義0.4。另一方面,當語塊中存在否定詞或程度修飾詞時,語塊的情感價值與評價詞的情感值不同。如果褒義成分前面有否定詞,整個語塊的值可能會變為貶義,而一個強度為“中”的成分前面有“相當”和“太”等程度修飾詞,詞塊的強度會變為高或極高。對于情感值為0.5的中性詞,語塊的情感值是根據主題信息來確定的。例如,當詞塊中的中性詞“小”是“床”時,意味著住戶感覺床狹小,因此這是一個貶義的評價,區塊的情感價值是(-0.1),見圖1。
按照圖1表示,第一步,輸入評價詞的情感值x0;第二步,判斷x0是否為0.5,當x0=0.5,查閱中性詞主題增量知識庫,得到新的情感值;x0≠0.5。第三步,檢查副詞b,若有,依據增量,判斷或大于1,或小于1,若x0>1則以1計。若無副詞,則繼續查看是否存在否定詞,存在否定詞,x0=1-原情感值,即原來由褒義變為貶義,若沒有否定詞,保留原值,作為最終值輸出。

圖1 情感值算法
本研究從評論文本中識別情感詞,根據語境中所包含的否定詞和程度副詞,得到語塊的整體情感值,并根據相應的實體和屬性計算整體評價值,達到服務質量評價的目的。根據細分的情感類別計算評價屬性的情感值,得到更詳細的評價結果,更準確地反映客戶體驗。評價結果基于對場景語義分類的識別,基于語義分析,并在語義分析的基礎上,對每個屬性的評價值進行統計。本文將漢語語義分析和管理決策的統計分析的本質進行了濃縮。針對酒店服務質量指標不平等、數據支持不到位、評價指標分類粗糙、評價準確性和可信度低等問題,提出了酒店服務行業的基于情感語義的服務質量評價方法。對在線評論專業詞匯細分為幾十個語義類,在服務質量評價領域,尚屬少見。有效地解決了以往評價指標過于籠統,對決策參考價值不高的問題。指標的計量基于文本的語義分析,統計分析情感值,準確反映了顧客體驗,解決了以往評價結果可信度不高、參考意義有限的問題。
注釋:
①Charles J.Fillmore.Topics in lexical semantics[M].Bloomington,Indiana University Press,1977.
②Charles J.Fillmore.Frame semantics[J].Seoul,Hanshin Publishing Co,1982,111-137.
③美國加州大學伯克利分校.FrameNet[DB/OL]:https://framenet.icsi.ber-keley.edu/fndrupal/.
④Cruz,Fermin L.;Troyano,Jose A.;Enriquez,Fernando.Long Autonomy or Long Delay?'The Importance of Domain in Opinion Mining[J].Expert Systems with Applications,2013,40(8):3174-3184.