周紅照,侯敏,滕永林*
(1.許昌學院 文史與傳媒學院,河南 許昌 461000;2.中國傳媒大學 國家語言資源監測與研究有聲媒體中心,北京 100024)
評價計算是一項讓機器智能理解人類言語中評價信息的工程,與情緒計算共同構成情感計算的兩大分支。評價計算是競選預測、網絡輿情監測、聊天機器人、文獻聲譽追蹤等諸多應用系統的關鍵技術,持續成為自然語言處理領域的研究熱點。2006年美國國家標準與技術研究院(NIST)最早舉辦“博客領域的評價計算評測”[1],歷經十余載發展,評價計算已經從淺層粗粒度的評價句識別與觀點極性判定研究,進入到深層細粒度的評價對象抽取研究。例如“楊潔篪在接受媒體采訪時說,這次中美高層戰略對話是有益的,有利于增進相互了解。”(新華網2021/03/20),計算機判斷出這是一個正面評價句之后,怎樣進一步判斷評價詞“有益”“有利于”的評價對象是“這次中美高層戰略對話”,而非其他句子成分呢?近年來,隨著數據、算力、算法“三駕馬車”迅猛發展,人工智能在圖像識別、語音識別與合成、淺層句法分析等領域進步斐然,然而在涉及深層語義理解的評價對象抽取領域卻進展緩慢。
已有評價對象抽取系統主要采用以下4種方法:(1)最短距離法——認為評價對象與評價詞在距離上呈負相關,距離評價詞越近的名詞越有可能成為評價對象[2];(2)候選加過濾法——首先抽取句子中的名詞和名詞短語作為候選評價對象,然后根據詞頻、與主題詞的點互信息(PMI)、冗余度、剪枝算法等對候選評價對象進行過濾[3-6];(3)句法規則法——利用Stanford Parser、哈工大語言技術平臺(LTP)、人工歸納的詞性組合模板等對評價句作短語結構文法或依存句法分析,抽取與評價詞具有直接組成成分關系或句法依存關系的詞語為評價對象[7-14];(4)機器學習模型法——將評價對象抽取視作序列標注任務,采用有監督的條件隨機場模型(CRF)或無監督的神經網絡模型(CNN/RNN),讓機器從訓練語料中學習評價對象的概率分布[15-22]。候選加過濾法由于缺乏評價詞與評價對象的關聯分析,難以有效去除噪聲;最短距離法、短語結構文法與依存句法規則法在近距離搭配上比較有效,但低估了評價意義語言表達形式的復雜多樣性,過于理想化和簡單化,覆蓋率較低;機器學習模型法理論上可行,但從歷屆中文傾向性分析評測(COAE)和自然語言處理與中文計算會議(NLPCC)組織的評價對象抽取評測結果看,效果并不理想,機器從大規模語料中挖掘評價對象的分布規律猶如“大海撈針”,若缺乏方向性的理論指導,很容易迷失方向,甚至可能會“誤入歧途”,此外深度學習的不透明性、可解釋性差等問題影響系統的自我糾錯與持續改進。
陸儉明先生指出[23]:“語言學在當今飛速發展的、基于人工神經網絡的‘計算機深度學習’的人工智能事業中,逐漸被邊緣化。不是人工智能不需要語言學知識,而是已有的語言研究成果不怎么適應人工智能研究的需要。”我們認為,漢語評價對象抽取任務之所以近年來遲滯不前,難有突破,“癥結”在于與漢語評價知識本體研究缺乏有效、深度的結合,缺少有效的、特征化的語言學知識這駕“數據”馬車的有力驅動。而在各種特征化的語言學知識中,對評價對象抽取工作最有效的是系統化、形式化的評價構式知識。正如王寅先生所言[24]:“從構式角度來研究語言的意義在于:可望實現語言理論的充分性(兼顧中心和邊緣現象)和統一性(將語法的認知研究都歸結為構式),深化句法與語義的接口研究(以形義配對體為基點)。”從構式的角度研究評價對象抽取,有助于從根本上扭轉當前最短距離、依存關系、機器學習模型等方法只考慮局部關系義、未考慮全局整體義,只考慮淺層字面義、未考慮深層語用義的不利局面。例如“孔子學院不僅讓漢語成功走出國門,它也成為傳播中國文化的重要力量。”(《新聞聯播》2011/12/04)從淺層字面義和局部關系義看,評價詞“成功”描述的對象是“漢語走出國門”,但從深層語用義和全局整體義看,這一“致使構式”真正的評價對象是漢語成功走出國門的推動者“孔子學院”,整個句子的語用目的,即說話者的交際意圖是夸贊“孔子學院”。
評價詞包括評價動詞、評價形容詞、評價名詞、評價副詞4類。本文以評價動詞為研究對象,以智能識別評價動詞的評價對象為研究目標,以評價動詞與評價對象配對構式為研究內容,找出幫助計算機自動識別評價動詞的評價對象的形式化特征標記,探索陸儉明先生倡導的“構式語法為人工智能服務”[25]的實現路徑,為其他評價詞類的評價對象抽取研究提供案例參考。
本文的研究思路如下:首先,從《現代漢語常用詞表》中選取使用頻率最高的10個評價動詞作為樣本詞(支持、反對、批評、促進、值得、破壞、滿意、犯罪、改善、感謝);然后,從2021年3月1日至2021年3月10日百度資訊——新聞網站中檢索出200個評價句(每詞20句)作為樣本語料;其次,具體考察樣本語料中評價動詞與評價對象的配對情況,抽象概括評價構式的基本類型,并精準找出區分各類評價構式的特征標記;再次,把評價構式類型與特征標記理論研究結果轉化成機器可讀的形式語言,建立評價動詞—評價對象智能抽取規則簇;最后,選取新的測試詞與測試語料,實驗檢驗規則簇的信度與效度,根據實驗結果的反饋情況修正、補充和完善規則簇。
計算機要想準確抽取評價動詞的評價對象,需要兼顧評價動詞本身的詞義特征與評價動詞所處構式的特征。上述10個樣本評價動詞根據詞義本身的特征可劃分為兩類:“支持、反對、批評、滿意、感謝”屬于一類,與其配對的評價對象是評價的承受者,即評價動詞所針對或涉及的事物(受事角色);“促進、值得、破壞、犯罪、改善”屬于一類,與其配對的評價對象是評價觸發者,即觸發評價主體做出褒貶評價的事物(施事角色)。文獻[14]把第一類評價動詞稱作“后指動詞”,認為其后面的賓語即評價對象,但我們考察100句后指動詞樣本語料發現,動詞賓語為評價對象的句子只有55句,簡單地把兩者畫等號只能獲得55%的召回率。文獻[14]把第二類評價動詞稱作“前指動詞”,認為其前面的成分為評價對象,但文章并沒有具體指明是前面的哪種成分,若動詞前面既有主語成分又有狀語成分,既有名詞性成分又有謂詞性成分,或同時出現多個名詞性成分,機器該如何從中做出選擇?句法與語義是兩個不同的平面,句法關系與語義關系并非一一對應(賓語≠受事角色、主語≠施事角色)。呂叔湘先生很早就注意到句法與語義的不對稱性[26]:“論結構關系,A應該屬于B,但是在語義上A指向C。”因此,我們應充分意識到句法與語義的區別,不能將兩者混為一談,抽取評價動詞的評價對象旨在解決評價動詞與評價對象之間的語義(或語用)指向關系,而非句法結構關系;同時我們也要意識到句法與語義之間的聯系,抽象的、深層的評價意義必須要通過具體的、表層的句法形式來體現。作為句法與語義這對矛盾統一體的“評價構式”,正是下文所要論述的對象。
考察100句樣本語料中后指評價動詞“支持、反對、批評、滿意、感謝”與評價對象(受事角色)的配對情況,共歸納概括出8種評價構式(例句中帶下劃線的為評價動詞,帶波浪線的為評價對象,加著重號的是計算機據以定位評價對象的特征標記)。
構式1后指評價動詞+×××+評價結束標記(占比55%):
(1)多國代表在聯合國人權理事會發聲支持中國。(新華網2021/03/02)
(2)有歐盟官員批評意大利的決定,認為這將引發“疫苗爭端”。(《西寧晚報》2021/03/07)
(3)總而言之,以目前咱們國家教育資源的分布情況,我堅決反對在中小學取消英語的主課地位。(騰訊網2021/03/09)
若后指評價動詞前面沒有出現其他特征標記,則計算機默認評價動詞與評價結束標記(包括標點符號、語氣詞和嘆詞)之間的內容為評價對象。把“支持、批評、反對”等收錄到語義詞典,賦予其“hzv”(后指評價動詞)的語義標記,把標點符號、嘆詞、語氣詞宏命名為“JSB”(結束標記)。計算機匹配語料時若遇到hzv,則抽取hzv與JSB之間的內容作為評價對象。
構式2對/對于/向+×××+動詞/副詞/“的”+后指評價動詞(占比14%):
(4)據悉,在收到中國疫苗的第二天,塞爾維亞總統武契奇再次在公開場合向中國表示了感謝。(網易新聞2021/03/10)
(5)四川成都某酒店房間內,市民劉先生隔離結束前用近80個礦泉水瓶擺成心形,以表達對防疫工作人員的感謝。(騰訊網2021/03/09)
(6)據西班牙《阿斯報》報道,皇馬對于塞爾維亞前鋒約維奇的外租表現不滿意,球員最近陷入了進球荒中。(騰訊網2021/03/08)
例(4)中的后指評價動詞“感謝”充當謂詞賓語,例(5)中的后指評價動詞“感謝”充當定語中心語,例(6)中的后指評價動詞“滿意”充當謂語中心語,但3個句子的評價對象均為后指評價動詞前面的介詞賓語。也就是說,三種不同的句法形式表示了基本相同的評價語義關系,都可以歸入構式2中。
構式3對/對于+×××,+后指評價動詞+評價結束標記(占比3%):
(7)不過對于訓練中這樣的表現,庫里本人似乎并不滿意。(騰訊網2021/03/08)
(8)對國網尉氏供電公司大力實施的機井通電工程,尉氏縣永興鎮高標準農田建設項目負責人很是滿意。(人民網2021/03/05)
(9)對于上訴法院要求“重新考慮恢復三級謀殺指控”的裁定,8日當天,肖萬的律師提出反對,并表示將向明尼蘇達州最高法院要求撤銷這項裁定。(中國青年網2021/03/09)
漢語與英語、俄語、日語等具有豐富形態變化的語言相比,缺少形態變化,表示語法意義的主要手段是語序和虛詞,具有“重意合不重形合”“形散而神不散”的特點,句式靈活多變,同一種語義關系,說話者出于不同語用目的可以采用不同的句法形式。第3種評價構式可以看作第2種評價構式的變體,說話者把介賓狀語前置于句首,作為所要談論的話題。
構式4×××+被動詞+后指評價動詞(占比13%):
(10)拜登政府這種“跟中國硬拼”的政策,遭美國社會反對!(網易網2021/03/09)
(11)作為全球最大的零售商,沃爾瑪此前一直飽受美國國內的批評。(騰訊網2021/03/04)
(12)李子柒三次拒回記者提問,引60萬人支持:分寸感,每個人都要懂。(騰訊網2021/03/07)
這種構式屬于被動型評價構式,其語義結構是評價對象(受事)+被動詞+評價主體(施事)+后指評價動詞。被動詞指“遭、受、引、引發、引起、被、讓、令”等表示被動意義的詞,可將其收錄到語義詞典并賦予其“bdc”(被動詞)的語義標記。計算機在匹配語料時,若匹配到“bdc+hzv”,則抽取被動詞的前鄰主語為評價對象。
構式5×××+是+必要詞/主體詞+后指評價動詞+的(占比3%):
(13)趙冬苓:我覺得抄襲無疑是應該堅決反對的。(《南方都市報》2021/03/08)
(14)振興農村,有哪些投資要不得?這幾項是必須要反對的!(騰訊網2021/03/09)
(15)配置方面真的是我最滿意的地方,這售價能夠買到多一倍的豪華配置。(艾瑞網2021/03/08)
構式5與構式4的評價對象都是評價動詞的前鄰主語,但特征標記有所不同。構式5必須同時出現“是”“必要詞或主體詞”“的”3要素,才能斷定評價對象是前鄰主語。例(16)雖然出現了“是”和“的”,但沒有出現“必要詞或主體詞”,所以評價詞“反對”的前鄰主語“我們”并非評價對象,真正的評價對象是句首話題。必要詞指“應、應該、應當、要、必須”等表示必要性意義的詞,可在語義詞典中賦予其“byc”(必要詞)的語義標記,主體詞主要包括人稱代詞、人名、組織機構等。
(16)邀請達賴去臺灣,我們是堅決反對的。(中國青年網2016/03/07)
構式6后指評價動詞+的+是+×××(占比3%):
(17)而升職之后最應該感謝的,是提拔我們的領導,畢竟古人說過:“滴水之恩,涌泉相報”。(騰訊網 2021/03/07)
(18)最滿意的還是女兒的公主房了,因為滿滿都是少女的色彩。(搜狐網2021/03/09)
(19)蘭英說創業的過程是艱辛的,她最想感謝的是跟她一起創業的團隊和員工們,因為有了他們的不離不棄,才有了公司的今天。(澎湃新聞2021/03/08)
構式6與構式5互為變體,通過調換主語和賓語的位置,兩者可以相互轉化。例(13)抄襲無疑是應該堅決反對的?應該堅決反對的無疑是抄襲;例(17)升職之后最應該感謝的是提拔我們的領導?提拔我們的領導是升職之后最應該感謝的。調整語序之后句子的基本語義不變,這再次體現出漢語表達的靈活性,同一種語義關系可以根據語用需要采用不同的句法形式來表示。
構式7名詞1+建議詞+×××+標點符號+名詞2+后指評價動詞+評價結束標記(占比3%):
(20)委員建議對996工作制監管:網友一邊倒支持。(和訊科技2021/03/10)
(21)專家建議對996工作制監管:網友直呼支持!(中關村在線2021/03/10)
(22)專家建議產假延長至3~6年,為何女性集體反對,幾乎吵翻了天?(騰訊網2021/03/08)
這種評價構式的評價對象是前句賓語,在100句樣本語料中僅出現了上面3例,是一種邊緣型評價構式。判斷這種評價構式的特征標記是前句中的謂語動詞“建議”,與“建議”類似的詞有“提議、倡議、倡導、提出、提倡、發起、號召、呼吁”等,可統稱為“jyc”(建議詞),這類詞具有引出新對象的功能,且引出的新對象往往成為下文評價主體(名詞2)所要談論的對象。
構式8×××+交出/交上+滿意(占比6%):
(23)我們黨向人民、向歷史交出了一份滿意答卷。(《北京日報》2021/03/01)
(24)中國政府交上了一份令中國人民滿意的答卷,也給國際社會留下深刻印象。(搜狐網2021/03/06)
(25)李克強在政府工作報告中指出,過去一年我國交出一份人民滿意、世界矚目、可以載入史冊的答卷。(新華網2021/03/05)
這是一種專門為某個評價詞制定的特殊評價構式。任何事物都是既有普遍性又有特殊性,評價詞也一樣。“滿意”既有后指評價動詞的普遍特征,也有自身的特殊特征,例如評價構式“×××+交上/交出+滿意+答卷”中的“滿意”不能替換為“支持、反對、批評、感謝”等同類評價動詞,這啟示我們要想全面提升評價對象抽取系統的性能,需要關注評價詞典中的特殊評價詞,為其制定專門的評價構式,最終實現一般評價構式、邊緣評價構式和特殊評價構式的統籌兼顧。
考察100句樣本語料中前指評價動詞“促進、值得、破壞、犯罪、改善”與評價對象(施事角色)的配對情況,共歸納概括出5種評價構式。
構式9×××+助動詞/介詞/副詞/引號/動詞/形容詞/致使詞+前指評價動詞(占比84%):
(26)燒荒會破壞土壤結構。(騰訊網2021/03/07)
(27)這節課在情境與對話中促進學生發展。(澎湃新聞 2021/03/09)
(28)幼兒園多了收費少了,學前教育三大難題正在改善。(《人民日報》2021/03/02)
(29)“以中高考成績獎勵教師和學生”破壞教育生態,難怪教育部要禁止。(騰訊網2021/03/06)
(30)接受《法治日報》記者采訪的專家認為,“高考移民”問題牽涉到多方利益,破壞了高考公平。(《法治日報》2021年03月07日)
(31)在她看來,當下“教育商業化”現象嚴重破壞了當前基礎教育生態,要以治理環境生態的力度綜合破解教育生態難題。(《重慶晨報》2021/03/09)
(32)從人拉驢馱到“活水”入戶,從“飲水難”到“飲水甜”,農村飲水安全工程不僅讓干旱山區的人民改善了苦澀的日子,更為甘肅人民邁進小康社會注入了強勁動力。(人民網2021年03月02日)
例(26)—例(32)代表7種不同的句法形式,評價對象均是特征標記前面的句子主語,我們“求同存異”將其抽象概括為一條評價構式。在100句前指評價動詞樣本語料中,共有84句語料符合這種構式,占比84%,可將其視為前指評價動詞與評價對象的常規配對構式。機器匹配到“qzv”(前指評價動詞)時,若該句不符合其他構式類型,則默認句子主語為評價對象。
構式10非致使動詞+×××+前指評價動詞(占比7%):
(33)安康公安征集李俊丁等人違法犯罪線索!(騰訊網 2021/03/10)
(34)英國BBC曝光美國Facebook:破壞“地球之肺”亞馬孫雨林的幫兇。(騰訊網2021/03/05)
(35)15萬左右論緊湊型SUV,日產逍客相比柯珞克誰更值得選擇?通過上述介紹來看,顯然是出自德系的斯柯達柯珞克更值得。(搜狐網2021年3月8日)
這種評價構式的評價對象是非致使動詞后面的名詞性成分,其特征標記是“非致使”動詞。如果替換為“致使”動詞(如“讓、使、造成、導致”),評價對象就變成了動詞前面的句子主語:例(36)真正的評價對象是致使動詞“讓”前面的句子主語“共享輪椅”,而非“讓”后面的“醫院基本民生”。由此可見,要想辨別這兩種不同的評價構式,有必要區分致使/非致使動詞。
(36)共享輪椅讓醫院基本民生得到改善!(財訊網2021/03/10)
構式 11將/把+×××+列入/納入/列為+犯罪(占比5%):
(37)國家正式將這十種行為列入犯罪!重罰!判刑!(澎湃新聞2021/03/07)
(38)此次刑法修改,明確將侮辱、誹謗英雄烈士的行為納入犯罪。(搜狐網2021/03/01)
(39)刑法修正案(十一)增設新罪名,再次明確將未經批準進口、銷售國外藥品的行為列為犯罪,但同時也設置了“足以危害人體健康”的前提要件。(網易網2021/03/01)
這是專為評價動詞“犯罪”制定的特殊評價構式。“促進、值得、破壞、改善、犯罪”5個樣本前指評價動詞中能進入這一評價構式充當“列入、納入、列為”賓語的只有“犯罪”。雖然這5個詞在《現代漢語詞典》中均標注為動詞,但“犯罪”除了有“做出危害國家和社會、依法應處以刑罰的事”的動詞意義,還有表示所做事情的違法性質的名詞意義。這再次表明,要想準確抽取評價對象,既要考慮同類評價詞的普遍特征,也要考慮其中個別成員的特殊特征。
構式12×××+的+前指評價動詞(占比2%):
(40)另一方面,出口市場的改善抑制了這種下滑。(金投網2021/03/09)
這種評價構式在100句樣本語料中只有2例,雖然出現頻率極低,但也代表一種類型。其形式特征是評價對象與前指評價動詞構成以結構助詞“的”為標記的定中短語,定中短語充當話題主語。通常情況下,作定語中心語的前指評價動詞(“改善”)語義前指作定語的施事/領事(“出口市場”);但在句子謂語部分再次出現評價詞語的特殊情況下(例41),則“評價對象+的+前指評價動詞”整體充當謂語評價詞語(“未獲青睞”)的評價對象,這體現了構式的套疊性。
(41)臺灣《中國時報》26日發表社論指出,離島交通的改善未獲臺當局“行政院”“前瞻計劃”青睞。(中國臺灣網2017/04/26)
構式13前指評價動詞+的+是/非+×××(占比2%):
(42)要說今年最值得買的一款MPV非上汽大眾威然Viloran莫屬。(車訊網2021/03/10)
這種評價構式在樣本語料中也只出現了2例。判斷這種評價構式的特征標記是助詞“的”和判斷詞“是”(肯定判斷)或“非”(否定判斷)。“前指評價動詞+的”構成大顆粒度、表泛指概括性意義的評價短語,充當被陳述的話題主語,判斷動詞“是/非”后面表具體意義的賓語是所要抽取的評價對象。這種評價構式與構式6的形義關系基本一致,兩者可以合并。
把“評價動詞與評價對象配對構式類型及特征”理論研究的結果,用機器可讀的形式語言進行表示,就形成了“評價動詞與評價對象智能配對規則簇”(見表1)。規則使用的詞性標記符號及其含義參見《中國傳媒大學分詞標注系統(CUCBst)詞性標記集》(共76個標記),語義標記符號(共11個)及其含義具體如下:hzv——后指評價動詞、qzv——前指評價動詞、bdc——被動詞、byc——必要詞、rr——人稱代詞、jyc——建議詞、uv——助動詞、zsv——致使動詞、QSB——評價起始標記、JSB——評價結束標記、NP——名詞性詞語。規則按照先特殊后一般的順序排列,即限定條件多的特殊評價構式與邊緣評價構式在前,限定條件少的一般評價構式在后,以獲得最佳匹配效果。
我們把11種語義標記符號及具體詞語添加到用Python語言編程研發的評價分析系統CUCsas2.0的語義詞典,把表1中的12條評價構式規則簇添加到CUCsas2.0的評價對象抽取規則庫,期望能夠提升系統對評價動詞評價對象的抽取準確率和召回率。

表1 評價動詞與評價對象智能配對規則簇Table 1 Rules cluster of intelligent pairing between opinion verbs and opinion targets
CUCsas2.0系統運行的完整流程如下:①加載語料→②調用分詞詞典和分詞規則對語料作分詞及詞性標注→③調用評價詞典和語義詞典對語料作情感和語義標注→④調用短語和句子情感計算規則庫對分詞標注語料作情感值計算→⑤調用評價對象規則庫抽取評價句中的評價對象。
上述流程可簡要概括為加載語料→分詞標注與情感計算→抽取評價對象三大步,我們以例(43)具體說明CUCsas2.0系統的語料處理過程。
(43)多國使節對中國全國人大完善香港選舉制度表示支持。(新華網2021/03/06)
第一步:加載語料。把句子“多國使節對中國全國人大完善香港選舉制度表示支持。”加載至評價分析系統CUCsas2.0;
第二步:分詞標注與情感計算。系統調用分詞詞典Lexicons和分詞規則MODIRULE對語料進行分詞及詞性標注,調用評價詞典UsrDic0和語義詞典UsrDic1對語料進行褒貶情感和語義特征標注,調用短語和句子情感計算規則庫PhraseRule對語料進行情感值計算。語料分詞標注與情感計算結果為:多/m國/n使節/n對/p中國全國人大/nt完善/v&po&qzv(0.625)香港/ns選舉/v制度/n表示/v支持/v&po&hzv(0.25)。/w ;
第三步:抽取評價對象。系統調用評價對象抽取規則庫匹配經分詞標注與情感計算后的語料,抽取語料中的評價對象。例(43)滿足規則庫中“評價動詞與評價對象智能配對規則簇”中第5條規則“對|對于|向/p+#+*/v|d|u+*/hzv=N2”左部的匹配條件——N1:對/p N2:中國全國人大/nt完善/v&po&qzv(0.625)香港/ns選舉/v制度/n N3:表示/v N4:支持/v&po&hzv(0.25),系統自動抽取規則左部的第2項(N2)作為評價對象,并賦予其褒義(POS)的情感極性——“中國全國人大完善香港選舉制度(POS)”。
為了檢驗上述研究所得12條“評價動詞與評價對象智能配對規則簇”的信度與效度,檢驗系統相較于基準系統(Baseline)的性能變化情況,我們開展了下面3項實驗。
實驗一(信度測試):我們仍然以《現代漢語常用詞表》中10個最高頻的評價動詞“支持、反對、批評、促進、值得、破壞、滿意、犯罪、改善、感謝”為檢索詞,從2021年3月20日至2021年3月30日的百度資訊——新聞網站中檢索出500個評價句(每詞50句)作為測試語料,實驗檢驗基于500句樣本語料為10個樣本評價動詞撰寫的評價對象抽取規則,是否適用于這10個樣本評價動詞所出現的其他語料。
實驗二(效度測試):我們以《現代漢語常用詞表》中詞頻排名第11—第20的10個評價動詞“改進、犧牲、違法、信任、愛國、損害、危害、優化、適合、奉獻”為檢索詞,從2021年3月20日至2021年3月30日的百度資訊——新聞網站中檢索出500個評價句(每詞50句)作為測試語料,實驗檢驗基于詞頻排名第1—第10的樣本評價動詞的使用情況撰寫的評價對象抽取規則,是否適用于其他評價動詞。
實驗三(Baseline):我們以基于后指動詞、前指動詞語義分類和淺層句法分析的評價對象抽取系統CUCsas1.0(第二屆自然語言處理與中文計算會議“中文微博觀點要素抽取”評測第一名[14])為基準系統,以實驗一和實驗二的1 000個評價句為實驗語料,對比檢驗系統性能的變化情況。
以國際普遍采用的準確率(P)、召回率(R)和F1值為評價指標,實驗結果如表2所示。

表2 評價動詞與評價對象智能配對規則簇信度與效度測驗Table 2 Reliability and validity test of intelligent pairing rules cluster between opinion verbs and opinion targets
實驗結果表明:本文基于“評價動詞與評價對象配對構式類型及特征”本體研究,構建的CUCsas2.0“評價動詞與評價對象智能配對規則簇”的信度與效度達到80%左右,規則基本吻合語言規律,具有較強的泛化能力。與Baseline相比較,新系統的準確率和召回率均有顯著提升,F1值提高約13個百分點,證明基于評價構式本體研究所得語義特征和構式規則對推進評價對象智能計算工程有明顯幫助。
分析系統評價對象抽取錯誤和未召回的語料,主要有以下3點原因:
第一,難以找出形式標記。
(44)部分西方媒體對真相視而不見、見而不報,華春瑩點名批評:要有良心!(《中國青年報》2021/03/30)
(45)中消協回應“H&M事件”:損害消費者合法權益。(騰訊網2021/03/25)
(46)為感謝追回被盜手機,恩師給民警學生送錦旗。(澎湃新聞2021/03/30)
例(44)—例(46)中評價動詞“批評”“損害”“感謝”的評價對象分別為前句主語“部分西方媒體”、前句賓語中的定語“H&M”、后句介詞賓語“民警學生”,計算機目前缺乏判斷的形式依據。
第二,缺少對實義動詞的詞義分類研究。
(47)熬夜的危害比你想象還要大!(網易網2021/03/23)
例(47)中評價動詞“危害”的評價對象是前面的定語“熬夜”(動詞),但規則9“*/NP+的/u+*/qzv=N2”把定語限定為名詞性詞語,沒有考慮到有些實義動詞也可充當定語評價對象。哪些實義動詞可以充當評價對象,哪些實義動詞不能充當評價對象,兩者的區別特征是什么,尚待研究。
第三,難以辨析“同形異構”評價構式。
(48)作為一種新型的持久性污染物,PFAS對·于人體的危害越來越令人擔憂。(澎湃新聞2021/03/23)
“同形異構”評價構式指一種評價構式形式具有兩種或兩種以上的潛在結構意義。例(48)“A+對于+B+的+危害”這一構式的評價對象有A或B兩種可能,目前匹配的是規則9“*/NP+的/u+*/qzv=N2”,抽取定語B“人體”為評價對象,但正確評價對象是主語A“PFAS”。“同形異構”評價構式的辨析方法有待研究。
評價對象抽取是一項語言學與計算機科學交叉融合的語義計算工程,需要數據、算力和算法“三駕馬車”共同驅動。當前漢語評價對象抽取的算力已經不成問題,算法方面也已經做了大量研究,各種統計方法和機器學習模型(包括基于深度學習的神經網絡模型)均有所應用,但是評價對象抽取的效果還遠未達到令用戶滿意的程度,其“癥結”在于缺乏對語言本體的深入研究,缺少“數據”這輛馬車的有力基礎支撐。評價對象抽取這項細粒度的語義計算任務要想取得實質性進展,需要改變“重計算、輕本體”的偏頗現狀,加強對語言本體的深入研究,盡快從構建評價詞典的基礎詞匯層研究,轉向以“評價構式”為核心的詞匯—句法—語義融合機制研究。
漢語評價構式大致分為評價動詞構式、評價名詞構式、評價形容詞構式、評價副詞構式4種基本類型。本文以評價動詞構式為研究對象,選取《現代漢語常用詞表》中使用頻率最高的10大評價動詞作為樣本詞,以小規模的媒體新聞報道語料為樣本語料,對后指評價動詞與受事評價對象配對構式、前指評價動詞與施事評價對象配對構式進行了分類研究,共歸納概括出13種評價動詞構式,并且精準找出了識別每一種評價構式的特征標記,建立了較為完善的評價動詞構式體系,并轉化為機器可讀的形式語言,構建起評價動詞與評價對象智能配對規則簇。實驗結果表明,規則簇具有較高的準確率和召回率,F1值可以達到80%左右(比基準系統提升約13%)。論文基于小規模語料,初步探索了構式語法為人工智能服務的可行性,提供了構式語法與情感智能計算相結合的研究思路和研究案例,我們下一步將基于更大規模的語料開展實驗,修正、補充和完善評價動詞構式理論體系和規則簇;同時,對另外3類評價詞與評價對象的配對規律展開研究,最終建立全面系統的漢語評價構式知識體系。