




【摘要】文章對《現代漢語規范詞典》中127個高頻形容詞的釋義項進行統計分析,研究發現常見形容詞釋義模型特征為“實體一特征一值”,提出將此模型應用于編撰對外漢語形容詞同義詞、反義詞電子詞典。該研究對于電子詞典自動轉換具有重要指導意義,并可以推廣到其他語言類詞典的自動轉換制作。
【關鍵詞】現代漢語形容詞;概念語義模型;電子詞典編纂
【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009—8097(2012)06-0062-03
一 現代漢語形容詞的常見釋義方法
在《現代漢語規范詞典》中,一共收錄了2,000多個形容詞。參考《現代漢語語法信息詞典》,從中選擇了如下127個高頻單音節形容詞作為考察對象:
從總體上說,《現代漢語規范詞典》采用的釋義體系是按意義的引申脈絡安排義項,即第一個義項為本義,其余為引申義。從詞源學的角度來說,本義是詞的起始義項。然而,該義項并沒有廢棄,而是處于經常的使用之中。
對上述127個形容詞的釋義項進行考察,發現一種常見的釋義方式是:同義詞、反義詞加特征。此處,同義詞和反義詞也是高頻形容詞。而特征指的是釋義項和被釋義項共同的語境限制語(一般通過圓括號引入),其作用是解釋兩個詞語在哪些方面相同或者相異。例如,“大”的一個義項為:(在面積、體積、容量、數量、年齡、力量、程度、重要性方面)超過通常的情況或特定的比較對象(跟‘小’相對)。其中,“小”是“大”的反義詞,而“面積”、“體積”等是其特征。
具體統計結果如下:
1)在127個形容詞中,有69個形容詞的本義中既有同義詞或反義詞,也有特征;
2)31個形容詞的本義中只有同義詞或反義詞,而7個形容詞的義項中只有特征;
3)在20個形容詞的本義中,既沒有出現同義詞、反義詞,也沒有出現特征。
通過進一步考察,發現部分形容詞的引申義中采用了同義詞或反義詞加特征的釋義方法:或本身作為同義詞或反義詞在其他高頻形容詞的釋義項中出現。二現代漢語形容詞概念語義模型的建構
在認知科學的研究中,“特征,值”結構(attribute-valuesystem,簡稱AVS)是一種常見的表征形容詞語義的理論框架:名詞概念分解為一組特征(attributes),形容詞則處理為特征的值(values)。以smith的選擇性修飾模型為例(如圖1):
在此圖中,最上層為“蘋果”這個簡單概念。中間層為該概念所具有的一些特征——“顏色”、“形狀”和“質感”等等。最下層為特征的值。例如,“形狀”可以進一步分為“圓的”、“方的”、“圓柱形的”。
基于AVS的理論框架,我們可以建立現代漢語形容詞的概念語義模型。在圖2中,形容詞及其同義詞和反義詞都處理為特征的值。
其中,E為實體,表征名詞概念;A1、A2表征不同的特征;v2和v1、v3分別是形容詞及其同義詞或反義詞。與以往的一些形容詞概念語義模型相比(例如Blutner的聯結主義選擇性修飾模型),該模型的一個創新點是一個值可以與多個特征相聯結,從而有效地表征了形容詞本身的多義性。
三 現代漢語形容詞概念語義模型的自動抽取
對于一個具體的形容詞而言,其同義詞、反義詞和特征是不完全相同的。由于手工建立每個形容詞的概念語義模型費時費力,有必要考慮采用自然語言處理中的技術進行自動抽取。
目前,我們主要采用模板抽取的方法,從機讀詞典中自動地抽取形容詞的概念語義模型。基本步驟如圖3所示:
形容詞的概念特征需要從釋義項中提取,因此需要對其進行預處理。本文采用了上海交大計算機系計算語言學實驗室開發的切分標注系統SEGPOS,對釋義項進行了分詞處理。同時,進行了初步的句法分析:采用淺層句法分析的方法,從釋義項中抽取名詞短語、動詞短語等句法成分。
以127個高頻形容詞作為訓練集,對一部分詞條的釋義進行了標注,在此基礎上生成一些抽取模板。與此同時,手工從中抽取概念特征或屬性,以之作為機器自動獲取的樣例(見表1)。
然后,將所抽取的模板用于概念特征的自動抽取。基本思路是:主要采用定義形式自動機的方法,對人工標注完成的形容詞訓練集進行分析。抽取的模板被看做是由項所組成的有序序列,每個項對應于一個詞或者詞組。
以模板“形容……一樣”為例,可以根據它的特點概括為一個模式:
P=prep+(noun|attr|adj.attr)+adv
用有限自動機的方式可以表示為:
將這個自動機轉換成如下正則表達式,機器就可以進行分析并進行模板的自動抽取:
Pattern=prep(adj|n)’adv
實驗結果表明:在進行特征抽取的時候,采用模式匹配法的準確率高達93.12%,優于詞頻分析法和最大公共子串分析法。
采用同樣的方法,可以開展形容詞同義詞和反義詞的自動抽取。常見的同義詞模板有“……而……”,反義詞模板有“跟……相對”、“不……”等等。采用這些模板也取得了令人滿意的效率。
四 在對外漢語電子詞典編纂中的應用
1 外向型學習詞典的釋義結構
從詞典學的角度來看,現代漢語形容詞概念語義模型可以作為一種外向型學習詞典的釋義結構。與傳統的文本內向詞典相比,它具有如下幾個方面的優勢:
(1)能夠清晰地區分同義詞的異同,提高學生的辨義能力。兩詞相同,是由于聯結了相同的特征和值,不同之處在于聯結了其他的特征或值;
(2)能夠簡便地區分詞典中收錄的形名組合是詞組還是復合詞,從而提高學生的搭配能力。如果某個實體(表征了名詞)可以與不同的值(表征了形容詞)相聯結,形名結構一般為詞組,否則很可能是復合詞;
(3)提供了詞匯查詢和概念查詢兩種途徑。通過特征,可以同時查到相關的形容詞和名詞。學生在書面表達中需要采用形名結構的時候,可以在一組相關的同義詞中挑選出合適的形容詞;
(4)通過進一步調整語義模型中的特征、值的數量以及出現次序,就能夠調整教學的進度和難度,從而滿足不同水平學習者的學習需求。
2 雙語學習詞典的釋義結構
現代漢語形容詞的概念語義模型是對英語中選擇性修飾模型、聯結主義選擇性修飾模型等AVS語義模型的繼承和發展,因此也能夠反過來表征英語中的形容詞概念語義。
《牛津英漢雙解實用詞典》(A.s.Homby)是一本在國內外具有廣泛影響力的詞典。通過不完全統計分析,發現其形容詞的釋義方式與《現代漢語規范詞典》高度相似。例如:
big adj.1 large,n size,extentorintensity…
red adj.2(a)of the very darkest colour,like coal 0r soot;opposite ofwhite,
在“big\"的釋義中,“large”是其同義詞,而“size”、“extent”和“intensi夠”是其特征。而“red”的反義詞為“white”,特征為“colour”。
因此,現代漢語形容詞的概念語義模型可以進行泛化,進一步表征英語形容詞的釋義項。從這個角度出發,可以清晰地揭示英、漢兩個同義形容詞在所聯結的同義詞、反義詞和特征等方面的細微差異。
五 結束語
在對外漢語教學中,詞典發揮了重要的作用。然而,目前所使用的一些詞典大多為內向詞典,主要用于本族語者的學習和工作需要。因此需要在此基礎上改編為學習詞典,尤其是雙語學習詞典,才能更好地滿足外國學習者需要。隨著對外漢語計算機輔助教學的發展,有必要進一步轉換為相應的電子詞典。
本文所提出的現代漢語概念語義模型是一種新型的學習詞典釋義結構。采用模板抽取技術,能夠將機讀版內向詞典,例如《現代漢語規范詞典》自動改編為一本形容詞同義詞、反義詞電子學習詞典。
由于該模型也能夠有效地表征英語形容詞的釋義項,可以進一步用于英語詞典的自動轉換,從而在此基礎上編纂出一部雙語形容詞同義詞、反義詞電子學習詞典。
編輯:李原