999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向中文信息處理的“N+V”結構的句法語義研究

2015-04-29 03:36:47劉安然
現代語文 2015年1期
關鍵詞:結構

摘 ?要:立足于面向計算機的語言本體研究,從切分語料中選擇數條N+V結構,從句法、語義和語用特征的角度探索該結構形成歧義的原因,找尋搭配兩個成分的搭配規則,并將之形式化,進而制定相應的機用識別策略,從而提升計算機對該結構進行分析的能力。

關鍵詞:中文信息處理 ?“N+V”結構 ?自動消歧

“N+V”格式是一種比較常見的同形異構結構,雖然表層形式簡潔,從層次劃分上不存在困難,但是內部可能存在不同的語法關系、語義關系。

一、“N+V”結構本體分析

(一)“N+V”結構的語法關系

本文所指“N+V”結構是指可以自足的、無其他成分或標記的合法語言單位,不包括“把N+V了”“N的V”等結構形式。根據馮志偉先生的潛在歧義理論,我們將這種結構底層存在的語法關系區分如下:

主謂關系,其中“N”作主語,“V”作謂語,二者之間是陳述與被陳述的關系,如:糧食豐收、媽媽做飯、小二黑結婚;

偏正關系,其中“N”為修飾語,“V”是中心語,如:口頭創作、直線上升、文藝演出、汽車制造、語言研究、核試驗;

既可以分析成主謂關系也可以分析成偏正關系,這種結構在沒有給定語境時會產生理解上的歧義,如:機器生產、專業人員培訓。

其中,前兩種屬于“格式真歧義短語”,它們具有相同的表層類型形式,但是對應著兩種句法功能結構,計算機在處理時不能判斷采取哪種句法結構,就會產生兩種結果,而這種歧義對人來說是不存在的;最后一種屬于“實例真歧義短語”,即實例化后產生的短語對應至少兩種句法結構,這種歧義對人和計算機都是存在的。

除此之外,由于已經給定短語格式,其中成分的詞類已經確定,不會作為結構歧義的產生原因;另一方面,只涉及兩個成分的“N+V”結構,詞與詞搭配時不會產生不同的結構層次,也就不會成為結構歧義的產生原因。

(二)“N+V”結構的語義、語用關系

“N”和“V”之間的語義關系不止一種,“N”既可以作為施事支配“V”,又可以作為“V”的受事受到“V”的支配,還可以作為狀語修飾“V”,當同一個結構能夠分析出不同關系時就會產生歧義。如“機器”既可以作為“生產”動作的對象,又可以作為“生產”動作的施行者,就會產生歧義。因此,我們可以認為,不及物動詞只能構成主謂結構和部分狀中結構,而不會產生歧義,只有“V”可以帶賓語并且能帶體詞性賓語時,才會反過來支配前面的“N”,才會產生理解上的區別。如“專業人員培訓”中的“培訓”是及物動詞,“專業人員”既可以作為狀語,表示“培訓”動作的執行者,又可以作為賓語,表示“培訓”動作的對象。

當進入結構的“N”和“V”之間構成動作與受事、對象關系時,有可能構成定中結構。當進入結構的“N”和“V”之間構成施事主體與動作關系時可能構成主謂結構。當這兩種關系同時存在時,就會構成歧義結構,這也是歧義格式中最常見的雙重歧義關系,還有一些歧義結構的語義關系比較特殊,如:西部開發(“N”既是客體又是地點)、每個人都給一本書(“N”既是主體又是與事)。而當這兩種關系都不存在時,“N”通常表示“V”的某種方式、手段,或是動作的時間、原因、范圍等,此時構成偏正結構中的另一種——狀中結構。

名詞性的“N+V”結構還具有一種特殊的語篇特征,即“N”失去話題性,不能被回指,而“V”失去謂詞性,得到指稱意義,有時可以被數量詞修飾,如:一項季度考核、一份會議記錄。據此,整個結構就產生指稱的語義效果,具有類別義和概念性的傾向,伴隨著“N”的改變,類別也會發生變化。

根據現有“N+V”結構的研究成果來看,學者們對定中式的研究比較多,其討論主要集中在此結構的性質、產生機制和限制條件方面。

對于進入定中結構的“N”的限制條件,李晉霞提出高生命度、高個體度的名詞不易進入;缺省賓語不能進入;區別性的下位名詞更易進入;概念信息非常具體的“N”不易進入。耿國鋒則提出語義抽象、泛化,分布上失去名詞形態特征的名詞比較容易進入,還有抽象名詞、集合名詞較容易進入。對于“V”的限制條件,馬真、陸儉明《“名詞+動詞”詞語串淺析》中提出四類排斥進入主謂結構的動詞:企圖類、成為類、“使”類和“著想”類;并提出進入偏正結構的動詞必須是名動詞。李晉霞則提出:強動作動詞、特征動詞、口語動詞、黏著動詞、不及物動詞不易進入,但可以舉出很多反例。耿國鋒提出,動作具有無界性的動詞、非完成性和非瞬時性的動詞、及物性降低的動詞比較容易進入,且進入后失去動詞的典型句法功能。但是,名詞性“N+V”結構處在不穩定的發展變化中,許多曾經排斥的情況已經有為數不少的用例,需要重新考慮相應的規則。

這些限制條件具有啟發價值,但其中某些概念比較模糊,有些對音節的限制幾乎只是現象描寫,還有一些從詞類角度總結的限制條件更是瑣碎而充滿例外,不適合直接作為計算機消歧的策略。

二、歧義成因與識別方法

計算機處理自然語言時,是以詞類標記序列為對象的,除了需要切分和了解各個詞的詞類、意義之外,還需要知道搭配規則與結果。根據馮志偉先生的潛在歧義理論,抽象的歧義格式所包含的歧義在代入具體成分時可能消除或保留。這里我們將“N+V”歧義格式分化為單義結構分別進行歧義成因和消解的討論。

(一)主謂結構

在主謂結構中,“N”擔任施事或感事,是動作行為的發出者或主體。參照知網的信息結構庫,我們將典型的主謂結構的模式總結為以下幾類:

N→V=[施事](個人名詞/團體名詞)→(事件,行動)

N→V=[施事](動物)→(事件,行動/狀態)

N→V=[感事](表人名詞/表物名詞)→(事件,關系/狀態)

通常來說,人或動物更容易發出動作,作為施事構成主謂結構,比較常見;而沒有生命的物體也可以進入這種結構,如:長江奔騰、工程竣工,它們可以作為動作的感事進入結構,所以我們可以制定這樣的規則,其中zwp表示主謂結構:

R1 ? ?IF N∈ V的主體語義類(即N的語義類為V的主體語義類或其子集)

AND V[+單獨作謂語]

THEN N+V≌zwp

END IF

此條件的實現方法在于建立以動詞為中心的詞匯網絡,針對動詞的每個論元關系建立詞庫,再作為外部調用。高生命度的名詞容易將N+V語符串通過心理加工構成主謂結構,當聽到這類名詞時聽眾容易產生“怎么樣?”的語義期待,這也是這類名詞不易構成偏正結構的原因。而“N”為人所共知的著名人物時,容易產生歧義,例如:魯迅研究。

“N+V”形式的獨立的主謂結構單獨成句時往往受到語義上的很大限制,通常只能用于祈使句、表示對比或在口語中提問與回答,比較容易識別。如:

你說。

——誰去? ? ——小明去。

我忘了,他記得。

(二)偏正結構

在偏正狀中結構中,“N”描述“V”具有的某種特性,往往表示非常態的情況。其中有一種是由“N”作狀語與某種不及物動詞共同構成的,如:直線上升、五點出發、火線入黨等,區分度比較明顯,可以制定這樣的規則,其中zzp表示狀中結構:

R2 ? ?IF V[+自身動作] or V [+趨向動詞]

AND N∈ V的主體語義類①

THEN N+V≌zzp

END IF

對于其他偏正狀中結構來說,語義具有如下幾種模式:

“N”表示范圍。這種模式中的“V”在語義上一定存在一個域外的施事論元,如:局部調整、全線出擊、側面打聽。

“N”表示時間、處所、方式、工具。這幾種模式都是狀語的常見用法,如:電話報名、網上繳費、鄉村支教。

這種名詞作為狀語直接修飾動詞的現象,簡潔便當且鮮明直觀,在古代漢語中就已經存在,如:風馳電掣、天翻地覆、灰飛煙滅等,在成語中仍有許多保留。另外,許多“N單+V單”的偏正結構已經被看作雙音節動詞收入了詞典,如“龜縮、云集、瓜分”等。這些詞數量有限且穩定封閉,用建立詞庫的方法進行標記就可以實現計算機對它們的自動識別。

在偏正定中結構中,“V”是中心語,具有動名兼類的性質,動詞性減弱,名詞性增強;“N”從自己的語義出發對“V”的類別進行限定,與“V”間是屬性關系。有些結構中的“V”本身就與相關意義的“N”同形,如:合唱指揮、語文測驗、學歷證明。有些結構中的“V”則是在語境中獲得名詞性,如:政策調整、干部提拔等,其中的“V”指的是“V”所代表的動作事件。定中結構作賓語時,前面的謂語往往是既可以帶體詞性賓語又可以帶謂詞性賓語的,如表示判斷、變化、心理態度等意義的動詞。

定中結構主要有如下幾種模式:

N→V = [受事](具體名詞)→(事件,行動)

其中“N”是“V”的賓語,可以進入“把”字結構,這種情況在所有偏正式結構中所占比例最大,如“身體檢查、日程安排、罪犯抓捕”。值得注意的是,“V”的缺省賓語一般不能構成這種結構,如“*學生教育”,因為“教育”的客體必然是學生,通常不這樣說,而“學生”的下位概念則比較容易進入。如:小學生教育。

N→V = [結果](具體名詞)→(事件,行動)

“N”的實體在“V”的影響下產生、改變或消失,可以用“出來”“成”檢驗。如:產品開發、服裝剪裁、文件起草。

這兩種結構中,“V”一般都是及物動詞,“N”是“V”的賓語,有相應的“N+V”格式。對于這兩種格式,我們制定這樣的規則,其中dzp表示定中結構:

R3 ? ?IF N∈ V的客體語義類②

AND V[+過程性]

THEN N+V≌dzp

END IF

其它結構還包括“N”表示對象、目的,有時還包括表示處所、方式、工具等,這些情況下一般沒有對應的“N+V”格式或變換后語義上發生改變。如:

對象:質量保證、會場布置、難民補助、社區服務

目的:會議籌備、主席選舉、毒品搜查

工具:糧食救濟、津貼補助、金錢獎勵

方式:網絡服務、行政干預、電話采訪

處所:西部開發、地下工作、異地就業

對于這些格式,我們制定這樣的規則:

R4 ? ?IF N∈ V的狀況語義類∪V的時空語義類∪V的目的語義類③

AND V[+過程性]

THEN N+V≌dzp

END IF

其中有些“N”的意義與狀中結構難以區分,有時狀中結構也能充當名詞性成分。為了對其進行區分,我們考慮這樣的情況:偏正結構都是向心結構,整體性質由中心詞的性質決定,狀語修飾謂詞而定語修飾體詞,定中結構中的“V”呈現出明顯的名詞化。齊滬揚在《偏正式“N+V”短語研究》一文中將偏正式“N+V”結構的名詞性和動詞性連續情況繪制如下圖④:

因此我們制定這樣的補充規則:

R5 ? 在句中作為謂語的一定是狀中結構,作為主語、賓語、定中結構中心語和定語的一定是定中結構。如:

記者電話采訪了張先生。(作謂語)

電話采訪是一種調查手段。(作主語)

張先生接受了電話采訪。(作賓語)

電話采訪的內容無可奉告。(作定語)

(三)歧義結構

上文所述皆是基于約束法的消歧策略,但是不管語料的規模多大也無法概括語言的全貌,這些規則是根據現有語料制定的,難免掛一漏萬。且有一種無法處理的情況,即:當“N”既屬于“V”的主體語義類又屬于“V”的客體語義類時構成歧義結構,無法以形式化的規則判斷。好在語言自有其整體性,各個部分間能夠相互影響,可以將其放到具體語境中,根據上下文信息,基于優選法,從若干備選語義中選擇最優方案。沒有上下文的、獨立成句的情況,上文已經討論過,一般都出現在對話中,也可以根據語境區分。例如,“理事會審查”原本是個歧義結構,但在下列語境中可以輕易區分:

XX公司的理事會審查工作已近尾聲。

理事會審查通過了這項提案。

對此,基于現有語料,我們提出幾個假設性質的規則:

R6 當句中出現了“V”的其他客體時,就可以認為這個“N+V”是主謂關系。例如:

在與中方新聞界交流、座談的過程中,非洲朋友介紹了各自國家的新聞體制及運作情況。

蒙古教官培訓阿富汗軍隊的費用大部分是由美國提供的。

雞吃了混合食物比牛更能轉化蛋白質。

R7 將“N+V”結構的左端記為Wi,若Wi-1為“由”“用”等介詞,則可以認為這個“N+V”是主謂關系。

這種情況已經不是前述的自足結構,“N”由介詞引入,語義上支配動詞。例如:

我是公司的法人代表,是由任局長任命的。

這些工具大部分仍然由手工業或工場手工業方式生產,然后才裝到由機器生產的工作機的機體上。

即將派往伊拉克的軍人是根據美格“訓練與裝備”計劃由美國教官培訓的。

通過對這兩個假設規則的分析,我們發現不能獨立成句、必須作為句子成分才能出現的“N+V”結構已經上升到句子層面的語言形式了,本文不再討論。

(本文得到國家“973”重大基礎理論研究項目子課題“語言計算模型與理論:面向網絡語言的句法和語義分析的理論模型[項目編號:2014CB340500]”的支持。)

本文寫作過程中得到南京大學文學院沈陽教授、鐘叡逸老師的具體指導;本文在解放軍外國語學院作報告時,李宗江教授提供了寶貴意見。特此致謝!

注釋:

①主體語義類包括:施事(agent)、當事(relevant)、感事

(experiencer)、領事(possessor)

②客體語義類包括:受事(patient)、內容(content)、結果

(resultevent)、致事(beneficiary)

③狀況語義類包括:方式(manner)、工具(instrument)、材料

(material)時空語義類包括:時間(time)、空間(location)

④轉引自:章婧.現代漢語定中N+V結構研究[D].北京,中國人民大

學,2008.

參考文獻:

[1]俞士汶.計算語言學概論[M].北京:商務印書館,2007.

[2]章婧.現代漢語定中N+V結構研究[D].北京:中國人民大學,

2008.

[3]馮志偉.論歧義結構的潛在性[J].中文信息學報,1995,(4):

14~24.

[4]李晉霞.定中“N賓+V”結構構成因素的考察[D].北京:教育部

語言文字應用研究所,2003.

[5]馬真,陸儉明.“名詞+動詞”詞語串淺析[J].中國語文,1996,

(3):183~188.

[6]耿國鋒.名詞性“N+V”短語分析[D].開封:河南大學,2008.

[7]詹衛東.面向中文信息處理的現代漢語短語結構規則研究[D].北

京:北京大學,1999.

[8]楊泉,馮志偉.面向中文信息處理的現代漢語“V+V”結構歧義

問題研究[J].語言文字應用,2005,(1):123~129.

[9]王錦,陳群秀.現代漢語語義資源用于短語歧義模式消歧研究

[J].中文信息學報,2007,(5):80~86.

[10]袁毓林.語義角色的精細等級及其在信息處理中的應用[J].中

文信息學報,2007,(4):10~20.

(劉安然 ?江蘇南京 南京大學文學院 ?210023)

猜你喜歡
結構
DNA結構的發現
《形而上學》△卷的結構和位置
哲學評論(2021年2期)2021-08-22 01:53:34
論結構
中華詩詞(2019年7期)2019-11-25 01:43:04
新型平衡塊結構的應用
模具制造(2019年3期)2019-06-06 02:10:54
循環結構謹防“死循環”
論《日出》的結構
縱向結構
縱向結構
我國社會結構的重建
人間(2015年21期)2015-03-11 15:23:21
創新治理結構促進中小企業持續成長
現代企業(2015年9期)2015-02-28 18:56:50
主站蜘蛛池模板: 日韩第九页| 国产精品福利导航| AV片亚洲国产男人的天堂| 美美女高清毛片视频免费观看| 青青青国产视频手机| 1769国产精品免费视频| 国产av无码日韩av无码网站| 亚洲一本大道在线| 国产午夜无码专区喷水| 999在线免费视频| 久久不卡精品| 国产a v无码专区亚洲av| 美女无遮挡拍拍拍免费视频| 日本不卡在线视频| 免费观看精品视频999| 亚洲国产精品VA在线看黑人| 日本高清免费不卡视频| 免费高清毛片| 亚洲成人一区二区三区| 一级黄色网站在线免费看| 久久亚洲日本不卡一区二区| 国产精品任我爽爆在线播放6080| 欧美日在线观看| 素人激情视频福利| 在线免费观看a视频| 欧美国产在线精品17p| 97亚洲色综久久精品| 91成人在线免费视频| 四虎永久免费地址| 91成人在线免费视频| 欧美亚洲国产日韩电影在线| 国产精品一区在线麻豆| 日本AⅤ精品一区二区三区日| 亚洲欧洲日韩综合| 67194亚洲无码| 91亚洲视频下载| 亚洲成a∧人片在线观看无码| 黄色三级网站免费| 香蕉久久国产超碰青草| 91精品国产一区自在线拍| 亚洲色大成网站www国产| 国产精品大白天新婚身材| 久久精品一卡日本电影| 国产综合精品一区二区| 国产在线视频二区| 日韩无码视频专区| 亚洲国产亚洲综合在线尤物| 日韩免费成人| 久久亚洲黄色视频| 日韩午夜片| 亚洲男人的天堂久久精品| 成年免费在线观看| 一本无码在线观看| 特级aaaaaaaaa毛片免费视频| 国产精品视频a| 久久久久人妻精品一区三寸蜜桃| 日本不卡视频在线| 精品色综合| 欧美色综合网站| 国产激情无码一区二区免费| 久久综合五月| 日韩精品欧美国产在线| 欧美在线导航| 久久综合色视频| 综合亚洲网| 亚洲精品黄| 热久久综合这里只有精品电影| 国精品91人妻无码一区二区三区| 久久毛片网| 777午夜精品电影免费看| a毛片在线免费观看| 中文字幕第4页| 亚洲日本www| 伊人久久福利中文字幕| 欧美成人aⅴ| 91无码人妻精品一区二区蜜桃| 91丝袜乱伦| 欧美性久久久久| 中文字幕在线观看日本| 91精品专区| 99久久免费精品特色大片| 亚洲精品桃花岛av在线|