999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于概念層次網絡的越南語名詞短語內部結構研究

2019-11-07 09:50:16王聞慧
現代語文 2019年7期

王聞慧

摘 要:名詞短語是構成句子的重要語言單位,其復雜性、歧義性的特點對計算機處理語言造成了很大困擾。運用概念層次網絡(Hierarchical Network of Concepts)理論分析越南語名詞短語內部構成,并結合語義塊知識對越南語名詞性語義塊進行探討,可以發現,越南語名詞性語義塊有五種組成模式。對越南語名詞短語進行形式化描述,可以為越南語自然語言的計算機處理提供新的視角。

關鍵詞:概念層次網絡;越南語;名詞性語義塊;內部結構

名詞短語,是自然語言句子中數量最多、比重最大、內部結構最為復雜的語言單元,它所承擔的句法功能比其他類型短語更為多樣。目前對名詞短語的研究已有不少,大多是從傳統句法層面(詹衛東,2000;張孝榮,2010;錢小飛等,2017)、DP假說理論(肖紅,2005;周君,2014;李亞非,2015)等方面進行探討,但隨之而來的歧義問題卻難以解決。概念層次網絡(Hierarchical Network of Concepts,簡稱HNC)是一種將自然語言映射到概念空間的理論體系。它通過模擬人類大腦對自然語言理解的脈絡聯想過程,使計算機在消解語言歧義方面有所提高。HNC具有多個概念節點,能將隱性知識顯性化地用符號系統來表示,有利于計算機理解自然語言。

在概念層次網絡中,短語則對應于語義塊這一概念,語義塊作為句子的下一級語義構成單位,是構成句類的函數(苗傳江,2015:54),它在句類中充當十分重要的角色。例如,可以通過語義塊的個數和順序、特征語義塊(EK)的類型來判斷該句所屬類型。從服務于語言信息處理的角度出發,無論是何種自然語言理解任務都需要對句子進行詞匯分析、句法分析以及語義理解。HNC理論通過對語義塊的分析,得到相應的句類信息,直接從詞形上升到詞匯意義概念層面,省略了從詞形到“實物”的對應過程。

根據語義塊承載語義信息的重要程度,HNC理論將其分為主語義塊(即句子的中心主干成分)與輔語義塊(即可選的輔助性成分)。本文主要是對主語義塊中作名詞性成分的名詞性語義塊進行探討,在此基礎上對名詞性語義塊的內部構成進行分析總結。本文第一部分對HNC語義塊的相關知識進行簡要介紹;第二部分從短語結構語法層面,對越南語名詞短語的內部結構進行梳理;第三部分主要對越南語名詞性語義塊進行分類研究。

一、基于HNC理論的語義塊知識

在HNC理論的基礎上,所有自然語言句子均可以用語義塊的排列組合來表示。例如,在轉移句中分別存在轉移動作發出者TA、轉移T、轉移接收者TB以及轉移的內容TC,其句類表達式為:TJ=TA+T+TB+TC。由此可以看出,句子是由語義塊組合構成的。語義塊可以由一個單獨的詞、一個短語、一個句子來構成。HNC理論將主語義塊分為A(作用者)、B(對象)、C(內容)、E(特征)四大類,其中,A、B、C統稱為廣義對象語義塊(JK),而E因決定句類則被稱之為特征語義塊(EK)。A與B被統稱為句子說明的對象,并依據動作的主動性程度進行區分判定;EK常常由謂詞性成分來擔任,如喜歡、送給、打等。從這四類主語義塊各自特點來看,名詞性語義塊通常作廣義對象語義塊(JK),在個別情況下也可以充當特征語義塊。

與傳統語言學將短語劃分為中心成分與修飾成分不同,HNC認為,在語義塊中包含著核心部分與說明部分。例如,在“張先生喜歡李小姐的個性”一句中,對“李小姐的個性”這一名詞短語,傳統短語結構語言學將“個性”視作中心成分,“李小姐的”則充當限定性成分。而在HNC理論則不同,“李小姐”與“個性”是反應引發者及其表現,“李小姐”與“張先生”之間有直接引發關系,所以“李小姐”是語義塊的核心成分。“張先生喜歡李小姐的妹妹”與上句句法結構完全相同,但“李小姐”和“妹妹”并不是反應句的引發者及其表現,而是作為一個整體充當反應引發者,因此,“妹妹”是語義塊的核心部分,“李小姐”只是語義塊的說明部分。

眾所周知,語言的復雜性特征使得計算機在分析處理自然語言時困難重重,HNC理論可以對語言中的歧義、模糊現象進行理解和分析,并在中文自然語言處理中得到成功應用。這主要體現在以下方面:

一是語言具有嵌套性,在理論上可以無限嵌套進行下去。如“張先生喜歡李小姐”“張先生喜歡貌美的李小姐”“張先生喜歡貌美的李小姐的氣質”等。HNC將這一現象解釋為廣義對象語義塊的B-C分解(對象和內容的分解),只要計算機識別出來語義塊的邊界,就可以將無論嵌套多長的語義塊提取出來,有利于更進一步的句法分析與語義理解。

二是語序具有靈活性,它直接表現為一個意思可以由若干種句式來表達。如“張三打斷了李四的腿”“李四的腿被張三打斷了”“李四被張三打斷了腿”,這三種句式雖然不同,但表達的意思完全相同。前兩句分別是作用句的基本格式與規范格式(HNC理論中對應為!12代碼)。第三句通常情況下被認為有四個組成部分,即“李四”“張三”“打斷了”“腿”。但HNC仍將它視為是三主塊句規范格式,其中,“李四”與“腿”之間發生了廣義對象語義塊的分離現象,它們本是一個語義塊單位。

三是句子作語義塊的情況,這是語義塊復雜構成的特殊形式,在HNC中稱之為句蛻與塊擴。句蛻指的是由句子蛻變成語義塊或者是其中一部分,包括原型句蛻和要素句蛻兩類。其中,原型句蛻就是句子不經變化直接當作語義塊使用。要素句蛻又包括JK要素句蛻和EK要素句蛻兩類,主要區別在于突出的核心成分是JK還是EK。在句蛻的基礎上加入其他成分就構成了包裝句蛻。例如,“老師知道張三打斷了李四的腿這件事”就是原型包裝句蛻,“老師不相信打斷了李四的張三的謊話”就是JK要素包裝句蛻。塊擴這一概念,顧名思義,可以理解為語義塊擴展為一個句子的情況,但這種情況是有選擇性的,并不適用于所有語義塊。在信息轉移句中,JK3常常用來表示信息轉移的內容,如“我告訴他今天我要去北京參加會議”中,“今天我要去北京參加會議”是轉移句的JK3語義塊。傳統上將這類句子稱為復句,“今天我要去北京參加會議”是其中的分句,而HNC理論將它解釋為信息轉移句的JK3塊擴成一個句子。

第一類與第二類雖然都是語義塊內部結構的循環模式,但在根本上有很大不同。第一類側重于說明部分的嵌套迭代,第二類是語義塊分解的特殊情況。這兩類都能說明語言的層次性與非線性特點,HNC對它們的理解也更加直觀與全面。

(三)含句蛻現象的名詞性語義塊

在越南語中,常存在“N+V+N”的歧義現象,該詞性組合序列既可以表示一句話,也可以是一個短語,其中,“V+N”作定語修飾前面的中心詞。在傳統語法中,往往將“V+N”結構作定語的情況,解釋為省略介詞“ma?”的特殊形式。這類“句子型”的名詞性語義塊結構復雜,在HNC理論中,則將它解釋為語義塊的句蛻現象。可以說,正是由于越南語定語后置的特殊性,使得本是要素句蛻的表達同原型句蛻的完全相同。如:“các ho?t_??ng tr?_giúp ng??i tàn_t?t(幫助殘疾人的各項活動)”,該句子是“各項活動幫助殘疾人”的JK要素句蛻,正是由于越南語定語后置的特點,導致這兩句話譯成越南語時句子完全一樣。計算機在處理這類歧義現象時,很難弄清楚該類表達到底是表主謂賓的句子成分還是短語成分,而HNC就給出了消解歧義的方法,即通過對句類中語義塊的切分進而做出有效判斷。在越南語中,除了語義塊全部成分的句蛻,還存在語義塊內部部分結構的句蛻。如:“nhi?m v? ki?m_tra,??n ??c các B?,ngành,??a_ph??ng(檢查督促各部、各界、各地方的任務)”,它與上個例子在句法結構上完全相同,但上個例子中的“各項活動”可充當句子的主語,也就是JK1;而此例中,“nhi?m v?(任務)”后面的動詞短語(動賓結構)作定語。從語義限制的角度來看,“nhi?m v?(任務)”就不能作“ki?m_tra , ??n ??c(檢查、督促)”等特征語義塊的JK1成分,該類動詞的主語應當由pp類(HNC概念節點中的“人”)概念來充當。在此例中,可以理解為“ki?m_tra,??n ??c các B?,ngành,??a_ph??ng(檢查督促各部、各界、各地方)”語義塊的說明部分所產生的省略主語形式(!3)格式句蛻。總的來看,第三類中含句蛻現象的情況包含了整個語義塊句蛻與部分成分句蛻兩種情況。

(四)含“cu?a”的名詞性語義塊核心成分區分

“cu?a”結構在越南語中的重要程度如同漢語中的“的”字結構,通常用來表示領屬,該結構在名詞短語中使用非常頻繁,同時它也是形成越南語定語復雜性的重要原因。一般來說,領屬范疇包含了范圍領屬(如“B??c Kinh cu?a Trung Qu??c”中國的北京)、處所范疇(“s?n v??n ???ng cu?a ho?c viê?n”學校的運動場)、領有范疇(“cu??n sa?ch cu?a t?i”我的書)、親屬范疇(“me? cu?a chi? ??y”她的媽媽)、附屬領屬(“m??t cu?a anh ??y”他的眼睛)、整體部分領屬(“tu?i cu?a a?o”衣服的口袋)、本體屬性領屬(“ca?i khi? ch??t cu?a chi? ??y”她的氣質)、本體特征領屬(“di?ch bê?nh cu?a con cho?”狗的病)(沈陽,1995)。在HNC中,“cu?a”結構既可以用來表示C(內容),也可以用來表示B(對象)與C(內容)的融合。當表示后者時,名詞性語義塊的核心成分往往與短語結構語法所定義的中心成分有所差別。如上文提到的“?ng Tr??ng thi?ch em ga?i cu?a c? Ly?(張先生喜歡李小姐的妹妹)”與“?ng Tr??ng thi?ch ca?i khi? ch??t cu?a c? Ly?(張先生喜歡李小姐的氣質)”,“em ga?i cu?a c? Ly?(李小姐的妹妹)”與“ca?i khi? ch??t cu?a c? Ly?(李小姐的氣質)”短語結構雖然相同,但前者的核心成分是cu?a 之前的“em ga?i(妹妹)”,而后者語義塊的核心成分是“c? Ly?(李小姐)”,處于cu?a結構之后。從越南語含“cu?a”名詞性語義塊的領屬性關系來看,表示本體特征屬性的“cu?a”字結構核心成分通常位于后面,其他類型領屬關系核心成分位于“cu?a”字之前。因此,“cu?a”字結構到底偏重于前部還是后部,HNC理論可以通過對概念層面的合理解析,得到語義塊的核心成分,有利于機器在處理復雜長難句時,對句子主干的正確把握。

(五)名詞短語中介詞修飾成分輔語義塊化

除了第四類中“cu?a”字結構作復雜定語之外,越南語中還存在著諸多介詞短語做定語的情況,如引出內容的“vê?……”結構、表示時間空間的“trong/va?o……”結構、表示目的的“?ê?/nh??m……”結構、表示結果的“cho……”結構等。句子除了由主語義塊構成外,還存在具有輔助性意義的輔語義塊成分,用以表示手段、工具、途徑、比照、條件、起因、目的等,對應于一般而言的介詞短語。因此,短語結構中的介詞短語做后置定語的情況,在HNC中則可被視作是輔語義塊的表示形式。例如:

(1)Ch?_th? v? t?ng_c??ng c?ng_tác qu?n_l?,ch?_??o nh?m thúc_??y s? ra_??i,phát_tri?n c?a các b?o_tàng và s?u_t?p t?_nh?n.(有關加強管理與指導工作的指示,旨在促進寶藏與私人藏品的誕生與發展。)

(2)L??i di chu?c vê? viê?c riêng.(個人遺囑)

(3)B??u kh?ng khi? gia ?i?nh ?oa?n tu? êm ?ê?m trên ki?nh d???i nh???ng tr???c nh??ng ba?n th?? ph??t.(供桌前洋溢著敬上愛下溫馨和諧的家庭團聚氣氛)

上述用例都是結構復雜的名詞性語義塊,其中,包含了“vê?”內容說明、“nh?m”目的限制、“c?a”領屬成分等介詞短語充當定語的情況。根據越南語語法書(Nguy?n Tài C?n,1997)的看法,這些語義塊是整體作為一個名詞短語,但根據HNC理論的觀點,“vê?”“nh?m”等介詞結構是句子的輔語義塊,由此來降低語義塊內部的構成復雜性。計算機可以通過“分而治之”的方法,先采取將輔語塊去除的方式,找出語義塊邊界;再根據輔語義塊的限定對象,對語義塊甚至是句類做進一步分析,以此來降低語義塊分析解剖的難度。

綜上所述,筆者根據越南語語言特點、名詞短語結構以及HNC理論,對越南語名詞性語義塊進行了分類研究。從本文的論述可以看出,對結構復雜的名詞短語而言,HNC理論在分析語義塊時更為清晰,便于機器的理解,同時也為自然語言處理后續更高層次任務的開展奠定了基礎。HNC理論在漢語中已經形式化,并產生了很多成功應用的案例,但不同語言之間會存在一定的差異性,如何針對不同語言的特點,使HNC理論得到更為切實、更為有效的應用,則是今后將面臨的關鍵問題。由于HNC理論是一個關于自然語言理解處理的理論體系,是一套形式化的符號基元系統,而真正做到讓計算機處理、理解語言是具體的工程性問題,如何將理論落地,在技術應用層面實現語言智能,也是一項十分艱辛的任務。具體到本文討論的問題而言,就是在HNC理論指導下,如何找到語義塊邊界并將相關句類界定清楚。語言現象再復雜多變也總歸是有規律可循的,HNC為我們提供了從概念空間層面理解語言的思路,我們也希望這一理論在今后會有更大的發展與突破。

參考文獻:

[1]Nguy?n Tài C?n. Ng? pháp ti?ng Vi?t[M].Ti?ng-T? ghép-?o?n ng?,NXB ?H và THCN,1997.

[2]Cheng,L.& R.Sybesma.Bare and not-so-bare nouns and the structure of NP[J].Linguistic Inquiry,1999,(4).

[3]詹衛東.面向中文信息處理的現代漢語短語結構規則研究[M].北京:清華大學出版社,南寧:廣西科學技術出版社,2000.

[4]錢小飛,侯敏.漢語最長名詞短語的結構復雜性研究[J].語料庫語言學,2017,(1).

[5]張孝榮.名詞短語的內部結構及其句法實現[J].安徽師范大學學報(人文社會科學版),2010,(4).

[6]周君.也談英漢名詞短語的句法層級結構[J].外國語(上海外國語大學學報),2014,(5).

[7]肖紅.越南語名詞短語的內部結構[D].湖南大學碩士學位論文,2005.

[8]李亞非.也談漢語名詞短語的內部結構[J].中國語文, 2015,(2).

[9]苗傳江.HNC(概念層次網絡)理論導論[M].北京:清華大學出版社,2005.

[10]林麗.面向信息處理的越南語主謂謂語句句式轉換研究[J].解放軍外國語學院學報,2013,(5).

[11]譚志詞,徐方宇,林麗.基礎越南語(3)[M].北京:世界圖書出版公司,2013.

[12]沈陽.領屬范疇及領屬性名詞短語的句法作用[J].北京大學學報(哲學社會科學版),1995,(5).

主站蜘蛛池模板: 在线免费不卡视频| 蜜臀AVWWW国产天堂| 亚洲男人的天堂在线| 欧美第二区| 免费国产一级 片内射老| 黄色网页在线观看| 亚洲av无码久久无遮挡| 2021无码专区人妻系列日韩| 久草视频精品| 欧美亚洲另类在线观看| 99九九成人免费视频精品| 美女免费黄网站| 无码高潮喷水专区久久| 国产精品久久久久久久久kt| 乱系列中文字幕在线视频| 国国产a国产片免费麻豆| 久久精品视频亚洲| 久久人人爽人人爽人人片aV东京热| 超清无码一区二区三区| 青草精品视频| 在线综合亚洲欧美网站| 亚洲首页在线观看| 蜜桃视频一区二区| 亚洲人成网站色7777| 91福利一区二区三区| 国产色婷婷| 亚洲欧美人成电影在线观看| 久久免费视频6| 激情视频综合网| 看国产毛片| 国产成人精品一区二区三在线观看| 亚洲男人天堂网址| 这里只有精品国产| av在线人妻熟妇| 亚洲精品国偷自产在线91正片| 国产超薄肉色丝袜网站| 深夜福利视频一区二区| 熟妇无码人妻| av一区二区三区在线观看| 国产69囗曝护士吞精在线视频| 福利国产微拍广场一区视频在线 | 亚洲第一成年人网站| 区国产精品搜索视频| 国产青榴视频| 国内精品视频区在线2021| 在线观看网站国产| 亚洲一级毛片在线观| 自拍中文字幕| 欧美亚洲另类在线观看| 综合色区亚洲熟妇在线| 欧美综合区自拍亚洲综合绿色 | 国产美女在线观看| 欧美成人aⅴ| 第一页亚洲| 国产va视频| 老司机久久99久久精品播放| 国产精品尤物在线| 凹凸精品免费精品视频| 香蕉蕉亚亚洲aav综合| 91免费国产在线观看尤物| 亚洲伊人天堂| 免费在线不卡视频| 国产精欧美一区二区三区| 国产在线拍偷自揄观看视频网站| 国产婬乱a一级毛片多女| 中文字幕无码电影| 国产成人精品视频一区视频二区| 99热国产这里只有精品无卡顿"| 日韩成人在线网站| 亚洲国产欧美自拍| 狠狠ⅴ日韩v欧美v天堂| 亚洲一区二区三区麻豆| 中文字幕首页系列人妻| 99无码熟妇丰满人妻啪啪| 亚洲精品老司机| 色网站免费在线观看| 国产 在线视频无码| 免费人成网站在线观看欧美| 亚洲av日韩av制服丝袜| 天堂亚洲网| 青青操视频在线| 亚洲日韩在线满18点击进入|