999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

布拉格學派的功能生成描述理論

2019-11-07 09:50:16馮志偉周建
現代語文 2019年7期

馮志偉 周建

摘? 要:功能生成描述理論不但是布拉格學派在信息時代的繼續和發展,而且是少有的將理論和實踐完美地結合起來的語言學理論。通過著重介紹布拉格依存樹庫(PDT)和捷克語動詞配價詞表(Vallex),來探討功能生成描述理論在自然語言處理中的應用價值。布拉格依存樹庫采用三級標注體系,由詞匯層、形態層、句法層和語義層四個層級構成。捷克語動詞配價詞表內容豐富,信息量大,便于使用。布拉格依存樹庫和捷克語動詞配價詞表有助于驗證功能生成描述的理論主張,對自然語言處理也是大有用處的。

關鍵詞:功能生成描述;布拉格樹庫;動詞配價詞表

“功能生成描述”(Functional Generative Description,簡稱FGD)理論是由捷克語言學家斯加爾(Petr Sgall)等人創立的一種形式化的語言理論,它是布拉格功能主義語言觀在信息時代的反映。這種理論的目標,是從功能主義和語言生成的角度出發,使用形式化的方法來描述語言,具有強烈的方法論色彩,因此叫做“功能生成描述”。

這一理論的代表作是捷克布拉格查理士大學的斯加爾、哈吉科娃(Hajicová)和帕內沃娃(Jarmila Panevová)合著的The Meaning of the Sentence in Its Semantic and Pragmatic Aspects(《句子意義的語義及語用研究》,1986)以及斯加爾和哈吉科娃共同撰寫的論文Dependency Syntax in Functional Generative Descriptions(《功能生成描述中的依存句法》,2003)。限于篇幅,本文僅介紹了功能生成描述理論的部分內容,建議感興趣的讀者閱讀原文。

一、功能生成描述理論

功能生成描述理論是一種分層次、基于依存原則的語言學理論,同時也是一種源于自然語言處理(Natural Language Processing,簡稱NLP)實踐的語言學理論。因此,功能生成描述理論非常注重語言的形式化描述和計算機實現。

功能生成描述理論認為語言是一種層次性的功能結構,在語言意義和語音表達之間存在著如下五個層次:

·語義層

·表層句法層

·形位層

·音位層

·語音層

在功能生成描述理論中,語義層占有重要的地位。在語義層表示中,最重要的概念是基本依存結構(Basic Dependency Structure,簡稱BDS)?;疽来娼Y構是在詞表和表示依存關系種類的特征結構時所形成的字母表上的字符串。

功能生成理論的這種形式化描述是現代語言學理論所必要的。這樣的形式化描述,一方面發展了布拉格傳統的語言學理論,另一方面,也有助于該理論在自然語言處理領域的應用。

可以說,圍繞功能生成描述理論,布拉格的學者們不但構造了一系列的自然語言處理應用系統,也在像捷克語這樣的自由詞序語言的依存語法的形式化理論和計算機實現方面作了許多開拓性的工作。

白雪(2016)曾對功能生成理論作了較為系統地評介,并在配價的組織模式、層次上,將其與喬姆斯基(N.Chomsky)的最簡方案進行了比較。本文從自然語言處理的角度,著重對布拉格依存樹庫(PDT)和動詞配價詞表(Vallex)作進一步的補充,以饗讀者。

二、布拉格依存樹庫

布拉格依存樹庫(Prague Dependency Treebank①,簡稱PDT)是在功能生成描述理論基礎之上建立的,它是目前世界上規模最大的依存樹庫。布拉格依存樹庫是一個含有豐富的語言學信息的手工標注捷克語樹庫。它還有配套的樹庫查詢、標注和分析軟件,供使用者選用。

布拉格依存樹庫采用三級標注體系,除了形態層(morphological layer,簡稱m-layer)之外,其他的兩個層次分別為表層句法(analytical layer,簡稱a-layer)和深層句法(tectogrammatical layer,簡稱t-layer)。表層句法層相當于我們一般所說的句法層,深層句法相當于我們一般所說的語義層。除了這三個標注層之外,布拉格依存樹庫還將那些沒有標注的文本視為一個獨立的層級,叫做“詞匯層”(word layer,簡稱w-layer)。這樣,一個句子在依存樹庫中的標注就有了四個層級:即詞匯層、形態層、句法層和語義層。

布拉格依存樹庫中句子的標注及四個層級之間的聯系,如圖2所示:

圖2說明了捷克語句子“Byl by ?el dolesa”的標注情況?!癇yl by ?el dolesa”對應的逐詞英譯為:“He-was would went to forest(他想到森林中去)”。

在圖2中,從下至上的四個層級是:詞匯層(w-layer)、形態層(m-layer)、句法層(a-layer)和語義層(t-layer)。值得注意的是,原句詞匯層中所含的輸入錯誤“dolesa (to forest)”,在形態層得以恢復為正常的“do lesa”。

在形態層(m-layer)中,每一個詞的下面有兩行附加信息,其中的第一行為該詞的詞典形式(詞目),第二行標明了該詞在句中的形態特征。

除增加了一個全句的支配結點外,句法層(a-layer)中的結點和形態層中所出現的詞是對應的。在每個結點下面,標注該結點與其支配詞之間的依存關系類型。依存樹庫中的句法層與其他依存句法理論得到的分析樹基本相似,盡管這里沒有采用箭頭來標記詞間支配關系,我們還是可以很方便地從一個詞在句法結構樹中的上下位置來判斷該詞的地位。

語義層(t-layer)中的結點和輸入句子中的詞不是一一對應的,而且結點上的詞還使用了配價詞典中的形式標記。結點下面的標記表示該詞與其支配詞之間的語義關系,如:“ACT”表示“行動者”,“PRED”表示“謂詞”,“DIR3”表示“趨向”,等等。在語義層中,全部的單詞都是實詞,不再有介詞或其他虛詞的位置。從這個角度來說,可以把語義層視為句子中心詞的配價實例化之后的一種結果。由此可見,為了進行語義層的標注,配價詞典是必不可少的。

總的來說,功能生成描述理論實質上是一種多層級的依存語法理論,配價在這種理論中占有重要的地位。按照功能生成描述理論的創立者哈吉科娃和斯加爾(2003)的說法:“如果將依存視為一種基本關系,那么詞匯單元的句法特性就可以依據其可有或必有的從屬成分來進行描述,這種描述可包括詞匯組合的限制,它們與句子表層結構的關系等?!瓘V義的配價框架包含了所有的補足語和說明語,狹義的配價框架只考慮補足語和那些必有的說明語?!币虼?,在功能生成描述理論的初創時期,另一位創立者帕內沃娃(Jarmila Panevová)就在Prague Bulletin of Mathematical Linguistics(《布拉格數理語言學通訊》)發表了題為On verbal frames in functional generative description(《功能生成描述中的動詞框架》,1975)的長文,專門討論配價框架的問題。

三、捷克語動詞配價詞表

2008年發布的捷克語動詞配價詞表(The Valency Lexicon of Czech Verbs,簡稱Vallex),共收有6460個詞項,可能是目前最大的面向應用的配價詞表。

除了語言研究的一般用途外,在自然語言處理中,捷克語動詞配價詞表(Vallex)還有以下用途:

1.可以保證語料庫和布拉格依存樹庫(PDT)中配價結構的一致性;

2.可以幫助進行自動句法分析;

3.可以幫助生成輸入句子的語義結構表示;

4.可以幫助通過自動的方式來構造動詞配價詞典。

我們不妨以捷克語動詞配價詞表中的具體詞條“z?ídit”(建立)及其構成為例①,來直觀感受一下Vallex配價詞典的格式,具體如圖3所示:

圖3中的詞項(word entry)為含有某一動詞所有義項的抽象單位。詞項由一系列非空的框架項(frame entries)構成,其中每一項對應一個義項??蚣茼棸鋬r框架本身的描述、意義的解釋及其他附加信息。配價框架是由一些框架槽(frame slots)構成的,每一個槽表示該動詞要求的補足語。每一個槽是由其函子(functor,即句法語義關系的名稱)和可能的形態形式來表現的。

在捷克語動詞配價詞表中,每一詞條(entry)的內容非常豐富,主要包括:Headword lemma(中心詞的詞目)、aspect(體)、gloss(詞條說明)、frame slot(框架槽)、functor(配價功能)、type of complementation(補足語類型)、morphemic forms(形態形式)、mark for idiomatic frame(成語框架的標示)、frame entry(框架條目)、valency frame(配價條目)、aspectual counterpart(體成分)等。

值得一提的是,捷克語動詞配價詞表不但提供了傳統的印刷版,也構建了xml格式和html格式的電子版本,這對詞表的共享、交流和使用,都是很有意義的。特別是建立在html格式之上的交互界面,非常便于人們使用,具體如圖4所示:

通過這個交互界面,用戶可以按照不同的指標來瀏覽配價詞表的內容,對各類動詞的配價結構進行定量和定性的研究分析。例如,如果用戶要查詢單詞“brát”的配價功能,可以點擊functors,交互界面就會顯示出它的各種配價功能,如ACT,ADDR,PAT,LOC,DIR等。

總的來說,功能生成描述理論不但是布拉格學派在信息時代的繼續和發展,而且是少有的將理論和實踐完美地結合起來的語言學理論。本文著重介紹的布拉格依存樹庫(PDT)和捷克語動詞配價詞表(Vallex),不僅有助于驗證功能生成描述的理論主張,而且對自然語言處理也是大有用處的。目前已有數種歐洲語言采用PDT的標注體系來構造相應的樹庫,這對功能生成描述理論的傳播和進一步應用無疑是大有裨益的。

參考文獻:

[1]Jarmila Panevová.On verbal frames in functional generative description II[J]. Prague Bulletin of Mathematical Linguistics,1975,(23).

[2]Petr Sgall,Eva Hajicová,and Jarmila Panevová.The Meaning of the Sentence in Its Semantic and Pragmatic Aspects[M].Dordrecht:D.Reidel,1986.

[3]Eva Hajicová,Petr Sgall.Dependency Syntax in Functional Generative Descriptions[A].In ?gel,Vilmos;Eichinger,Ludwig;Eroms,Hans-Werner;Hellwig,Peter;Heringer,Hans-Jürgen;Lobin,Henning (eds.).Dependenz und Valenz: Ein? Internationales Handbuch Der Zeitgen?sischen Forschung[C].Berlin:De Gruyter,2003.

[4]白雪.功能生成理論評介[J].現代語文(語言研究版),2016,(2).

主站蜘蛛池模板: 国产麻豆永久视频| 老熟妇喷水一区二区三区| 亚洲国产清纯| 久久亚洲天堂| 国产成人av大片在线播放| 国产欧美精品午夜在线播放| av在线无码浏览| 91久久精品国产| 久久精品国产亚洲AV忘忧草18| 欧美成人精品在线| 操美女免费网站| 亚洲欧州色色免费AV| 日本黄色不卡视频| 激情综合婷婷丁香五月尤物| 亚洲IV视频免费在线光看| 日韩高清在线观看不卡一区二区| 国产主播喷水| 天堂在线视频精品| 麻豆精品久久久久久久99蜜桃| 国产视频自拍一区| 国产亚洲视频免费播放| 中国美女**毛片录像在线| 波多野结衣无码视频在线观看| 中文字幕第1页在线播| 无码精品福利一区二区三区| 老司机aⅴ在线精品导航| 永久免费无码日韩视频| 欧美精品高清| 亚洲成肉网| 天天综合天天综合| 在线免费观看AV| 91福利国产成人精品导航| 国产丝袜无码一区二区视频| 日韩精品成人在线| 婷五月综合| av色爱 天堂网| 国产成人精品视频一区视频二区| 中文字幕日韩丝袜一区| 久久综合一个色综合网| 国产一线在线| 久久综合婷婷| 免费在线看黄网址| 美女亚洲一区| 伊人色综合久久天天| 伊人久久大香线蕉影院| 国产成人精品综合| 亚洲精品欧美重口| 日本道综合一本久久久88| 乱系列中文字幕在线视频| 91av成人日本不卡三区| 久草网视频在线| 久久黄色小视频| 国产美女丝袜高潮| аⅴ资源中文在线天堂| 亚洲香蕉在线| igao国产精品| 亚洲人妖在线| 精品国产电影久久九九| 国产日韩欧美在线视频免费观看 | 亚洲一区二区三区中文字幕5566| 亚洲天堂免费| 国产成人精品一区二区免费看京| 久久精品无码专区免费| 国产日韩欧美在线播放| 成人午夜亚洲影视在线观看| 久久精品人人做人人爽97| 中国美女**毛片录像在线| 日韩精品免费在线视频| 国产欧美日韩免费| 亚洲不卡无码av中文字幕| 国产91无码福利在线| 欧美一区二区丝袜高跟鞋| 成人免费网站在线观看| 欧美在线综合视频| 中文字幕免费在线视频| 亚洲人成网站在线播放2019| 亚洲欧美综合另类图片小说区| 波多野结衣第一页| 丁香五月激情图片| 女人av社区男人的天堂| 丁香婷婷综合激情| 国产在线无码一区二区三区|