999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

漢語復句信息處理研究二十年

2015-04-25 09:57:16吳鋒文
中文信息學報 2015年1期
關(guān)鍵詞:語義研究

吳鋒文

(信陽師范學院 文學院,河南 信陽 464000)

?

漢語復句信息處理研究二十年

吳鋒文

(信陽師范學院 文學院,河南 信陽 464000)

加強漢語復句信息處理研究對中文信息處理具有重要意義。該文介紹了漢語復句信息工程的概況,將復句知識建模、關(guān)系標記識別、非分句識別、復句句法語義關(guān)系判定、復句知識庫建設等成果條理化,結(jié)合已有成果的研究視角、方法及關(guān)注焦點來分析復句信息處理的研究現(xiàn)狀,并對其發(fā)展趨勢進行了展望。

信息處理;復句;關(guān)系標記;自動識別

1 引言

在漢語研究領(lǐng)域,復句作為重要的語法實體單位,它上連篇章,下含小句,兼具句法、語義和語用等方面的屬性,因而成為語法研究的熱點,受到學者的廣泛關(guān)注。復句在基礎(chǔ)研究方面成果豐碩,特別是出現(xiàn)了復句研究代表性專著《現(xiàn)代漢語復句新解》(王維賢1994)和《漢語復句研究》(邢福義2001)[1]。

然而,隨著科技信息的發(fā)展和學科研究的融合,面向信息處理的漢語研究需求日益突出,中文信息處理正成為漢語應用研究的熱點。目前,中文信息處理正處于“句處理”攻堅階段[2],而句處理現(xiàn)狀是對單句自動句法分析研究較多,對復句的信息處理卻關(guān)注較少。復句在句法、語義方面與單句存有區(qū)別,而且它作為連接小句與篇章的“橋梁”,受到的語境制約也相對較多,因而要解決好“句處理”問題,漢語復句的句法語義自動分析問題必須受到重視。為此,邢福義緊跟時代發(fā)展趨向,適時提出了“漢語復句信息工程”理念,推動漢語復句應用層面的研究。

為順應中文信息領(lǐng)域“句處理”發(fā)展趨勢,推動漢語復句信息工程發(fā)展,本文擬對近二十年來(1994-2013)漢語復句在信息處理領(lǐng)域的研究進行系統(tǒng)梳理,勾勒復句信息處理研究的現(xiàn)狀,審視研究中存在的問題,并對未來研究趨向進行展望,以期進一步深化漢語復句信息處理研究。

2 漢語復句信息工程概觀

當今信息時代,語言成為一種有用的資源。如何對語言資源進行開發(fā)與利用,正成為計算語言學和人工智能、人機交互、專家系統(tǒng)等智能化領(lǐng)域的重要議題,這是時代與科技發(fā)展的要求。基于這種時代背景和學術(shù)使命,華中師范大學語言研究所語言學家邢福義教授帶領(lǐng)其研究團隊適時啟動漢語復句信息工程。

姚雙云以小句中樞說為理論指導,對復句信息工程的研究內(nèi)容、目標以及復句層次關(guān)系標注的方法進行了初步探討[3]。漢語復句信息工程是一個文理交叉的大型跨學科研究課題。這一課題,以漢語句法研究為本,以漢語信息處理研究為用,以漢語復句作為促進學科發(fā)展的研究突破口。該課題主要包括5個方面的研究內(nèi)容:一為漢語復句關(guān)系詞的覆蓋范圍、配對情況、搭配強度和關(guān)系詞的相似度;二為復句關(guān)聯(lián)模式、內(nèi)部結(jié)構(gòu)特點與外部功能特點;三為關(guān)系詞和復句復雜特征集的描述與合一運算;四為關(guān)系詞的自動識別和標注、關(guān)聯(lián)項功能的自動識別和標注、復句句式類別與層次關(guān)系的自動識別與標注;五為有標復句標注語料庫的構(gòu)建以及面向復句領(lǐng)域的研究工具的開發(fā)。

本工程研究目標包括兩個方面。其一,在研究的基礎(chǔ)性工作上,建立一個漢語研究專用標注語料庫—漢語復句語料庫,它包含豐富的句法、語義信息,是漢語復句研究的重要平臺;其二,在研究的深度和理論方法追求上,揭示復句關(guān)聯(lián)的內(nèi)在機制,建立復句關(guān)聯(lián)的基本模型,總結(jié)復句句式類別與語義關(guān)系的計算機自動判定的方法,有效地提高計算機處理句子的能力。在工程實施過程中,努力將《漢語復句研究》一書的豐富成果形式化,使之應用于語言信息化領(lǐng)域的研究實踐,并進一步發(fā)掘復句的語法功能,弄清復句功能分類。本工程的研究實踐分前、后兩期。前期工程專門針對有標復句進行研究,重點研究復句的聯(lián)結(jié)機制,復句關(guān)系標記的識別及其標注,分句的確認,分句層次和語義關(guān)系的判定等,在前期研究的基礎(chǔ)上,逐步探索有標復句向無標復句研究的過渡,從而轉(zhuǎn)向后期的無標復句句法、語義關(guān)聯(lián)的自動判定研究。

在華中師范大學語言研究所和計算機科學系部分師生通力合作下,復句信息工程進展順利,已完成了復句語料庫和基于復句語料庫的分詞系統(tǒng)的開發(fā),在復句語料自動標注、關(guān)系標記與非分句的識別、關(guān)聯(lián)模式的形式化描寫,以及復句句法語義判定研究等方面已取得了階段性成果,有標復句的信息處理正如火如荼地開展。

而且,以邢福義和胡金柱教授為領(lǐng)隊的聯(lián)合研究團隊,近幾年先后主持教育部重大基金項目“面向中文信息處理的復句聯(lián)結(jié)機制及形式化策略分析”和國家社科基金 “有標復句層次關(guān)系的信息化研究”和“基于規(guī)則的復句關(guān)系標記自動標注與實現(xiàn)策略研究”等課題,致力于漢語復句及其關(guān)系標記的信息處理研究,逐步實現(xiàn)漢語復句研究從基礎(chǔ)層面向應用層面的融合與轉(zhuǎn)變。

3 漢語復句信息處理研究現(xiàn)狀

近二十年來,漢語復句應用層面的研究正逐漸融入計算科學領(lǐng)域,為漢語復句研究開辟了新的道路,成為計算語言學的重要議題。相關(guān)研究成果主要集中在復句知識建模、復句關(guān)系標記的識別、非分句語段的識別、復句句法語義關(guān)系判定、復句知識庫工程建設等方面。

3.1 復句知識建模

語言知識建模,是實現(xiàn)自然語言理解的關(guān)鍵性技術(shù)。張仕仁圍繞著漢語復句的計算機處理問題,提出采用盒式圖和復雜特征集表示復句結(jié)構(gòu)形式與意義結(jié)構(gòu),并探討了漢語復句的自動分析問題。通過對復句結(jié)構(gòu)的分析,把復句歸結(jié)為分句、聯(lián)合結(jié)構(gòu)、偏正結(jié)構(gòu)3種基本成分,并用盒式圖表示這些結(jié)構(gòu),以此構(gòu)造出各式各樣的復句來。為了能正確地劃分復句基本結(jié)構(gòu)的類型,采用了復雜特征集描述,并構(gòu)造出一棵復句的“功能結(jié)構(gòu)樹”[4]。該文是研究漢語復句信息處理的較早文獻。

此外,胡金柱、邢福義、王琳、肖升等引入本體論思想,探索復句本體建模問題。胡金柱、邢福義介紹了本體研究現(xiàn)狀,引入本體元模型建模方法,在漢語小句元模型的基礎(chǔ)上構(gòu)造漢語復句靜態(tài)本體模型,以期推動漢語本體語義網(wǎng)的研究,使中文信息處理水平努力提升到句子的層面[5]。王琳利用本體元建模方法構(gòu)建漢語小句元模型,并采用本體網(wǎng)絡語言OWL描述小句本體,對小句進行語義分析,然后利用構(gòu)成的小句元模型再去描述復句模型,最后生成整個復句的OWL表示[6]。肖升在分析復句結(jié)構(gòu)和邏輯連接詞的基礎(chǔ)上,采用面向?qū)ο蠓椒?gòu)建有標復句的本體模型[7]。

3.2 復句關(guān)系標記的識別

復句關(guān)系詞語是復句句法、語義關(guān)系的形式標志,因而關(guān)系詞語的識別是復句信息處理的基礎(chǔ)性工作。近十年來學界主要從機械匹配、機器學習、語料庫、規(guī)則和統(tǒng)計、標記搭配判斷等方面對關(guān)系標記識別問題進行了研究。

鄒嘉彥將關(guān)系標記的信息表示為五元組,采用機械匹配的方法來確定關(guān)系詞語和復句關(guān)系,并進行語料篇章關(guān)系詞的標注實驗[8]。高維君將機器學習技術(shù)應用于漢語復句關(guān)系詞的歧義辨別,將漢語關(guān)聯(lián)詞語的消歧識別轉(zhuǎn)化為決策樹分類器,提高了漢語關(guān)系詞語識別的正確率[9]。李文翔等以語料庫為資源,采用數(shù)據(jù)挖掘算法提取反映關(guān)聯(lián)詞語用法的各種特征信息,并將這些信息整理為關(guān)聯(lián)詞語的知識庫,作為關(guān)聯(lián)詞識別的依據(jù),并對有歧義的關(guān)聯(lián)詞語提出了基于決策樹的消歧方法[10]。胡金柱、沈威采用概率統(tǒng)計方法,構(gòu)建關(guān)系標記的渡越矩陣,并對容易產(chǎn)生歧義的“結(jié)果”和“如”進行關(guān)系標記自動標注的個案測試,其測試結(jié)果較為理想[11]。沈威、姚雙云(2007)探討了基于規(guī)則方法的關(guān)系詞語識別策略,將關(guān)系詞的識別過程分解為關(guān)系詞表的建立、規(guī)則庫的建立、利用關(guān)系詞表和規(guī)則庫進行關(guān)系詞標注3個步驟[12]。尹蔚、羅進軍對選擇標記“是……,還是……”的識別問題進行個案研究,總結(jié)出影響有標復句合用型關(guān)系詞識別率的一些規(guī)律,分別為關(guān)系標記的語序制約律、相互制約律、句法空間制約律、親密度制約律[13]。

復句關(guān)系標記識別研究中,偽關(guān)系詞的篩除與過濾是難點。為解決這一問題,胡金柱、舒江波提出一種基于基于詞性標記和關(guān)系詞搭配理論的正向算法提取復句語料中的關(guān)系標記。首先采用正向選擇算法,利用詞性標記的特點對復句實例中的詞語進行剪枝,優(yōu)化匹配效率,得到初始的關(guān)系詞集,然后根據(jù)關(guān)系標記的搭配理論對候選詞集進行處理,過濾掉偽關(guān)系詞,最終標記出復句中的關(guān)系詞[14]。胡金柱、雷利利從關(guān)系詞的搭配關(guān)系出發(fā),采用解空間樹得到關(guān)系標記所有的搭配集合,并對解空間樹進行剪枝,去掉無用搭配集,過濾掉偽關(guān)系標記,最終識別出復句關(guān)系標記,測試表明,解空間樹和剪枝算法對復句關(guān)系詞判定的正確率達到98.9%[15]。

姚雙云在大規(guī)模語料庫分詞處理基礎(chǔ)上,探討了關(guān)聯(lián)詞搭配模式自動發(fā)現(xiàn)的基本方法[16]。通過評估關(guān)聯(lián)詞搭配的3個重要參數(shù)(搭配距離、搭配強度MI值、搭配強度Z值),并設定閾值,超過閾值的模式自動作為候選搭配模式。實驗表明,該方法有助于發(fā)現(xiàn)以往未被注意的復句句法搭配模式。

3.3 非分句語段的識別*所謂“非分句”,是指出現(xiàn)在復句中的缺乏“分句”相對獨立地位的各種短語性語段。如“成功的基礎(chǔ)是奮斗,奮斗的收獲是成功,所以,天下唯有不知而艱辛奮斗的人,才能走上成功的高峰。”中劃橫線部分就是一個名詞性非分句語段成分。

復句句法語義關(guān)系的判定,其前提是要確定分句的數(shù)目,排除各種短語語段的干擾。胡金柱、俞小娟結(jié)合語言學的相關(guān)理論,提取出識別短語字段的因素,并對這些因素進行主成分分析,進而得出短語字段識別的綜合影響因素以及與原始的具體因素之間的關(guān)聯(lián),采用主成分分析法識別復句中的非分句[17-18];李瓊在界定非分句的基礎(chǔ)上,采用基于詞性信息和句法信息的方法來識別復句中的短語字段[19];李瓊還探討了基于語義知識的非分句的識別策略[20]。此外,王立霞、孫宏林探討了現(xiàn)代漢語介詞短語邊界識別問題[21]。這些研究的開展,為復句層次關(guān)系自動識別研究奠定了基礎(chǔ)。

3.4 復句句法語義關(guān)系判定

計算機對漢語復句進行自動句法分析,其核心任務是對分句間的層次構(gòu)造和語義關(guān)聯(lián)進行自動判定。這方面主要成果有魯松、李晉霞、洪鹿平、周文翠、劉云、羅進軍、吳鋒文以及胡金柱、舒江波等。

魯松、宋柔從機器翻譯角度,研究判定漢語描述型復句分句間的內(nèi)在聯(lián)系的形式化處理方法,給出了完整的關(guān)系判定規(guī)則,并提出了采用中心分句動態(tài)判定方法來解決部分復句處理規(guī)則局部性的問題[22];魯松、白碩等以復句的層次關(guān)系研究為對象,將多重復句的層次結(jié)構(gòu)形式化為層次關(guān)系樹,并采用上下文無關(guān)文法表示多重復句,提出一種基于具有預測機制、自底向上、部分數(shù)據(jù)驅(qū)動的確定性移進-規(guī)約算法來處理多重復句的層次關(guān)系[23]。李幸、宗成慶在分析漢語標點符號用法和句法功能的基礎(chǔ)上,提出一種新的面向漢語長句的層次化句法分析方法,對復句層次關(guān)系處理具有一定借鑒意義[24]。

周文翠采用統(tǒng)計方法,借鑒支持向量機(SVM)理論來識別無標并列復句。該文首先從語言學角度角度提取主語、謂語等相關(guān)特征,并根據(jù)《知網(wǎng)》語義分類將特征量化,然后構(gòu)建并列復句模型來識別并列復句[25]。遺憾的是,該研究局限在兩個分句之間,因而并沒有涉及到分句間的層次判定分析。而洪鹿平通過確定逗號的功能來判斷復句的切分點,將復句轉(zhuǎn)化為分句的有序集,在此基礎(chǔ)上,采用條件隨機場(CRF)理論來判定分句間的語義關(guān)系[26],也沒有涉及分句間的層次判定分析。

李晉霞、劉云著重探討了二重復句的自動分析問題[27]。他們認為,一個多重復句的層次劃分實質(zhì)上是分句之間相互選擇、匹配構(gòu)成不同層次復句子模塊的過程。該文總結(jié)出能夠?qū)崿F(xiàn)二重復句自動層次劃分的幾種復句標記聯(lián)結(jié)模式,并指出關(guān)系包孕、關(guān)系詞音節(jié)數(shù)量對復句層次劃分的影響。

羅進軍從句法識別的角度,提出建立有標復句表里關(guān)聯(lián)模態(tài),并結(jié)合關(guān)系標記語表序列聚類的方法來識別有標復句層次關(guān)系[28],但該方法對歧義型有標復句格式的句法分析仍將無能為力。

為解決復句自動句法分析中關(guān)系詞的省略和嵌套問題,劉云提出關(guān)系詞語“離析度”思想,引入信息頻率和權(quán)重值的思想來評估復句關(guān)系詞的離析度,以關(guān)系詞離析度思想來解決復句層次關(guān)系識別問題,并總結(jié)歸納出“最鄰近優(yōu)先匹配原則”、“前者前優(yōu)先,后者后優(yōu)先”等復句層次分析的規(guī)則[29];汪夢翔在關(guān)系詞“離析度”基礎(chǔ)上,闡述了關(guān)系詞離析度在復句自動句法分析中的應用問題[30]。

吳鋒文從復句信息處理角度出發(fā),對復句的層次關(guān)系識別問題進行了系列研究[31-33]。為解決關(guān)系詞省略和關(guān)系詞不能標示分句間層次組合順序的局限,全面考察了3句式復句標記聯(lián)結(jié)模式與層次關(guān)系之間的制約規(guī)律,將有標復句分為充盈態(tài)與非充盈態(tài)兩類。標記充盈態(tài)模式與復句實例層次關(guān)系間存在“一對一”的映射關(guān)系,其復句實例可以采用基于規(guī)則方法來識別;標記非充盈態(tài)模式與復句實例間不存在“一對一”的映射關(guān)系,其層次關(guān)系的判定需要引入分句間的語義分析。在界定分句語義關(guān)聯(lián)度基礎(chǔ)上,從主謂句法成分角度對分句關(guān)聯(lián)進行深層知識挖掘,提取出直接聚層關(guān)聯(lián)的分句間存在的10組典型特征,構(gòu)建了一種基于分句語義關(guān)聯(lián)度判定的復句分析法。此外,還對“二標三句式”、“一標三句式”復句的層次關(guān)系判定問題進行個案研究[34-35],歸納出復句層次關(guān)系判定的若干句法語義規(guī)則,實驗表明了該研究的有效性。

胡金柱、舒江波嘗試采用分句語義關(guān)聯(lián)理論來解決復句層次關(guān)系識別中的難點,從句法和語義角度總結(jié)出分句語義關(guān)聯(lián)的3大類、14個小類的特征,并根據(jù)特征之間的相互約束規(guī)律和分句特征的統(tǒng)計規(guī)律來確定分句關(guān)聯(lián)特征分析的先后順序,在此基礎(chǔ)上討論分句間語義關(guān)聯(lián)度的計算方法,根據(jù)分句間的關(guān)聯(lián)度來確定分句的層次歸屬[36]。

3.5 復句語言知識庫的構(gòu)建

實踐表明,中文信息處理的開展,需要語言知識庫的支持。為適應研究的需要,復句語言知識研究也引起學者關(guān)注:邢福義、姚雙云探討了復句語料庫的建設及其在復句信息工程中的應用問題[37];為改進現(xiàn)有分詞系統(tǒng)對復句關(guān)系詞標注結(jié)果不準的狀況,杜超華、胡金柱在中國科學院ICTCLAS 分詞軟件的基礎(chǔ)上,研發(fā)了基于復句語料庫的分詞系統(tǒng)[38];劉云開展了漢語虛詞知識庫的研究,該虛詞知識庫中包含大量復句關(guān)系詞語的相關(guān)句法、語義、語用信息[39];胡金柱、吳鋒文緊扣“句處理”需求,開發(fā)漢語復句知識庫,初步研制了一個包含436個復句關(guān)系標記的復句知識子庫,并探討了關(guān)系標記信息的形式化表征與運算問題[40-41]。

4 漢語復句信息處理研究展望

總體而言,近二十年漢語復句應用層面的研究取得了一些可喜的成就:漢語復句信息處理的兩項基礎(chǔ)性工作——復句關(guān)系詞的識別及非分句的識別與標注,都取得一定進展;漢語復句句法語義關(guān)系判定問題逐漸受到學界的關(guān)注,特別是復句語料庫、基于復句語料庫的分詞系統(tǒng)以及復句知識庫的建設,都將為漢語復句信息工程推向縱深發(fā)展奠定堅實的基礎(chǔ)。

當然,我們也要清醒認識到,漢語復句應用層面的研究起步較晚,研究還極其薄弱。目前復句信息處理研究,無論是復句關(guān)系詞、非分句的識別,還是復句句法語義關(guān)系判定,都是在受限領(lǐng)域里進行的。可以說,已有研究雖已觸及到漢語復句信息工程的“冰山一角”,但更多問題還需進一步去發(fā)掘和探索。展望漢語復句信息處理研究的未來,需要著重做好以下幾方面的工作。

首先,需要進一步加強漢語復句研究的“兩棲學者”聯(lián)合攻關(guān)勢態(tài)。當前信息時代,語言學的多邊緣化趨勢日益明顯,語言學科的發(fā)展要跟上時代步伐,必須面向社會,面向應用,其研究成果必須服務于社會經(jīng)濟的發(fā)展[42]。中文信息處理需要的,并不是現(xiàn)在漢語學界已有知識的照搬,而是需要根據(jù)計算機的“能力”去總結(jié)和發(fā)掘漢語的規(guī)律,使之具有可操作性。但就漢語復句研究而言,長期以來學界研究關(guān)注點在于基礎(chǔ)研究,是基于“人際理解”的,而不是基于“機器理解”的,沒有考慮到漢語信息處理的需求,使得已有成果不能完全適應中文信息處理的需要。在新的時代,中文信息處理研究需要文、理不同學科研究團隊的聯(lián)合攻關(guān)已成為共識,漢語復句研究必需結(jié)合社會的應用需求,實現(xiàn)研究思路的轉(zhuǎn)變,為適應中文信息處理的需求而加強面向機器的應用型研究。這種研究思路的轉(zhuǎn)變,需要漢語言學界和計算機學界兩支隊伍緊密結(jié)合起來,需要整合不同學科(除語言學、計算機科學,還涉及到邏輯學、人腦科學、信息傳播學等)之間的研究資源,大力培養(yǎng)既懂語言學又會計算機科學的“兩棲人才”。

其次,需要進一步加強漢語復句語義識別研究,實現(xiàn)無標分句的句法語義消歧。隨著復句關(guān)系詞語與非分句識別研究的開展,集中力量研究漢語復句句法語義關(guān)系識別將是復句信息工程的重心。在復句層次關(guān)系識別方面,魯松、白碩、羅進軍等作出了開拓性工作,但對因缺乏關(guān)系標記而出現(xiàn)分句層次歸屬歧義的情形仍無能為力;周文翠、洪鹿平等采用統(tǒng)計策略研究復句分句的語義識別,為復句的語義識別奠定了基礎(chǔ),但沒有涉及到分句間的層次構(gòu)造的處理;胡金柱、吳鋒文關(guān)于分句語義關(guān)聯(lián)的研究才剛起步。加強漢語復句的語義識別仍是任重道遠,要最終解決復句句法語義關(guān)系識別問題,無標分句的層次歸屬消歧研究將是無法跨越的“溝坎”。只有首先突破對無標分句層次歸屬消歧處理,才能實現(xiàn)有標復句向無標復句信息處理研究的過渡。

再者,需要進一步加強復句知識庫資源建設。研究表明,語言知識庫在中文信息處理中具有重要作用。漢語言知識庫建設已取得一定進展,如《現(xiàn)代漢語語法信息詞典詳解》、虛詞知識庫、漢語知網(wǎng)、HNC 詞語知識庫以及漢語框架語義知識庫(CFN)的開發(fā)與利用,已在學界產(chǎn)生一定影響。但由于知識產(chǎn)權(quán)方面的原因,這些語言知識庫的兼容性、通用性不強,而漢語復句的專用知識庫建設又很滯后。因而,集中力量開發(fā)一個集復句分類系統(tǒng)、關(guān)系詞知識庫、分句聚層組合規(guī)則庫、分句句法語義特征集于一體的復句本體知識庫[43],將是今后漢語復句應用研究面臨的重要任務。

[1] 吳鋒文.新時期以來漢語復句基礎(chǔ)研究綜觀[J].信陽師范學院學報(哲社版).2013,33(1):78-84.

[2] 陸儉明.關(guān)于句處理中所要考慮的語義問題[J].語言研究,2001,21(1):1-12.

[3] 姚雙云.小句中樞理論的應用與復句信息工程[J].漢語學報.2005,5(4):71-79.

[4] 張仕仁.漢語復句的結(jié)構(gòu)分析[J].中文信息學報.1994,8(4):43-54.

[5] 胡金柱,邢福義.復句靜態(tài)本體模型初探.第三屆HNC與語言學研究學術(shù)研討會論文集[C].北京:北京師范大學出版社,2006.

[6] 王琳.基于本體的漢語復句語義分析[D].武漢:華中師范大學碩士學位論文.2006.

[7] 肖升,胡金柱.面向?qū)ο笥袠藦途浔倔w建模[J].計算機應用研究.2010,27(2):552-554.

[8] 鄒嘉彥,連興隆.中文篇章中的關(guān)聯(lián)詞語及其引導的句子關(guān)系的自動標注.中文信息處理國際會議論文集[C].北京:清華大學出版社,1998:288-297.

[9] 高維君,姚天順,黎邦洋,等.機器學習在漢語關(guān)聯(lián)詞語識別中的應用[J].中文信息學報.2000,14(3):1-8.

[10] 李文翔.基于語料庫的關(guān)聯(lián)詞識別方法[J].計算機工程與應用.2004,41(7):50-52.

[11] 胡金柱,沈威.基于渡越矩陣的復句關(guān)系詞自動標注初探[J].微計算機信息.2007,24(30):200-202.

[12] 沈威,姚雙云.基于規(guī)則的復句中的關(guān)系詞標注探討[J].福建電腦.2007,23(4):6-7.

[13] 尹蔚,羅進軍.從“是p,還是q”有標選擇復句看合用型關(guān)系詞的自動識別[J].中南大學學報(社科版).2007,19(6):740-743.

[14] 胡金柱,舒江波,姚雙云,等.面向中文信息處理的復句關(guān)系詞提取算法研究[J].計算機工程與科學.2009,37(10):90-93.

[15] 胡金柱,雷利利.多重復句關(guān)系標記搭配的求解模型研究[J].計算機工程與科學.2011,39(11):177-182.

[16] 姚雙云,胡金柱,肖升,等.關(guān)聯(lián)詞搭配的自動發(fā)現(xiàn)[J].計算機應用研究.2011,28(12):4426-4429.

[17] 胡金柱,俞小娟.基于規(guī)則庫和聚類分析的復句短語字段的自動識別研究[J].華中師范大學學報.2008,52(2):190-194.

[18] 俞小娟,胡金柱.用主成分分析法研究短語字段的判別因素[J].計算機技術(shù)與發(fā)展.2008,18(10):116-119.

[19] 李瓊,胡金柱.現(xiàn)代漢語復句中短語字段的自動識別初探[J].寧夏大學學報.2008,30(1):6-10.

[20] 李瓊.基于語義知識的書讀前后非分句語言片段識別[J].湖北社會科學.2010,24(3):128-131.

[21] 王立霞,孫宏林.現(xiàn)代漢語介詞短語邊界識別研究[J].中文信息學報.2005,19(3):80-86.

[22] 魯松,宋柔.漢英機器翻譯中描述型復句的關(guān)系識別與處理[J].軟件學報.2001,12(1):83-93.

[23] 魯松,白碩,李素建,等.漢語多重關(guān)系復句的關(guān)系層次分析[J].軟件學報.2001,12(7):987-995.

[24] 李幸,宗成慶.引入標點處理的層次化漢語長句句法分析方法[J].中文信息學報.2006,20(4):8-15.

[25] 周文翠,袁春風.并列復句的自動識別初探[J].計算機應用研究[J].2008,25(3):764-766.

[26] 洪鹿平.漢語復句關(guān)系自動判定研究[D].南京:南京師范大學碩士學位論文.2008.

[27] 李晉霞,劉云.面向計算機的二重復句層次劃分研究[C].第7屆計算語言學聯(lián)合學術(shù)會議論文.2003.

[28] 羅進軍.基于句法識別的有標復句層次關(guān)系研究[J].漢語學報.2009,9(1):83-89.

[29] 劉云.復句關(guān)系詞語離析度考察[J].語言教學與研究.2008,30(6):15-21.

[30] 汪夢翔.關(guān)聯(lián)詞離析度在有標復句層次自動分析中的應用[J].云南師范大學學報(哲社版).2011,54(4):148-152.

[31] 吳鋒文,胡金柱,肖明,等.基于規(guī)則的漢語復句層次關(guān)系自動識別研究[J].華文教學與研究.2010,10(1):85-92.

[32] 吳鋒文.基于關(guān)系標記的漢語復句分類研究[J].漢語學報.2011,11(3):63-73.

[33] 吳鋒文.基于主謂語知識挖掘的分句語義關(guān)聯(lián)研究[J].語言文字應用.2011,20(4):132-142.

[34] 吳鋒文.面向信息處理的“二標三句式”復句層次關(guān)系判定[J].信陽師范學院學報(哲社版).2012,32(1):88-93.

[35] 吳鋒文.面向信息處理的“一標三句式”復句層次關(guān)系判定[J].北方論叢.2012,54(1):64-68.

[36] 胡金柱,舒江波,羅進軍.漢語復句中分句的語義關(guān)聯(lián)特征[J].語言文字應用.2010,19(4):121-130.

[37] 邢福義,姚雙云.復句語料庫的建設及利用[C].第三屆HNC與語言學研究學術(shù)研討會.2005.

[38] 杜超華,胡金柱.基于復句語料庫分詞系統(tǒng)研究[J].計算機與數(shù)字工程.2007,35(5):43-45.

[39] 劉云.漢語虛詞知識庫的建設[M].武漢:華中師范大學出版社.2009.

[40] 胡金柱,吳鋒文,李瓊,等.漢語復句關(guān)系詞庫的建設及其利用[J].語言科學.2010,9(2):133-142.

[41] 吳鋒文.面向中文信息處理的三句式有標復句層次關(guān)系自動識別研究[D].武漢:華中師范大學博士學位論文.2010.

[42] 許嘉璐.設想和現(xiàn)狀——試論中文信息處理與現(xiàn)代漢語研究[J].中文信息學報.2001,15(2):1-8.

[43] 吳鋒文.從信息處理看漢語復句分類研究[J].信陽師范學院學報(哲社版).2011,31(4):79-83.

Chinese Compound Sentences Processing: Past 20 Years

WU Fengwen

(College of Liberal Arts, Xinyang Normal University, Xinyang, Henan 464000, China)

The study on Chinese Compound Sentences is essential to the information processing. This paper summarizes the past researches on compound sentences, including compound sentences modeling, relation markers recognition, structure recognition, compound sentences parsing and corpus construction. It also reveals the prospects and possible research trends in further studies.

information processing; compound sentences; relation markers; automatic recognition

吳鋒文(1981—),博士,副教授,主要研究領(lǐng)域為漢語語法,中文信息處理。E?mail:wufw@mail.ccnu.edu.cn

1003-0077(2015)01-0013-06

2013-05-12 定稿日期: 2013-10-11

國家社科基金(14CYY035,11BYY052);教育部人文社科基金(12YJC740110);信陽師范學院第五批青年骨干教師資助計劃

TP391

A

猜你喜歡
語義研究
FMS與YBT相關(guān)性的實證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
語言與語義
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
新版C-NCAP側(cè)面碰撞假人損傷研究
“上”與“下”語義的不對稱性及其認知闡釋
認知范疇模糊與語義模糊
“深+N季”組配的認知語義分析
當代修辭學(2011年6期)2011-01-29 02:49:50
主站蜘蛛池模板: 国产成人乱码一区二区三区在线| 毛片免费视频| 久久精品人妻中文系列| 亚洲国产第一区二区香蕉| 亚洲第一精品福利| 日韩精品亚洲一区中文字幕| 伊人久久大香线蕉影院| 日韩一区二区在线电影| 无码人中文字幕| 57pao国产成视频免费播放| 中文字幕精品一区二区三区视频| 亚洲天堂自拍| 免费视频在线2021入口| 97se亚洲| 91外围女在线观看| 精品国产欧美精品v| 亚洲视频一区在线| 99视频在线精品免费观看6| 人妻一区二区三区无码精品一区| 网友自拍视频精品区| 被公侵犯人妻少妇一区二区三区| 亚洲精品国产综合99久久夜夜嗨| 91国内在线观看| 久久黄色毛片| 久久精品娱乐亚洲领先| 在线看免费无码av天堂的| 午夜少妇精品视频小电影| 青青青视频蜜桃一区二区| 国产午夜精品鲁丝片| 久久精品国产精品一区二区| 九九热在线视频| 亚洲乱码精品久久久久..| 国产三级成人| 性色一区| 在线国产你懂的| 麻豆精品在线播放| 免费Aⅴ片在线观看蜜芽Tⅴ| 国产在线精彩视频二区| 国产白丝av| 久久a级片| 国产91导航| 国产精品欧美亚洲韩国日本不卡| 在线观看无码a∨| 午夜福利免费视频| 国模沟沟一区二区三区| 亚洲天堂自拍| 欧美精品亚洲精品日韩专区| 亚洲国产天堂久久九九九| 国产麻豆福利av在线播放| 日韩欧美中文字幕在线精品| 久草性视频| 美女内射视频WWW网站午夜| 国产成人一二三| 天天操精品| 国产乱人激情H在线观看| 一本久道热中字伊人| 午夜无码一区二区三区| 国产成人盗摄精品| 99伊人精品| 91福利在线观看视频| 亚洲AV无码一二区三区在线播放| 99re热精品视频国产免费| 国产自在自线午夜精品视频| 久草视频中文| 国产系列在线| 国产精品第三页在线看| 国产H片无码不卡在线视频 | AV在线天堂进入| 久久精品国产精品一区二区| 精品自窥自偷在线看| 国产精品免费p区| 中文一级毛片| 中国国产一级毛片| 青草免费在线观看| 国产成人精品一区二区秒拍1o| 亚洲欧美精品一中文字幕| 国产jizzjizz视频| 综合社区亚洲熟妇p| 伊人色综合久久天天| 国产一级做美女做受视频| 国产主播在线一区| 国产精品入口麻豆|