999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

計(jì)算語(yǔ)言學(xué)芻議*

2013-05-14 11:33:46邵澤國(guó)
關(guān)鍵詞:規(guī)則計(jì)算機(jī)語(yǔ)言

邵澤國(guó)

(1.上海師范大學(xué) 語(yǔ)言研究所,上海200234;2.上海電子信息職業(yè)技術(shù)學(xué)院,上海201411)

自20世紀(jì)40年代人類開始研究機(jī)器翻譯以來,“使計(jì)算機(jī)具有人的語(yǔ)言能力”就成為了人們一直追逐的美好愿望。這一愿望驅(qū)使了語(yǔ)言科學(xué)與計(jì)算機(jī)科學(xué)的結(jié)合,從而誕生了計(jì)算語(yǔ)言學(xué)。經(jīng)過幾十年的發(fā)展,這一交叉學(xué)科涉及的學(xué)科領(lǐng)域不斷擴(kuò)大,同時(shí)在不同的學(xué)科視角下對(duì)該學(xué)科有著不同的定義和命名。本文從語(yǔ)言科學(xué)的視角來觀察這一新學(xué)科,提出了一些不成熟的看法。

1 計(jì)算語(yǔ)言學(xué)綜述

俞士汶的研究中這樣定義計(jì)算語(yǔ)言學(xué)[1]:“計(jì)算語(yǔ)言學(xué)(Computational Linguistics)指的是這樣一門學(xué)科,它通過建立形式化的數(shù)學(xué)模型來分析、處理自然語(yǔ)言,并在計(jì)算機(jī)上用程序來實(shí)現(xiàn)分析和處理的過程,從而達(dá)到以機(jī)器模擬人的全部或者部分語(yǔ)言能力的目的。”從上述定義中可以解析出:(1)計(jì)算語(yǔ)言學(xué)將人文科學(xué)(語(yǔ)言學(xué))與自然科學(xué)(數(shù)學(xué)、計(jì)算機(jī)科學(xué))緊密地結(jié)合在一起,是人文科學(xué)與自然科學(xué)的一個(gè)橋梁;(2)這門學(xué)科的研究本體是人類語(yǔ)言(自然語(yǔ)言),其目標(biāo)是“使計(jì)算機(jī)具有人的語(yǔ)言能力”;(3)計(jì)算語(yǔ)言學(xué)是一個(gè)典型的邊緣交叉學(xué)科,涉及到語(yǔ)言科學(xué)、計(jì)算機(jī)科學(xué)和數(shù)學(xué)。

隨著人們對(duì)該學(xué)科的逐步認(rèn)識(shí)和不斷研究,如今計(jì)算語(yǔ)言學(xué)已開始涉及更多的學(xué)科領(lǐng)域,例如認(rèn)知學(xué)、邏輯學(xué)、心理學(xué)、社會(huì)學(xué)、人類學(xué)等。而同時(shí)人們把用計(jì)算機(jī)處理自然語(yǔ)言的過程在不同時(shí)期或不同側(cè)重點(diǎn)時(shí)又稱為自然語(yǔ)言處理(Natural Language Processing)、自然語(yǔ)言理解(Natural Language Understanding)、人類語(yǔ)言技術(shù)(Human Language Technology)、計(jì)量語(yǔ)言學(xué)(Quantitative Linguistics)、數(shù)理語(yǔ)言學(xué)(Mathematical Linguistics)等。

機(jī)器翻譯是人類最早用計(jì)算機(jī)來處理非數(shù)值運(yùn)算的應(yīng)用,它首次將自然語(yǔ)言與計(jì)算機(jī)聯(lián)系在一起。上世紀(jì)60年代,機(jī)器翻譯的研究步入了一個(gè)低谷,從而引發(fā)人們重新審視語(yǔ)言的計(jì)算機(jī)處理。很快人們發(fā)現(xiàn)語(yǔ)言的計(jì)算機(jī)處理過程不同于一般的數(shù)值計(jì)算,它不是一個(gè)簡(jiǎn)單的機(jī)械過程,應(yīng)該注意對(duì)自然語(yǔ)言的理解。隨后人們開始嘗試用計(jì)算機(jī)來理解語(yǔ)言的含義。通過對(duì)語(yǔ)言的分析和計(jì)算讓機(jī)器能夠解釋語(yǔ)言,這樣的一個(gè)研究范疇被人們稱為自然語(yǔ)言理解。隨著人們對(duì)“理解”的日益加深——計(jì)算機(jī)對(duì)語(yǔ)言的理解離不開或者說根基于計(jì)算機(jī)對(duì)語(yǔ)言數(shù)據(jù)的處理,隨之焦點(diǎn)從“理解”變成了“處理”,即而有了自然語(yǔ)言處理。

隨著更多學(xué)科的滲入,人們開始細(xì)化、區(qū)分計(jì)算機(jī)對(duì)自然語(yǔ)言處理的過程。若在這個(gè)過程中側(cè)重于從計(jì)算的角度來看待語(yǔ)言學(xué)的性質(zhì),或以自然語(yǔ)言為對(duì)象來研究算法,則稱之為計(jì)算語(yǔ)言學(xué),它是用計(jì)算機(jī)來模擬人去分析、處理自然語(yǔ)言。如果是專注于對(duì)自然語(yǔ)言進(jìn)行各種類型的信息處理和加工技術(shù)的研究,且強(qiáng)調(diào)計(jì)算機(jī)實(shí)現(xiàn),則稱之為自然語(yǔ)言處理。若是以計(jì)算機(jī)作為工具手段,用數(shù)理統(tǒng)計(jì)方法來研究和描述自然語(yǔ)言,對(duì)自然語(yǔ)言進(jìn)行計(jì)量研究,通過計(jì)算機(jī)的處理來獲取語(yǔ)言中隱含的數(shù)量規(guī)律則稱為計(jì)量語(yǔ)言學(xué)。如果是專注于以數(shù)學(xué)方法來刻畫語(yǔ)言的各種特點(diǎn),從而形成表述嚴(yán)密的語(yǔ)言理論體系,則稱之為數(shù)理語(yǔ)言學(xué)。

自然語(yǔ)言是人類文明的一個(gè)結(jié)晶,它具有人的一定屬性。有些學(xué)者認(rèn)為計(jì)算語(yǔ)言學(xué)更接近于人類學(xué)的研究范疇,于是在人類學(xué)的領(lǐng)域里,人們開始用“人類語(yǔ)言技術(shù)”這一更確切的術(shù)語(yǔ)來命名面向人類語(yǔ)言的處理技術(shù)的研究。

事實(shí)上,計(jì)算語(yǔ)言學(xué)與自然語(yǔ)言處理、自然語(yǔ)言理解、人類語(yǔ)言技術(shù)、計(jì)量語(yǔ)言學(xué)、數(shù)理語(yǔ)言學(xué)相互之間沒有嚴(yán)格的界限,一般人們會(huì)用計(jì)算語(yǔ)言學(xué)或自然語(yǔ)言處理來命名計(jì)算機(jī)處理自然語(yǔ)言的過程。

2 計(jì)算語(yǔ)言學(xué)的發(fā)展

計(jì)算語(yǔ)言學(xué)的發(fā)展歷程按照時(shí)間節(jié)點(diǎn)分為3個(gè)階段:萌芽期、發(fā)展期和應(yīng)用期。

(1)萌芽期

計(jì)算語(yǔ)言學(xué)的萌芽期是指20世紀(jì)50~60年代。1954年,美國(guó)喬治敦(Georgetown)大學(xué)與IBM公司合作,在IBM-701型計(jì)算機(jī)上進(jìn)行了俄語(yǔ)翻譯成英語(yǔ)的機(jī)器翻譯實(shí)驗(yàn),這是世界上首次將計(jì)算機(jī)應(yīng)用在非數(shù)值計(jì)算的信息處理領(lǐng)域。這一實(shí)驗(yàn)標(biāo)志著計(jì)算語(yǔ)言學(xué)的誕生。

該階段的計(jì)算機(jī)語(yǔ)言學(xué)僅局限于機(jī)器翻譯的研究,并且人們只是將語(yǔ)言作為一種特殊數(shù)據(jù)類型的數(shù)據(jù)交給計(jì)算機(jī)來計(jì)算,并沒有將這種數(shù)據(jù)賦予語(yǔ)言的特性。

(2)發(fā)展期

計(jì)算語(yǔ)言學(xué)的發(fā)展期是指20世紀(jì)60~80年代。在此期間,人們除了繼續(xù)機(jī)器翻譯研究,還出現(xiàn)了對(duì)語(yǔ)言信息檢索的研究。這個(gè)時(shí)期最重要的標(biāo)志是人們開始注重計(jì)算機(jī)對(duì)語(yǔ)言的 “理解”。比較有代表性的研究成果有:①20世紀(jì)60年代,出現(xiàn)了一批基于諾姆·喬姆斯基(CHOMSKY N,美國(guó)語(yǔ)言學(xué)家)的轉(zhuǎn)換—生成語(yǔ)法的語(yǔ)言處理系統(tǒng)。如麻省理工學(xué)院拉法勒(RAPHAEL B)的信息檢索系統(tǒng)SIR、韋森鮑姆的ELIZA。這些系統(tǒng)采用的主要技術(shù)是模式識(shí)別中的句法匹配,但沒有成熟的句法分析;②1972年伍茲(Woods)在他的自然語(yǔ)言信息檢索系統(tǒng)(LUNAR)中提出了著名的擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)ATN(Augmented Transition Network)。同年,威諾甘德(WINOGAND T)的自然語(yǔ)言理解系統(tǒng)(SHRDLU)嵌入了一個(gè)句法分析程序、一個(gè)語(yǔ)義分析程序、一個(gè)問題求解器,是一個(gè)句法、語(yǔ)義和推理的組合系統(tǒng)。1975年,香克(SCHANK R)設(shè)計(jì)了基于本人概念從屬理論的MARGIE(Meaning Analysis,Response Generation,and Inference on English) 系 統(tǒng),系統(tǒng)由概念分析器、推理器和篇章生產(chǎn)器3部分組成。

(3)應(yīng)用期

自20世紀(jì)80年代至今統(tǒng)稱為計(jì)算語(yǔ)言學(xué)的應(yīng)用期,這時(shí)人們開始將計(jì)算語(yǔ)言學(xué)更多地稱為自然語(yǔ)言處理。這個(gè)階段有兩個(gè)重要的變化:一是一些計(jì)算語(yǔ)言學(xué)(自然語(yǔ)言處理)系統(tǒng)開始走出實(shí)驗(yàn)室,逐漸成為被社會(huì)接受的實(shí)用系統(tǒng);二是基于統(tǒng)計(jì)的計(jì)算語(yǔ)言學(xué)處理方法開始出現(xiàn)并逐漸成熟。

在此期間計(jì)算語(yǔ)言學(xué)反過來促進(jìn)語(yǔ)言科學(xué)的發(fā)展表現(xiàn)得尤為明顯,涌現(xiàn)出了各種新的語(yǔ)法體系,如Gazder的廣義短語(yǔ)結(jié)構(gòu)語(yǔ)法(Generalied Phrase Structure Grammar)、Bresnan 與 Kaplan 的 詞 匯 功 能 語(yǔ) 法 (Lexical Functional Grammar)、KAY M 的功能合一語(yǔ)法(Functional Unification Grammar)等。到了20世紀(jì) 90年代,隨著計(jì)算機(jī)技術(shù)的發(fā)展,特別是關(guān)系型數(shù)據(jù)庫(kù)技術(shù)的成熟,語(yǔ)料庫(kù)語(yǔ)言學(xué)(Corpus Linguistice)的研究蔚然成風(fēng),許多國(guó)家和學(xué)術(shù)機(jī)構(gòu)相繼推出了不同語(yǔ)種的超大型語(yǔ)料庫(kù)或知識(shí)庫(kù)。

這些成果大大提高了計(jì)算語(yǔ)言學(xué)(自然語(yǔ)言處理)系統(tǒng)的能力,涌現(xiàn)出了諸如美國(guó)的METAL和LOGOS、日本的PIVOT和HICAT、法國(guó)的ARIANE以及德國(guó)的SUSY等著名的實(shí)用性系統(tǒng)。

3 計(jì)算語(yǔ)言學(xué)的研究方法

計(jì)算語(yǔ)言學(xué)的研究方法一般分為基于規(guī)則的方法、基于統(tǒng)計(jì)的方法以及規(guī)則與統(tǒng)計(jì)相結(jié)合的方法。有學(xué)者從方法論上又將基于規(guī)則的方法稱為理性主義方法,將基于統(tǒng)計(jì)的方法稱為經(jīng)驗(yàn)主義方法[2-3]。

(1)基于規(guī)則的方法

基于規(guī)則的方法(簡(jiǎn)稱規(guī)則法)通常是先由語(yǔ)言學(xué)家撰寫“規(guī)則庫(kù)”(例如“詞典”),再由計(jì)算機(jī)科學(xué)家編寫算法程序,對(duì)“規(guī)則庫(kù)”進(jìn)行解釋和執(zhí)行,如圖1所示。具體地說,就是由句法分析器按照設(shè)定的自然語(yǔ)言語(yǔ)法把輸入句分析為句法結(jié)構(gòu),再根據(jù)語(yǔ)義規(guī)則把語(yǔ)法符號(hào)結(jié)構(gòu)映射到語(yǔ)義符號(hào)結(jié)構(gòu)。

(2)基于統(tǒng)計(jì)的方法

基于統(tǒng)計(jì)的方法(簡(jiǎn)稱統(tǒng)計(jì)法)是通過對(duì)語(yǔ)料庫(kù)中的訓(xùn)練數(shù)據(jù)來估計(jì)統(tǒng)計(jì)模型中的參數(shù),從而建立統(tǒng)計(jì)性的語(yǔ)言處理模式。這里“語(yǔ)料庫(kù)”由語(yǔ)言學(xué)家建立,計(jì)算機(jī)科學(xué)家負(fù)責(zé)建立統(tǒng)計(jì)模型、利用語(yǔ)料庫(kù)訓(xùn)練模型參數(shù)以及編寫算法解決問題,如圖2所示。

(3)規(guī)則統(tǒng)計(jì)相結(jié)合的方法

規(guī)則統(tǒng)計(jì)相結(jié)合的方法(簡(jiǎn)稱規(guī)則統(tǒng)計(jì)法)是規(guī)則法與統(tǒng)計(jì)法的融合,充分吸收兩者的優(yōu)點(diǎn)。規(guī)則方法易于表達(dá)復(fù)雜的語(yǔ)言知識(shí)且語(yǔ)言知識(shí)的表達(dá)較直觀、靈活;但語(yǔ)言知識(shí)的覆蓋率低,缺乏統(tǒng)一的語(yǔ)言知識(shí)沖突解決機(jī)制。而統(tǒng)計(jì)方法的統(tǒng)計(jì)模型提供了統(tǒng)一的沖突解決機(jī)制,且大規(guī)模數(shù)據(jù)保證了語(yǔ)言知識(shí)的大覆蓋率;但它不善于表示復(fù)雜的、深層次的語(yǔ)言知識(shí),對(duì)于數(shù)據(jù)稀缺的語(yǔ)言沒有好的解決方案。

統(tǒng)計(jì)方法在發(fā)展過程中不斷改進(jìn),逐漸吸收規(guī)則方法的優(yōu)點(diǎn)來彌補(bǔ)自身的缺陷,統(tǒng)計(jì)模型趨于復(fù)雜,甚至一些模型直接建立在規(guī)則表示的基礎(chǔ)上,從而能夠表達(dá)很復(fù)雜的語(yǔ)言知識(shí)。兩者的巧妙融合形成了規(guī)則統(tǒng)計(jì)法。目前來看該方法將成為計(jì)算語(yǔ)言學(xué)的主流方法。

4 漢語(yǔ)計(jì)算語(yǔ)言學(xué)研究的狀況及存在的問題

4.1 研究的狀況

屬于漢藏語(yǔ)系的中國(guó)在計(jì)算機(jī)語(yǔ)言學(xué)方面的研究與應(yīng)用目前還落后于印歐語(yǔ)系的歐美等國(guó)家,這是由漢語(yǔ)自身的特點(diǎn)以及國(guó)內(nèi)計(jì)算機(jī)技術(shù)相對(duì)落后造成的。但近年來,我國(guó)的計(jì)算語(yǔ)言學(xué)的研究在理論以及應(yīng)用方面都取得了可喜的成績(jī)。最典型的理論方面的研究成果是黃曾陽(yáng)(中國(guó)科學(xué)院聲學(xué)研究所)的概念層次網(wǎng)絡(luò)理論(Hierarchical Net Work of Concept);應(yīng)用方面的代表有北京大學(xué)的《現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典》、清華大學(xué)的《漢語(yǔ)語(yǔ)素?cái)?shù)據(jù)庫(kù)》、董振東的《知網(wǎng)》(How Net)、潘悟云的漢語(yǔ)方言地理信息系統(tǒng)平臺(tái)、中國(guó)社會(huì)科學(xué)院文學(xué)研究所的千萬詞級(jí)漢語(yǔ)語(yǔ)料庫(kù)、臺(tái)灣中央研究院的千萬級(jí)古代、近代、現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)及清華大學(xué)的《ZW大型通用漢語(yǔ)語(yǔ)料庫(kù)》等。

4.2 存在的問題

雖然國(guó)外的計(jì)算語(yǔ)言學(xué)(自然語(yǔ)言處理)技術(shù)比國(guó)內(nèi)先進(jìn),但國(guó)外的很多理論和方法很難照搬應(yīng)用在漢語(yǔ)言處理上。原因在于表意體系的漢語(yǔ)與表音體系的印歐語(yǔ)在自身特征上有很大的差異。印歐語(yǔ)在詞匯、語(yǔ)法、語(yǔ)用、語(yǔ)境諸層面上有明顯的特征區(qū)分,相互間又有對(duì)應(yīng)關(guān)系。但漢語(yǔ)在各層面上很難劃分,特別是句法和語(yǔ)法間的界限相當(dāng)模糊。另外,漢語(yǔ)沒有嚴(yán)格意義上的形態(tài)變化(形態(tài)標(biāo)記),對(duì)詞沒有一致認(rèn)可的定義,沒有明顯的分詞的自然形態(tài)界限。總的來說漢語(yǔ)的計(jì)算機(jī)處理要難于印歐語(yǔ)的處理,突出的幾個(gè)問題是:

(1)漢語(yǔ)的歧義

歧義是自然語(yǔ)言的普遍現(xiàn)象,當(dāng)語(yǔ)言形式不能完全決定語(yǔ)言內(nèi)容(語(yǔ)義)時(shí)即稱為歧義。在語(yǔ)言的語(yǔ)音、詞匯、句法、語(yǔ)境上都存在歧義現(xiàn)象。漢語(yǔ)言文字是字形、字音分離的文字(不考慮有音無字的民族語(yǔ)),所以一字多音、一音多字現(xiàn)象特別多。再加上漢語(yǔ)詞匯較難定義,句法、語(yǔ)法界限模糊,使得漢語(yǔ)的排歧相當(dāng)困難。目前多是綜合利用語(yǔ)法和語(yǔ)義知識(shí),結(jié)合字典、語(yǔ)法規(guī)則庫(kù)及上下文信息來進(jìn)行排歧,但效果并不理想,特別是無法解決語(yǔ)境歧義。

(2)漢語(yǔ)語(yǔ)法兼類

語(yǔ)法兼類即詞的同形異類,同一形式的詞具有兩種或兩種以上的語(yǔ)法功能類別。如“連”這個(gè)詞兼有副詞、介詞、動(dòng)詞、名詞和量詞5種詞性。兼類詞雖然數(shù)量不多,但出現(xiàn)的頻率較高,且越是常用詞,其兼類現(xiàn)象越嚴(yán)重。

(3)分詞

多數(shù)中文句子是一長(zhǎng)串連續(xù)的漢字(而不是以空格或其他分隔標(biāo)記分開的單詞),并且詞匯缺少明顯的形態(tài)變化[4]。

(4)詞性標(biāo)注

建立句法結(jié)構(gòu)樹的首要任務(wù)是詞性標(biāo)注,即明確文本中所有語(yǔ)法兼類詞在具體語(yǔ)境下所屬的詞性。在語(yǔ)法平面內(nèi)現(xiàn)有的詞性標(biāo)注法有:基于規(guī)則的方法、基于統(tǒng)計(jì)的方法、基于神經(jīng)網(wǎng)絡(luò)的方法、規(guī)則與統(tǒng)計(jì)混合法。

(5)電子詞典

電子詞典包含了語(yǔ)料加工處理所需的有關(guān)詞的各種語(yǔ)言學(xué)知識(shí),包括分詞、詞性標(biāo)注、短語(yǔ)分析等。電子詞典的規(guī)模和質(zhì)量決定了計(jì)算機(jī)處理語(yǔ)言的成敗,目前高質(zhì)量、大規(guī)模的漢語(yǔ)電子詞典還在建設(shè)中。

(6)規(guī)則庫(kù)

語(yǔ)言是有規(guī)則的,規(guī)則是可以描述和處理的。規(guī)則庫(kù)就是把語(yǔ)言學(xué)知識(shí)歸納成一套文法規(guī)則,用于判斷匹配成的句子是否合法。

最典型的語(yǔ)言學(xué)知識(shí)表示方法有依存語(yǔ)法(Dependency Grammar)、格語(yǔ)法(Case Grammar)、語(yǔ)法樹方法(Syntax Tree)、轉(zhuǎn)換生成語(yǔ)法(Transformational Generative Grammar)、擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)法(Augmented Transition Network)、語(yǔ)義網(wǎng)絡(luò)(Semantic Network)理論、蒙塔鳩語(yǔ)法(Montague Grammar)、系統(tǒng)語(yǔ)法(System Grammar)、概念依存理論(Conceptual Dependency Theory)和現(xiàn)代語(yǔ)法理論。

20世紀(jì)80年代后,國(guó)外又推出了一些新的語(yǔ)法理論和方法,較有影響力的有廣義短語(yǔ)結(jié)構(gòu)語(yǔ)法(Generalized Phrase Structure Grammar)、頭驅(qū)動(dòng)的短語(yǔ)結(jié)構(gòu)語(yǔ)法(Head-driven Phrase Structure Grammar)、 詞匯功能語(yǔ)法(Lexical Functional Grammar)、 功能 合 一 語(yǔ) 法 (Functional Unification Grammar)、 鏈 語(yǔ) 法 (Link Grammar)、 范 疇 語(yǔ) 法(Categorial Grammar)、依存語(yǔ)法(Dependency Grammar)和樹嫁接語(yǔ)法(Tree Adjoining Grammar)。

而以上這些文法規(guī)則多是國(guó)外學(xué)者基于印歐語(yǔ)言對(duì)象的研究成果,要么完全不適用于漢語(yǔ)處理,要么需要系統(tǒng)改造后才能適用于漢語(yǔ)處理。

(7)統(tǒng)計(jì)信息庫(kù)

統(tǒng)計(jì)信息庫(kù)包含了對(duì)語(yǔ)料庫(kù)信息的各種統(tǒng)計(jì)結(jié)果,如帶詞性標(biāo)注的詞頻統(tǒng)計(jì)、鄰接詞同現(xiàn)概率統(tǒng)計(jì)和短語(yǔ)結(jié)構(gòu)分布信息等,它為基于統(tǒng)計(jì)的語(yǔ)料庫(kù)處理技術(shù)提供了客觀的語(yǔ)言分布數(shù)據(jù)。這些數(shù)據(jù)可以認(rèn)為是計(jì)算機(jī)從大規(guī)模語(yǔ)料中獲得的語(yǔ)言學(xué)知識(shí),不僅有助于計(jì)算機(jī)信息處理,更對(duì)語(yǔ)言學(xué)研究起到推動(dòng)作用。同電子詞典一樣,漢語(yǔ)的統(tǒng)計(jì)信息庫(kù)還處于發(fā)展建設(shè)階段。

5 計(jì)算語(yǔ)言學(xué)的研究意義

1950年,圖靈(Alan Mathison Turing)提出了被后人稱之為人工智能直接起源之一的著名的“圖靈測(cè)試”。而這個(gè)測(cè)試正是機(jī)器理解人類語(yǔ)言的典型例子,所以有的學(xué)者把計(jì)算語(yǔ)言學(xué)(自然語(yǔ)言處理)看作是人工智能的一個(gè)分支。語(yǔ)言是人類智能與智慧的高度表現(xiàn),因而對(duì)計(jì)算機(jī)語(yǔ)言學(xué)的研究也有助于人們揭開人類智能的奧秘、認(rèn)識(shí)自己,為智能科學(xué)的發(fā)展和突破貢獻(xiàn)力量。

作為一個(gè)邊緣交叉學(xué)科,自然語(yǔ)言處理的發(fā)展受益于相關(guān)學(xué)科的發(fā)展,同時(shí)也會(huì)促進(jìn)相關(guān)學(xué)科,特別是信息科學(xué)、語(yǔ)言學(xué)、認(rèn)知學(xué)、心理學(xué)的進(jìn)步。計(jì)算語(yǔ)言學(xué)立足于實(shí)驗(yàn)、理論和計(jì)算來實(shí)現(xiàn)計(jì)算機(jī)對(duì)語(yǔ)言文字信息的自動(dòng)分析和理解,是實(shí)用性很強(qiáng)、應(yīng)用范圍很廣的學(xué)科,它為國(guó)民經(jīng)濟(jì)的發(fā)展和社會(huì)的進(jìn)步帶來了動(dòng)力。隨著信息化時(shí)代的到來,特別是近幾年來網(wǎng)絡(luò)信息的大爆炸,計(jì)算語(yǔ)言學(xué)被認(rèn)為是處理信息網(wǎng)絡(luò)世界中語(yǔ)言載體的核心技術(shù)。如今,計(jì)算語(yǔ)言學(xué)已在機(jī)器翻譯、信息檢索、人機(jī)交互、語(yǔ)音識(shí)別、語(yǔ)音合成、文本分類、自動(dòng)文摘、問答系統(tǒng)等應(yīng)用領(lǐng)域里發(fā)揮了重要作用,這正是該學(xué)科的研究意義和實(shí)用價(jià)值所在。

語(yǔ)言是人類智慧的最重要特征,可以說人類的語(yǔ)言和大腦是世界上最復(fù)雜的兩樣?xùn)|西,而計(jì)算機(jī)是研究它們的最有效的輔助工具。因此對(duì)計(jì)算語(yǔ)言學(xué)的研究及其成果的應(yīng)用是人類社會(huì)發(fā)展必須且必將邁過的一道坎。另外值得一提的是,近期越來越多的學(xué)者指出漢語(yǔ)是世界上方言語(yǔ)種最多、文獻(xiàn)資料最豐富、唯一保持歷史延續(xù)性的語(yǔ)言,對(duì)漢語(yǔ)的計(jì)算語(yǔ)言學(xué)研究不僅對(duì)重樹我國(guó)文明大國(guó)的地位有著積極的推動(dòng)作用,更重要的是,未來國(guó)際計(jì)算語(yǔ)言學(xué)研究的突破極有可能發(fā)生在中國(guó)。

[1]俞士汶.計(jì)算語(yǔ)言學(xué)概論[M].北京:商務(wù)印書館,2007.

[2]馮志偉.自然語(yǔ)言處理的形式模型[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2010.

[3]江銘虎.自然語(yǔ)言處理[M].北京:高等教育出版社,2006.

[4]俞士汶,黃居仁.計(jì)算語(yǔ)言學(xué)前瞻[M].北京:商務(wù)印書館,2005.

猜你喜歡
規(guī)則計(jì)算機(jī)語(yǔ)言
撐竿跳規(guī)則的制定
計(jì)算機(jī)操作系統(tǒng)
數(shù)獨(dú)的規(guī)則和演變
語(yǔ)言是刀
文苑(2020年4期)2020-05-30 12:35:30
基于計(jì)算機(jī)自然語(yǔ)言處理的機(jī)器翻譯技術(shù)應(yīng)用與簡(jiǎn)介
科技傳播(2019年22期)2020-01-14 03:06:34
讓語(yǔ)言描寫搖曳多姿
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
信息系統(tǒng)審計(jì)中計(jì)算機(jī)審計(jì)的應(yīng)用
TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
累積動(dòng)態(tài)分析下的同聲傳譯語(yǔ)言壓縮
主站蜘蛛池模板: 婷婷99视频精品全部在线观看| 亚洲天堂自拍| 99精品这里只有精品高清视频| 亚洲国产中文综合专区在| 高清码无在线看| 久久精品视频亚洲| 九九视频免费看| 欧美曰批视频免费播放免费| 91在线播放国产| 国产麻豆精品久久一二三| 国产在线视频福利资源站| 国产精品午夜福利麻豆| 午夜老司机永久免费看片| 素人激情视频福利| 久久这里只有精品66| 色AV色 综合网站| 日韩欧美色综合| 人妻免费无码不卡视频| 在线另类稀缺国产呦| 九九热视频在线免费观看| 国产性猛交XXXX免费看| 亚洲无码高清视频在线观看| 青青国产在线| 欧美日韩高清| 欧美激情网址| 国产精品无码在线看| 亚洲日韩精品伊甸| 免费一级成人毛片| 中文字幕首页系列人妻| 欧美区一区二区三| 欧美A级V片在线观看| 亚洲婷婷在线视频| 久草视频精品| 亚洲色大成网站www国产| 国产高清无码第一十页在线观看| 国产精品香蕉在线观看不卡| 乱系列中文字幕在线视频| 国产成人禁片在线观看| 国产97区一区二区三区无码| 国产亚洲视频中文字幕视频| 久久精品中文字幕免费| 亚洲成人一区二区三区| 国产另类乱子伦精品免费女| 国产区免费| 亚洲综合中文字幕国产精品欧美| 2020国产免费久久精品99| 精品午夜国产福利观看| 99久久精品国产自免费| 国产嫩草在线观看| 久久久精品久久久久三级| a毛片免费在线观看| 免费无码一区二区| 激情无码字幕综合| 99精品国产自在现线观看| 中文字幕无码av专区久久| 国产91高跟丝袜| 亚洲综合第一区| 欧美精品另类| 国产最新无码专区在线| h视频在线观看网站| 亚洲黄色视频在线观看一区| 国产欧美日韩一区二区视频在线| 欧美成人精品一区二区| 天天摸天天操免费播放小视频| 国产一区二区三区精品欧美日韩| 性色一区| 国产sm重味一区二区三区| 国产va在线| 114级毛片免费观看| 欧美成人h精品网站| 婷婷色一区二区三区| 国产福利2021最新在线观看| 精品国产一区91在线| 97人妻精品专区久久久久| 最新痴汉在线无码AV| 久久久久久久久18禁秘| 色婷婷天天综合在线| 国产欧美日韩资源在线观看| 成人国产免费| 久久一本精品久久久ー99| 欧美日本在线播放| a毛片在线免费观看|