摘 要:長(zhǎng)久以來(lái),作為人工智能的關(guān)鍵問(wèn)題,自然語(yǔ)言理解的發(fā)展一直局限于以詞匯、句法、語(yǔ)義、語(yǔ)用的分析為基礎(chǔ)。無(wú)論是機(jī)器翻譯,語(yǔ)料庫(kù)研究,語(yǔ)篇理解研究,還是概念層次網(wǎng)絡(luò)理論,只是研究形式不同,究其根本都是在進(jìn)行語(yǔ)言規(guī)則與統(tǒng)計(jì)的研究,都未能脫離傳統(tǒng)模式的束縛。本文突破傳統(tǒng),從信息屬性著手,提出了信息耦合屬性概念。
關(guān)鍵詞:自然語(yǔ)言理解;人工智能;信息耦合
自然語(yǔ)言理解是人工智能的一個(gè)重要分支。國(guó)外自然語(yǔ)言理解研究較早,也誕生了諸多較有影響的理論。自二十世紀(jì)50年代以來(lái),在眾多語(yǔ)言學(xué)家、邏輯學(xué)家、心理學(xué)家等的努力下,各種關(guān)于自然語(yǔ)言理解的理論體系紛紛誕生。其中較有影響的有:轉(zhuǎn)換生成語(yǔ)法、依存語(yǔ)法、語(yǔ)義網(wǎng)絡(luò)、蒙塔鳩語(yǔ)法、擴(kuò)展轉(zhuǎn)換網(wǎng)絡(luò)、系統(tǒng)語(yǔ)法、格語(yǔ)法、概念依存理論、境況語(yǔ)義學(xué)等。近年來(lái),語(yǔ)料庫(kù)語(yǔ)言學(xué)又得到迅速發(fā)展。國(guó)內(nèi)自然語(yǔ)言理解研究起步較晚,要從二十世紀(jì)70年代末算起。早期階段以語(yǔ)形分析為主,中期及中后期開(kāi)始注重語(yǔ)義分析并開(kāi)始探索基于語(yǔ)料庫(kù)的統(tǒng)計(jì)方法。近期則語(yǔ)料庫(kù)統(tǒng)計(jì)與規(guī)則分析并重。
對(duì)于自然語(yǔ)言理解,從國(guó)際上看當(dāng)前的問(wèn)題主要表現(xiàn)為,一方面是哲學(xué),認(rèn)知科學(xué),思維科學(xué)和心理學(xué)等學(xué)科所研究的層次太高,太抽象,宏觀與微觀隔離,提出的方案根本無(wú)法付諸具體實(shí)施;另一方面是,一直局限于以語(yǔ)法、語(yǔ)義、語(yǔ)境研究為基礎(chǔ)的應(yīng)用語(yǔ)言學(xué)所研究的層次太低,談不上是真正的自然語(yǔ)言理解。就國(guó)內(nèi)而言,其特點(diǎn)是:課題比較分散,應(yīng)用項(xiàng)目偏多,基礎(chǔ)研究比例略少;選題時(shí),容易跟著國(guó)外的選題走,立項(xiàng)論證時(shí),關(guān)鍵考慮國(guó)外怎么做,很多課題沒(méi)有取得理論上的突破。
總的來(lái)看,無(wú)論是國(guó)外的研究還是國(guó)內(nèi)的探索,各種自然語(yǔ)言理解方法理論體系歸根結(jié)底都毫無(wú)例外地遵循下面的原則:1.把所需要研究的語(yǔ)言問(wèn)題形式化。2.找出解決問(wèn)題的相應(yīng)算法。
然而審視問(wèn)題角度的差異常常會(huì)從根本上制約我們對(duì)事物的認(rèn)知。就如同我們?cè)鯓涌创O(píng)果落地一樣。是蘋(píng)果天經(jīng)地義就應(yīng)該落地,就像我們已經(jīng)認(rèn)知的其他萬(wàn)千事物一樣,不需要再考慮,還是另有引力促成?對(duì)于自然語(yǔ)言理解是必須把所要研究的語(yǔ)言問(wèn)題形式化,得出其相應(yīng)算法,就像長(zhǎng)久以來(lái)人們對(duì)其認(rèn)知的情況一樣,不需要再考慮,還是另有信息屬性促成呢?
眾所周知,計(jì)算機(jī)解決問(wèn)題的關(guān)鍵是算法。但我們?nèi)祟悶橛?jì)算機(jī)賦予某種算法后,計(jì)算機(jī)也只能解決這些算法能使其解決的問(wèn)題。自圖靈測(cè)試提出以來(lái),人們想盡各種方案來(lái)解決這一難題。但人們最終發(fā)現(xiàn),計(jì)算機(jī)執(zhí)行命令是必須要有算法的,只要計(jì)算機(jī)按照一定的算法去執(zhí)行一定的命令,那么似乎它就永遠(yuǎn)也不可能突破圖靈測(cè)試,無(wú)法實(shí)現(xiàn)真正的自然語(yǔ)言理解。除非有一種算法,這種算法可以使計(jì)算機(jī)像人類一樣接收外界萬(wàn)事萬(wàn)物的信息,并對(duì)其做出自主的反應(yīng)。然而,當(dāng)前來(lái)看,這似乎是不可能的。因?yàn)橥饨缛f(wàn)事萬(wàn)物的信息數(shù)量是無(wú)限的,其變化發(fā)展亦是無(wú)限的。我們根本無(wú)法找出所有信息的特點(diǎn)及信息與信息之間的關(guān)系,并將其賦予計(jì)算機(jī),使得計(jì)算機(jī)能夠?qū)θ魏涡畔⒆龀龊侠矸磻?yīng)。
從算法的角度看,人的智能是靈活無(wú)限的,而計(jì)算機(jī)只能按照人編排好的算法去執(zhí)行有限的命令。目前,尚無(wú)一種算法能夠完成對(duì)所有事物關(guān)系的認(rèn)知。只要我們賦予計(jì)算機(jī)以一定的算法,就無(wú)法使其真正智能化。而沒(méi)有算法,計(jì)算機(jī)解決問(wèn)題就無(wú)從談起。除非能找到一種無(wú)算法算法,才可能使其從根本上有所突破,否則就談不上是真正的自然語(yǔ)言理解。而這聽(tīng)起來(lái)就是矛盾的。
那么,從審視計(jì)算機(jī)的角度來(lái)看,人腦的智能應(yīng)是何來(lái)呢?是人腦中天生就存有宇宙中所有事物的關(guān)系,所以才有著無(wú)限的認(rèn)知能力么?顯然,這是荒謬的。那么,人是如何能了解宇宙萬(wàn)物的呢?既然不是內(nèi)有,那么就一定是外來(lái)。這些關(guān)系一定存在于事物信息之中。
如果事物關(guān)系是存在于信息自身當(dāng)中,那么就恰恰為無(wú)算法算法的實(shí)現(xiàn)提供了充分必要條件。所謂無(wú)算法算法,其中算法就是指賦予計(jì)算機(jī)以一定的算法去處理信息,無(wú)算法就是對(duì)于外部世界無(wú)限數(shù)量的具體信息間的邏輯關(guān)系與處理方案,是根據(jù)信息耦合屬性,從信息自身中去提取而不是人為去賦予。
那么,信息在什么結(jié)構(gòu)環(huán)境下,怎樣交互作用才會(huì)解出事物關(guān)系呢,這會(huì)不會(huì)是一種極為復(fù)雜的情況呢?有人認(rèn)為,在對(duì)人腦沒(méi)有透徹的了解之前,無(wú)法實(shí)現(xiàn)真正的智能。這就好比是在說(shuō),在沒(méi)有找到能飛上月球的鳥(niǎo)進(jìn)行研究之前,人類是不可能制造出登月飛船的。
試想,人類是在自然環(huán)境下進(jìn)化而來(lái)的。這是個(gè)極為緩慢的過(guò)程。從單細(xì)胞生物開(kāi)始,到目前經(jīng)歷了數(shù)十億年,生物體長(zhǎng)久以來(lái)絕大部分機(jī)能還只是用在維系生命體的存活上了。萬(wàn)千生物當(dāng)中,目前,也只有人類一種生命體達(dá)到了智能的水平。因此,從歷史的角度來(lái)看,智能到目前為止還應(yīng)該是一個(gè)基于生物性基礎(chǔ)上萌發(fā)的一個(gè)相對(duì)極為簡(jiǎn)單而絕非復(fù)雜的事物才對(duì)。
對(duì)于自然語(yǔ)言理解,之所以長(zhǎng)久以來(lái)找不到能真正解決問(wèn)題的答案,問(wèn)題在于前提條件的錯(cuò)誤。人們假定了這樣前提條件,計(jì)算機(jī)在什么條件下執(zhí)行什么樣的命令要由人來(lái)預(yù)先指定,接下來(lái)一切對(duì)于答案的努力都是基于這個(gè)錯(cuò)誤的前提下進(jìn)行的,因而找不到答案。
[參考文獻(xiàn)]
[1]馮志偉.機(jī)器翻譯研究[M].北京:中國(guó)對(duì)外翻譯出版公司.2005.
[2]黃昌寧.統(tǒng)計(jì)語(yǔ)言模型能做什么?[J].語(yǔ)言文字應(yīng)用,2002,1.
[3]黃曾陽(yáng).HNC理論概要[J].中文信息學(xué)報(bào).1997,11.
作者簡(jiǎn)介:胡振波(1979.6-),男,吉林省舒蘭市人,學(xué)歷:碩士,專業(yè):英語(yǔ)語(yǔ)言學(xué),研究方向:應(yīng)用語(yǔ)言學(xué)。