摘要:基于知識的問題求解需要一個豐富而相對完備的信念系統(tǒng),尤其是當(dāng)任務(wù)具有領(lǐng)域非限定特征時。經(jīng)典知識工程關(guān)于知識獲取、表示與使用的方法只能適應(yīng)領(lǐng)域受限問題,因為它不是從概念發(fā)展的角度來建構(gòu)概念系統(tǒng)的,面臨著Framework Problem。針對認(rèn)知心理學(xué)對概念系統(tǒng)發(fā)展與表征問題研究有一定的認(rèn)知深度同時又缺乏系統(tǒng)構(gòu)造與實現(xiàn)機制研究的情況,提出了一種基于框架表征的概念系統(tǒng)表征與發(fā)展方法,詳細(xì)研究了概念在內(nèi)的隱水平I、外顯水平E1、外顯水平E2和外顯水平E3上的表征和發(fā)展過程。這一研究對于提高基于知識的系統(tǒng)推理能力和問題求解能力具有顯著意義。
關(guān)鍵詞:概念化; 知識表示; 學(xué)習(xí); 語義系統(tǒng)
中圖法分類號:TP301文獻標(biāo)識碼:A
文章編號:1001-3695(2007)01-0018-02
1概念系統(tǒng)發(fā)展
人之所以能熟練地實施問題求解、推理、決策、規(guī)劃、自然語言理解、情景理解等認(rèn)知行為,都是因為他有一個相對完備的概念系統(tǒng)。人的這些認(rèn)知行為不同于以特定應(yīng)用背景為目標(biāo)的人工智能系統(tǒng),因為后者通常是一個在問題內(nèi)容、呈現(xiàn)形式、應(yīng)用背景、預(yù)設(shè)條件等方面都非常有限定性的系統(tǒng),而前者不是。也就是說為了應(yīng)對如此廣泛、不確定的需求,人的知識系統(tǒng)必須是通用性的,而不能是專用性的。最為神奇的是人們用一個知識系統(tǒng)就能夠完成問題求解、推理、規(guī)劃、決策、語言理解與情景理解等所有智能性操作,這對知識系統(tǒng)所具有的知識量、表征與存儲方式、使用方式提出了很高的要求。當(dāng)前專家系統(tǒng)或基于知識的系統(tǒng)在知識表示方法的研究上還不能適應(yīng)認(rèn)知的要求。我們知道知識的核心是概念,我們通常將概念化后的知覺經(jīng)驗稱為知識,知識在可陳述性上更為突出,但作為智能行為的內(nèi)核來說,知識系統(tǒng)與概念系統(tǒng)并無原則上的差異。在后文中我們更多使用的是概念系統(tǒng)。
非限定性的知識使用過程需要一個完備的概念系統(tǒng)[1]。最明顯的例子來自人們在自然語言理解、基于上下文的情景理解和涉及常識的問題求解時不拘一格地靈活運用知識。
人的概念系統(tǒng)的形成不是一蹴而就的,有一個由少到多、從粗到精的發(fā)展過程,正是從小到大地不斷學(xué)習(xí)才能得到。因此對概念系統(tǒng)形成的過程在算法層次上的研究將非常有助于構(gòu)造更為理想的知識結(jié)構(gòu),這對人工智能而言是一個非常核心的問題[2]。
知識表示雖然是人工智能的傳統(tǒng)和經(jīng)典研究領(lǐng)域,但近年來在新知識表示方法以及針對知識表達充分性、知識結(jié)構(gòu)、概念系統(tǒng)、概念化等專題的研究非常缺乏,一個共同點是研究的出發(fā)點往往是知識工程的應(yīng)用需求而不是解釋認(rèn)知的理論需求,雖然可實現(xiàn)性很好,但無法達到心理學(xué)的理論深度。
發(fā)展心理學(xué)與認(rèn)知心理學(xué)對此類問題有很多的研究[3],但這些領(lǐng)域?qū)^程的研究多于對機制的研究,基本上可以說是粗線條的,均不在算法層次上。即使提出了一些對認(rèn)知現(xiàn)象進行解釋的模型也因為缺乏對表征和加工過程銜接的細(xì)節(jié)研究,以及包含有太多尚未有定論的其他認(rèn)知技能,從而使得這些模型很不精細(xì),離可操作性有非常遠(yuǎn)的距離。本研究的目標(biāo)是為概念發(fā)展的表征形式找到一個可實現(xiàn)的方法,為計算機系統(tǒng)執(zhí)行基于知識的任務(wù)時提供豐富詳實的語義支持。這一研究基于這樣一個理論背景,即探索認(rèn)知結(jié)構(gòu),這是一個若干領(lǐng)域共有的核心科學(xué)問題[4,5]。
2表征重述理論
發(fā)展心理學(xué)致力于研究人的認(rèn)知發(fā)展過程,其中較具代表性的觀點有Piaget的后成建構(gòu)論以及Fodor的模塊先天論。KarmiloffSmith調(diào)和先天論與建構(gòu)論中的某些方面,提出了表征重述過程與RR(Representation Redescription)模型[6]。她主張人類特有的獲取知識的方式是通過表征重述過程,認(rèn)為相同的知識可以有多種儲存的形式和水平。RR模型包括三個階段以及維持這三個階段的四種不同水平的表征。
(1)人們主要從外部環(huán)境中抽取信息形成表征附加物,這時的表征只是加在已有的材料之上,既不改變既存的穩(wěn)定表征,也不與它們發(fā)生關(guān)系。在這一階段的表征形式稱為內(nèi)隱(水平I)表征。在這個水平上的表征以程序形式對外在環(huán)境中的刺激進行編碼。水平I表征獨立儲存,可以產(chǎn)生成功的行為,但這種行為是相對不靈活的。
(2)一個內(nèi)部驅(qū)動的階段,內(nèi)部表征成為變化的重點。維持這一階段的表征是外顯1(E1)表征。E1表征是水平I表征重新編碼為一種新的壓縮形式的結(jié)果。水平E1涉及外顯的表征,這些表征能被操作并與其他重述過的表征發(fā)生聯(lián)系。它們還沒有通達到意識,也不能用言語報告,但顯然超越了程序水平。
(3)外部材料和內(nèi)部表征調(diào)和了,在內(nèi)部控制和外部控制之間達到平衡。維持這個階段的表征被稱為外顯2/3(E2/3)水平表征。E2/3表征超越了E1水平的表征,它們均涉及有意識的通達,區(qū)別是E3水平可言語報告而E2則不能。
在每一個階段,最后結(jié)果都必須是在現(xiàn)有表征水平下達到行為的連貫成功,這被稱為行為掌握。在相鄰兩個階段之間發(fā)生表征重述,表征重述過程以行為掌握為基礎(chǔ)。通過表征重述,獨立儲存的、程序化的內(nèi)隱信息逐漸變?yōu)榭梢员徽J(rèn)知系統(tǒng)其他部分利用且較靈活的外顯知識。表征重述過程在人的認(rèn)知發(fā)展過程中的各個領(lǐng)域、各個時刻不斷重復(fù)發(fā)生,且受到已有表征內(nèi)容和外顯水平的制約。
RR模型的提出為知識系統(tǒng)的建構(gòu)提供了一種新的方法,即從表征的變化發(fā)展來研究認(rèn)知發(fā)展。由于這個模型屬于發(fā)展心理學(xué)領(lǐng)域,所以只是一個粗線條的假設(shè),在計算角度上非常不精細(xì)。筆者雖然提出了幾種不同水平的表征,但并沒有詳細(xì)描述其表征形式,也沒有給出重述過程具體遵循哪些因素、如何發(fā)生等細(xì)節(jié)。因此,如果想要把RR模型應(yīng)用到知識系統(tǒng)的建構(gòu)中來,如何表示各種不同水平的知識、選取哪些特征、以何種形式進行重述等都是有待解決的問題。
3表征的實現(xiàn)
RR模型提出了四種不同水平的表征,但區(qū)別這四種水平表征的因素,如是否通達到意識、能否用言語報告等無法簡單地對應(yīng)到概念系統(tǒng)中來。因此,我們可以借鑒RR模型中表征發(fā)展的觀點,而不必嚴(yán)格遵循模型中幾種水平的劃分。系統(tǒng)中的表征主要包括以下幾種:
(1)外部知覺材料的表征。其表征元素包括從人的感覺通道采集到的物理信息,如顏色、重量、長度等;也包括一些簡單的抽象關(guān)系,如包含關(guān)系和類屬關(guān)系等;另外還包括一些帶參數(shù)的形式化動作原語,它們表示一些語義極其簡單的動作過程,如握、踢等。在表征形式上,用經(jīng)典的框架方法來表示概念,框架中的槽表示概念的屬性。事件用劇本來表示,它包括角色——事件的主角、開始狀態(tài)和結(jié)果,以及按照時間順序描述的事件過程。知覺經(jīng)驗的表征嚴(yán)格說來并不算一種心理表征,它只是盡可能如實地反應(yīng)了外部材料。以后的所有表征水平都是在此基礎(chǔ)上進行提取、抽象、歸納和分析的結(jié)果。表1描述了一個簡單的計數(shù)事件,在事件過程中,從“Here”重復(fù)移動一個蘋果到“There”,并以“One, Two, Three,…”的順序計數(shù),最后重復(fù)計數(shù)過程的最后一個數(shù)字。
表1簡單計數(shù)事件實例
(2)內(nèi)隱表征。它是通過底層次的歸納和加工,把知覺過程參數(shù)化后所得的表征。最初輸入系統(tǒng)中的外部材料都是很具體的,對它可進行的處理很有限,除了基于物理信息相似性的歸納外,還有一些特征的提取。提取的依據(jù)參照認(rèn)知心理學(xué)家提出的一些先天敏感性,如對循環(huán)周期的敏感性以及在幾何形狀中對對稱的敏感性等。內(nèi)隱表征的形式是參數(shù)化的程序表征,它用與程序很類似的語句描述了某類事件的一般性流程,與程序語句一樣,其中可能包括一些循環(huán)分支和條件分支。正如RR模型中的內(nèi)隱水平一樣,它能引起正確的行為,但這種行為是不靈活的。表2描述了計數(shù)過程的內(nèi)隱表征,它描述出了計數(shù)中的循環(huán)過程,即從待計數(shù)集合中重復(fù)選出物體進行計數(shù)直到不存在未被計數(shù)的物體為止。
表2計數(shù)過程的內(nèi)隱表征
(3)外顯表征1。在此水平中,程序中的內(nèi)隱信息開始被逐步外顯,在這一水平首先被外顯的是程序的結(jié)果部分。在外顯過程中,事件結(jié)果的語義被突出。一個事件的結(jié)果可以表示該事件的大部分語義,經(jīng)過結(jié)果的外顯,這個事件本身擁有了語義,可以被系統(tǒng)其他部分所利用。表3是計數(shù)事件的外顯1水平表征,它與上一水平相比,僅僅是結(jié)果上的外顯。在上一水平一個毫無意義的計數(shù)結(jié)果,在這一水平被外顯成為了被計數(shù)集合的一個屬性,即集合的基數(shù)。
表3計數(shù)事件的外顯1水平表征
(4)外顯表征2。在此水平中,事件中的其余信息(如因果關(guān)系等)被外顯。外顯的結(jié)果使這些信息變得更通用、更一般化,并且同樣能為系統(tǒng)其他部分所利用。表4描述了計數(shù)事件的外顯2水平表征。比較兩個水平可以看出,在外顯2表征中,事件里被計數(shù)集合內(nèi)的元素與計數(shù)序列中的“One,Two, Three,…”元素一一對應(yīng),該信息被外顯了。
表4計數(shù)事件的外顯2水平表征
以上四種表征的變化發(fā)展過程也正是概念系統(tǒng)變化發(fā)展的過程。需要強調(diào)的一點是,系統(tǒng)任何時刻的知識表征都不會是它最終的表征,知識的發(fā)展變化是知識系統(tǒng)建構(gòu)的一個重要特點。對同一知識的各種不同水平的表征同時存在于系統(tǒng)中,對不同的任務(wù)可以采用不同的表征來完成。
4討論
上述研究的根本目標(biāo)是在算法可實現(xiàn)的要求下建立一個使用參照和佐證符號語義系統(tǒng)。更復(fù)雜的、領(lǐng)域非限定的應(yīng)用需要語義信息更完備的推理,這無法在人工智能的傳統(tǒng)假設(shè),即低階結(jié)構(gòu)不連續(xù)假設(shè)的基礎(chǔ)上做到。本文所提出的與其說是知識獲取模型,不如說更是一個認(rèn)知模型,它有助于我們在非常細(xì)節(jié)的層次上認(rèn)識概念系統(tǒng)的表征形式和使用原則。
參考文獻:
[1]危輝.認(rèn)知相關(guān)性與智能模型構(gòu)造的系統(tǒng)觀點(博士后研究工作報告)[D].杭州:浙江大學(xué)研究生院,2000.
[2]Mark H Bickhard, Loren Terveen. Foundational Issues in Artificial Intelligence and Cognitive Science[M]. Amsterdam: Elsevier,1995.1118.
[3]劉愛倫,水仁德.思維心理學(xué)[M].上海:上海教育出版社,2002.
[4]Kurt Vanlehn. Architectures for Intelligence[M]. New Jersey: Lawrence Erlbaum Associates Publishers, 1991.
[5]Robert L Solso. Mind and Brain Sciences in 21st Century[M]. Cambridge: The MIT Press, 1997.
[6]KarmiloffSmith A. Beyond Modularity: A Developmental Perspective on Cognitive Science[M]. Cambridge:The MIT Press, 1992.
[7]Carassa A, Tirassa M. Representational Redescription and Cognitive Architectures[J]. Behavioral and Brain Sciences,1994,17(4):711712.
作者簡介:
施蕓虹,碩士,主要研究方向為智能系統(tǒng);危輝,教授,主要研究方向為人工智能、認(rèn)知科學(xué);陳燕,碩士,主要研究方向為人工智能。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文