馮 康
(淮南師范學院計算機與信息工程系,安徽 淮南 232038)
認知科學的發展及研究方向*
馮 康
(淮南師范學院計算機與信息工程系,安徽 淮南 232038)
研究認知科學的起源、發展、學科結構及研究方向。提出了基于過程的認知定義,探討了認知科學的起源;將認知科學的發展劃分為計算理論、符號處理理論、多理論三個階段;論述了認知科學的學科結構及研究方向,指出認知模型、大腦存儲模型、認知計算是當前認知科學的主要研究方向。研究發現,基于過程的認知定義能夠體現認知的本質。一元事件認知模型能夠模擬人類的認知,是一種理想的認知模型。
認知科學;認知模型;大腦存儲模型;認知計算
認知科學研究的任務是發現人類認知的本質和規律,揭示人類心智的奧秘。美國國家科學基金會(NSF)已經將認知科學列為21世紀四大帶頭學科之一,并啟動了人類認知組計劃HCP(Human Cognome Project)[1],而我國也在《國家中長期科學和技術發展規劃綱要(2006-2020)》中將認知科學列為基礎研究的學科前沿問題。因此,非常有必要對認知科學的起源、發展、研究方向及最新的研究成果進行綜述。
2.1 認知的不同定義
2.1.1 心理學定義
心理學認為:認知在廣義上是指任何生物體生理特性的一種功能表現,狹義上是指人腦中以信息處理方式進行的認識過程。美國心理學家霍斯頓(Houston J P)等人[2]進一步把這種觀點歸納為認知表現的五種主要類型:
(1)認知是信息的處理過程;
(2)認知是思維的過程;
(3)認知是心理學上的符號運算;
(4)認知是對問題的求解;
(5)認知是一組相關的活動,如知覺、思維、學習、記憶、判斷、推理、問題求解、概念形成、想象、語言使用等。
2.1.2 哲學定義
哲學從四個層次對認知進行了定義:
(1)認知是人類認識客觀事物、獲得知識的活動;
(2)認知是人類知覺、記憶、學習、言語、思維和問題解決的過程,是人類對外界信息進行積極加工的過程;
(3)認知可以表示為目標、信念、知識和知覺及對這些表示實施操作的計算;
(4)認知是回答“什么、誰、何時、哪里、怎樣”這幾個問題的答案[3]。
2.1.3 語言學定義
語言學從語言在認知中的獨特作用給出了認知的定義:認知是人類對語言的處理過程。該定義從四個層次概括了語言和認知的關系:
(1)認知是人類語言產生的原因;
(2)語言是人類認知的對象;
(3)語言是人類認知的表達;
(4)認知的發展帶動語言的發展[4]。
2.1.4 計算機科學定義
計算機科學從計算的角度對認知給出了既簡單而又深刻的定義:認知是大腦的一種計算。計算機科學提出這樣的定義,是因為人腦和計算機無論在硬件層次和軟件層次有多么的不同, 但是在計算理論這一層次上, 它們都具有產生、操作和處理抽象符號的能力,都是一個信息計算的系統[5]。
2.1.5 基于過程的認知定義
對于認知的本質,文獻[6,7]認為,認知不同于感知,人類感覺器官每天都會接收海量的感知信息,但并沒有觸發相應的認知,只有感知信息間發生了相互作用才會觸發認知;認知不是對觀察到的感知信息間的相互作用進行簡單存儲,而是在對它們的計算,并轉化為知識加以記憶。認知是一個學習系統,理解世界的知識還可以通過學習直接獲取并加以記憶;認知是一個輸入/輸出系統,輸入量是需要完成的任務,輸出量是完成任務的方法,而完成任務是通過改造世界來實現的;認知是一個反饋系統,改造世界中方法的有效性會校正理解世界中的知識。根據認知的以上本質,文獻[8]提出基于過程的認知定義,定義認知是人類觀察世界、理解世界、改造世界的完整過程,如圖1所示。

Figure 1 Cognition based on process圖1 基于過程的認知
上述定義中,觸發人類認知的是外部世界的事件,而事件就是人類感知信息間相互作用的邏輯表達;觀察世界是對觸發認知的事件進行計算,并轉化為認識,而認識就是知識的一種表達;理解世界是對觀察世界轉化的認識進行記憶,同時理解世界還可以通過學習直接接收外部世界已有的認識加以記憶,體現了認知是一個學習系統的思想;改造世界根據理解世界記憶的認識,完成外部世界輸入的任務,并向外部世界輸出完成任務的方法,體現了認知是一個輸入/輸出系統的思想;改造世界中如發現完成任務的方法無效,還可以反過來影響理解世界中的認識,體現了認知是一個反饋系統的思想;而正是觀察世界、理解世界、改造世界的完整過程構成了認知。因此,基于過程的認知定義能夠體現認知的本質。
2.2 認知科學的定義
認知科學是研究人類認知的本質及規律,揭示人類心智奧秘的科學。它的研究范圍包括知覺、注意、記憶、動作、語言、推理、思考乃至意識在內的各個層次和方面的人類的認知活動。認知科學是建立在心理學、計算機科學、神經科學、人類學、語言學、哲學共同關心的交界面上, 即為解釋、理解、表達、計算人類乃至機器的智能的共同興趣上, 涌現出來的高度跨學科的新興科學。
3.1 認知科學的起源
認知科學起源于古代,基本上以思辨式的研究為主。從20世紀30年代開始,一批有遠見卓識的科學家就已經開始了認知科學的基礎研究,1973年,美國心理學家朗蓋特第一次在論文中使用“認知科學(Cognitive Science)”一詞。1977年,著名的認知科學研究領域的權威期刊《Cognitive Science》創刊。1979年,在著名的斯隆基金會的資助下,由心理學、語言學、計算機科學和哲學界著名的學者Schank R、Collins A、Norman D等人發起,聯合其他學科對認知進行深入研究,一些著名的學者在加州共同成立了美國認知科學協會,并將權威期刊《Cognitive Science》確定為認知科學學會會刊。美國認知科學協會的成立標志著認知科學的誕生[9]。從此以后,世界各國的名牌大學及科研院所紛紛成立認知科學的研究中心或研究所,并創刊了一批具有國際影響力的認知科學學術期刊,如《Cognitive Psychology》、《Cognition》、《Cognitive Neuroscience》。上述種種努力,使得認知科學得到了迅速的發展,并逐漸成為世界各國爭相發展的前沿學科[10]。
3.2 認知科學的發展
在認知科學近60年的發展歷程中,其主要指導理論在發生著變化,因此我們可以按照主要指導理論將認知科學的發展分為以下三個不同的發展階段。
3.2.1 計算理論階段
約為20世紀40年代到50年代末,這一階段認知科學的研究主要是基于“認知即計算”這一經典理論而展開的。其代表人物為丘奇(Church)、圖靈、馮·諾伊曼。美國數學家丘奇最早在他的論文《初等數論中的一個不可解問題》中,提出了人類的認知和其它任何具有輸入輸出關系的函數一樣,都是可定義可計算的;圖靈在其著名的“圖靈機”和“圖靈測試”中,進一步表達了對認知和智力的理解,他認為認知和智力的任何一種狀態都是圖靈機的某一種狀態, 認知和智力的任何活動都是圖靈機定義的可以表達的、可以一步一步地機械實現的“計算”;馮·諾伊曼在“馮·諾伊曼體系結構計算機”中,將人類的大腦思維模擬為中央處理器對一系列指令序列的處理,而將人類記憶的認知信息和學習技能模擬為存儲器中存儲的數據和程序,將接受信息和改造世界模擬為輸入/輸出,從而將認知統一在“計算機”這一認知模擬器中,其中心思想仍然是中央處理器對指令的計算[11]。
3.2.2 符號處理理論階段
從20世紀50年代末到80年代初期,這一階段認知科學的研究主要基于“認知是對符號的計算機處理”的理論,又被稱為“計算機處理經典符號階段”,因為它和當時逐漸發展起來的計算機科學緊密相關。符號處理理論實際上是“認知即計算”理論的延伸和拓展。既然認知是計算,所以它一定是個信息處理系統,并將描述認知的基本單元定義為“符號”;而不同的認知活動都可以模擬為一個計算機程序;因此,人類的認知就是計算機程序對符號的一系列處理,包括輸入符號、輸出符號、存儲符號、復制符號、建立符號結構及條件性轉移,從而實現智能。艾倫·紐維爾和赫伯特·西蒙是這個階段認知科學研究的杰出代表,他們將任何可被人類感覺器官感知、智能系統分辨、認知功能實現的有意義的認知模式,如圖像、聲音、文字、語言、意識等,都編碼為物理符號,而將人類的某個認知活動模擬為一個計算機程序。基于這種思想,他們合作開發了最早的模擬人類認知的啟發式程序“邏輯理論家(Logic Theorist)”,并在著名的“達特茅斯會議”上發布,引起認知科學研究領域的極大轟動。他們進一步研究人類認知中求解難題的共同思維規律,開發出能夠求解11種難題的著名計算機程序“通用問題求解器(General Problems Solver)”,從而將符號處理階段的認知科學的研究發展到了一個頂峰。
3.2.3 多理論階段
從20世紀70年代到今天,三種主要的指導理論引領著認知科學的發展,它們分別是人工神經網絡理論、模塊理論、環境作用理論。
“人工神經網絡理論”又稱“聯結主義理論”,該理論把人類的認知模擬為多個人工神經元所組成的神經網絡來處理信息,是一種信息處理系統,信息是交互作用的人工神經元的激活模式,信息并不存在于特定的神經元中,而是存在于神經網絡的聯結中或權重里,通過調整權重就可以改變網絡的聯結關系并進而改變網絡的功能。
“模塊理論”由福德(Forder)首次提出,受計算機硬件和軟件中的模塊化思想影響,福德認為人類認知的主體—大腦,在結構及功能上實際都可以劃分為若干個高度專業化并相對獨立的認知模塊,這些模塊的結合及相互作用實現了人類的認知功能。因此,認知科學研究的重點應該是大腦功能模塊的劃分及相互作用機制的研究[12]。
“環境作用理論”認為,認知科學的研究不應該僅僅局限在表達(Represention)和推理(Reasoning)等認知方法和理論的研究中,還應該從系統的角度來研究,尤其注重認知體所在的環境及現場對認知的影響。人類的認知不只是認知個體大腦的思維活動,還取決于環境,發生在個體與環境的交互作用之中。這方面研究的代表人物是MIT的Brooks教授,他的《沒有表達的智能》、《沒有推理的智能》等一系列的論文,強調了認知體與環境交互作用對認知的重大影響,并以研究成果“人造昆蟲”將這一理論推到了高峰[13]。
4.1 認知科學的學科結構
當前,國際上公認的認知科學的學科結構如圖2所示,它是基于美國科學家Pylyshyn Z提出的六角形認知科學學科結構圖,分布在六角形六個頂點的是心理學、計算機科學、神經科學、語言學、人類學、哲學六大核心支撐學科,體現了認知科學是上述六大核心支撐學科共同關注的交界面[14]。這六大核心支撐學科之間互相交叉,又產生出11個新興交叉學科,分別是控制論、神經語言學、神經心理學、認知過程仿真、計算語言學、心理語言學、心理哲學、語言哲學、人類學語言學、認知人類學、腦進化。

Figure 2 Subject structure of cognitive science圖2 認知科學的學科結構圖
4.2 認知科學的研究方向
當前,認知科學的研究方向主要集中在與計算機科學相關的認知模型、大腦存儲模型及認知計算的研究上。
4.2.1 認知模型
認知模型是指模擬人類認知,從而人工構建出的認知對象、認知架構、認知模擬的統一體。考慮到認知科學研究的巨大復雜性,研究認知科學往往摒棄認知的許多表象,而將認知的實質簡化在一個認知模型(Cognitive Model)中,并通過對認知模型的研究來發現認知的本質及其規律[15]。
4.2.2 大腦存儲模型
大腦存儲模型是指仿生人類大腦的存儲機制而構造出的人工存儲模型。人類的大腦是迄今為止已知的最復雜、最合理、最高效的存儲系統。模擬大腦的存儲機制構建一個大腦存儲模型,以這個大腦存儲模型為研究對象進行大腦存儲的深入研究,不但可以解決以真正大腦為研究對象進行研究面臨的諸多生理和倫理困難,而且可以以一個全新的角度提出大腦存儲研究的科學理論和方法,并將這些理論和方法應用于人造存儲系統的實踐中。因此,大腦存儲模型的研究有著很高的理論水平和應用價值[16]。
4.2.3 認知計算
認知計算(Cognitive Computation)是指仿生人類在認知過程中,對所有認知數據連續進行處理時所采用的全部算法。借助于認知計算,我們不但可以將外部世界紛繁復雜的信息進行量化、融合、轉達,而且還可以把人類的認知機制建模在一個適合認知科學研究的認知模型中,開展認知實驗,記錄認知數據,計算認知性能指標,發現認知的本質和規律,并最終構建一個具有人類認知功能的“認知機”[17]。
5.1 符號主義認知模型
符號主義認知模型是最傳統的認知模型,它的認知對象是符號。符號主義認知模型主要思想是把認知當成對理性符號的處理,借助于不同的產生式規則,對符號進行替換運算。產生式規則被描述成“條件——動作”形式,它模仿了人類在推理和解決問題對應不同條件執行的相應動作。符號主義認知模型的主要代表是Newell A提出的狀態算子和結果模型SOAR(State Operator And Result)、Anderson J K提出的思維適應性控制模型ACT(Adaptive Control of Thought)。SOAR是圍繞著算子的選擇和應用功能來組織產生式規則,其高層結構由控制策略、成果記憶區和工作記憶區組成。基于上述思想的SOAR實現了短時記憶的功能,并且很好地使概念、事實、規則有機結合在一起[18]。ACT模擬人類高級認知過程的產生式規則, 產生式規則系統由三個記憶部分組成:工作記憶、陳述性記憶和產生式記憶。產生式規則既可以由工作記憶根據現場情況臨時產生,也可以是陳述性記憶存儲的以往的產生式規則,還可以是產生式記憶中推理出的新的產生式規則。ACT實現了長期記憶的功能,較好地體現了認知過程中“從做中學”的思想[19]。
5.2 聯結主義認知模型
聯結主義認知模型是一個巨大的信息節點交互網絡,各節點與其他每個節點之間相互聯結、相互影響,它的認知對象是在這個網絡中傳遞的信息。聯結主義認知模型模擬了人類的思維過程,具有自學習和自適應的能力。聯結主義的典型代表是McClelland等人創立的平行分配過程模型PDP(Parallel Distributed Processing),又稱人工神經網絡。PDP模擬了人類的神經網絡,其特色在于信息的分布式存儲和并行協同處理。雖然單個節點的結構極其簡單,功能有限,但大量節點構成的網絡系統所能實現的功能卻很強大[20]。
5.3 腦邏輯認知模型
腦邏輯認知模型是模擬大腦的認知機制而非生理解剖結構建立起來的認知模型,該模型包括思維引擎、記憶體和感知及動作緩存機制,力圖研究記憶的意識對認知行為的影響。該方面的研究尤其以Calgary大學的Wang Ying-xu教授最為有名,Wang Ying-xu教授及其團隊自2003年至2011年,連續發表了多篇論文,詳細闡述了腦邏輯認知模型對人類認知的模擬、腦邏輯認知模型中如何實現認知中數據、信息、知識和行為間的關聯。腦邏輯認知模型為計算機模擬自然智能行為和認知方法建立了基礎[21]。國內學者提出的基于粒計算的認知模型和機制主義模型同樣屬于腦邏輯認知模型。
5.4 認知模型的最新研究——一元事件認知模型
一元事件認知模型如圖3所示。

Figure 3 Cognitive model based on single unit event圖3 一元事件認知模型
5.4.1 一元事件認知模型的基本概念
(1)認知元。認知的基本單位是認知元,以小寫字母x、y、z等表示。
(2)一元事件。記作e=[x1,x2,…,xn]→y(n≥2),一元事件代表了外部世界中觸發人類認知的具有因果關系的認知事實。
(3)認識。認識是認知模型到某一時刻止對結元相同的所有一元事件的認知,記作y=[e1u/a][e2u/b][…/…],包含量化的范數、單元數、復雜度及所在行的清晰度等屬性值。
(4)任務。任務記作j={r}→k,是一個不完整的一元事件描述。
(5)方法。方法是任務中缺省的必元或結元,是完成任務后輸出的結果。
5.4.2 一元事件認知模型的特征
(1)本能。本能是一元事件認知模型各功能機構本身固有的操作序列,在滿足一定的外部和內部條件時被觸發執行。
(2)hlt。hlt是一元事件認知模型的各功能機構的一種暫停狀態,此時,它暫停一切操作,等待該功能機構某種本能被觸發。
(3)box。一元事件認知模型內部的各功能機構內都存在著一定數量的box,作為存放數據的中間存儲單元。
5.4.3 認知流程
將按時間先后串行作用于一元事件認知模型上的一元事件、認識、任務定義為一個認知流程,如圖4所示即是一個認知流程例子。

Figure 4 Sample of a cognitive process圖4 一個認知流程
5.4.4 認知性能指標
(1)成功率:認知模型到某一時刻止,完成的任務占提交的任務總數的比例,記作η。
(2)潛能:認知模型到某一時刻止,能夠完成的所有任務的總數,記作pl。
(3)水平:某一時刻,記憶體的水平即為認知模型的水平,記作l。
(4)認知量:認知模型在某一時刻,已經存儲在記憶體中的認識總量,記作q。
(5)認知率:認知模型在某一時刻之前,認知量和感悟及接受的認識總量之比,記作a。
5.4.5 一元事件認知模型的研究結論
文獻[22]認為,理想的認知模型隨著認知流程的延續,各個認識的屬性值呈動態變化,完成任務能夠改變記憶體中存儲的認識,而認知指標的變化則與記憶體容量的變化線性相關。
圖5a和圖5b分別是一元事件認知模型中對應圖4的認知流程實驗,在容量c=19時,t9和t15兩個不同的時刻,記憶體存儲的認識屬性變化情況。其中,認識y4的范數由1變化為3,單元數由2變化為8,復雜度由3變化為17,而全部認識y1、y2、y3、y4、y5、y6所在行的清晰度由6、3、5、4、2、1改變為0、4、5、1、3、2;而完成任務的前后,即t9和t15兩個不同的時刻,記憶體中存儲的認識由6個減少為5個。
可見,一元事件認知模型中,隨著認知流程的延續,各個認識的屬性值都呈動態變化,而完成任務改變了記憶體中存儲的認識。

Figure 5 Cognition stored in memory bank at t9 and t15圖5 t9時刻和t15時刻記憶體中存儲的認識
表1為在t9時刻和t15時刻,容量c變化時一元事件認知模型認知指標的對應變化。

Table 1 Changes in cognitive data
從表1中可以看出,不同時刻,當記憶體的容量c增大時,各項認知指標都相應增大,而當容量減小時,各項認知指標又相應地減小。如認知指標潛能pl,當記憶體的容量c從10增加到19時,潛能pl從20增加到40,而當記憶體的容量c從21減小到19時,潛能pl從44減小到40。可見,認知指標的變化與記憶體容量的變化線性相關。
更多的認知流程實驗在一元事件認知模型上的結果和圖5a、圖5b及表1的結果相似,因此綜合以上論述,可知一元事件認知模型是一種理想的認知模型。
6.1 基于神經科學的大腦存儲模型
基于神經科學的大腦存儲模型認為大腦存儲認知信息的最小解剖單位是神經元細胞。大腦左右兩個半球的表面是一層平均厚度約2.5 mm的大腦皮層,由150億個左右的神經元細胞構成,是認知信息存儲的主要場所。大量的大腦皮層損傷病例及通過去除大腦皮層的某個區域或對大腦皮層的某個區域給予適當的物理刺激(如電流刺激)發現,大腦皮層的不同物理區域存儲不同的認知信息。最新的研究發現,位于大腦前部的額葉(Frontal Lobe)區域存儲與人類智能及運動有關的認知信息[23],位于大腦上部的頂葉(Parietal Lobe)區域存儲與人類的感覺、知覺及語言有關的信息,位于大腦后部的枕葉(Occipital Lobe)區域存儲與人類視覺有關的信息,而位于大腦中部的顳葉(Temporal Lobe)區域則存儲與人類聽覺、嗅覺有關的信息[24]。籍此,基于神經科學的大腦存儲模型認為大腦的存儲機制是將不同性質的認知信息在不同的大腦皮層區域分類存儲。
6.2 基于神經影像學的大腦存儲模型
基于神經影像學的大腦存儲模型利用現代神經影像學技術,對人類認知活動產生的認知信息存儲在大腦的物理位置進行定位,對大腦對認知信息的響應強度進行測量,對存儲認知信息時腦區各部分之間相互關聯的變化進行觀察,從而建立對應的大腦存儲模型。這些神經影像學技術包括直接測量與腦神經活動直接相關的生物電磁場變化信號的彌散張量成像DTI(Diffusion Tensor Imaging)、腦磁圖MEG(Magnetoencephalography)、腦電圖EEG(Electroencephalography)和事件相關電位(ERPs)等技術,以及間接測量腦神經活動引起的血液動力學變化信號的單光子發射計算層析成像(SPECT)、正電子發射層析成像(PET)和功能磁共振成像fMRI(functional Magnetic Resonance Image)等技術。其中,功能磁共振成像fMRI是在磁共振成像(MRI)技術的基礎上發展起來的進行腦功能成像的新技術,可無創傷地對神經元活動進行比較準確的定位,并具有比較高的空間和時間分辨率及較好的可重復性,通過腦血流、葡萄糖代謝和受體的觀察,依據血氧水平依賴性BOLD(Blood Oxygen Level Dependent)腦功能成像方法,得到優質的fMRI圖像,借助于先進的fMRI圖像處理和分析技術,可以更精確地確定各腦功能區以及其內部構造和功能特點,尤其是腦的存儲認知信息情況,因此成為目前最先進的大腦存儲模型研究手段之一[25]。
基于上述的fMRI技術,人們發現了大腦存儲認知信息的更精細結構。對短時間內需要存儲和操作的信息—即工作記憶,大腦皮層會分配不同的區域存儲不同類型的信息或作為操作的臨時存儲區。如詞語工作記憶中信息是存儲在左半球后頂葉皮質區(BA 40),而詞語工作記憶進行復述時,由左半球Broca區(BA 44)、左前運動區(BA 6)以及左輔助運動區(BA 6)作為臨時存儲區;而空間工作記憶中的信息是存儲在腦右半球一些腦區,包括右枕前皮質(BA 19)、右前運動區(BA 6)以及右腦前額葉腹側(BA 47);視覺工作記憶信息主要存儲在左半球的頂葉和顳葉下部[26]。對長時間內需要存儲和操作的信息——長時記憶,大腦皮層也有相應的存儲區域。如長時記憶的情景記憶信息是存儲在左額葉、顳葉內側和頂枕區,長時記憶的語義記憶信息存儲在左側前額葉和顳葉的左側顳中回(BA 21)和雙側顳頂區(BA 37)[27]。fMRI研究還表明,某個大腦皮層區域存儲對應類型的信息不是絕對的,在某些情況下(如另外一個大腦皮層區域被切除)它可以代償存儲另外一個大腦皮層區域應該存儲的認知信息;進一步的研究還發現,內顳葉體積的縮小與長時記憶中的提取成功率減少有關,而隨著人類年齡的增加,內顳葉體積有逐漸減小的趨勢,這也解釋了老年人相對于年輕人記憶力減退的原因[28]。
6.3 基于心理學的大腦存儲模型
基于心理學的大腦存儲模型把大腦當作一個黑箱,通過給被試提供不同的視覺素材、聽覺素材及對應的記憶規則,研究被試在該記憶規則下對輸入信息的記憶效果,從而把大腦黑箱還原成一個存儲認知信息的存儲模型。這些不同的視覺素材、聽覺素材及對應的記憶規則構成了不同的研究人類大腦存儲模型的心理學實驗。其中經典的實驗有Posner視覺信息編碼實驗、Clark和Chase句子-圖畫匹配實驗、Sternberg短時記憶信息相加因素法實驗、字母轉換實驗(“開窗”實驗)、Peterson和Peterson遺忘進程實驗、Waugh和Norman分開痕跡消退與干擾實驗、四卡片證真和證偽等一系列心理學實驗[29]。通過這一系列的實驗,心理學家在關于大腦的存儲模型上得出以下的共識:即大腦的存儲模型是以Baddeley三成分模型為框架的泛工作記憶模型。Baddeley三成分模型是Baddeley等人最早提出的,他們認為刺激人類認知的信息被分為三種不同的成分,分別存儲到大腦中不同功能的存儲區中。其中,直接刺激人類感覺器官產生的視覺、聽覺等認知信息被稱為工作記憶信息,它們暫時存儲在大腦的工作記憶區中,如果這些信息不被人類的認知進行處理,則這些信息很快就會從工作記憶區中消失,所以,工作記憶信息又被稱為短時記憶信息;當工作記憶信息被人類的認知有意識地進行了一次處理,則生成的信息稱為陳述性記憶信息,被存儲在陳述性記憶區。而當工作記憶信息被人類的認知有意識地進行了重復的處理,則生成的信息稱為程序性記憶信息,被存儲在程序性記憶區內;程序性記憶信息存儲在大腦中的時間最長,因此又被稱為長時記憶信息,而陳述性記憶信息存儲在大腦中的時間介于工作記憶信息和程序性記憶信息之間[30]。心理學后續的關于大腦存儲模型的研究擴展了工作記憶信息、陳述性記憶信息、程序性記憶信息的內涵和外延,但都基于工作記憶信息,所以統稱為泛工作記憶模型。
6.4 基于語言學的大腦存儲模型
語言是人類特有的信息交流與存儲方式,人類的語言功能受大腦皮層的語言中樞控制,與大腦的關系極其復雜。很多語言學家從人類語言的組成單位及組織規則的角度,映射大腦對應的存儲模型。Elissa等人[31]認為,人類語言的組成單位有音節、詞語、短語、句子、段落、篇章,它們都具有聲學特征或語義特征,人類語言的組織規則是由小的語言組成單位分層遞歸地組合建構成較大的語言組成單位,正是不同的組織規則才構成了人類不同的語言。音節是最小的語言組成單位,音節的個數是有限的,人類大腦生來就具有識別和控制發出音節的神經元組織,即對音節的掌握是人類大腦的本能;由小的音節組合建構成大的詞語,是后天訓練學習的結果,這個訓練學習的方式或程序構成了人類語言的第一層組織規則,并被牢牢地存儲在大腦皮層中;依次類推,由詞語構成短語,由短語構成句子,由句子構成段落,由段落構成篇章都是后天訓練學習的結果,這些訓練學習的方式或程序被作為人類語言不同層次的組織規則,相繼存儲在大腦皮層中[32]。因此,基于語言學的大腦存儲模型認為語言是不同層次的組織規則(程序)在本能音節(數據)上的運行結果(輸出),大腦中存儲的是語言的組織規則而非語言本身,任一層次組織規則的改變都可以改變語言本身,但處于較低層次的組織規則的改變對語言的改變影響更大[33]。這種存儲模型得到很多語言學家的支持。
7.1 基于腦電信號的認知計算
基于腦電(EEG)信號的認知計算是設計一組認知實驗,記錄被試對應認知實驗中不同認知活動的腦電信號,并通過對腦電信號的計算、分析,提取不同的認知活動對應的腦電信號特征。常見的認知實驗有圖片刺激實驗、數字運算實驗、規則提取實驗等。被試一般經過挑選,文化程度較高且頭發不太濃密的短發成年男性是首選。實驗中,被試佩戴電極導數適中(如64導、128導)的電極帽,按要求完成認知實驗中的任務。實驗過程中生成的腦電信號被與電極帽相連的放大器放大,再經降噪、過濾、采樣、A/D轉換,最終生成特定格式的文件如.cnt文件,作為基于腦電信號的認知計算的原始數據存儲在PC機中。
認知計算繼續對存儲在PC機中的腦電信號的原始數據進行處理。去除壞樣本是計算的第一步,比如發生嚴重漂移的EGA信號或明顯的肌電、眼電信號。接著是根據腦電信號對不同認知活動進行特征提取,共空間模式CSP(Common Spatial Pattern)是最新的從多導的腦電信號中提取某種認知活動腦電信號特征的有效算法。該算法將某種認知活動對應的腦電信號進行標記,作為Ⅰ類,而把其它的所有信號進行標記,作為Ⅱ類。CSP通過對兩類的腦電信號進行訓練,得到一個投影矩陣P,P能將兩類數據投影到方差區別最大的方向,從而去除了Ⅱ類信號的干擾,突出了Ⅰ類信號的特征[34]。設V是包含兩類信號的原始腦電信號,而Z是經過投影之后得到的可供特征提取及分類的腦電信號,則Z=PV。取A=(P-1)T,A的每一行向量被稱為一個空間模式。CSP的關鍵是求解投影矩陣P,設供訓練的輸入腦電信號是一個K×T的矩陣,其中K是腦電數據的導數,T是數據的樣本點數,X1是Ⅰ類帶標記的訓練數據,X2是Ⅱ類帶標記的訓練數據,X1的協方差矩陣為:
X2的協方差矩陣為:
R1和R2均為K×K的方陣,令:
R=R1+R2
作特征值分解,得:
U是R的特征向量矩陣,∑是R的特征值對角陣。對R進行白化,白化矩陣為W,
令:
T1=WR1WT
T2=WR2WT
由于對T1和T2作特征值分解得到的特征向量矩陣Uesp是一樣的,因而:
∑1和∑2分別是Ⅰ類、Ⅱ類帶標記訓練數據特征值的維度,當∑1較大時,則∑2必然較小,從而可以對Ⅰ類、Ⅱ類數據進行有效的區分。于是,投影矩陣P最終確定為:
7.2 基于功能磁共振(fMRI)數據的認知計算
基于fMRI數據的認知計算分為三個步驟:認知活動實驗、圖像采集、數據分析。
認知活動實驗同樣需要精心設計,所不同的是,為了提高fMRI圖像中BLOD信號的信噪比,同一種認知活動的實驗需要重復多次,重復的時間間隔稱為刺激時間模式,常用的刺激時間模式有組塊設計BD(BlockDesign)和事件相關設計ED(Event-relatedDesign)[35]。
圖像采集包括fMRI圖像采集和解剖圖像采集兩部分。fMRI圖像通過采用特定的成像序列掃描而獲得,掃描與實驗同步進行;由于fMRI圖像的分辨率和信噪比不高,還需要掃描一幅與fMRI圖像位置完全相同的高分辨率解剖圖像,從而把fMRI圖像得到的腦區激活信息對應到相應的解剖位置上,解剖圖像一般采用3D圖像或T1解剖結構圖像[36]。
數據分析包括對采集的圖像數據進行預處理及計算,以確定不同認知活動對應的解剖腦區。預處理一般包括層間時間校正、頭動校正、標準化、平滑等;計算包括原始fMRI圖像重建、轉換成標準格式、fMRI圖像層面時間校正和運動校正、fMRI圖像的時間域濾波、fMRI圖像的空間平滑、去除頭皮外偽影、時間序列時間點數據的標準化、空間歸一化或標準化、統計、激活腦區與解剖位置對應等[37]。很多新開發的軟件已經能夠完成fMRI數據分析的某些功能,如美國Wisconxin醫學院生物物理研究所研制的ANFI、Friston等人開發的SPM、美國匹茲堡大學CCN實驗室(ClinicalCognitiveNeurosciencelaboratory)開發的NIS、商業fMRI數據分析軟件BrainVoyage等。
7.3 基于視聽覺信息的認知計算
基于視聽覺信息的認知計算將認知定義為大腦對視聽覺信息的計算,它的認知數據就是被人類直接感知和理解的一組圖像、語音和文本(語言)等信息[38]。認知計算的目標是從人類的視聽覺認知機理出發,研究并構建新的計算模型與計算方法,提高計算機對非結構化視聽覺感知信息的理解能力和海量異構信息的處理效率,克服圖像、語音和文本(語言)信息處理所面臨的瓶頸困難[39]。認知計算主要解決感知特征提取、表達與整合,感知數據的機器學習與理解,多模態信息協同計算等核心科學問題[40]。目前,基于視聽覺信息的認知計算已經在視聽覺信息協同計算、自然語言理解以及與視聽覺認知相關的人腦―計算機接口等三項關鍵技術方面取得一定的突破,Google公司已經研制成功集成上述相關研究成果、具有自然環境感知與智能行為決策能力的無人駕駛車輛,并成功地在加州的公路上行駛了20萬公里[41]。
認知科學已經在網絡態勢感知、求解認知難題、自主虛擬人決策等許多領域開展了應用,并產生了動態信任預測認知模型[42]、基于OBDD(OrderedBinaryDecisionDiagram)的動態認知難題的符號化模型檢測[43]、IVMiner(IntelligentVirtualMiner)[44]等成功的應用成果。目前,認知科學的研究正得到世界各國的高度重視,對認知的不同定義會引導認知科學的研究朝著不同的方向發展,基于過程的認知定義抓住了認知的本質,該定義將使認知科學的研究立足于科學實驗而不再是思辨式論述。當前,認知科學的研究應立足于基于過程的認知定義,緊密結合計算機科學、心理學、神經科學、人類學、語言學、哲學等學科先進的研究手段及最新研究成果,特別是神經科學領域先進研究手段如fMRI等,并以認知模型、大腦存儲模型、認知計算作為認知科學研究的主要研究方向。相信經過科學的研究,我們一定能夠發現人類認知的本質和規律,揭示人類心智的奧秘,并創造出具有人類認知功能的“認知機”。
[1]ThagardP.Theoryandexperimentincognitivescience[J].ArtificialIntelligence, 2007, 171(18):1104-1106.
[2]ShepardRN.Thesteptorationality:Theefficacyofthoughtexperimentsinscience,ethics,andfreewill[J].CognitiveScience, 2008, 32(1):3-35.
[3]BoudewijnseGA,Braddon-MitchellD,JacksonF(2007).Philosophyofmindandcognition,anintroduction.Victoria(Australia):Blackwell[J].CognitiveSystemsResearch, 2008, 9(3):229-231.
[4]StenningK,OberlanderJ.Acognitivetheoryofgraphicalandlinguisticreasoning:Logicandimplementation[J].CognitiveScience, 1995, 19(1):97-140.
[5]ChaterN,BrownGDA.Fromuniversallawsofcognitiontospecificcognitivemodels[J].CognitiveScience, 2008, 32(1):36-67.
[6]FeiXu,GriffithsTL.Probabilisticmodelsofcognitivedevelopment:Towardsarationalconstructivistapproachtothestudyoflearninganddevelopment[J].Cognition, 2011, 120(3):299-301.
[7]W?llmerM,EybenF,GravesA,etal.BidirectionalLSTMnetworksforcontext-sensitivekeyworddetectioninacognitivevirtualagentframework[J].CognitiveComputation, 2010, 2(3):180-190.
[8]FengKang,YaoNan-sheng.Cognitivemodelbasedonsingleunitevent[J].PatternRecognitionandArtificialIntelligence, 2012, 25(1):172-180. (inChinese)
[9]SimonHA.Cognitivescience:Thenewestscienceoftheartificial[J].CognitiveScience, 1980, 4(1):33-46.
[10] Johnson-Laird P N. Mental models in cognitive science[J]. Cognitive Science, 1980, 4(1):71-115.
[11] Wells A J. Turing’s analysis of computation and theories of cognitive architecture[J]. Cognitive Science, 1998, 22(3):269-294.
[12] Fehling M R. Unified theories of cognition:Modeling cognitive competence[J]. Artificial Intelligence, 1993, 59(1-2):295-328.
[13] Arzi-Gonczarowski Z, Lehmann D. From environments to representations—a mathematical theory of artificial perceptions[J]. Artificial Intelligence, 1998, 102(2):187-247.
[14] Pylyshyn Z. On computation and cognition:Toward a foundation of cognitive science:A response to the reviews by A K Mackworth and M J Stefik[J]. Artificial Intelligence, 1989, 38(2):248-251.
[15] Cooper R, Fox J, Farringdon J, et al. A systematic methodology for cognitive modeling[J]. Artificial Intelligence, 1996, 85(1-2):3-44.
[16] Hernández-Orallo J, Dowe D L. Measuring universal intelligence:Towards an anytime intelligence test[J]. Artificial Intelligence, 2010, 174(18):1508-1539.
[17] Neokleous K C, Avraamides M N, Neocleous C K, et al. Selective attention and consciousness:Investigating their relation through computational modelling[J]. Cognitive Computation, 2011, 3(1):321-331.
[18] Laird J E, Newell A, Rosenbloom P S. Soar:An architecture for general intelligence[J]. Artificial Intelligence, 1987, 33(1):1-64.
[19] Anderson J R, Bothell D, Byrne M D, et al. An integrated theory of the mind[J]. Psychological Review, 2004, 111(4):1036-1060.
[20] Bowers J S. On the biological plausibility of grandmother cells:Implications for neural network theories in psychology and neuroscience[J]. Psychological Review, 2009,116(1):220-251.
[21] Wang Ying-xu, Wang Ying. Cognitive informatics models of the brain[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part C:Applications and Reviews, 2006, 36(2):203-207.
[22] Schockaert S,Prade H.Solving conflicts in information merging by a flexible interpretation of atomic propositions[J]. Artificial Intelligence, 2011, 175(11):1815-1855.
[23] Chepenik L G, Wang Fei, Spencer L, et al. Structure-function associations in hippocampus in bipolar disorder[J]. Biological Psychology, 2012, 90(1):18-22.
[24] Geranmayeh F, Brownsett S L E, Leech R, et al. The contribution of the inferior parietal cortex to spoken language production[J]. Brain and Language, 2012, 121(1):47-57.
[25] Freeman W J,Ahlfors S P,Menon V.Combining fMRI with EEG and MEG in order to relate patterns of brain activity to cognition[J]. International Journal of Psychophysiology, 2009, 73(1):43-52.
[26] Piantadosi S T,Tily H,Gibson E.The communicative function of ambiguity in language[J]. Cognition, 2012, 122(3):280-291.
[27] Bittrich K, Schulze K, Koelsch S. Electrophysiological correlates of verbal and tonal working memory[J]. Brain Research, 2012, 1432(13):84-94.
[28] Krawczyk D C, McClelland M M, Donovan C M, et al. An fMRI investigation of cognitive stages in reasoning by analogy[J]. Brain Research, 2010, 1342(25):63-73.
[29] M?ller R, Schenck W. Bootstrapping cognition from behavior—a computerized thought experiment[J]. Cognitive Science, 2008, 32(3):504-542.
[30] Baddeley A.The episodic buffer:A new component of working memory?[J]. Trends in Cognitive Sciences, 2000, 4(11):417-423.
[31] Newport E L, Hauser M D, Spaepen G, et al. Learning at a distance II Statistical learning of non-adjacent dependencies in a non-human primate[J]. Cognitive Psychology, 2004, 49(2):85-117.
[32] Feist M I. Space between languages[J]. Cognitive Science, 2008, 32(7):1177-1199.
[33] Espinilla M, Liu Jun, Martínez L. An extended hierarchical linguistic model for decision-making problems[J]. Computational Intelligence, 2011, 27(3):489-512.
[34] Ye Ning, Sun Yu-ge, Wang Xu, et al. Recognition based on common spatial patterns and ANN for brain-computer interface signal[J]. Journal of Northeastern University(Nature Science), 2010, 31(1):12-15. (in Chinese)
[35] Angelika L,Benno G,Alfonso C.Asymmetric fMRI adaptation reveals no evidence for mirror neurons in humans[J]. Proceedings of the National Academy of Sciences of the United States of America, 2009, 106(24):9925-9930.
[36] Zhi Lian-he, Li Yu-xiao, Zhao Shu-jun, et al. Feature extraction of fMRI data based on discrete wavelet transform[J]. Chinese Journal of Medical Imaging Technology, 2010, 26(6):1151-1154. (in Chinese)
[37] Anderson J R, Carter C S, Fincham J M, et al. Using fMRI to test models of complex cognition[J]. Cognitive Science, 2008,32(8):1323-1348.
[38] Davis D N. Cognitive architectures for affect and motivation[J]. Cognitive Computation, 2010, 2(3):199-216.
[39] van Atteveldt N, Roebroeck A, Goebel R, et al. Interaction of speech and script in human auditory cortex:Insights from neuro-imaging and effective connectivity[J]. Hearing Research,2009,258(1-2):152-164.
[40] Furdea A, Halder S, Krusienski D J, et al. An auditory oddball (P300) spelling system for brain-computer interfaces[J]. Psychophysiology, 2009, 46(3):617-625.
[41] Ulrich A, Markus K, Shah K, et al. Testing the theory of embodied cognition with subliminal words[J]. Cognition, 2010, 116(3):303-320.
[42] Li Xiao-yong,Gui Xiao-lin.Cognitive model of dynamic trust forecasting[J]. Journal of Software, 2010, 21(1):163-176. (in Chinese)
[43] Luo Xiang-yu, Su Kai-le, Gu Ming. A model checking approach for solving epistemic riddles[J]. Chinese Journal of Computers, 2010, 33(3):406-414. (in Chinese)
[44] Cai Lin-qin, Mei Tao, Sun Yi-ning, et al. Research on behavior and cognition models of virtual human for decision training[J]. Journal of System Simulation, 2008, 20(2):368-371. (in Chinese)
附中文參考文獻:
[8] 馮康,姚南生. 基于一元事件的認知模型[J]. 模式識別與人工智能,2012, 25(1):172-180.
[34] 葉檸,孫宇舸,王旭,等.基于共空間模式和神經元網絡的腦-機接口信號的識別[J].東北大學學報(自然科學版),2010,31(1):12-15.
[36] 支聯合,李玉曉,趙書俊,等.基于離散小波變換的fMRI數據特征提取[J]. 中國醫學影像技術, 2010, 26(6):1151-1154.
[42] 李小勇,桂小林.動態信任預測的認知模型[J]. 軟件學報, 2010, 21(1):163-176.
[43] 駱翔宇,蘇開樂,顧明.一種求解認知難題的模型檢測方法[J].計算機學報,2010, 33(3):406-414.
[44] 蔡林沁,梅濤,孫怡寧,等.用于決策訓練的虛擬人行為認知模型研究[J].系統仿真學報,2008, 20(2):368-371.
FENGKang,born in 1968,associate professor,his research interests include cognitive science, and model checking.
Developmentandresearchdirectionsofcognitivescience
FENG Kang
(Department of Computer and Information Engineering,Huainan Normal University,Huainan 232038,China)
To study the origin, development,subject structure and research direction of cognitive science,the definition of cognition based on process is proposed,and the origin of cognitive science is discussed.The development of cognitive science is divided into computation theory stage,symbols processing theory stage and multi-theory stage,then the subject structure and research direction of cognitive science are introduced,the main research directions of cognitive science include cognitive model,storage model of the brain and cognitive computation.The definition of cognition based on process is able to embody the essence of cognition.Therefore,the cognitive model based on single unit event is able to simulate the cognition,and it is an optimal cognitive model.
cognitive science;cognitive model;storage model of the brain;cognitive computation
1007-130X(2014)05-0906-11
2012-11-26;
:2013-04-03
安徽省高等學校省級自然科學研究項目(KJ2012Z374);國家自然科學基金資助項目(61170060);安徽省自然科學基金資助項目(11040606M135);淮南市科技計劃項目(2012A01007)
TP181
:A
10.3969/j.issn.1007-130X.2014.05.021

馮康(1968-),男,安徽淮南人,副教授,研究方向為認知科學和模型檢測。E-mail:fenglikanglcq@163.com
通信地址:232038安徽省淮南市淮南師范學院計算機與信息工程系
Address:Department of Computer and Information Engineering,Huainan Normal University,Huainan 232038,Anhui,P.R.China