◎中國科學院生物物理研究所 陳霖院士
我們必須開展什么樣的新一代人工智能的基礎(chǔ)研究,才能使我國成為人工智能領(lǐng)域真正意義上的科學大國?像圖靈的計算模型,回答了“什么是計算”的問題,奠定了整個計算機科學的基礎(chǔ);像香農(nóng)的通信數(shù)學原理,回答了“什么是信息”的問題,奠定了現(xiàn)代信息論的基礎(chǔ)。對于我們而言,關(guān)鍵是能否提出“什么是新一代人工智能”的核心基礎(chǔ)科學問題,以及我們究竟有什么能力和基礎(chǔ)來建立回答這樣問題的原創(chuàng)系統(tǒng)理論。
總結(jié)近40年從事認知科學研究的經(jīng)驗,我們認為,發(fā)展新一代人工智能的核心基礎(chǔ)科學問題是:“認知和計算的關(guān)系”。例如,要回答“人工智能會不會取代人類智力”這個廣泛關(guān)注的問題,凝煉成科學問題,本質(zhì)上是要回答“認知和計算的關(guān)系”(或者“認知和計算的差別”)問題。
認知和計算的關(guān)系問題可以進一步細化為4個方面的關(guān)系:1、認知的基本單元和計算的基本單元的關(guān)系;2、認知神經(jīng)表達的解剖結(jié)構(gòu)和人工智能計算的體系結(jié)構(gòu)的關(guān)系;3、認知涌現(xiàn)的特有精神活動現(xiàn)象和計算涌現(xiàn)的特有信息處理現(xiàn)象的關(guān)系;4、認知的數(shù)學基礎(chǔ)和計算的數(shù)學基礎(chǔ)的關(guān)系。
研究任何一種過程,建立任何一種過程的科學理論,必須首先回答一個基本問題:這種過程操作的基本單元是什么?每門成熟的基礎(chǔ)科學都有其特定的基本單元,如高能物理學的基本粒子、遺傳學的基因、計算理論的符號以及信息論的比特等。對于認知科學而言,必須回答:什么是認知過程操作的基本單元?
認知科學的大量實驗事實表明,認知的基本單元不是計算的符號,不是信息的比特。例如,根據(jù)記憶的實驗,Miller提出計量工作記憶大小的單元不是計算機計量記憶大小的比特,而是一種整體性的“組塊”(chunk)。人類的工作記憶可以記住4個組塊。一個組塊可以是一個字母、可以是多個字母組成的詞,甚至可以是多個詞組成的短語,它們顯然具有非常不同的信息量比特。再如,Kahneman提出注意選擇的基本單元是整體性的“知覺物體”。還有,Poepple提出時間組織的基本單元是整體性的“時間格式塔”。“組塊”“知覺物體”“時間格式塔”,這些關(guān)于認知基本單元的概念的重要性在于,它們不是借用于計算理論或信息科學,而是原創(chuàng)于認知科學的實驗發(fā)現(xiàn)。

陳霖 院士
目前的關(guān)鍵問題是,如何超越直覺的理解,科學準確地定義這些認知基本變量,從而建立這些基本變量的統(tǒng)一的認知基本單元模型。這對于理解“認知和計算的關(guān)系”,把新一代人工智能建立成一門成熟的基礎(chǔ)科學(Poggio認為的“從煉金術(shù)轉(zhuǎn)化成化學”),具有重要的基本意義。
腦成像(brain mapping)不是指成像技術(shù),而是指大腦功能解剖結(jié)構(gòu)的一種學說,即智力的模塊性:大腦是由專司某種認知功能、結(jié)構(gòu)和功能相對獨立和分離的多個腦區(qū)組成的。這樣的模塊性結(jié)構(gòu),跟通用計算機的中心處理器和統(tǒng)一記憶存儲器的計算體系結(jié)構(gòu)是不相同的。
我們進一步提出認知神經(jīng)表達的解剖結(jié)構(gòu)的概念,這是因為近來我們發(fā)現(xiàn),敲除了視桿、視錐細胞只保留內(nèi)生感光神經(jīng)節(jié)細胞(ipRGCs)的盲鼠,能夠檢測拓撲性質(zhì)。而且ipRGCs對一致地識別拓撲性質(zhì)既是充分的,又是必要的。ipRGCs只是視網(wǎng)膜的一種神經(jīng)節(jié)細胞,又分成5個子類,而且這5個子類中只有2-3類涉及識別拓撲性質(zhì)。這樣的神經(jīng)表達實驗表明,大范圍首先的拓撲性質(zhì)知覺起源和根源于一種形態(tài)、投射關(guān)系、分子特性特定的細胞。然而,人工神經(jīng)網(wǎng)絡(luò)的每個“細胞”是相同的,只是連接不同。
如果說,深度學習是來自神經(jīng)系統(tǒng)層次結(jié)構(gòu)的啟發(fā),那么起源于特定神經(jīng)細胞的、超越腦區(qū)成像的全腦成像,必將為發(fā)展新一代人工智能的計算體系結(jié)構(gòu),提供深刻得多和豐富得多的啟發(fā)。
基礎(chǔ)科學面臨四大問題:物質(zhì)的本質(zhì)、宇宙的起源、生命的本質(zhì)和智力的產(chǎn)生。這四大問題的前3個基本上是關(guān)于物質(zhì)世界的研究;而智力的產(chǎn)生是對精神世界的研究。認知科學研究智力的產(chǎn)生,就是要揭示人類認知精神世界涌現(xiàn)的特有的現(xiàn)象。正如McClleland認為的“人類認知最偉大的主要成就是認知涌現(xiàn)的現(xiàn)象”,理解認知的涌現(xiàn)是對符號處理的認知計算理論的深遠的挑戰(zhàn)。
意識正是認知涌現(xiàn)的特有精神活動現(xiàn)象的一個典型。意識研究的困難在于,如何把人工智能是否會產(chǎn)生意識之類的直覺思辨的討論,變成科學實驗的研究。
在意識的科學研究中,我們提議如下4個方面來比較研究和分析“認知和計算的關(guān)系”:1、意識的認知機制——什么是意識?2、意識的神經(jīng)表達——意識是如何在大腦中產(chǎn)生的?3、意識的進化——意識是如何起源與進化的?4、意識異常——精神疾病的本源是什么?
無論是經(jīng)典的計算理論還是目前流行的貝葉斯計算理論,都認為認知過程是圖靈意義的離散符號的計算。也就是說,計算的數(shù)學基礎(chǔ)是圖靈機。
跟傳統(tǒng)的、目前仍然占統(tǒng)治地位的認知計算理論不同,我們提出,體現(xiàn)在不同認知層次的認知基本單元(如組塊、知覺物體、時間格式塔等)的共同本質(zhì)——同一不變性和整體性——可以定義為容限空間上的大范圍拓撲不變性質(zhì)。各個認知層次(包括知覺、注意、學習、記憶、數(shù)的認知、發(fā)展和進化、情緒、意識)的實驗,一致支持了這個Wolfe稱為“大范圍首先”的認知基本單元的拓撲學定義。“大范圍首先”的容限空間的拓撲學,不像是圖靈機。
目前流行的基于計算概念的理論數(shù)學,不能滿意地解釋我們發(fā)現(xiàn)的諸多亟待解釋的基本認知現(xiàn)象,如“大范圍首先”、不變性的直接知覺、認知偏向、意識涌現(xiàn),以及起源于ipRGCs的拓撲性質(zhì)分辨等。我們正在提出和發(fā)展適合描述認知的新的數(shù)學框架,包括“大范圍首先”的數(shù)學基礎(chǔ):用Minsky的Perceptron平行計算模型奠定分析高復(fù)雜性拓撲性質(zhì)計算和“大范圍首先”拓撲性質(zhì)知覺關(guān)系的數(shù)學基礎(chǔ),用Zeeman的容限空間代數(shù)拓撲學(同調(diào)論)奠定“大范圍首先”的知覺組織的數(shù)學基礎(chǔ),用Klein的Erlangen綱領(lǐng)奠定“大范圍首先”的不變性直接知覺的數(shù)學基礎(chǔ);包括認知基本單元(概念格的“知覺物體”刻畫)、認知基本關(guān)系(半序的“容限”表征)、認知基本操作(泛拓撲的認知過程描述)的數(shù)學。近來我們尋找在大腦中實現(xiàn)“大范圍首先”的量子模型,通過張量代數(shù)可以獲得一些量子理論的構(gòu)成要素。認知和計算的關(guān)系的研究使得數(shù)學與認知在各自最本源地方相匯,這正是把煉金術(shù)轉(zhuǎn)化為化學,對新一代人工智能的數(shù)學基礎(chǔ)的探索。
認知和計算關(guān)系的問題需要長期探索,應(yīng)當?shù)玫匠掷m(xù)的支持。就認知科學的學科特點,建議注意3個方面的布局。
重視認知層次的新變量、新概念和新原則的研究。目前腦科學發(fā)展的一個趨勢是,一方面腦和神經(jīng)系統(tǒng)的生物學的數(shù)據(jù)前所未有地大量涌現(xiàn),另一方面計算的、物理學的概念越來越普遍借用到認知過程的分析。但是一個相對被忽視的問題是,如何在認知心理的層次來理解這些空前豐富的生物學層次的數(shù)據(jù)?這樣的問題超越了生物學和信息科學的層次,必須要有認知科學層次的、適合描述認知的新概念和新原則來回答。
人類為主,動物為輔;宏觀為主,結(jié)合微觀。人工智能的基礎(chǔ)研究應(yīng)當強調(diào)系統(tǒng)和行為層次。
以實驗為基礎(chǔ)的學科交叉。我們的一個基本出發(fā)點是,物理、計算的基本并不一定意味著認知的基本,適合描述物理世界的變量并不一定適合描述認知世界。認知和計算的關(guān)系的問題,如“什么是認知基本單元”的問題,不能單靠物理的推理或計算的分析來解決,根本上只有通過實驗來回答。在這個意義上,認知科學本質(zhì)上是實驗的。因此,人工智能的基礎(chǔ)研究要特別注重認知科學的實驗研究,要注重實驗為基礎(chǔ)的空前多學科的交叉。
(來源:《中國科學院院刊》2018年第10期)