陳曉華,杜國平
(1.湘潭大學 哲學系,湖南 湘潭 411105;2.中國社會科學院 哲學研究所,北京 100732)
2016年3月15日,圍棋世界冠軍韓國棋手李世石與谷歌人工智能阿爾法圍棋AlphaGo 進行較量,這場人機大戰的總比分最終定格在4∶1。AlphaGo贏了,人工智能借此迎來了新的春天。2017 年7 月8日,國務院印發《新一代人工智能發展規劃》(以下簡稱《規劃》)的通知,重點對我國人工智能發展的總體思路、戰略目標、主要任務和保障措施進行系統的規劃和部署,為推動我國人工智能的長期發展指明了方向。《規劃》指出,人工智能目前的任務之一就是建立新一代人工智能關鍵共性技術體系,共包括八項共性技術,其中一項就是自然語言處理技術:重點突破自然語言的語法邏輯、字符概念表征和深度語義分析的核心技術,推進人類與機器的有效溝通和自由交互,實現多風格、多語言、多領域的自然語言智能理解和自動生成。為了進一步細化和落實《規劃》的相關任務,2017年12月14日,中華人民共和國工業和信息化部印發了《促進新一代人工智能產業發展三年行動計劃(2018—2020 年)》,其中特別寫道:培育智能理解產品,加快模式識別、智能語義理解、智能分析決策等核心技術研發和產業化。筆者將回顧邏輯學與人工智能的悲歡離合,分析人工智能的困境,探尋擺脫困境的邏輯學路徑和方法。
“人工智能”一詞正式出現于1956 年麥卡錫召集的“人工智能夏季研討會”。而對于該名稱的使用,與會者當時并未形成共識,紐厄爾和西蒙更贊同“復雜信息處理”的概念。1958年,英國國家物理實驗室召開“思維過程機器化”會議,會上有人再次提出“人工思維”。人工智能作為一門學科其起源應該有一段較長的路徑。“人工”一詞在日常使用中意思比較確定,就是人造的、人為的,如人工湖、人工降雨等。但是“智能”(intelligence)一詞,人們對于它就有不同的理解。斯滕伯格就人類意識這個主題給出了以下定義:智能是個人從經驗中學習、理性思考、記憶重要信息以及應付日常生活需要的認知能力[1]。
對認知能力或思維的形式化、機械化研究至少可以追溯到亞里士多德的形式邏輯。形式邏輯把思維內容和思維形式區分開來,這是推理活動的出發點。邏輯的形式化是人工智能最強大最根本的基礎。西班牙的盧爾(Raymond Llull)可能是第一個嘗試機械化人類思維過程的人,他建立了一套基于邏輯的系統,用幾何圖形和原始邏輯來實現思維機械化。萊布尼茨又把這個想法往前推進一步,他認為所有的推理只是字符的結合或替代,可以建立一種“邏輯演算”,解決所有的邏輯論證問題,即思維是可計算的。這個思想為邏輯的數學形式化奠定了基礎,也為圖靈機及其物理實現奠定了強有力的思想基礎。英國數學家布爾在《思維規律研究》一書中給出了符號推理的一般方法,他使用三個邏輯運算符號“或、與和非”,變元基于真或假建立關系,其代數語言和邏輯運算規則的組合能夠計算思維。19世紀末,德國數學家和邏輯學家弗雷格建立了第一個邏輯公理化系統,即給定幾個初始公理和推理規則,就可以推出所有的真命題。同時,他提出算術邏輯形式化,用邏輯形式來表達算術,開創了數學證明論中的邏輯主義學派。這一切都朝著思維是可計算的方向發展,所有的推理都是可以證明或計算的。但是這一偉大目標并非能夠在所有系統中實現,1931年哥德爾證明了一致的初等算術系統,存在無法證明的真語句。這就表明思維形式化和機械化存在一些局限。1936 年,圖靈在其《論可計算數及其在判定性問題上的應用》一文中提出一種理想的計算數學模型,后人稱之為圖靈機。所有可計算函數都可以用圖靈機計算,圖靈機為電子計算機的出現奠定了理論基礎。1946年,第一臺電子數字計算機ENIAC(世界上第一臺電子計算機是1942 年的阿塔納索夫- 貝瑞計算機,Atanasoff-Berry Computer,通常簡稱ABC計算機)的誕生也是多代人堅持不懈努力的結果。電子計算機的誕生為人工智能提供了物理實現的基礎。
至此,形式計算理論、依據形式計算理論而設計的電子計算機以及生物學上神經元的發現奠定了整個人工智能的基礎。1943年,麥卡洛可和皮茨合作發表了一篇開創性的文章——《神經活動內在概念的邏輯演算》,建立了第一個神經網絡的數學模型,神經元的狀態和神經元之間的關系采用興奮-抑制(0-1)方式,這個模型可以執行高級神經活動功能。神經網絡模型具有計算能力,而這一切以前只能由人腦來完成。該文開創了邏輯符號主義學派人工智能和聯結主義人工智能研究的范式。
1956 年達特茅斯會議的一個成果就是紐厄爾和西蒙公布了一個程序“邏輯理論家”,它可以證明《數學原理》中的命題邏輯部分。1958年夏天,王浩在一臺INM-704機上只用了九分鐘就證明了《數學原理》中的一階邏輯的全部定理,他被認為是定理證明的開山鼻祖。定理證明是極端的符號主義學派。所有符號主義學派的人工智能技術的基礎都是定理證明,如專家系統、知識表示和知識庫。在20世紀70年代初,人工智能發展遭遇瓶頸。莫拉維克這樣總結20世紀70年代人工智能領域遇到的障礙:首先,最難進行自動化,且計算機難以完成那些在人們看來最自然不過的事情,比如看、聽和利用常識進行推理。這表明當時的困境首先來自計算機本身的局限性,由于計算能力不足,無法解決指數型爆炸的復雜計算問題。其次,常識推理,需要大量對世界的認識信息,而計算機沒有相關的知識儲備。
眾所周知,計算機技術的發展日新月異,因而硬件的局限性只是暫時的。而對于世界的信息獲取問題,也因專家系統的發展而得以解決。專家系統的知識表示、自然語言理解都可以用符號結構來表示,常見的數理邏輯不夠用,需要新的邏輯系統,如知識圖譜中的描述邏輯。顯然這是邏輯符號主義學派的做法,他們堅信利用數學邏輯方式可以模擬人類大腦思維的運行方式。而聯結主義學派則認為通過對大腦結構的仿真設計來模擬大腦的工作原理,即智能是源自大腦神經元之間的鏈接,而非單個的神經元。1982年,霍普菲爾德提出一種新的神經網絡,可以解決一大類模式識別問題,并給出了一類組合優化問題的近似解。
1987年,由于美國蘋果公司和IBM公司生產的臺式機性能不斷提升,個人電腦的理念不斷蔓延,AI硬件的市場需求突然下跌。并且,由于互聯網的出現,人類專家可以隨時隨地在網上解答問題,專家系統從而失去了存在的意義。
挑戰與機遇并存,神經網絡在20 世紀80 年代由于互聯網的到來而被遮掩。隨后,互聯網產生的巨大的信息數據為神經網絡的發展提供了更好的契機。深度學習之父辛頓站在神經網絡大神霍普菲爾德的肩膀上,于1983 年發明了玻兒茲曼機;到2006 年,他又開發出深度信念網絡,一種用于受限玻兒茲曼機的快速學習算法,深度學習技術開始騰飛。神經網絡由一層層神經元構成,深度學習就是利用具有多層神經元的神經網絡來進行機器學習。從形式理論來看,一層網絡就是一個函數,多層網絡就是多個函數的嵌套。層數越多,網絡越深,表達能力越強,當然伴隨而來的復雜度就呈指數級增長。深度學習技術,催生了“智能就是大數據加深度學習”的觀念。神經網絡是我們的終極算法嗎?深度學習是通向通用人工智能的正確路徑嗎?讓我們拭目以待。
機器能夠思考嗎?圖靈在1950年的《計算機與智能》一文中試圖回答這個問題。他提出了圖靈測試,詳細定義并解釋了人工智能及其研究目的、發展方向,并駁斥了當時科學界及社會上普遍存在的反對觀點。這在今天看來依然具有深刻意義。圖靈測試表明,如果測試者無法區分人與機器在語言行為方面的差別,那么我們就可以認為機器具有“智能”。圖靈在文末指明了兩條研究范式:符號派和聯結派。通過這兩種范式,計算機程序可以實現我們今天所說的通用人工智能或強人工智能。他這樣寫道:“我們或許期待著,有一天,機器能夠在所有純智能的領域中同人類競爭。但是從哪里起步最好呢?甚至這也是一個困難的抉擇。許多人認為,非常抽象的活動,比如下棋,可能是最好的。也有人認為,最好是給機器配備能買得到的最好的感覺器官,然后教它懂英語,并講英語。這個過程可以像通常教孩子那樣,指著東西,說出它們的名字,等等。我還是不知道正確答案是什么,但是我認為兩種方法都應該試一試。”[2]90
《計算機與智能》一文引發了機器智能的技術探索,同時也引發了機器智能技術背后的哲學反思。德雷福斯是對機器智能進行哲學反思最有影響力的哲學家之一,他認為機器智能是不可能的。美國蘭德公司1965 年12 月出版了德雷福斯的P-2344 報告,題為《煉金術與人工智能》,尖銳唱衰人工智能,對人工智能早期發展提出了重大的挑戰。德雷福斯在該報告的基礎上進行擴充,于1972年出版了《計算機不能做什么:人工智能的極限》。該書專門對明斯基1968 年出版的人工智能論文集《語義信息加工》進行了研究,并且把聯想主義心理學假設擴充為生物學、心理學、認識論和本體論四個方面的假設,從而涵蓋了當時人工智能研究方法的全部基礎。德雷福斯對人工智能在四個層面的理論一一進行了駁斥。在生物學層面,麥克洛克-皮茨的神經元是二元的;德雷福斯認為人腦是模擬的。在心理學層面,人工智能學家表征為信息處理和規則;德雷福斯認為信息和常識是無法用規則表示的。在認識論層面,麥卡錫認為所有的知識都是可以形式化的;德雷福斯認為人的知識不是形式化的,人們可以用微分來描述物體運動,但并不是物體在求微分。在本體層面,人工智能學者認為世界由事實構成,是可以還原的;德雷福斯認為人和物是有區分的,物可以還原,但人需要現象學。正如德雷福斯所指出的,由于智能必須處在某一局勢之中,因此它不能同人類生活的其他方面分隔開來[3]。而人工智能學者認為,日常生活中智能所需的一切都可以客體化并表達為一種信念系統,智能的理解力可以形式化為事實和規則的復雜系統,這在德雷福斯看來是毫無道理的。
德雷福斯并不孤獨,批評人工智能的哲學家還有一位——塞爾,他在1980 年的《心靈、大腦和程序》一文中提出一個思想實驗“中文屋”,這個思想實驗就是要反駁即使是機器通過了圖靈測試,該機器依然不具有智能。塞爾認為,計算程序至多是理解語法,但并沒有理解語義,信息必須內化才是理解,即知識成為人身的一部分。也就是說,單純的形式化符號操控是沒有理解能力的,計算機硬件也不同于神經蛋白,不具有意向性,缺乏生成心理過程所需的恰當的因果能力。塞爾認為,只有一種機器能夠思維,實際上只有一些類型非常特殊的機器,即大腦和那些與大腦具有相同因果能力的機器才能夠思維[2]118。
機器智能技術的探索一直在發展,從當初的邏輯符號學派到現如今如日中天的深度學習,總是不斷地向機器智能方向逼近。2018年的圖靈獎獲得者深度學習三巨頭之一的Yann LeCun指出,深度學習存在一些局限性,具體表現在以下幾點:缺乏理論支持、推理能力欠缺、短時記憶能力需要加強以及無監督學習能力弱[4]。首先,神經網絡依然由經驗來搭建。網絡參數有可能只是一個局部最優,而不是全局最優,因而算法還有很大的優化空間。深度學習目前不是一個發展完善的理論,還有很多地方需要加強研究。其次,深度學習最受詬病的是缺乏邏輯推理能力,在面對需要復雜推理的任務時受到一定限制。圖靈獎得主、貝葉斯網絡之父珀爾在ArXiv上發布了他的論文《機器學習理論障礙與因果革命七大火花》,其中指出,當前的機器學習系統幾乎都是以概率統計的方式運行,不能作為通用智能的基礎。他認為,突破口在于“因果革命”,借鑒結構性的因果推理模型,能對自動化推理做出獨特貢獻。
一句話,以目前的技術,機器智能還需要走很長一段路。
人工智能領域最經典的兩個思想實驗——圖靈測試和“中文屋”(塞爾),說的是機器的自然語言理解問題。圖靈說,檢驗機器智能的高低最好的辦法就是讓機器會自然語言并且理解自然語言;而塞爾說,機器會把英文翻譯成中文,還不是真正的理解,只有真正理解,機器才有智能。自然語言顯然是指人類日常使用的語言。機器理解人類的日常語言,就是用計算機科學中的算法和數據結構的概念來建立一個語言的計算理論。相對于“自然語言”來說,這個計算理論就是“機器語言”。這兩者之間的差異是顯而易見的。機器語言是一套規則系統,系統中的表達式都是遞歸生成的,語形和語義之間存在一一對應關系,每一個語形符號的含義都是確定的。而自然語言并不完全是遞歸生成的,語形和語義之間并不存在一一對應的關系,其相關性是在社會實踐活動中逐步固定下來或逐步發生改變。也就是說,自然語言是靈活多樣的。兩者的形成機制并不一樣,因而自然語言帶來了一些有趣的計算性挑戰,包括分詞、標注、分類、信息提取、建立句法和語義表示等。但是從技術層面來看,語言計算模型和人類處理自然語言的方式的不一樣并不重要,重要的是計算機是否真的理解人類語言。
語言的計算模型就是自然語言的形式化。1956 年喬姆斯基在《句法結構》一書中創建了轉換生成語法。他寫道:“這篇論文是從廣義(跟語義學相對)和狹義(跟音位學及詞法相對)兩個方面來討論句法結構的。我們打算建立一種公式化的一般語言結構理論,并且打算探討這種理論的基礎。”[5]喬姆斯基的句法分析和自動機有著密切的關聯。喬姆斯基把句法分成四種類型,即0型、1型、2型、3型。0 型文法等價于圖靈機,1 型文法(上下文有關文法)等價于線性有界非確定圖靈機,2 型文法(上下文無關文法)等價于下推自動機,3 型文法(正則表達式)等價于有限自動機。顯然,形式語言理論成為一種可以計算的理論,可以直接應用到自然語言的機器處理中,成為自然語言理解的有力工具。
形式語言理論的發展和人工智能的抱負分不開,自然在技術路線上也和人工智能的兩條路徑相吻合。以生成語言學為基礎的研究路徑,稱為理性主義,和邏輯符號主義學派相對應;以大規模語料庫分析為基礎的研究路徑,稱為經驗主義,和聯結主義相對應。大規模語料庫的出現其實就是對基于規則分析方法的一個重要補充,也是研究目標的轉向,機器通過自動學習來獲取語言知識。
理解自然語言的核心是理解語言的意義。而在形式語言理論中對于語義的表示方法采用語言學的直觀表征還是數學或邏輯的形式表征,學界一直沒有取得共識。顯然語言學的直觀表征在語料庫中居多,通過對語言運用實例的大量搜集、整理和分析,歸納出自然語言的典型特征,并用形式的方法表述出來。而數學或邏輯的形式表征更方便計算機的操控。邏輯的形式表征是將自然語言表達式的成分轉換成高階邏輯的表達式,數學的形式表征通過類型化特征結構圖中的屬性—值來表示語法和語義信息。數學或邏輯的形式表征有一個潛在的原則——組合原則,即一個復雜表達式的語義由它的各個成分的語義及其組合模式得到。這一原則保證語句語義的遞歸生成,即一個復雜的表達式的語義可以遞歸計算。
生成語法理論之后衍生出眾多的語法理論,其中組合范疇語法在生成力和解釋力方面更加貼近自然語言。組合范疇語法CCG 是在古典范疇語法基礎上發展起來的,其優點在于:它的句法和語義之間有一個透明的接口,每個詞條的語義表達式和句法范疇都被存放在詞庫的詞項上,句法范疇和語義類型、語義最后的表達式都可以基于詞庫中的范疇指派生成[6]。組合范疇語法CCG不僅滿足了自然語言處理所需要的句法分析,而且滿足了詞與詞之間的語義關系。現階段的自然語言處理僅僅利用CCG的句法范疇進行標注和推演,忽視語義類型的標注和推演,這使得CCG的句法分析器難以達到完美的效果。尤其對于意合型的漢語,這類語言句法上缺少嚴格的形態標記,語序靈活,上下文依賴程度高。CCG 處理的效果更是不盡如人意。對于該問題的處理,鄒崇理的研究團隊做了一系列的工作,特別是構建了漢語CCG語料庫。該語料庫把基于短語結構語法的賓州漢語樹庫轉換成基于組合范疇語法的漢語CCG 樹庫。漢語CCG 樹庫目前的一些句法分析在語義上是不合適的,還需要額外的手工標注來獲得正確的分析。同時CCG 樹庫用相同的方式給相同類型的所有范疇提供共指標記,顯然不夠嚴謹,無法在語義上反映相應的共指關系。造成這種現象的原因是范疇的標注只是句法的,不含有語義信息。這表明CCG 漢語樹庫尚需進一步完善,這就需要邏輯語義學研究的介入。
朱松純認為,人工智能是小數據、大任務,而不是相反[7]。環境中的智能體通過觀察操控環境中的有限信息(小數據),建立信息或行為之間的因果關聯,從而做出復雜的行為(大任務),即具有因果推斷能力就可以在小數據的基礎上完成大任務。小數據、大任務的典范就是“烏鴉范式”:烏鴉進城覓食,找到一枚堅果,現在的任務是把堅果砸碎。烏鴉發現路過的車輛會把堅果軋碎,但是車流密集,自己也有可能被軋死。那么,覓食的任務就分解成兩個任務:車軋碎堅果,避免車輛軋到自己。它發現有紅綠燈的十字路口可以達成這個任務。它發現了車輛、人行道和紅綠燈之間的因果關系。也就是說,在這個過程中烏鴉并不需要大量的數據,只需要少量的數據,但是最重要的是在這少量的數據中有效地獲得因果關系,并根據這個因果關系制定相應的行動方案。也就是說,只有給機器配備了因果推理模型,機器才可以說是具有了智能。而因果推理模型則是結合了演繹推理和歸納推理等推理模式。早期的人工智能理論主流是基于邏輯符號的演繹推理,而現在如日中天的深度學習卻是基于大數據的概率統計推理,均不可能發明出真正的人工智能。
問題是怎么從數據中提煉出因果關系。這就需要一個因果模型。如果找到了這樣一個好的因果模型,那么我們就可以做實驗,從大數據中找到真正的因果關系。對于因果發現的方法,我們最熟悉的莫過于密爾五法,但是該方法存在很多的問題,可操控性弱。研究因果模型推理的杰出學者珀爾把因果分為三個層面,并稱之為“因果關系之梯”:關聯、干預和反事實推理。這三個層面其實對應于三個不同層次的認知能力:觀察力(發現環境中的規律的能力)、行動力和想象力。因果關系之梯的第一層級要求我們基于被動觀察做出預測。其典型問題是:“如果我觀測到……會怎樣?”這個可用條件概率來表征:P(y | x)= p。就是說,假設我們觀察到事件x 時,事件y 出現的概率等于p,即把x 和y 關聯起來。處于第二層級的“干預”則是主動行動起來,即怎么做。可以用形如P[y | do(x)]的句子來表征,表述的是假設我們干預x,然后觀察事件y 的概率。第三層級的反事實就是思想實驗,如果我做出了不同的行動結果會怎樣?這一層級需要用到回溯推理。可以用形如P(yx | x′,y′)的表達式來刻畫,意思是:我們觀察到x 時事件y 的概率是基于我們實際上觀察到x′時y′的概率。珀爾指出:“因果關系之梯的每一層級都有一種代表性生物。大多數動物和當前的學習機器都處于第一層級,它們通過關聯進行學習。像早期人類這樣的工具使用者則處于第二層級,前提是他們是有計劃地采取行動而非僅靠模仿行事。我們也可以通過實驗來習得干預的效果,這大概也是嬰兒獲取大多數因果知識的方式。反事實的學習者處于階梯的頂級,他們可以想象并不存在的世界,并推測觀察到的現象的原因為何。”[8]珀爾從因果關系之梯及其形式表達出發,得出目前的深度學習還處于第一層面。僅僅停留在第一層面達不到真正的因果關系,還需要額外的條件,才能進行因果推理。
珀爾指出,因果關系之梯用因果圖就可以很好地說明。用因果圖來構建因果模型不僅僅是畫箭頭,箭頭背后還隱藏著概率。當我們繪制一個從X指向Y的箭頭時,其實是在說,某些概率規則或函數具體說明了“如果X 發生改變,Y 將如何變化”。通常情況下,因果圖自身的結構就足夠讓我們推測出各種因果關系和反事實關系:簡單的或復雜的、確定的或概率的、線性的或非線性的。正是在這個基礎上,珀爾稱之為“結構因果模型”[9],該模型由三個部分構成:圖模型、結構化方程以及反事實和干預邏輯。其中,圖模型作為表征知識的語言,反事實邏輯表達問題,結構化方程以清晰的語義將前兩者關聯起來。由此建立的因果關系演算系統能夠執行一些當前機器學習系統無法實現的任務,并且是使用因果建模工具完成的。
愛因斯坦認為,西方科學的發展是以兩個偉大的成就為基礎的,那就是希臘哲學家發明的形式邏輯體系,以及通過系統的實驗發現有可能找出因果關系。我們現在依然在做這兩件事,用形式系統來刻畫智能,用形式系統找出數據或信息之間的因果關聯。什么是智能?從圖靈測試到“中文屋”,從大數據到因果推斷,到小數據、大任務,其背后隱藏著理性主義和經驗主義、符號主義學派和聯結主義學派的哲學和方法之爭。
鄒崇理認為,在自然語言理解中,理性主義走向極致,規則模式只能解析實際運用的少量表達式;經驗主義走向極致,個案個例的羅列無章可循,不便從中識別不合法的表達式。怎樣進行理性主義和經驗主義關于語義的深度融合?目前的研究重心是結合多種邏輯工具作為自然語言的語義表征,采用統一的機器算法和人工標注相結合的方式,給漢語CCG句法分析樹庫匹配語義表征。
為了解決深度學習中的關系推理問題,深智團隊(DeepMind)聯合谷歌大腦、MIT等機構27位作者發表了一篇探究性的文章《關系歸納偏置、深度學習和圖網絡》,將圖的一階邏輯和概率推理結合到一起,試圖解決深度學習中的因果推理問題。深智團隊也提供另外一種方案:傳統的貝葉斯因果網絡、知識圖譜與深度強化學習融合。這種方案也是困難重重。同時值得一提的是,馬爾科夫邏輯網是將馬爾科夫網絡與一階謂詞邏輯相結合的統計關系學習模型,具有強大的描述能力、邏輯推理能力和處理不確定性的能力。這些方案,暫時無法分出優劣,也許是條條道路通羅馬,只有等到達人工智能的奇點之后才知道哪條路是可行的。
未來已來,正如圖靈所說:初見前路近可至,細思百事競待忙。(We can only see a short distance ahead,but we can see plenty there that needs to be done.)[10]