999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

如何讓通用人工智能系統能夠“識數”

2021-10-19 05:34:51徐英瑾

徐英瑾

摘 ? 要: “識數”的字面意思就是說,數字表達式的使用者需要知道這些表達式日常實踐中的具體意義,如知道“十公里”算不算“路遠”,“十萬元”算不算“昂貴”。主流人工智能系統雖然都是數碼化的,但卻未必真正“識數”,因為它們都無法以一種靈活的方式來理解數字表達式在特定的日常語境中究竟意味著什么,并在這種理解的基礎上進行復雜的語用推理。為了使得人工智能系統能夠“識數”,工作思路應是在非公理化推時系統的平臺上來構建數字表征。訓練非公理化推理系統使之“識數”的指導原則,就是先教會它表征那些最不抽象的數學概念,再一步步進展到更抽象的概念。而這一教學步驟的安排,與我們教導兒童識數的路線圖是有點相似的。在這個面向機器的數字教學法中,我們將以對“邏輯專名”的教學作為對數字表征教學的重要前導。

關鍵詞: 數感;知覺;通用人工智能;非公理化推理系統;邏輯專名

中圖分類號:TP18 ?文獻標識碼:A ?文章編號:1004-8634(2021)05-0024-(13)

DOI:10.13852/J.CNKI.JSHNU.2021.05.003

一、導言:什么叫“識數”

在人類的知識中,大量的內容都包含了數字表征。例如,在經典的蓋梯爾問題中,對于“史密斯知道得到工作的那個人口袋里有十枚硬幣”這樣的命題,1 就包含了“十枚硬幣”這樣包含數字的表征。然而,這樣的命題所涉及的數字表征(如“十……”)是如何與那些非數字表征(如“……枚硬幣”)結合在一起的呢?對于這個問題,西方主流知識論學界并沒有投入大量的資源來加以研究。在本文中,筆者將試圖從人工智能哲學的角度,闡明通用人工智能系統獲得與日常生活相關的數學知識的原理,從而為我們進一步理解數字表征在日常知識中的地位提供一個新的視角。

初看起來,由于我們已經假定了所有的人工智能系統都是數碼化的,所以,“人工智能究竟該如何表征數字”這個問題似乎就根本沒有被加以單獨討論的必要了。但是,我們這里說的“數字表征”的真正含義卻是“識數”,也就是把握一個帶有特定單位的數字表征的具體實踐意義,比如,知道“十公里”算不算“路遠”,“十萬元”算不算“昂貴”。這種意義上的“識數”,也可以被理解為對于“數感”(number sense)的把握。 “數感”一詞由心理學家丹齊格(Tobias Danzig)首創,2其字面意思就是:數字的使用者在他們的日常實踐中對數字的實踐意義的領會。根據戴夫林(Keith Devlin)的理論,1數感的獲取有賴于兩種能力的預先獲得:第一,估數(subitizing),亦即比較那些通常在視覺中同時呈現的兩批事物的數量的能力;第二,計數 (counting),即通過數數來回憶在時間中相繼呈現的對象的數量的能力。而現有的人工智能系統,是否能夠在上述意義上“識數”,則頗為成疑。

數感和符號運算之間的關系很復雜。一方面,基于如下兩個理由,兩者的確彼此不同:第一,數感只能保證主體具有估算數值的能力,而不是處理復雜與精密的符號運算的能力。第二,通常認為,數感的出現有賴于自然演化的歷程,因為人類的數感和其他物種如鳥類、2鼠、3獅子4和黑猩猩5的數感具有相同的特征。與之相對比,進行符號運算的能力則毫無疑問與文化有關,因為在動物界中只有人類具有文化,并且只有人類會進行復雜的符號運算。

不過,另一方面,我們也有理由宣稱數感和符號運算彼此是有緊密聯系的。具體而言,符號運算的能力雖必然由特定文化所滋養,但同時也被人類的基因稟賦所限制,而這些限制的存在,則可以通過下面的例子來加以說明:在不同的文化中,人類均對十進制系統具有特殊的偏愛,而這一點,恰恰與“凡人均有十根手指”這一生物學事實頗有關聯。6從這個角度看,與人類的生物稟賦更有關聯的數感,其實是為各種文化中的各類數學構造提供了“原材料”——從這個角度看,沒有哪類需要計算活動的人類文化的形成是離得開數感的。

上述這些描述必然是基于心理學或者生物學材料的。然而,為何人工智能需要關注這些材料呢?換言之,為什么人工智能系統需要數感?此外,在人工智能系統中實現對于數感的把握機制到底難不難?若是困難,其難點又何在呢?

二、為什么通用人工智能系統需要“識數”

首先,讓我們不妨將在人工智能中與人類數感所對應的東西稱作“人工數感”。它將從以下兩個方面對人工智能提供重大貢獻:

其一,“人工數感”會讓人工智能體有能力在日常對話中進行適當的數量推理。例如,聊天機器人很有可能與人類一起討論商品價格等物的數量。若要勝任此類談話,人工智能體就應能將數字與非數字表征的評價詞匯(“很多”“很少”“幾乎足夠”“太多”“太貴”等)聯系起來,如整合為如下判斷:“這幢別墅作價五百萬美元,這實在太貴了”“讓他捐三十元,對他而言已經算很多了”等。顯然,判斷者要做出這種判斷,就必須依據不同的語境給出不同的“數詞—評價詞”配對模式。由此看來,人工智能體若無恰當的數感(不知道數字在日常實踐活動中的意義),就根本無從打通數字、評價詞、語境之間的推理通路。

其二,“人工數感”會提升人工智能系統做出數學創新的潛力。筆者所說的“數學創新”是指發現全新的數學知識,而不是再次“發現”已經發現過的東西。從康德7 到布勞威爾,8 在關于數學知識獲取方式的認識論研究傳統中,一直有學者認為數學創新和數學直覺有關。換言之,在數學中新構造出來的對象,必須能在某些可被直觀的心理圖像中獲取其意義。這種主張也被稱為“數學直覺主義”。雖然作為一種關于數學知識合法性的證成性理論(亦即關于數學創新應當是怎樣的理論),數學直覺主義的合理性還未得到普遍贊同,但若我們僅僅將其視為一個心理學理論(亦即關于數學創新實際上是怎樣的理論),該學說的學術價值則較少有爭議。實際上,戴夫林1提到的兩種與“數感”相關的能力——估數和計數——也是與數學直覺相關的,因此,此二者分別依賴于空間性的直覺和時間性的直覺。

不過,“直覺”這個術語依然帶有人類中心主義的傾向。現在筆者就將它外推到人工智能體上。如何進行這種外推呢?筆者建議把“直覺”變為一個副詞,即“在直覺上”。對于任何智能體而言,凡是能夠與其可提取的記憶模式(不只是數學模式)構成類比的事項,都可以被說成是“在直覺上”存在的事項。照此,當我們說“A在直覺上是B”的時候,就相當于說“A是B”這一判斷成立的情形,與系統的可提取記憶中的某個例子構成了類比關系。至于為何這種意義上的對于“在直覺上”的定義既適用于人類也適用于機器,乃是因為:這個定義中的關鍵短語(如“類比”“模式”“可提取的記憶”)無論對人類還是人工智能體都是適用的。依此思路,如果人工智能體要通過它所具備的數感或直覺來進行數學創新,它就應該把新的構造視為其經驗中可提取模式的類比物,從而保證這些數學構造是富有意義的。

有人或許會問:人工智能體為何一定需要恰當的數學直覺來輔助數學創新呢?這是因為,倘若沒有數學直覺的輔助,數學探索的效率將會降低。因為正確的數學直覺可以大幅度縮小數學探索的范圍。換句話說,如果被構造的數學對象E與經驗中常見的某種成熟的模式構成類比關系,那么,E看起來會比其他備選的有待構造的對象更有希望被構造成功。

不過,目前為止我們僅僅初步勾勒了一些大框架,來討論如何在通用人工智能系統中實現自主的數學創新,關于這個話題,尚有更多細節方面的空白有待未來的研究加以充實。但是值得注意的是,在通用人工智能系統中實現數學創新,畢竟是一項困難的挑戰。與之相比,在通用人工智能系統中實現對于日常對話與數字表征的整合,看上去要容易一些。按照“先易后難”的原則,我們必須將對于后者的實現視為日程表上的首選任務。有鑒于此,在下面的討論中,筆者會將注意力更多地集中于這項比較容易完成的任務上。

在展開正面的闡述之前,筆者還需要對“目前主流人工智能系統是否能夠應對上述兩項挑戰”這一問題給出評估意見。而筆者的相關評估意見乃是消極的。在筆者看來,為滿足特定需要而產生的主流人工智能系統,既不能有效地評估特定數學表達式的實踐價值(這屬于前文所說的“較為容易的任務”),遑論進行數學創新(這屬于前文所說的“較為困難的任務”)。

不過,或許有人會舉出例證,反對筆者的上述評斷。例如,有人可能會認為“自動數學家系統”(Automated Mathematician,縮寫AM)2 構成了筆者論斷的一個反例,因為據稱該系統可以自動地發現哥德巴赫猜想的內容和一些基本的算數定理。然而,正如勒納特(Douglass Lenat)與布朗(John Brown)3 所指出的,這個系統之所以能夠發現那些數學對象,乃是因為系統中存在著特定的LISP語言短程序;而只要沒有系統外的人類研究員用復雜的數學概念來解釋這些程序的運行,那么,該系統的上述數學發現就會泡湯。因此,從認識論角度看,AM自身并不真正理解它的“發現”,因為只有當某主體能夠運用其自身的內部認知架構來解釋某事時,該主體才算得上真正“理解”了這件事。從這個角度看,AM肯定是缺乏數感的,因為數感的存在本身就預設了一種解釋數字表達式的能力。無獨有偶,在業界頗有名氣的“培根系統”(BACON)4 也有同樣的毛病。該系統據稱能重新發現一些重要的物理學定律(如理想氣體定律、開普勒第三定律、庫侖定律、歐姆定律、伽利略單擺定律和恒定加速度定律等)。從認識論角度看,培根系統其實也無法真正理解其發現,因為在該系統中出現的數學變量的物理意義恰恰是由人類設計師預先賦予的——至于該系統自身,則不能對這類變量給出任何一種元描述。也因為這一點,培根系統不可能獲得數感,因為數感的存在本身就預設了對于數學變量的意義加以解釋的能力。

然而,上述對于主流人工智能系統的批評性斷言是否犯下了“以偏概全”的謬誤呢?在自動數學家系統與培根系統之外,是否還可能存在著別的能夠擁有數感的主流人工智能系統呢?而筆者接下來要論證的就是:只要一個人工智能系統不是通用人工智能系統,它在原則上就是“不識數”的。

三、為何主流人工智能系統均是天生“不識數”的

一般而言,主流的商用計算機均是“數碼化”的,因為它們的內部語言通常是基于八進制或十六進制的編碼來運行的(順便說一句,八進制或十六進制乃是二進制的某種變種)。對于LISP這樣的高級編程語言來說,它們的運行也是基于上述編碼的。但是主流計算機的這種“數碼化”,是不足以使其產生“數感”的。為何這么說呢?這是因為,一個主體若要有健全的數感,就需要知道在特定語境中一個數字到底算不算“大”,而要做出這種判斷,該主體就需要在不同語境中選擇不同的“參照物”來決定對象到底算不算“大”。這里的參照物其實并非一個靜態的對象,而是對于多項要素綜合評估后產生的結果。而這些要素包含了系統的任務截止時間點、剩余時間、剩余電量、知識庫內容、硬件條件等異常豐富的內容。我們將這些要素統稱為“運行資源”。譬如,對于一個運行資源相對豐富的系統來說,10分鐘的任務解決時間限制就會顯得很“寬松”,而對于一個運行資源逼仄的系統來說,同樣的時間量則會顯得“不夠用”。很顯然,要對系統的運作資源進行整體概觀,系統自身就要對其內部運行條件與其周圍環境之間的動態關系進行把握。由于這種動態關系是依據語境變化而變化的,所以,相關的把握結果就不能在任何公理化的系統中被預先編碼,因為任何一種公理化的知識庫整合方式都是缺乏足夠的語境靈活性的。

以上述結論為出發點,我們也可以重新理解上一部分對于自動數學家系統與培根系統的評論。這兩個系統都是公理化的,因為在這兩個系統中,程序員必須預先固定好一些特定數量的結構性要素。而既然這些要素已經被固化,此類設計思路便會使得相關的系統無法靈活應對各種應用語境的變化。例如,自動數學家系統就包括了上百個被稱為“概念”的數據結構、上百個“啟發式規則”以及一個簡單的控制流。然而,若沒有人類的干預和解釋,該系統是無法自主調整這些要素的。與之類似,就培根系統而言,雖然貌似能夠處理大量與特定物理學法則相關的數據,但是關于“哪些數據值得成為備選的物理法則的奠基性證據”這個問題,卻是無法進行自主思考的。毋寧說,程序員會預先告訴系統哪些數據是具有“物理學價值”的。但這就等于將科學發現的最重要步驟“分包”給人類完成了。從這個角度看,培根系統只不過就是人類智能的副產品罷了。

那么,公理化進路的人工智能系統就沒有別的辦法來應對語境靈活性了嗎?譬如,設計者能夠在系統中設定某些“元公理”,以便預先規定好某些特定的知識模塊和某些特定種類的語境之間的聯系,這樣的系統難道就不能讓自己的行為具有語境靈活性了嗎?很可惜,對于上述問題的回答乃是否定的,因為再多的“元公理”也不可能窮盡所有的知識模塊與語境之間的聯系。以古哈(Guha)1的“微理論”為例(微理論乃是為“Cyc系統”而設計的一個輔助性的概念工具):他以微理論為基礎,對Cyc系統的知識庫加以重新組織和分類,使之成為一些更易處理的知識模塊,而每一個微理論則包括幾條可以被進一步測試或打磨的公理或規則。那么,此類設計是如何使恰當的知識模塊能夠在恰當的語境中得到恰當的調用呢?其訣竅便是在諸微理論之上再去設定作為其元公理的“表述規則”,以便預先規定在哪些語境中一個微理論有權調用另一個微理論所導出的結果。不過,即便整個設計方案已然假定了設計者能夠預知在每一個工作情境該用何種微理論,但是誰又能有這種神一般的預知力呢?

有人或許會問:上述的診斷意見都是針對“符號主義進路的人工智能系統”的,那么,該診斷是否也適用于聯結主義或深度學習進路的人工智能系統呢(順便說一句,由于深度學習技術只是傳統聯結主義技術的升級版,下面我們將僅僅提及聯結主義進路的人工智能系統)?

筆者認為,對于上述問題的回答乃是肯定的,盡管從表面上看,對于聯結主義進路的人工智能系統的構建思路,的確不同于符號主義的人工智能系統。概而言之,構造一個聯結主義網絡的基本思路便是去構造一個高度簡化的神經網絡模型。這樣的模型通常包括一個輸入層、幾個隱藏層以及一個輸出層,而其中每一層都包含大量的人工神經元節點。在“有監督學習”模式的人工聯結主義模型中(這是一種最典型的聯結主義構造模式),對于系統的訓練是離不開大量學習樣本的“喂入”的。 而一個相關的訓練樣本在被系統處理之后,系統會立即判定實際的處理輸出與目標輸出之間的差值——如果此差值過大,以至于實際輸出必須被視為“誤差”,那么,該系統會依據特定的學習規則來調整節點間的聯結權重。經過一系列的此番調整,神經網絡所產生的輸出就會越來越接近目標輸出,直至訓練達標。

然而,上述技術路徑依然不足以讓相關的系統產生那種足以靈活地適應多樣性語境的“數感”。其原因是:一個系統要有健全的數感,就必須把握評價性詞匯(如“大的”“足夠的”等)、數字表達式與語境要素三者間的關系,故而,訓練一個聯結主義網絡所用的訓練樣本,也必須包含所有這三類要素。但這一點是不可能實現的,因為我們根本不可能在訓練樣本中包含語境要素。這又是為何呢?這是因為:語境要素本身就是一個囊括很多下級要素的高階概念,而聯結主義網絡的輸入單元層一般只對訓練樣本的低階特征敏感。因此,從原則上說,除非我們讓語境概念的含義縮水,否則,就無法通過訓練一個聯結主義網絡來讓其獲得真正的語境靈活性(順便說一句,某些深度學習系統貌似能夠處理一些“語境”,但這種“語境”僅僅指文本的前后文關聯,而無法囊括更多的要素,因此,非上文所討論的“語境”)。

對于主流人工智能系統的批評,就到此為止了。下面,我們將轉入對機器“數感”的實現方案的嘗試性討論。

四、如何在納思中表征數量

在下文中,筆者將依據非公理化推理系統(Non-Axiomatic Reasoning System,縮寫NARS,漢譯為“納思”)所提供的技術刻畫手段1來討論“如何實現機器數感”這個問題。納思是一個通用推理系統,而非針對特定知識領域的專用推理系統。除了通用性之外,它與傳統推理系統的不同處還在于:即使沒有得到用以完美解決問題所需要的充分知識與充足時間,該系統也有能力從自身的有限經驗出發進行學習,并對給定的問題提供某種尚可被接受的解法。研究納思的目標有兩方面:首先,此類研究有助于理解一切智能系統的規范性特點;其次,此類模型能夠提供一個計算模型來描述“會思考”的機器,以直接助力通用人工智能系統的研究。目前,納思研究計劃也被視為方興未艾的 “通用人工智能運動”的一個代表性技術流派。2

那么,我們究竟該如何在一個納思中實現機器數感呢?在這方面,發展心理學關于孩童如何學習數學過程的研究成果,或許頗有參考價值。3 也就是說,我們要將納思也視為某種意義上的孩童,就像教育孩童那樣去教育這樣的人工智能系統。比如,我們首先要教會納思那些最具體、最基本的數學概念,然后一步步地將我們的教學目標過渡到那些更抽象的概念。那么,什么才是最具體、最基本的數學概念呢?或許不是自然數,而是那些自然語言中的量詞(如“有一些”等)。譬如,對于孩童而言,在把握“一”或“二”這些概念之前,或許得先學會說“有一些糖果是紅的,而有一些則不是”,這就預設了他們已學會諸如“一些”“大多數”之類的量詞。

對于數學哲學中的邏輯主義流派4 較為熟悉的人可能會說,筆者提出的思路無非就是弗雷格或羅素式的邏輯主義思路的翻版,即以量詞為基礎,將數學還原為邏輯。但上述印象乃是錯誤的。在弗雷格或羅素式的一階謂詞邏輯中,所謂的“量詞”便只有“存在量詞”和“全稱量詞”兩種而已,難以有效地涵蓋自然語言中那些表述不同程度的量詞,如“很少”“一點點”“一些”“大多數”“幾乎全部”等。與之相較,筆者提出的納思式進路,正是要顧及在日常語言中的這些常見量詞。

那么,我們該如何對這些量詞進行技術刻畫呢?

在納思中,概念節點A與B之間的連接強度,可以被理解為主項的成員從屬于謂項的成員的程度,而這樣的強度或者程度可以被進一步地表現為A與B之間連線的“寬度”或者“權重”。這一點或許會讓人聯想起貝葉斯網絡(見圖1),因為連接貝葉斯中諸節點的那些通路的權重,也能對一個事件引發另一個事件的概率值進行編碼。

然而,納思網絡與貝葉斯網絡尚有兩點重要差異。

差別之一:在納思最為基礎的表征層次上,諸納思節點所編碼的,基本上是像“蘋果”或“紅”這樣的概念,而不是代表事件的命題(如圖1所展現的那些事件: “天在下雨”“灑水器開著”“草坪濕了”等)。因此,在圖2中,兩個納思節點之間雖然有一個箭頭將其聯系到了一起,但這并不代表一個事件相對于另一個已被給定的事件的后驗概率,而僅僅代表某個主謂判斷——如“渡鴉是黑色的”——的強度(不過,更為復雜的納思構造物,還是可以通過某些納思節點來編碼復合詞項和命題的,但不在本文的討論范圍之內)。

差別之二:在貝葉斯網絡中,數據的更新規則必須能用標準的概率論規則來解釋,而納思的數據更新規則和標準的概率論規則卻有很大不同。依據標準的概率論,證據池中的證據被獲取的時間先后關系,與基于此池中證據的相關假設的成真概率并沒有本質性聯系,因此,一個嚴格基于標準概率論運作的智能系統是不可能產生“錨定效應”的(即一種特定的心理學效應,以使那些先被獲取的證據,比那些后獲取的證據,更能影響主體對于相關假設成真概率的判斷)。然而,納思卻可以模擬“錨定效應”的產生,1 以便應對某些需要系統急速做出判斷的問題處理情景。

下面我們就通過具體的例子,來說明納思是如何處理數量關系的。

假定該系統觀察到了10只渡鴉,其中有9只是黑的,由此形成了一個基本的納思式判斷“渡鴉→黑色的”(意思即“渡鴉是黑的”)。有兩個參數可以用以刻畫這樣一個判斷的真值,一個是頻率因子(f值),另一個是置信因子(c值)。對于f值而言,其計算公式是:

公式1: f = w + /w

在此,“w”代表系統所獲取的用以支持或者反對某假設的證據總數(在上述案例中,該值乃是10,因為系統的確觀察到了10只渡鴉),而“w + ”代表其中正面證據的總數(在上述案例中,該值乃是9,因為的確有9只黑渡鴉被觀察到了,以便從正面支持“渡鴉是黑色的”這個假設)。但需注意的是,這里的f值并不能通過對于概率的 “頻率主義解釋”1 來解讀,因為根據“頻率主義”的假定,一個系統是應當有無窮的時間來收集證據的,而納思則完全沒有采用這個假定。毋寧說,即使納思搜集證據的時間非常有限——這往往體現為一個很小的w值——該系統也能給出一個f值。

然而,僅僅依賴f值,納思對于判斷的真值的刻畫還是很不完整的。這種不完整性,可以通過對下述問題的考慮而得到揭示:現在假定系統已經觀察到了100只渡鴉,其中有90只是黑色。根據公式1,現在f值還是0.9。然而,我們的直覺似乎是:該數據要比舊的數據更為可靠,因為它基于一個更大的證據池。如何在納思中刻畫這一區別呢?光有f值恐怕不行,我們還得引入c值:

公式2: c=w/(w + k)

依據公式2,基于100份關于渡鴉的證據的f值(例如0.9),會被賦予一個更高的c值,而基于10份關于渡鴉的證據的f值雖然也可能是0.9,但卻會被賦予更低的c值。由此,就形成了兩個不同的數對,用以刻畫兩個不同的納思判斷的真值。很明顯,即使f值相同,兩個具有不同c值的納思判斷,其各自所導致的推論的強度也會不同:c值越高,從中導出的結論的強度也越高,反之亦然。

對于公式2的觀察還能告訴我們:當k取某常數時,w值越大,c值越接近1。不難想見,當w值已經變得很大時,它若變得更大,這一點并不會導致c值被明顯地提高。這樣一來,對于納思而言,系統所先得到的證據,在權重方面也會高于其后所得到的證據。這便等于是在納思中模擬了“錨定效應”。這就使得系統不會陷入不斷搜集新證據的怪圈,而在基本證據量大致足夠的情況下就產生出足夠高的c值。

不同的f值和c值所構成的數對,可以被映射到諸如“很少”“一點點”“一些”“大多數”“幾乎全部”等自然語言中的量詞上(見圖3)。但需要注意的是,當這些量詞在自然語言中被表征出來的時候,其背后的f值、c值、w值與 w +值均不會直接出現,而只會在系統的后臺運作中出現。這就好比說:當一個兒童覺得他所見過的大部分渡鴉都是黑的時,他或許已經遺忘了其所觀察過的渡鴉的精確數量。

有了上面的討論做基礎,我們似乎就可以討論如何在納思中表征自然數了。但在切入此話題前,我們還有一項預備工作要做。

五、如何讓納思學會“the”(“這個”或“那個”)

很多人或許會想當然地認為,如果我們要讓通用人工智能系統學會自然數,那么相關的教學起點就應當是所有的自然數中最小的“一”。然而,這可能不是一個好主意,因為“一”可能還是一個過于抽象的概念。筆者的建議是:從定冠詞“the”開始教。

為何要這么做呢?因為用“the”這個英語中的常見定冠詞時,說話人一般都會借此表示其背后所跟的對象在談話語境中的唯一性。比如,說“the old man”(那個老人)時,說話人一般就會預設在談話語境中僅有一個老人。上述分析其實也適用于漢語。雖然在漢語中沒有與“the”嚴格對應的單個的詞,但類似的現象也是有的。“the”一般在漢語中被翻譯為“這個”或“那個”,而當我們說“那個老人”的時候,我們往往也預設了語境中被涉及的老人只有一個。當然,筆者也注意到,西方語言哲學界近來有一種研究趨勢,即否認“the”之后所跟的對象在語境中是唯一的,1 但為了討論的簡潔計,筆者在此尚且不想處理這一新的學術見解。

那么,為何要讓納思先學會說諸如“The raven is black”(這個渡鴉是黑色的)這樣的句子,而不是先讓其學會“一”呢?這樣做的理由,乃是基于如下的三步論證:

第一步:一個智能系統要具有計數能力,首先就得具備辨別物理對象數量的能力。

第二步:僅僅讓系統知道“一”的意義,并不能使相關的智能系統具有上述的識別能力,因為抽象的“一”自身并不和物理對象相關聯。

第三步:與之相較,讓系統首先領會“the”的意義,則可能讓系統更快地掌握識別物理對象數量的能力,因為根據“the”的基本用法,它是必須引導其后面所跟的那些要被計數的物理對象的名稱的。

那么,我們究竟該如何在納思中刻畫“the”呢?一些人可能不禁想引用羅素對“the”的處理方案。2 依據該方案,“The raven is black”這句話必須被重述為:

?x[(Rx & ?y(Ry → y=x)) & Bx]

其自然語言翻譯是:存在至少一個對象,該對象是渡鴉;如果存在另一個事物也是渡鴉,那么這第二個事物無非就是第一個,而且它是黑色的。

然而,筆者不會采用羅素的上述處理方案。很明顯,他的處理方案預設了存在量詞和全稱量詞的基礎地位。但正如前文所述,這種預設使我們無法自然地處理自然語言中表示數量多寡不同程度的諸種量詞。所以,納思對于“the”的處理基本上會另辟蹊徑。

不過,羅素對“the”的處理也有一個值得贊許的地方,就是他區分了“摹狀詞”(如“the present French king”,即“當今法王”)和“邏輯專名”(如“this”,即“這個”)。依據羅素的觀點,雖然由“the”開頭的摹狀詞與邏輯專名都表明了它們所指的事物的唯一性,然而,二者依然有所分別。具體而言,邏輯專名與其外在對象之間的聯系更為直接,因為邏輯專名除了有指涉功能外,其本身不具有任何意義,而摹狀詞依然具有意義。

從納思的角度看,羅素的上述說法至少包含了一半的真理,盡管它也包含了一半的謬誤。此說的錯誤之處在于:即使如“這個”(this)這樣的邏輯專名,其實也不是完全沒有意義的,因為至少它表達了說話者和對象之間的距離。而此說所包含的真理性則在于:邏輯專名“這個”(this)的意義畢竟是非常稀薄的,以至于它大致能被視作為別的意義提供支點的一個“光裸”的載體。也正因為邏輯專名“這個”(this)的意義是貧乏的,它就特別適合成為教授自然數時所用的“教具”,因為在計數活動中人們的意向活動真正瞄向的并不是物理對象的數量,而是物理性質附著于其上的那些載體的數量。

那么,我們又該如何在納思中表征邏輯專名呢?從句法上說,邏輯專名跟其他納思詞項(或者節點)之間的區別主要在于:邏輯專名的外延里只有一個實例,而后者則有一個以上的實例。什么叫“外延”呢?在納思中,一個詞項的外延,就是作為該詞項的主詞出現的那些節點。那么,什么叫“主詞”呢?在納思中,對兩個變元x和y而言,x是y的主詞,當且僅當“x→y”的句法結構出現。有了上面的定義后,邏輯專名本身就可以通過對納思網絡的局部拓撲學結構的識別而得到計算機的自動定位。

另外,從語義學角度看,納思中所有包含邏輯專名作為其主詞的基本斷言,其實都表示了一個單稱命題。這些命題的f值和c值都必須被設定得較高,以便彰顯下述唯名論立場:無論從本體論立場看,還是從認識論角度看,那些關于個別事物的斷言都要比關于個別事物之集合或類型的斷言來得更為可靠。

基于上述分析,從納思的觀點看,當一個人說“那只渡鴉是黑色的”時,他其實是對如下兩個命題有所斷言:(1)這是一只渡鴉(該斷言與一對較高的f值和c值相結合)。(2)這是黑色(該斷言也與一對較高的f值和c值結合)。若用“a“”代表“這個”,則表征(1)和(2)的納思網絡的拓撲學結構便如圖4所示:

人們或許會認為,教會納思“識數”的下一個步驟就該是教會其掌握“一”的概念了。但是筆者接下來就要論證:在教會納思“一”之前,我們首先要教會它“二”。

六、如何教會納思“二”與“一”

為什么在教納思學會“一”之前,要先教會其掌握“二”呢?這是因為,如果一個集合只有一個下屬成員的話,那么該集合在成員數量方面的特征會變得過于稀松平常,以至于難以成為吸引注意力的顯豁特征。舉個例子:如果一名教師向學生展示一個橙子、一個蘋果和一把刀的話,學生如何能很快地意識到這三個集合的共性就是它們都只有一個下屬成員呢?要讓學生盡快注意到一個集合只有一個成員,唯一的辦法就是將該集合與擁有更多成員的集合相互比較。比如,將其與一個擁有兩個成員的集合相互比較。但這一點就預設了納思必須先掌握“二”這個概念。

在納思里引入“二”的步驟如下:

第一步:我們要教會納思兩個句子,即“這只渡鴉是黑色的”和“那只渡鴉是黑色的”。這兩個句子中的“這只”與“那只”實際上指稱了兩個不同的對象,因此我們就必須給它們指派兩個不同的邏輯專名,如“a”和“b”(見圖5)。

第二步:為了教學目的,假設a和b的指稱都很相似,那么,兩者之間有著很明顯的類比關系(見圖6)。

圖6 ? 納思網絡中兩個同類型的單稱判斷在主項方面的相互類比關系

第三步:基于上述步驟,納思會忽略a和b在其他方面的區別,由此將b視為a的另一個例。對于算術的教學而言,這一步是很重要的,因為一個系統要從事計數活動,就必須先忽略被計數的對象之間在物理性質方面的種種區別(見圖7)。

圖7 ?對于兩個邏輯專名的等同化處理

第四步:現在納思就得到了一個類似矩陣的網絡:它包含兩個a,從而每個a就像一個占位符,可以被任意其他符號替換,例如可以被替換成兩個點。由此,此類節點的語義內容就被降到了最低,而其在相關推理結構中的拓撲學地位則得到了凸顯。由此,我們就不妨引入一個新詞來指稱這個拓撲學結構。這個新詞就是“二”,也就是我們在納思里引入的第一個數詞。一個知道了“二”的用法的納思,實際上也就知道了:只要在系統的推理路徑中觀察到類似于圖8中上半部分的拓撲學結構,就可以用“二”來替換這個結構;或反過來說,對于出現“二”的判斷句,系統也可以進行反向處理,以復原出一個更為復雜的推理路徑圖。

圖8 ?在納思中引入“二”

現在總算到了教會納思掌握“一”的時候了。但是如何從針對“二”的教學過渡到針對“一”的教學?

我們不能通過引入“減法”來從“二”得到“一”,因為“二減一等于一”這個陳述預設了“一”的概念。與之相較,從“二除以二等于一”出發來定義“一”貌似更為可行,因為“二”畢竟是納思已經學會的一個概念。但是這個做法也預設了納思已經理解了“除以”的意義。不過,這一預設還是會帶來一些麻煩,因為抽象意義上的“除以”是很難被立即學會的。更可行的辦法是用“取半法”(也就是分母為“2”的特殊除法)的概念來替代抽象意義上的除法。對于“取半法”這一概念的引入,可以通過下述操作來實現:對于任意集合,求它的兩個等式的子集的分布方式。更具體而言,當我們讓納思求概念X之實例的半數時,納思就會嘗試著對原集合的成員進行隨機二分,由此得到兩個子集,然后一一比較這些子集的大小,直到找到兩個等式的子集為止。計算機很容易通過對網絡的局部拓撲學結構的檢索來完成上述任務,所以,我們沒有理由認為納思無法執行這個“取半任務”。故而,只要納思能對“二”的概念進行“取半”操作,它立刻就能得到“一”的概念。

現在,納思已經學會了“二”與“一”這兩個概念,由此也就有希望學會所有奇數和偶數。限于篇幅,在此不能詳述納思如何習得更復雜的算術概念。

需要注意的是,由于現代數學的高度復雜性,筆者認為不需要都依賴如此曲折的方式來教會納思數學概念。如果我們僅僅要設計一個具有低級數學智能的系統的話,那么,我們可以僅僅在納思中置入一些負責特定類型計算(如針對“對數”或“三角函數”計算)的專用計算模塊。對于納思的其他部分而言,這些模塊的內部運行就是一些“黑箱事件”。也就是說,這個系統的其余部分僅僅需要知道:自己應該在什么時候啟動這些模塊,以及如何理解它們的輸出。這就很像一個算術能力有限的人適應社會的方式——只要他知道怎么用便攜式計算器,并讀懂上面的數字,他就能適應。

從上面的分析來看,即便一個數學智能很低的納思,也可以在日常對話中很靈活地處理數字表達式。下面就是對于這一點的更為詳細的說明。

七、深入討論(代總結):納思如何在日常對話中做到“識數”

在本文第三部分,我們已經看到:傳統符號人工智能系統無法依據語境的變化而將正確的評價標簽(如“大的”“足夠多的”“太多的”等)與正確的數字表征相對應。而這些系統之所以做不到這一點,乃是因為這些系統是公理化的。因此,除非程序員提前用某些元公理來鎖定評價標簽、數字和語境三者的關系,否則,這些系統是無法在不同語境中將同一個評價標簽靈活地指派給不同的數字表征的。然而,人類的生活瞬息萬變,除非該系統的設計者對人類生活的各個方面能夠做到無所不知,否則,就根本不可能在系統中預裝針對所有可能語境的知識調用元公理。此外,即便是聯結主義或深度學習的系統,也無法解決這個問題。這是因為,要使這些系統學會將特定的評價詞與特定的數量表征相互聯系,就得預先喂給系統一些特定的“評價詞—數量”匹配樣本,作為訓練的起點。但是,這些匹配樣本又從何而來呢?在日常生活中,相同的數量詞會在不同的語境中獲得不同的評價詞(在兩個彼此不同的特定語境下,100000元和2元都有可能是“足夠”的),這一點就會使深度學習所需要的樣本特征變得非常不穩定,最終使此類機器學習根本無法進行。

而與上述傳統路徑相比較,納思則可以輕易解決這一難題,因為在一個統一的納思推理網絡中,數字表達式本來就已經與表示物理對象的詞項相互結合在一起了。因此,納思始終知道:“純粹的”數字只不過是從實際事態中抽象出來的量化刻畫,而這些刻畫隨時可以被復原為與實際物理對象相互關聯的原始狀態。此外,既然在納思中代表各類物理對象的節點的推理功能可以隨著系統的學習過程做調整,那么,包括數字節點和非數字節點在內的復合節點的推理功能自然也可以隨之調整。如果我們以建立諸如“足夠”和“不足”之類的評價詞與特定數量詞之間的推理關系為目標的話,以下便是旨在做出這類調整的一個極簡方案:

1.表征出系統所要達成的目標;

2.估算達成該目標所需的資源數量,并將其縮寫為RR;

3.估算目前可用的資源數量,并將其縮寫為RA(這里需要注意的是,有待評價的數字表達式,通常會采用RA的形式);

4.估算RA和RR的差值,如果由此算出“系統的剩余資源在達成當前目標之后,亦足以用來執行其他任務”,則將“足夠”這一標簽指派給RA,否則,將“不足”這一標簽指派給RA。

顯然,要將上述步驟一步步走完,系統就不得不與大量的語境因素打交道,如給定任務的內容、RA的值、RR的值等。因此,只要納思的運作能隨著這些語境因素的變化而變化,那么,納思就能夠以一種富有語境敏感性的方式做到“識數”。

當然,要在工程學的層面上實現上述目標,我們還需要付出很多具體的努力。但本文的概要性論述,已經為在通用人工智能系統中如何實現“人工數感”,勾勒出了一幅大致的路線圖。

How Can an Artificial General Intelligence System

Acquire “Number Sense”?

XU Yingjin

Abstract: Number sense literally means some form of awareness of what numbers mean to the users of these numbers in their practical lives. Mainstream AI systems(symbolic AI and connectionism included), being digitalized notwithstanding, do lack number sense in the sense that they all lack the capacities of building pragmatic inferential pathways connecting numerical expressions with non-numerical ones in a context-sensitive manner. The tentative realization of a machine-based number sense will appeal to the Non-Axiomatic Reasoning System(or “NARS”, the adjective form of which is “Narsian”), and it is different from mainstream. AI systems in the sense that it has capacities for learning from its experience, and for delivering its solutions to the given problems even when it is working with insufficient knowledge and limited time budget. The guiding principle for training NARS to acquire number sense is to teach it the least abstract mathematical notions first, then move to more abstract ones step by step, just like how we teach children mathematics. The Narsian representation of the “logical proper names” plays a pivotal role in this machine-oriented pedagogy.

Key words: number sense; intuition; Artificial General Intelligence(AGI); Non-Axiomatic Reasoning System(NARS); logical proper names

(責任編輯:蘇建軍)

主站蜘蛛池模板: 九九热在线视频| 天天躁夜夜躁狠狠躁躁88| 91丨九色丨首页在线播放| 国产91丝袜在线播放动漫 | 婷婷色狠狠干| 国产精品网拍在线| 亚洲成综合人影院在院播放| 欧美人在线一区二区三区| 日韩成人高清无码| 熟妇无码人妻| 亚洲av无码片一区二区三区| 青青青国产精品国产精品美女| 午夜人性色福利无码视频在线观看 | 国产成人精品综合| 亚洲国产精品美女| 亚洲欧洲一区二区三区| 亚洲成年网站在线观看| 欧美日韩国产高清一区二区三区| 欧美色图第一页| 国产一级在线播放| 玖玖精品视频在线观看| 日本福利视频网站| 91探花国产综合在线精品| 成年看免费观看视频拍拍| 伊人久久久久久久久久| 8090午夜无码专区| 国产视频 第一页| 中文字幕资源站| 99久久这里只精品麻豆| 91精品国产91欠久久久久| 在线观看亚洲精品福利片| 国产免费福利网站| 欧美午夜在线视频| 亚洲男人的天堂在线观看| 久久99蜜桃精品久久久久小说| 欧美一区二区三区国产精品| 欧美、日韩、国产综合一区| 六月婷婷综合| 中文字幕有乳无码| 日韩高清无码免费| 成人在线亚洲| 欧美 国产 人人视频| 欧美无专区| 国内毛片视频| 亚洲h视频在线| 18禁黄无遮挡网站| 欧美性精品| 直接黄91麻豆网站| 亚洲欧美国产五月天综合| 青青青国产精品国产精品美女| 五月激情综合网| 国产午夜无码专区喷水| 99久久精品国产综合婷婷| 热久久综合这里只有精品电影| 免费无码AV片在线观看中文| 四虎永久在线| 国产黄色视频综合| 国产精品hd在线播放| 米奇精品一区二区三区| 亚洲欧美不卡中文字幕| 18禁黄无遮挡免费动漫网站| 99视频只有精品| аⅴ资源中文在线天堂| 免费一级全黄少妇性色生活片| 美女内射视频WWW网站午夜| 欧美成人精品欧美一级乱黄| 国产高清在线丝袜精品一区| 免费一级α片在线观看| 被公侵犯人妻少妇一区二区三区| 老司机久久99久久精品播放| 91精品网站| 日韩欧美国产中文| 国产成人无码综合亚洲日韩不卡| 国产又粗又爽视频| 国产麻豆永久视频| 亚洲第一极品精品无码| 刘亦菲一区二区在线观看| 国产91小视频在线观看 | 无码专区国产精品一区| 国产成人艳妇AA视频在线| 欧美亚洲国产日韩电影在线| 国产91久久久久久|