劉 凱 賈 敏 黃英輝 胡祥恩 王 培
(1.渤海大學(xué) 教育科學(xué)學(xué)院,遼寧錦州 121013;2.渤海大學(xué) 通用人工智能研究所,遼寧錦州 121013;3.華中師范大學(xué) 心理學(xué)院,湖北武漢 430079;4.天普大學(xué) 計算機與信息科學(xué)系,賓夕法尼亞州費城 19122,美國)
隨著教育技術(shù)的快速發(fā)展與應(yīng)用,囿于學(xué)校場景的教育理論與線上線下廣泛存在的教育現(xiàn)象之間的矛盾逐漸凸顯,教育理論的“空洞化危機”被充分暴露出來(項賢明,2017)。這體現(xiàn)在教育和學(xué)習(xí)的本質(zhì)、教育與學(xué)習(xí)的交互機理等學(xué)科核心理論問題仍不明晰,教育實踐操作亦缺乏系統(tǒng)、連貫、有效的理論支撐(項賢明,2021)。其根本原因在于,教育學(xué)自身難以產(chǎn)出可證偽且特色鮮明的新知。因此,理論視角的創(chuàng)新與嘗試具有重要的研究價值。
通用人工智能(artificial general intelligence,AGI)之崛起可謂恰逢其時。能思考、有情感、有自我意識的計算機軟件系統(tǒng),將教育學(xué)研究對象拓展至“人—機”二元維度。這豐富了教育現(xiàn)象的內(nèi)涵,拓寬了教育學(xué)的可及邊界,避離了教育研究的生理與倫理限制,從而令純粹經(jīng)驗層面的教育實驗、模擬與評價走向現(xiàn)實,也使“教育學(xué)反哺人工智能”成為可能(劉凱等,2018a)。判斷一種知識是否是教育學(xué)知識,取決于是否從教育學(xué)角度進(jìn)行研究(項賢明,2021)。事實上,不僅通用人工智能系統(tǒng)的認(rèn)知元能力與人類非常相似,其成長過程也與人類高度類似,折射出“人—機”智能體背后可能蘊藏著普適性的教育客觀規(guī)律(劉凱等,2018b)。
為了貫通人與機器的教育阻隔,既有研究提出了通用人工智能的教育理論框架——“機器教育”(劉凱等,2018c)。該框架暗含一個重要的基本假設(shè):人類的許多教育經(jīng)驗也可用于硅基的計算機系統(tǒng)。然而,人類教育手段真的能對機器的學(xué)習(xí)過程產(chǎn)生影響嗎?在教育科學(xué)范式下,該問題可化歸為兩個遞進(jìn)式的科學(xué)問題:一是可能性,二是有效性。前者關(guān)注影響是否發(fā)生,驗證機器教育是否可能。在此基礎(chǔ)上,后者關(guān)注影響的效果,回答機器教育是否有效。本研究聚焦“可能性”問題,借助受控實驗檢視人類教育經(jīng)驗對機器的影響,嘗試證明“人機兼容”的一般性教育規(guī)律的確實性,并展望了教育科學(xué)的若干理論發(fā)展前景。
通用人工智能的探索有著悠久的歷史。20世紀(jì)中葉,控制論領(lǐng)域的學(xué)者嘗試將心理學(xué)和哲學(xué)的認(rèn)知方法形式化。這既是認(rèn)知科學(xué)的肇始,也是人工智能的濫觴。在隨后的三十年里二者建立了穩(wěn)固的共生關(guān)系。后來,人工智能的關(guān)注點從最初的認(rèn)知原則等理論問題,逐漸轉(zhuǎn)向統(tǒng)計計算等更偏實用的算法技術(shù)問題(戴維·弗農(nóng),2021)。然而,探索認(rèn)知奧秘的初心并未磨滅。在過去的二十年間,人工智能通過兩種途徑再次回歸認(rèn)知科學(xué)的本源:一是從主流人工智能內(nèi)部分化出“人工認(rèn)知系統(tǒng)”(Artificial Cognitive System)分支,延循主流研究的技術(shù)路線;二是從主流人工智能中分離出一支,采用嶄新的研究及技術(shù)路線并冠以“通用人工智能”之名。
非公理推理系統(tǒng)(Non-Axiomatic Reasoning System,NARS)是目前通用人工智能學(xué)界最完善且最具通用性的扛鼎之作,其開源版本(OpenNARS)備受關(guān)注。從原理上看,NARS是一個基于推理框架的通用人工智能建構(gòu)方案,將智能視為“開放環(huán)境中,智能主體應(yīng)對知識和資源相對不足情況的適應(yīng)能力”,同時滿足有限、實時及開放三個核心特征(Goertael & Wang,2007)。這些特征具有明顯的通用色彩,既是通用人工智能與當(dāng)前主流人工智能(即專用人工智能)相區(qū)別的核心要旨,也決定了NARS需將先天基于推理的認(rèn)知元能力與后天的經(jīng)驗知識進(jìn)行區(qū)分。這種經(jīng)驗習(xí)得的路徑和人類個體發(fā)展極為相似——非常依賴后天的社會學(xué)習(xí),并通過具身認(rèn)知不斷探索未知世界從而主動建構(gòu)自身的經(jīng)驗系統(tǒng)。換言之,NARS的學(xué)習(xí)行為不同于計算機科學(xué)領(lǐng)域的機器學(xué)習(xí),并非使用特定算法或算法組合對事先準(zhǔn)備好的數(shù)據(jù)集進(jìn)行模型訓(xùn)練和預(yù)測,而是像人類嬰幼兒一樣,依靠有限的資源和元水平技能實時學(xué)習(xí),主動得到“合理解”而非“最優(yōu)解”。
從技術(shù)上看,作為推理系統(tǒng),NARS使用名為納思語(Narsese)的人工形式化語言表征經(jīng)驗,此經(jīng)驗對應(yīng)于廣義的知識范疇,同時涵蓋具身的內(nèi)隱知識和抽象的外顯知識。NARS延循“詞項邏輯”的邏輯傳統(tǒng)——詞項是表征的最小構(gòu)成單位,“主詞—系詞—謂詞”形式的陳述是表征的基本語句,其中主詞和謂詞都是詞項(見圖1)。最典型的基本語句是繼承語句,采用“S→P”(S是一種P)的形式,體現(xiàn)著原子詞項間的自反與傳遞關(guān)系,原子詞項還可組合構(gòu)成復(fù)合詞項。基于時序的陳述能用來表示事件序列,意味著事件同時或接次發(fā)生。其它三類常用語句分別是:判斷語句由陳述和真值構(gòu)成,表示系統(tǒng)已知或能夠習(xí)得的知識;目標(biāo)語句是需要通過執(zhí)行操作才能實現(xiàn)的陳述,即期望的事件操作;問詢語句是一種沒有真值或欲望值的陳述,表示需要根據(jù)系統(tǒng)既有知識解答問題,這是NARS非常重要的一種輸出,借助互動問答便可管窺系統(tǒng)當(dāng)前的經(jīng)驗(Hammer et al.,2016)。上述語句是NARS接受的第三人稱視角下對象或事件的外在“客觀”描述。此外,系統(tǒng)還內(nèi)置一種由“SELF”(自我)變量直接發(fā)起操作的特殊語句,用于以第一人稱視角描述系統(tǒng)的“主觀”感受及體驗(Wang,2015)。

圖1 納思語的基本語法結(jié)構(gòu)
在NARS的記憶系統(tǒng)中,經(jīng)驗被組織成概念網(wǎng)絡(luò),存儲于名為Bag的數(shù)據(jù)結(jié)構(gòu)中。這是鑒于適應(yīng)性考量而為NARS資源分配設(shè)計的一種特殊的數(shù)據(jù)結(jié)構(gòu),所有概念都依據(jù)優(yōu)先級來分配資源。通常情況下,優(yōu)先級表示當(dāng)前主體實時需求的重要或迫切程度,概念或任務(wù)越重要或越急迫,被系統(tǒng)優(yōu)先處理的可能性就越高。不過,因資源相對不足,概念和任務(wù)的優(yōu)先級會隨著時間的推移而衰減,因被清除而自然地產(chǎn)生“遺忘”現(xiàn)象。盡管與神經(jīng)元網(wǎng)絡(luò)的形狀相似,但NARS的記憶系統(tǒng)是一個動態(tài)的生成式網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)節(jié)點及連接與主體經(jīng)驗存在累積性的語義映射關(guān)系,其形態(tài)并非事先設(shè)定,而由后天經(jīng)驗塑造。因此,相同的NARS系統(tǒng),如若經(jīng)歷不同的學(xué)習(xí)過程,其經(jīng)驗習(xí)得各異,記憶網(wǎng)絡(luò)的結(jié)構(gòu)也將有所不同。
作為人類教育經(jīng)驗的凝結(jié),教學(xué)原則在教育科學(xué)體系中占重要地位。它是有效教學(xué)必須遵循的基本要求和基本原則(孟憲承等,2006),不僅聯(lián)結(jié)著教學(xué)基本構(gòu)成元素——教育者、學(xué)習(xí)者、教學(xué)內(nèi)容和教學(xué)手段(柳海民,2002),也是貫通上層理論與教學(xué)實踐的橋梁。因此,教學(xué)原則在理論上有較好的輻射性,在操作上也有較強的便利性。前者蘊含了將學(xué)習(xí)者拓展至通用人工智能系統(tǒng)的可能性,后者體現(xiàn)出采用科學(xué)手段進(jìn)行測量的可行性。本研究聚焦“可能性”問題,嘗試通過實驗驗證人類教育經(jīng)驗對機器的影響。研究者擇取部分有代表性且適用于本研究的教學(xué)原則作為樣本,因此通用人工智能的如下兩個特性便成為抽樣的約束條件:
第一,具身經(jīng)驗的硅基特性。作為實驗被試的通用人工智能系統(tǒng)NARS,還難以裝配高度類人的生物軀體和生化感官。即便配全各種最新的傳感器,甚至是自動駕駛的毫米波雷達(dá),其感知也與人類差異甚大。這就決定了NARS的經(jīng)驗習(xí)得在具體內(nèi)容上與人類不同。因此,涉及生理差別的教學(xué)原則,如感知基礎(chǔ)概念(邱婷等,2007)、感知運動作為基礎(chǔ)(Graeses,2009)等,未必適用于NARS,也就不屬于本研究的考慮范圍。
第二,初始經(jīng)驗的白板特性。參與實驗的NARS系統(tǒng),實際上是一個經(jīng)驗為零的機器嬰兒。然而,許多教學(xué)原則的實際操作對象是已有一定常識和社會能力的教師或?qū)W習(xí)者。如果將此類教學(xué)原則應(yīng)用于機器嬰兒的測試,既有失公允,也無法實現(xiàn)。NARS的“理解”源自基于經(jīng)驗的語義學(xué)(Wang,2005),強調(diào)經(jīng)驗的建構(gòu)性和層級性——像人類嬰兒一樣,機器嬰兒一開始也無法理解復(fù)雜或抽象的經(jīng)驗材料。故而,在多元社會環(huán)境中學(xué)習(xí)(Linda et al.,2017)、分組學(xué)習(xí)、共同研究(陳鶴琴,2018)、收斂思維與發(fā)散思維發(fā)展的結(jié)合(彭道林,2016)等教學(xué)原則也未被納入本實驗。
出于對基本教學(xué)元素覆蓋的全面性及實驗操作可及性的考量,本研究以教學(xué)時間、教學(xué)組織、教學(xué)內(nèi)容及教學(xué)方法為基本框架,每個子類納入一至兩項代表性教學(xué)原則(見表一)。教學(xué)時間面向?qū)W習(xí)者,教學(xué)組織和教學(xué)內(nèi)容面向教材,教學(xué)方法面向教師。

表一 本研究選用的教學(xué)原則
NARS的經(jīng)驗存儲于記憶系統(tǒng)中,經(jīng)驗的習(xí)得與遺忘都將引發(fā)系統(tǒng)經(jīng)驗結(jié)構(gòu)(即記憶網(wǎng)絡(luò)結(jié)構(gòu))(Siew et al. ,2019)的動態(tài)改變。新經(jīng)驗的影響越大,記憶網(wǎng)絡(luò)結(jié)構(gòu)的變化越大;反之,新經(jīng)驗的影響越小,記憶網(wǎng)絡(luò)結(jié)構(gòu)的變化越小。如果人類的教學(xué)原則能影響通用人工智能系統(tǒng),那么存儲經(jīng)驗的NARS記憶系統(tǒng)會因教學(xué)原則的改變而生成不同的網(wǎng)絡(luò)結(jié)構(gòu)。由此,本研究提出以下假設(shè):
1)假設(shè)1:教學(xué)時間的差異能夠?qū)е翹ARS記憶網(wǎng)絡(luò)結(jié)構(gòu)的改變;
2)假設(shè)2:教學(xué)組織的差異能夠?qū)е翹ARS記憶網(wǎng)絡(luò)結(jié)構(gòu)的改變;
3)假設(shè)3:教學(xué)內(nèi)容的差異能夠?qū)е翹ARS記憶網(wǎng)絡(luò)結(jié)構(gòu)的改變;
4)假設(shè)4:教學(xué)方法的差異能夠?qū)е翹ARS記憶網(wǎng)絡(luò)結(jié)構(gòu)的改變。
針對如嬰兒一般的NARS系統(tǒng),背景常識少、結(jié)構(gòu)簡單、通俗易懂且有一定思考空間的內(nèi)容適合作為實驗材料。本研究選取“龜兔賽跑”這一經(jīng)典故事作為學(xué)習(xí)材料,依據(jù)有三:一是故事結(jié)構(gòu)清晰、內(nèi)容簡潔明了,易于形式化為納思語輸入;二是情節(jié)蘊含矛盾,利于體現(xiàn)NARS的推理學(xué)習(xí)能力;三是易于區(qū)分?jǐn)⑹屡c常識。敘事指實驗學(xué)習(xí)材料中的故事情節(jié),常識是理解敘事所需的相關(guān)背景知識。實驗學(xué)習(xí)材料的區(qū)分既能更好地貼合人類學(xué)習(xí)經(jīng)驗的建構(gòu)過程,也便于對教學(xué)組織和教學(xué)內(nèi)容進(jìn)行操作。
常識:兔子和烏龜都是動物,兔子跑得快,烏龜跑得慢。兔子和烏龜賽跑時,兔子贏烏龜輸。
敘事:某次,一只小白兔和一只小烏龜賽跑,小白兔跑一會就睡覺了,小烏龜卻一直跑。最后小烏龜獲得勝利,而小白兔輸了比賽。
問題:兔子和烏龜誰跑得快?
根據(jù)實驗假設(shè),自變量的類別依次為:教學(xué)時間(T)、教學(xué)組織(O)、教學(xué)內(nèi)容(C)、教學(xué)方法(M),自變量的構(gòu)面是人類教學(xué)原則實施時的不同水平(見圖2)。

圖2 實驗設(shè)計
1. 教學(xué)時間
教育行為總是發(fā)生在特定時空之中,充足的學(xué)時是一切教學(xué)活動開展的前提。對人類學(xué)習(xí)者而言,“給學(xué)習(xí)者一定時間進(jìn)行認(rèn)知處理”的教學(xué)原則意味著,學(xué)習(xí)材料內(nèi)化程度的逐漸深入,離不開認(rèn)知處理時間的保障。本研究中,教學(xué)時間用于檢視在其他變量保持不變的情況下,通用人工智能系統(tǒng)是否會因推理時間的不同而產(chǎn)生不同的學(xué)習(xí)結(jié)果。
由于時間的感知和處理具有主觀性(卡洛·羅韋利,2019),NARS剛啟動時并無成型的時間概念,其任務(wù)執(zhí)行時間也受操作系統(tǒng)和硬件平臺影響而具有不確定性,外部時鐘也無法恰當(dāng)刻畫系統(tǒng)的主觀時間感受。因此,出于測量客觀性和標(biāo)準(zhǔn)一致性的考量,本研究將“時間”操作性定義為NARS系統(tǒng)的推理步數(shù)。推理步數(shù)是一個優(yōu)秀的時間表征指標(biāo),因為NARS能夠很好地刻畫時間的相對變化,推理步數(shù)越多,耗時越多,且與軟硬件平臺無關(guān)。同時,為了直觀和便于理解,用加引號的“秒”表示推理步數(shù),1步等同于1“秒”。研究者以1000步為間隔周期進(jìn)行測量,即觀測從0“秒”(T0)至10000“秒”(T10)之間的11組學(xué)習(xí)結(jié)果之間的差異。
2. 教學(xué)組織
“教學(xué)材料組織清晰”原則指對于給定的教學(xué)內(nèi)容,如果組織得當(dāng),就能取得更好的教學(xué)效果。本研究使用教學(xué)組織考察在其他變量保持不變的情況下,通用人工智能系統(tǒng)是否會因教學(xué)內(nèi)容組織順序的差異而產(chǎn)生不同的學(xué)習(xí)結(jié)果。教學(xué)組織的操作性定義為:實驗學(xué)習(xí)材料中常識與敘事的不同組合方式。本研究設(shè)置了三種組織構(gòu)成方案:常識在敘事之前(O1)、敘事在常識之前(O2)和隨機輸入(O3)。三種方案內(nèi)容一致,僅輸入順序有異。其中,隨機輸入指對所有語句亂序重組。
3. 教學(xué)內(nèi)容
“深入淺出的協(xié)調(diào)”教學(xué)原則早已成為人類教育常識,由淺入深的教學(xué)設(shè)計亦是教學(xué)實踐遵從的科學(xué)指南,在缺乏基礎(chǔ)知識的情況下向?qū)W習(xí)者傳授新知只能事與愿違。本研究專門探究在其他變量保持不變的情況下,不同教學(xué)內(nèi)容是否會導(dǎo)致通用人工智能系統(tǒng)產(chǎn)生不同的學(xué)習(xí)結(jié)果。本研究將教學(xué)內(nèi)容的操作性定義設(shè)定為:提供常識和敘事(C1),僅提供敘事(C2)。前者(C1)對應(yīng)于符合教學(xué)原則的情況,不僅體現(xiàn)了“深入淺出”,而且常識與敘事的內(nèi)容關(guān)聯(lián)也同樣滿足“協(xié)調(diào)”的要求;后者(C2)缺少鋪墊,對應(yīng)于不符合教學(xué)原則的情況。
4. 教學(xué)方法
教學(xué)方法雖是人類教育藝術(shù)性的體現(xiàn),其背后也有大量建構(gòu)主義實證研究支撐。例如,“深度問題、探究原則”指出,一定深度的問題可以有效引發(fā)學(xué)習(xí)者的探究行為,從而獲得更好的學(xué)習(xí)效果。因此,提出問題或帶著問題學(xué)習(xí),成為有效教學(xué)的重要原則之一。本研究考察在其他變量保持不變的情況下,教學(xué)方法的改變是否會造成通用人工智能系統(tǒng)學(xué)習(xí)結(jié)果的差異。教學(xué)方法的操作性定義為:讓NARS“帶著”或“不帶”問題學(xué)習(xí)。無提問(M1)對應(yīng)于采用傳統(tǒng)的知識灌輸式授課方式,有提問(M2)對應(yīng)于采用問題啟發(fā)式授課方式。
本研究探究不同的人類教學(xué)原則能否導(dǎo)致通用人工智能系統(tǒng)學(xué)習(xí)結(jié)果的差異,即不同自變量水平是否會對NARS學(xué)習(xí)結(jié)果產(chǎn)生影響,聚焦差異的有無。NARS學(xué)習(xí)的加工過程及其結(jié)果都與記憶系統(tǒng)關(guān)系密切。與人腦類似,NARS的記憶系統(tǒng)是一個隨學(xué)習(xí)而動態(tài)變化的網(wǎng)狀結(jié)構(gòu),以概念及其連接關(guān)系為基本單位。盡管實驗學(xué)習(xí)材料內(nèi)容有限,但由其生成的真實存儲對象可以非常龐雜,包含目標(biāo)、復(fù)合詞項、抽象變量、事件、操作、時間戳等。因此,因變量只要鎖定在實驗所需范圍即可,沒必要提取記憶空間的所有細(xì)節(jié)。
事實上,實驗關(guān)注的是一個特定的記憶子網(wǎng)絡(luò),它由“animal”“rabbit”“turtle”“sleeping”“running”“win”和“quick”7個核心概念構(gòu)成。“animal”“rabbit”“turtle”相當(dāng)于自然語言中的名詞,起類目標(biāo)識作用。為避免陷入“羅素悖論”,本研究對“rabbit”(集合,如“兔”類)與“{rabbit}”(元素,如“這只小白兔”)進(jìn)行區(qū)分。“sleeping”“running”相當(dāng)于自然語言中的副詞,用方括號表示動作狀態(tài)。“win”和“quick”相當(dāng)于自然語言中的形容詞,用方括號刻畫性質(zhì)的狀態(tài)。
“龜兔賽跑”故事可被編譯為由7個概念表征的納思語集合。同時,本研究借助問詢這種向NARS提問的方式,在非侵?jǐn)_的情況下從外部探察目標(biāo)記憶子網(wǎng)絡(luò)的基本構(gòu)成(見表二)。因此,表二42項回答的統(tǒng)合構(gòu)成實驗所需的記憶子網(wǎng)絡(luò),不同的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)代表不同的學(xué)習(xí)結(jié)果。舉例而言,如果學(xué)習(xí)極為充分,概念之間將全部建立雙向聯(lián)系,形成一個完全圖的拓?fù)浣Y(jié)構(gòu)(見圖3-a);如果學(xué)習(xí)效果欠佳,概念之間會出現(xiàn)聯(lián)系的間斷,形成一個不完全圖的拓?fù)浣Y(jié)構(gòu)(見圖3-b)。

表二 實驗問詢表

圖3 記憶網(wǎng)絡(luò)結(jié)構(gòu)示例
網(wǎng)絡(luò)結(jié)構(gòu)計量來自網(wǎng)絡(luò)科學(xué),主要是對復(fù)雜網(wǎng)絡(luò)的圖結(jié)構(gòu)進(jìn)行描述(郭世澤等,2012)。本研究選取能夠體現(xiàn)圖結(jié)構(gòu)性特征的若干指標(biāo)輔助比較(見表三),其值通過NetworkX計算獲得。之所以將這些指標(biāo)作為輔助對比的依據(jù),原因在于與常見統(tǒng)計學(xué)指標(biāo)體系不同,網(wǎng)絡(luò)結(jié)構(gòu)對象具有特殊性,網(wǎng)絡(luò)結(jié)構(gòu)異質(zhì)性的識別及判定仍在探索中,并無獨立指標(biāo)脫穎而出成為學(xué)界共識。例如,相同的網(wǎng)絡(luò)元素可以產(chǎn)生不同的結(jié)構(gòu),比如均由四個節(jié)點和兩條邊構(gòu)成的網(wǎng)絡(luò),既可以是十字交叉結(jié)構(gòu),也可以是平行線結(jié)構(gòu)。更何況,對于給定N個節(jié)點及M條邊構(gòu)成的圖G,去除一條邊,未必能引發(fā)整體結(jié)構(gòu)的變化。但如果持續(xù)刪除,因沒有結(jié)構(gòu)變異的明晰邊界存在,不知何時才能轉(zhuǎn)化成新的結(jié)構(gòu),就會陷入“谷堆悖論”或“忒修斯悖論”。

表三 圖的結(jié)構(gòu)性特征指標(biāo)
鑒于此,目前學(xué)界尚無法直接判別圖結(jié)構(gòu)差異的顯著性,故只能采取間接手段測量:一是觀察圖的結(jié)構(gòu)統(tǒng)計性指標(biāo)是否出現(xiàn)變動,但需注意這些結(jié)構(gòu)指標(biāo)無法充分代表整體結(jié)構(gòu),僅供輔助性對比參考;二是利用圖與圖之間的結(jié)構(gòu)相似性反推其差異性。結(jié)構(gòu)相似系數(shù)越大,圖之間的差異越小;反之,結(jié)構(gòu)相似系數(shù)越小,圖之間的差異越大。本研究利用以邊際核為相似性函數(shù)構(gòu)造的Grakel(Kashima et al.,2003)完成圖相似度的計算,結(jié)果的取值范圍為[0,1],取值越接近0,表示兩個網(wǎng)絡(luò)結(jié)構(gòu)的差異越大。
研究者每次實驗開始時重新啟動OpenNARS v3.0.4軟件系統(tǒng),確保所有實驗輪次都以初始的空置記憶開始,同時多種控制參數(shù)(“Decision Threshold”“Task Duration”等)均采用系統(tǒng)默認(rèn)值。具體實驗輪次自變量操作如下:
1)實驗一:研究者在系統(tǒng)啟動后輸入“龜兔賽跑”納思語實驗學(xué)習(xí)材料,并在T0(0“秒”)、T1(1000“秒”)、T2(2000“秒”)、T3(3000“秒”)、T4(4000“秒”)、T5(5000“秒”)、T6(6000“秒”)、T7(7000“秒”)、T8(8000“秒”)、T9(9000“秒”)、T10(10000“秒”)等11個步點分別設(shè)置暫停斷點,以開展教學(xué)時間(T)實驗。系統(tǒng)在斷點暫停后立刻保存記憶系統(tǒng)鏡像,隨后執(zhí)行“實驗數(shù)據(jù)記錄”操作:研究者逐條輸入詢問表中的42個問題,先觀察并記錄NARS對當(dāng)前問題的輸出答案,然后調(diào)入剛保存的記憶鏡像并恢復(fù)中斷現(xiàn)場,用相同的斷點經(jīng)驗完成下一問題的詢問,以消除輸入間隔和問題順序變量對實驗的影響。待處理完42個問題后,研究者關(guān)閉并重新啟動NARS進(jìn)入下一輪次實驗。
2)實驗二:教學(xué)組織(O)實驗需要開展三輪操作,所有實驗材料都已提前準(zhǔn)備妥當(dāng)。研究者在系統(tǒng)啟動后輸入“龜兔賽跑”納思語實驗學(xué)習(xí)材料,第一輪實驗學(xué)習(xí)材料為常識在敘事之前(O1),第二輪是敘事在常識之前(O2),第三輪是隨機輸入(O3)。學(xué)習(xí)材料輸入后,研究者給予NARS一定“思考”時間,全部以10000“秒”為唯一終止斷點,繼而執(zhí)行與實驗一相同的實驗數(shù)據(jù)記錄操作。
3)實驗三:教學(xué)內(nèi)容(C)實驗需要開展兩輪操作,所有實驗學(xué)習(xí)材料都已提前準(zhǔn)備妥當(dāng)。研究者在系統(tǒng)啟動后輸入“龜兔賽跑”納思語實驗學(xué)習(xí)材料,第一輪實驗學(xué)習(xí)材料中含有常識和敘事(C1),第二輪實驗學(xué)習(xí)材料僅提供敘事(C2)。材料輸入后,研究者給予NARS一定“思考”時間,在10000“秒”處設(shè)置唯一終止斷點,繼而執(zhí)行與實驗一相同的實驗數(shù)據(jù)記錄操作。
4)實驗四:教學(xué)方法(M)實驗需要開展兩輪操作,所有實驗學(xué)習(xí)材料都已提前準(zhǔn)備妥當(dāng)。研究者在系統(tǒng)啟動后輸入“龜兔賽跑”納思語實驗學(xué)習(xí)材料,但第一輪實驗學(xué)習(xí)材料不含有問題(M1),第二輪實驗學(xué)習(xí)材料包含問題(M2)——即一開始就讓系統(tǒng)“帶著問題”學(xué)習(xí)。每輪都是在學(xué)習(xí)材料輸入后,研究者給予NARS一定“思考”時間,并以10000“秒”為唯一終止斷點,繼而執(zhí)行與實驗一相同的實驗數(shù)據(jù)記錄操作。
以上實驗每項重復(fù)30次,研究者將所有“實驗數(shù)據(jù)記錄”操作數(shù)據(jù)歸檔保存,使用NetworkX以及Grakel軟件包分別計算網(wǎng)絡(luò)結(jié)構(gòu)及相似度指標(biāo),并將網(wǎng)絡(luò)結(jié)構(gòu)指標(biāo)結(jié)果導(dǎo)入SPSS進(jìn)行t檢驗(差異顯著性:*表示p<0.05,**表示p<0.01,***表示p<0.001)或聚類分析。
實驗完畢后,本研究基于自變量構(gòu)面類別,逐一分析不同自變量水平對應(yīng)的因變量指標(biāo)是否存在差異。自變量變化引起的因變量差異需從兩方面考察:一是由記憶網(wǎng)絡(luò)結(jié)構(gòu)指標(biāo)的變化直接體現(xiàn),二是由記憶網(wǎng)絡(luò)結(jié)構(gòu)相似度指標(biāo)反向體現(xiàn)。為嚴(yán)謹(jǐn)起見,只有二者同時存在顯著差異時,本研究才判定結(jié)構(gòu)差異成立。
首先,隨著教學(xué)時間的推移,NARS記憶網(wǎng)絡(luò)中核心概念之間的連接逐漸增多(見圖4)。這不僅表明記憶網(wǎng)絡(luò)的動態(tài)“生長”,還展示出連接數(shù)量擴(kuò)張加速度的變化:初期迅速攀升,隨后進(jìn)入較長的平伏期,最后仍有小幅躍升。有趣的是,NARS的折線走勢與人類學(xué)習(xí)曲線形狀有異曲同工之妙。

圖4 隨時間變化概念間關(guān)系數(shù)量的變化
其次,記憶網(wǎng)絡(luò)的結(jié)構(gòu)指標(biāo)也出現(xiàn)了不同程度的變化(見表四)。從T0到T10,網(wǎng)絡(luò)節(jié)點數(shù)量雖固定為7,但邊的數(shù)目從13增至37,平均度從3.7143增長到10.5714,說明網(wǎng)絡(luò)規(guī)模在持續(xù)擴(kuò)張。隨著網(wǎng)絡(luò)變得復(fù)雜,集聚系數(shù)也正向增長,全局到達(dá)中心值卻在下降,體現(xiàn)了網(wǎng)絡(luò)密度的提升和內(nèi)部聯(lián)系的增強。圖的傳遞性指標(biāo)也印證了這一點。總體而言,隨著連接的增加,圖的結(jié)構(gòu)參數(shù)一直在非均勻地改變。

表四 不同教學(xué)時間下NARS記憶網(wǎng)絡(luò)的結(jié)構(gòu)特性值
再次,聚類分析結(jié)果表明,不同教學(xué)時間下記憶網(wǎng)絡(luò)相似度存在直觀差異。研究者利用Grakel計算兩兩比較圖的相似性后發(fā)現(xiàn),相似系數(shù)=0.0303~1.0000(見表五),再將其轉(zhuǎn)為共現(xiàn)矩陣從而借助SPSS進(jìn)行聚類分析,并采用敏感度和鑒別度較高的Euclidean距離作為測量區(qū)間,將其分為五個子類團(tuán)(見圖5):第一類(RT1)、第二類(RT0)、第三類(RT2)、第四類(RT8、RT3、RT5、RT4、RT7、RT6)、第五類(RT9、RT10),其中,第一類和第二類較接近,并與其他三類相距較遠(yuǎn)。

表五 不同教學(xué)時間下NARS記憶網(wǎng)絡(luò)的結(jié)構(gòu)相似度比較

圖5 聚類分析結(jié)果
可以看出,不同教學(xué)時間對應(yīng)的記憶網(wǎng)絡(luò)結(jié)構(gòu)的確存在差異,因此假設(shè)1成立。
2. 教學(xué)組織對NARS記憶網(wǎng)絡(luò)結(jié)構(gòu)的影響
面對相同的教學(xué)內(nèi)容,采取不同的教學(xué)組織,盡管差異不大,但NARS記憶網(wǎng)絡(luò)的結(jié)構(gòu)特征發(fā)生了不同程度的改變(見表六)。隨機組織的經(jīng)驗內(nèi)容擁有更多的邊數(shù),更高的平均度、集聚系數(shù),說明網(wǎng)絡(luò)的形態(tài)分布更均勻。不過,對記憶網(wǎng)絡(luò)的結(jié)構(gòu)相似度比較結(jié)果表明,在保證充足學(xué)習(xí)時長的情況下,教學(xué)內(nèi)容的組織順序差異對NARS記憶網(wǎng)絡(luò)結(jié)構(gòu)的影響較小,相似系數(shù)=0.9048(見表七)。因此,由于正面證據(jù)不夠充分,假設(shè)2未能成立。

表七 不同教學(xué)組織下NARS記憶網(wǎng)絡(luò)的結(jié)構(gòu)相似度比較

表六 不同教學(xué)組織下NARS記憶網(wǎng)絡(luò)的結(jié)構(gòu)特征值
值得一提的是,常識在前(O1)比常識在后(O2)擁有更好的集聚系數(shù)和傳遞性,卻具有更低的全局到達(dá)中心值。這說明雖然未同時滿足結(jié)構(gòu)差異的兩個判別指標(biāo),但網(wǎng)絡(luò)內(nèi)部仍然有異質(zhì)性結(jié)構(gòu)的存在,且常識的先行教授與學(xué)習(xí)更有利于NARS形成聚合性經(jīng)驗子團(tuán)。可見這與人類學(xué)習(xí)本質(zhì)上并無不同。
3. 教學(xué)內(nèi)容對NARS記憶網(wǎng)絡(luò)結(jié)構(gòu)的影響
對于不同的教學(xué)內(nèi)容,NARS記憶網(wǎng)絡(luò)結(jié)構(gòu)出現(xiàn)了顯著變化(見表八)。將常識作為后續(xù)學(xué)習(xí)的鋪墊,其網(wǎng)絡(luò)結(jié)構(gòu)有更多的邊數(shù),更高的平均度、集聚系數(shù)、全局到達(dá)中心值和更強的傳遞性,以及更低的平均最短路徑。此外,在不同教學(xué)內(nèi)容實驗條件下,NARS具有完全不同的記憶網(wǎng)絡(luò)結(jié)構(gòu),相似系數(shù)=0.0000。因此,假設(shè)3成立。

表八 不同教學(xué)內(nèi)容下NARS記憶網(wǎng)絡(luò)的結(jié)構(gòu)特征值
4. 教學(xué)方法對NARS記憶網(wǎng)絡(luò)結(jié)構(gòu)的影響
面對內(nèi)容相同但采用“問題導(dǎo)向”的教學(xué)方法,NARS記憶網(wǎng)絡(luò)結(jié)構(gòu)在邊數(shù)、平均度、平均最短路徑和傳遞性上保持不變,卻因包含問題(M2)的學(xué)習(xí)過程而具有更高的集聚系數(shù)和全局到達(dá)中心值(見表九)。此外,記憶網(wǎng)絡(luò)結(jié)構(gòu)相似度比較結(jié)果顯示,不同教學(xué)方法下NARS的記憶網(wǎng)絡(luò)結(jié)構(gòu)為中度相似,相似系數(shù)=0.5476,即存在明顯的結(jié)構(gòu)性變化。故而,假設(shè)4成立。

表九 不同教學(xué)方法下NARS結(jié)構(gòu)網(wǎng)絡(luò)特性值
本研究采用實驗方法探索人類教學(xué)原則對通用人工智能系統(tǒng)學(xué)習(xí)結(jié)果的影響。根據(jù)實驗結(jié)果,通用人工智能系統(tǒng)確實具有教育的可能性:
1)教學(xué)時間的差異能夠?qū)е峦ㄓ萌斯ぶ悄芟到y(tǒng)記憶網(wǎng)絡(luò)結(jié)構(gòu)的顯著改變。隨著教學(xué)時長的增加,概念間的關(guān)系逐漸趨于復(fù)雜,記憶網(wǎng)絡(luò)結(jié)構(gòu)之間的相似度相應(yīng)提高。這表明,通用人工智能系統(tǒng)的經(jīng)驗建構(gòu)過程也符合先快后慢的學(xué)習(xí)曲線,折射出認(rèn)知機器和人一樣具有教學(xué)時間差異的敏感性。
2)教學(xué)組織的差異未能導(dǎo)致通用人工智能系統(tǒng)記憶網(wǎng)絡(luò)結(jié)構(gòu)的明顯改變。研究者通過反思發(fā)現(xiàn),實驗二的前提條件為充足的學(xué)習(xí)時間。該結(jié)論具有一定的合理性,只要內(nèi)容相同,長時間反復(fù)學(xué)習(xí)最終能夠?qū)崿F(xiàn)相似的教學(xué)效果。但是,實驗雖確保了“終止時間”的一致性,卻忽略了達(dá)到目標(biāo)狀態(tài)的“執(zhí)行時間”的差異性。畢竟,相似教學(xué)效果的達(dá)成,可以有不同的教學(xué)效率。因此,實驗二的因變量測量未能考慮結(jié)構(gòu)生成效率的影響,這或許是假設(shè)2未能通過驗證的主要原因。這有待后續(xù)實驗補充完善。
3)教學(xué)內(nèi)容的差異能夠?qū)е峦ㄓ萌斯ぶ悄芟到y(tǒng)記憶網(wǎng)絡(luò)結(jié)構(gòu)的顯著改變。教學(xué)內(nèi)容的差異體現(xiàn)為實驗學(xué)習(xí)材料中常識知識的缺失,相似性為零的對比結(jié)果凸顯出常識作為教學(xué)內(nèi)容基礎(chǔ)具有不可或缺的價值。
4)教學(xué)方法的差異能夠?qū)е峦ㄓ萌斯ぶ悄芟到y(tǒng)記憶網(wǎng)絡(luò)結(jié)構(gòu)的顯著變化。本研究僅在實驗學(xué)習(xí)材料中引入問題,就令通用人工智能系統(tǒng)記憶網(wǎng)絡(luò)結(jié)構(gòu)產(chǎn)生較大改變。因此,選用適當(dāng)?shù)慕虒W(xué)方法這一規(guī)律在機器教育中同樣有效。
不論是更長的教學(xué)時間保障學(xué)習(xí)者對知識更全面的理解,還是強調(diào)基礎(chǔ)知識對后續(xù)學(xué)習(xí)的重要性,抑或是帶著問題的學(xué)習(xí)過程,皆體現(xiàn)出人類教育與機器教育共通的一般性規(guī)律。辭簡理博,本研究具有兩方面的重要價值:
1. 體現(xiàn)了機器教育的學(xué)術(shù)潛力
主流專用人工智能理論的羸弱,催生出“奇點”“機器威脅論”等錯誤觀點,教育學(xué)界也受到波及。然而,本研究明確指出,真正類人的通用人工智能系統(tǒng)不會到達(dá)“奇點”,其成長需要“養(yǎng)成”,需要經(jīng)驗的“積淀”,故而也需要被“教育”。可以說,離開教育,通用人工智能之“智”便無法充分實現(xiàn)。
繼而,通用人工智能系統(tǒng)可作為人類教育研究的絕佳“試驗場”。受制于倫理、生理等多方面因素限制,許多教育實驗無法在人類被試中實施,許多教育假設(shè)也無法被有效印證。對學(xué)習(xí)相關(guān)的特定神經(jīng)元單元及其組合的功能拆解與內(nèi)容追蹤,是教育心理學(xué)和教育神經(jīng)科學(xué)的終極渴求,在人腦中極難實現(xiàn),通用人工智能系統(tǒng)卻能擔(dān)此重任。
此外,為通用人工智能系統(tǒng)傳授人類教育經(jīng)驗,不僅可以檢視人類教育經(jīng)驗的科學(xué)性與通用性,也能使通用人工智能系統(tǒng)迅速成長并習(xí)得專長,從而盡早走向應(yīng)用,造福人類社會。與此同時,從通用人工智能系統(tǒng)學(xué)習(xí)和訓(xùn)練中得到的理論知識,還能遷回并反哺人類教育學(xué),甚至人類可向通用人工智能系統(tǒng)學(xué)習(xí)新知(好比人類棋手向AlphaZero學(xué)藝),從而讓人類學(xué)習(xí)者也能享用機器教育之益。
2. 展現(xiàn)了機器教育的理論魅力
機器教育開辟了一個嶄新的教育研究領(lǐng)域,有望對教育基本理論的系統(tǒng)性和科學(xué)性問題做出重大貢獻(xiàn),極大提升學(xué)科自信心及學(xué)術(shù)話語權(quán)。教育學(xué)理論體系經(jīng)常被扣上“拿來主義”的帽子——從心理學(xué)、人類學(xué)、哲學(xué)、社會學(xué)、神經(jīng)科學(xué)、經(jīng)濟(jì)學(xué)和計算機科學(xué)等學(xué)科輸入給養(yǎng),卻幾乎難以成功反向輸出。以機器教育為契機,對教育學(xué)科進(jìn)行更完善、更科學(xué)、更系統(tǒng)的拓展與梳理,能夠為其他學(xué)科懸而未決的諸多“難題”貢獻(xiàn)特色鮮明且效果顯著的“教育學(xué)解決方案”。例如,研究者可從學(xué)前教育視角,探索和研制基于教育手段的新一代認(rèn)知智能技術(shù)方案,并將其應(yīng)用于L5級自動駕駛、基于理解的自然語言處理等關(guān)鍵領(lǐng)域。就像嬰兒蹣跚學(xué)步和牙牙學(xué)語一樣,真正的自動駕駛和自然語言理解能力從來都是基于自我的主體視角而非他者的上帝視角,是主動的經(jīng)驗建構(gòu)而非被動的算法支配,屬于自創(chuàng)生而非被創(chuàng)造!
本研究嘗試做更進(jìn)一步的理論展望:國家戰(zhàn)略前沿學(xué)科中,人工智能發(fā)展的“攔路虎”不是技術(shù)阻礙,而是面臨深刻的教育科學(xué)問題;類腦研究高地的真正突破口,也非神經(jīng)科學(xué)、腦科學(xué)、心理學(xué)、機器人學(xué)或計算技術(shù),而恰恰是貌似與之關(guān)系甚遠(yuǎn)的教育科學(xué),畢竟類腦未必非得“仿生”,也可以“仿心”(心智)(劉凱等,2019);精神病理學(xué)及精神疾病的有效臨床治療等百年醫(yī)學(xué)難題,很可能因教育科學(xué)理論的新發(fā)展而獲益——如果一個沒有“肉身”的通用人工智能系統(tǒng)同樣出現(xiàn)與人類高度相似的“焦慮”“強迫”“抑郁”甚至某些“精神病性”行為癥狀,意味著絕不能將病因全都推諉給大腦結(jié)構(gòu)異常、神經(jīng)遞質(zhì)失衡、腸道菌群失調(diào)乃至多基因遺傳等“先天”生化因素。精神疾病也許真的存在精神層面的病理機制,而教育科學(xué)正是這門研究如何塑造“后天”精神世界及社會價值引導(dǎo)的新科學(xué)。
誠然,可能性不等于必然性。機器可以被教育并不意味著人類教育經(jīng)驗也一定對通用人工智能系統(tǒng)的學(xué)習(xí)過程起到正向作用。因此,后續(xù)工作將使用游戲引擎技術(shù)為NARS創(chuàng)建一個可感知的虛擬教學(xué)場景,通過一系列嚴(yán)格的行為實驗嘗試回答“有效性”問題:教育干預(yù)能否切實提升通用人工智能系統(tǒng)的學(xué)習(xí)效果?