人最原始的能力為什么是重要的?換句話說,人的眼耳口鼻五官四肢所帶來的運動、情緒、感知、勞動,進而品格、毅力,為什么是重要的和可持續的?近期人工智能所引發的多模態信息、具身智能可能為我們理解這個教育問題提供了另外一種思路。
如果將人的眼耳口鼻五官四肢所能感受和處理的信息按從低到高的層級排列的話,可以簡單分為視頻、音頻、語言、圖畫、符號、文字、圖示、數學公式等。有研究表明,動物最低級的視覺(眼晴)信息進化了5億年,相對來說,科學符號只有2000年,現代科學與數學公式只有幾百年歷史,我們通過12年分科學習的體系是工業革命后的產物。進化越充分的低級信息數量越大、信息密度越低,但是越接近人的本能和原始能力,而產生時間越晚的高級信息效率越高、信息密度越高,卻越遠離人的原始能力。
人是如此,社會工具的進化更是如此。一個新工具的產生,首先要考慮的是讓新一代什么都不會的年輕人能更高效地使用,而不是只有經過20年訓練的人才會使用。因此,當一個經過嚴格訓練使用老式工具的“工具人”基礎人體能力退化后,新的工具更適合最具備基礎人體能力的人,而不是相反。
目前,機器人跑馬拉松和機器人當保姆、保潔、保安、快遞員,比計算機自動編程要難多了,因此才有了具身智能的熱潮,具身智能主要涉及多模態數據的處理能力。
多模態數據的處理,簡單說就包含前面所述的低級和高級信息,然而人類處理以上信息更高效和更智能的原因在于采用了與計算機完全不同的處理方式。例如,計算機處理總是通過CPU或者GPU來進行,但人類是通過眼耳口鼻五官四肢分工完成的。人類在通過五官四肢與器官收集信息的同時,還能對其進行分類,完成比智能體更智能的去除幻覺作用。在這個過程中,高級信息的信息量極少效率極高,低級信息雖然信息量極大效率極低,卻起到了分支開關的作用,聯合起來形成了人的具身智能。例如,教師的大腦如果接到信號—一個學生聚精會神,就會直接輸出“是個認真的好學生”的結論,但是低級視覺信息還觀察到,同學們在討論問題時這個孩子很少發言,可能會有不合群的直覺,這個直覺就會將教師的思考分支到另外一個判斷計算模型中。
“信息即負熵”,人類發現的科學和發明的技術與工具,都試圖揭示世界的本質原因,用最高級的形式表達最本質的意義,因此人類對科技有執念,也希望科技能夠替代人類的重復勞動,然而真理向前一步往往就是謬誤。信息在生成過程中,是需要人做功的,在做功的過程中是需要不同類別的信息分工協作的,而“作為人”部分的具身智能,往往信息含量少、密度低,卻是關鍵少數信息。人類揭示自然的奧秘還是要服務于人,也要靠人去揭示,人工智能更是如此。人工智能在模擬與學習人類行為的過程中,抽象出來的高度簡化的“高級信息”,很有可能是誤導的和缺少指向的,而人類保持的原始具身能力對訓練和升級過程就極為重要,在教育領域尤為如此,教師的具身能力往往比高度簡化的數據更具有意義。
借用維特根斯坦所說的“凡是能夠說的,都能夠說清楚;凡是不能說的,必須保持沉默”,在教育領域“凡是能夠用數據表達的,都能夠表達清楚;凡是不能表達的,必須保持教師的具身”。教育的價值是由人的價值決定的,而人的價值很大程度上是具身價值。