孫茂松


人工智能的“熱”現狀
人工智能很“熱”,我們現在談論人工智能更多是從應用來看,從大眾角度來說。人工智能的研究初心是讓機器人具有人類個體的智能,也就是感知和認知的能力。感知,雖然不是人類獨有的,但與人類認知密切相關。認知則是人們獲得知識或應用知識的過程,或信息加工的過程,像語言、記憶、推理、思維、想象等,都屬于認知。人工智能這些年的發展,特別是隨著互聯網的興起,產生了超越初心的部分——群體智能,這是個體智能所沒有的,比如智慧城市等。人工智能發展歷史經歷了大的“三起兩落”,發端于2010年的第三次“起”趨于真實,人工智能研究從象牙塔走向社會,其最早的顯著性標志是語音識別。進入21世紀后大約有十年的時間,全世界研究者嘗試了各種機器學習的方法,語音識別的錯誤率怎么也降不下去。2010年人工智能進化到以深層神經網絡為代表的深度學習,使得語音識別的錯誤率大幅下降,開啟了這一波人工智能的高潮。2012年圖像識別、2015年機器翻譯也取得了類似的效果。圖像識別用的深層神經網絡是卷積神經網絡CNN,差不多可以說它是直接借鑒了腦的視覺處理機理,在國際公開測試集上前幾年已超過了人類的識圖能力。機器翻譯用的是循環神經網絡RNN。最近,有研究者發現人腦中存在類似的機制,這個腦科學的發現反而是受到了計算機科學的啟發。2016年谷歌研發的人工智能AlphaGo,利用了人類歷史上所有的優秀棋譜,同時加上機器學習,讓機器自己跟自己下,終于戰勝了人類頂尖棋手;不過,其后迭代出的AlphaGo Zero卻不再需要任何人類棋局,完全由機器自己跟自己下,結局是AlphaGo Zero完勝AlphaGo。如此種種,令人工智能留給公眾“神乎技矣”的深刻印象,大家對它產生了高度關注和期待。
人工智能的“冷”思考
這一代人工智能技術是以CNN和RNN為主要手段的深度學習技術,在大數據、大算力的支持下,人工智能得以發揮作用,產生了驚艷的效果。需要注意的是,我們現在可能過多強調了人工智能“強勢”的一面,對其局限性則關注不夠。前幾年,我們總在討論人工智能是否會超越人類,答案應該是“否”。實際上,這一代的人工智能技術要超越人類,需具備幾個基本條件。
首先是單一任務,任務的邊界是清楚的,比如下棋就是下棋,不能是炒菜。該任務還必須同時滿足如下性質:第一,其可能狀態是有限的,不能有超出預期的狀態出現;第二,元規則要確定,比如下棋,規定好你走一步我走一步,什么叫“死棋”,什么叫“活棋”;第三,信息完備,信息對雙方都是公開的;第四,也是最為重要的是,結果判斷可量化。人工智能面對滿足上述條件的任務,一定能夠戰勝人類頂級高手。但問題是,現實任務同時符合這幾個條件的幾乎沒有,無論是圖像識別、語音識別、機器翻譯還是自動駕駛,都至少不具備其中一個條件。在這些領域,目前的深度學習技術,即使給它足夠大的數據,要超越人類頂級高手實質上是不可能的,但確實有可能比大多數人做得好,所以可以輔助人類去替代一些相對簡單、重復性的智力勞動,這是這一代人工智能技術應用的基本定位。
為什么這一代人工智能有局限性?深層神經網絡的中間是一層一層的神經元,層與層之間的神經元以各種權重連接。它的長處是通過大量與任務相關的輸入輸出數據,可以自主學出來一個求解該任務的“函數”。理論上已經證明,如果一個神經網絡足夠復雜,它可以模擬、逼近任何函數。所以它的能力非常強,這是相當了不起的;但問題也恰恰出在這兒——說到底,它僅僅是一個針對特定任務的“函數”而已,我們并不清楚其中的功能機理,所以它的可解釋性、魯棒性都比較弱,運用顯式知識的能力差,推理能力缺乏,可用性也會打折扣。也就是說,它的長處和短處是共生并存的。如果某個輸入數據超出了這個“函數”的視野所及,是它沒有學過的,很可能馬上就會“犯糊涂”,產生種種令人意想不到的錯誤。如在自動駕駛中,本已訓練好的AI系統可以很好地識別STOP交通標志,但如果存心在上面貼上若干小紙條之類,人看一點兒問題也沒有,機器卻很可能會識別錯,你要是自動駕駛或許一下子就掉下懸崖了。
深層神經網絡的特點決定了AI很容易被沒有見到的情景所迷惑,而犯人不會犯的低級錯誤。人容易犯的高級錯誤,AI因為學習充分卻可能不會犯。人工智能可能隨時會犯低級錯誤,所以在自動駕駛之類關乎人的生命安全的應用場合中,一定要十分慎重,設計好應急措施。我們要正視人工智能的缺陷,辯證地看問題。
人工智能與腦科學及智慧教育一瞥
這些年人工智能和腦科學的研究一直在試圖互相借鑒。人工智能學界始終在留意腦科學的最新研究成果,看看哪些對設計新的人工智能算法或模型有啟發,雖然目前為止收獲不大,但這肯定是會越來越得到更多重視的一個方向。另一方面,現階段或許腦科學更容易從深度學習中找到新的實驗方法。腦科學的實驗數據足夠大,符合人工智能大數據運算的特點,利用深度學習技術,很有希望提出腦科學數據分析的新手段甚至開辟出新范式。
當前人工智能作用于教育并取得確定性成效的工作還不太多,雖然國際上已經有了不少初步的工作,如在線學習會產生大量數據,可通過人工智能技術發現學習者的特點,進行個性化學習,也就是因材施教。有研究根據學習者的以往學習數據,比如某個視頻看了多長時間、做題效果如何等,通過RNN神經網絡預先判斷作業的難度,有針對性地推送適合學生個體水平的、難度適中的作業;也有研究根據學習者行為讓AI自動判斷課程中哪一部分內容比較難。其實不同的學生感到困難的地方是不一樣的,并非固定不變,而以前決定課程內容的難度,多是基于教師的主觀判斷;此外還有通過CNN神經網絡,借助視頻技術來分析老師講課的狀態,如是精神飽滿還是比較平淡的照本宣科。教育學研究表明,在線教育中教師講課的生動性,是能否抓住學習者的關鍵因素。對教學視頻進行大規模的自動分析,再同學習者大數據建立關聯,有望對教師的在線教學提出改進建議。總體上看,人工智能賦能的智慧教育,其進展還是可圈可點的,但人工智能融合腦科學的智慧教育,似乎才剛剛起步。