李之齊 浙江理工大學
在《人工智能標準化白皮書(2018)》中人工智能是這樣定義的人工智能是利用數字計算機或者數字計算機控制的機器模擬、延伸和擴展人的智能,感知環境、獲取知識并使用知識獲得最佳結果的理論、方法、技術及應用系統。人工智能學者們致力于設計更加先進的算法和系統以模擬甚至延展人腦的智能,借助傳感器等器件產生對外界環境(包括人類)進行感知,甚至可以像人一樣通過聽覺、視覺、嗅覺、觸覺等接收來自環境的各種信息,對外界輸入產生文字、語音、表情、動作(控制執行機構)等必要的反應。借助于按鈕、鍵盤、鼠標、屏幕、手勢、體態、表情、力反饋、虛擬現實/ 增強現實等方式,人與機器間可以產生交互與互動,使機器設備越來越“理解”人類乃至與人類共同協作、優勢互補。而心理學則是在研究人類本身的知覺,感覺,記憶,情緒,情感等心理機制,探討意識與行為的之間的聯系,從某個角度來看,心理學在研究人類行為的心理機制,而人工智能在研究智能系統運作的心理機制。
從心理學的角度來講,人類的心理行為機制是一個黑箱,由于神經科學的局限我們不能直接的認識到大腦運行的機制,只能通過操作外部環境觀察行為反饋來理解心理。同樣的深度學習的層級越來越深,任務和網絡結構越來越復雜,人工智能的運行方式對我們來說也是一個黑箱(Bornstein,2016;Lipton,2016)這種不透明性阻礙了尋求改進這些模型的基礎研究,以及這些模型在現實世界問題中的應用(Caruana et al.,2015)。既然目前人工智能的視覺不但能夠識別物體,理解物體間的關系,甚至通過體會情感,這樣就有能力完成一些以前人類才能完成的心理學任務,利用心理學實驗來探究人工智能的“黑箱”并對其進行改進,下面兩個例子就會展示人工智能完成心理學任務。
(一)人工智能心理學實驗室。DeepMind公司的就專門為人工智能開設了一個虛擬3D游戲世界中的心理學實驗室―Psychlab(Leibo, J.Z., D'Autume, C.D.M.,2018),人工智能能夠在這個實驗室像正常人一樣環顧四周,而試驗給予的視頻圖像刺激顯示在實驗室中的顯示器中,給人工智能一個相應的任務,如果完成任務智能體會獲得獎勵。JoelZ.Leibo在他的論文中展示了8種任務,如圖4所示,分別為:1.連續識別:判斷面前的物品是否曾經出現過。2.變化檢測,判斷前后出現的兩組圖,是否發生了變化。3.任意的視覺映射,面前出現一個物體和四個標簽,標簽中只有一個是綠色。下次這個物體再出現的時候,要判斷出對應的綠色標簽在哪個位置。4.隨機點運動方向判斷:畫面中間的圓形區域,會出現大量的隨機點,人工智能需要指出主要的運動方向。5.視覺搜索:在一堆物體中發現要尋找的目標。6.玻璃圖案測試:要判斷兩個圖案中,哪一個是同心的玻璃圖案。7.視敏度測試:測量人工智能在不同對比度下的視敏度。8.多對象追蹤:畫面中有一組兩種顏色的小球,隨后全部變成統一顏色并開始移動,最后指定一個小球,人工智能要判斷原來這個球的顏色是什么。實驗者利用人工智能的試驗結果與人類進行相同試驗的試驗結果進行比較,來對人工智能進行改進。
(二)心理學實驗改進人工智能。以Jaderberg等人2016年提出智能體UNREAL為例(Jaderbe rg et al,2016),在指向目標任務中,UNREAL與人相比,對目標和誘餌的大小非常敏感,目標大時學習速度要快得多,誘餌大時最終性能不太理想(如圖1),這種發現也帶來了對一個簡單的中央凹視覺模型的具體改進,顯著提高了UNREAL在其他Psychlab任務上的表現。
因為研究任務的相似性,心理物理學與認知心理學的研究范式正不斷應用在人工智能領域,不止在視覺領域。例如,將大量關于情景記憶的研究應用到情景記憶體系結構的最近的人工智能研究中(Blundell et al,2016),并應用技術從語義認知研究到概念信息的最新模型(Raposo et al,2016)。
圖1 (1)連續識別(2)變化檢測(3)任意的視覺映射(4)隨機點運動方向判斷(5)視覺搜索(6)玻璃圖案測試(7)視敏度測試(8)多對象追蹤
(三)人工智能形狀偏好。人對看到的不認識的東西與語義概念進行匹配的時候,會通過采用歸納偏好來消除許多不正確的推理,比如:1.整體偏好,概念指向完整物體。2.分類偏好,概念指向意見食物的基本類別。3.形狀偏好,概念基于意見是我的形狀顏色或材質。SamuelRitte(2017)的團隊證明了人工智能在小樣本的情況下認識對象時同樣存在偏好,他們向深度神經網絡展示了三個物體的圖形:一個測試物體,一個與測試物體顏色相同但形狀不同的物體,一個與測試物體形狀相同但顏色不同的物體(如圖2)。之后通過記錄測試物體和和形狀相同物體而非顏色相同物體被做出同樣標注的次數占比來測量形狀偏好。發現他們的神經網絡如同人類一樣對物體的形狀有更強的偏好(相比較對物體的顏色或質地而言)。換言之,它們也具備形狀偏好。并且同人類偏好形成的過程相同,形狀偏好在神經網絡訓練時也是逐步顯現的。
圖2 人工智能的歸納偏好
綜上所述,心理學已經滲透到人工智能視覺的方方面面,借助于注意力機制,長短時記憶機制等心理機制的幫助,人工智能已經不僅僅在感覺上認知看到的內容,更能從知覺上理解它。甚至我們還可以讓它們做人類的心理學實驗來認知人工智能的心理構造,為改善智能體能力提供了參照。盡管如此,現在的人工智能距離真正的強人工智能還有很長的路要走,學習效率低,通用性差,動機獎勵函數設計困難,都是當前道路上遇到的問題,只有利用好計算機視覺才能更好的完成人類的工作。