李軍
目前弱人工智能的最好寫照是:一邊是天才、一邊是弱智的“雨人”式智能
人工智能,是2017年最熱的科技話題。從今年5月Google的人工智能系統AlphaGo以3比0戰勝世界圍棋第一人柯潔,到7月份Facebook的CEO馬克·扎克伯格(Mark Zuckerberg)和特斯拉的CEO埃隆·馬斯克(Elon Musk)為人工智能隔空論戰。最后埃隆·馬斯克直指馬克·扎克伯格對人工智能知之甚少。
那么,人工智能真的可以具有類人的智能嗎?今年5月底,《麻省理工技術評論》(MIT Technology Review)發表的人工智能發展前瞻時間表給了這樣的回答:除了戰勝人類圍棋高手的目標已經達到外,語言翻譯(2024年),撰寫高校論文(2026年),駕駛卡車(2027年)乃至撰寫紐約時報排行榜暢銷書(2049年)和完成外科手術(2053年)都赫然在列。
最近幾個月,有關人工智能的終極警告見諸媒體:如“霍金警告:人工智能可能讓人類滅絕”,“保安機器人‘自殺 人工智能對人類來說是福是禍”,“細思恐極!兩個人工智能系統用人類無法理解的語言進行了交流”等,那么,人工智能技術真的已經在人類可控的邊緣嗎?
答案是否定的:目前我們掌握的人工智能技術還非常粗糙和原始。如果把人工智能和人類使用工具的歷史相比,我們目前還處在人工智能的“石器時代”。
目前業界公認的人工智能發展分為三個階段,即弱人工智能(Artificial Narrow Intelligence,ANI)、強人工智能(Artificial General Intelligence,AGI)和超人工智能(Artificial Super Intelligence,ASI)。但每個階段的定義稍有不同。
所謂弱人工智能,就是像目前的各種對話機器人如Siri,還有圍棋系統AlphaGo和IBM的認知系統 Watson。它們需要依賴于海量數據,并在設計者精心構建的環境下進行模型訓練,最終對給定目標基于明確任務展現強大的計算和認知能力。目前人類出現的所有人工智能系統都在此階段,無一例外。
所謂強人工智能,目前業界沒有統一的定義。但總的來說強人工智能應該不再局限于單一的明確目標,它應該能夠自主進行非結構化數據的學習,并完成通用的任務。訓練過程不再局限于格式化的數據輸入,而是可以像訓練貓、狗一樣進行模糊訓練。
我認為,人工智能系統應該達到高級哺乳動物甚至人類嬰兒的智力水平,這才談得上強人工智能系統,這就包括了類似于批判性的分析問題和抽象的思考能力。
顯而易見,目前無論是谷歌、亞馬遜還是別的互聯網創新企業,他們研究的人工智能項目與此都還相去甚遠。
超級人工智能目前是意見分歧最大的階段。但總的來說,作為發展的最高階段,人工智能系統應該已經適用阿西莫夫的機器人三定律,即:機器人不得傷害人類,或因不作為使人類受到傷害;除非違背第一定律,機器人必須服從人類的命令;除非違背第一及第二定律,機器人必須保護自己。
所以,超級人工智能應該具有自我的認知能力,它將以我們目前無法理解的方式來構建和運行。同時,作為目前已知的智能和認知領域的唯一杰作——大腦,在超級人工智能到來時,大腦本身的工作方式和針對其的人工模擬技術一定已經實現。很難想象人類會創造一種新的和大腦工作機理完全不同的人工智能系統。
我認為更大的可能性是人類基于對大腦構造的深刻認識和全面仿真基礎上構建出真正的超級人工智能系統。
根據這樣的階段劃分,我們就知道目前所有的已經應用和還在研究的人工智能技術無一例外都是弱人工智能,其核心能力和大多數人所理解的智能相去甚遠。
那么我們看看,現有的人工智能技術究竟弱在哪里?
其一,目前的弱人工智能必須精確學習,指定輸入。人類智能來自于學習,而人類的學習過程往往是模糊學習,正誤混雜。對于目前的人工智能系統,學習的過程其實是通過輸入已知數據完成對模型的調整(通常被稱為訓練模型)。任何錯誤的已知數據都會導致模型偏離最終的理想結果。在沒有人工干預的前提下,模型本身沒有任何過濾錯誤數據影響的能力。
微軟公司在去年推出了一款名為“Tay”的人工智能系統,其設計能夠模仿一名19歲的美國少女與Twitter用戶在線聊天,微軟希望Tay能夠通過與人類對話進行自我學習并不斷完善,從而更好地與人類交流。但是在Tay上線之后僅僅16小時,Tay開始頻繁爆出粗口,其中不乏種族歧視、侮辱女性以及污穢不堪的詞句,最終微軟不得不將其緊急下線。
微軟的Tay人工智能系統發生與預想結果重大偏離的核心原因就是現有的弱人工智能技術無法面對模糊學習和錯誤信息的挑戰。
有關弱人工智能的指定輸入有這樣一個實例:主人設定掃地機器人iRobot每天凌晨1點半自動啟動清理房間,這樣起床后就能享受到干凈的室內空間。但當某天晚上他的寵物狗把大便拉在了地板上。第二天早上主人看到寵物狗的大便均勻地抹平在iRobot走過的每一個房間角落。
對于掃地機器人這種弱人工智能設備,傳感器采集的都是預設好數據,任何模型之外的因素如寵物狗的大便,都是視而不見的。
對于精確學習、指定輸入的弱人工智能,任何超范圍的輸入和訓練數據集中的噪聲數據對于其都可能帶來一場災難。
其二,目前的弱人工智能是單一能力的“雨人”式智能。美國電影《雨人》描寫了一個患有自閉癥、生活幾乎無法自理的人同時擁有超強的記憶力,甚至可以利用自己的超強能力到賭場贏錢。這種一邊是天才、一邊是弱智的“雨人”式智能,就是對于目前弱人工智能的最好寫照。endprint
從人工智能技術出現到現在,所有已知的人工智能系統都在追求給定場景下、特定業務問題的解決。所以,從數據收集、模型選擇、模型訓練到實際應用,目前的人工智能系統都是設計解決單一任務的。
以Google的AlphaGo為例,它除了會下圍棋,其他什么都不會。哪怕是需要解決類似的問題如下國際象棋,整個系統包括算法就都需要重構。
類似的情況同樣存在于絕大部分現有的人工智能系統中。比如對于自動駕駛系統,它的任務就是根據各個傳感器的動態輸入決定對于方向盤、油門和剎車等系統的操控。如果我們需要開發一個非輪式的行走機器人,那么原有自動駕駛系統積累下來的“知識”全無用處,從輸入數據到核心算法全部都要推倒重構。
對于具有“雨人”式智能的這種單一功用人工智能系統,其實更應該稱其為人工智能輔助系統,因為幾乎沒有任何應用場景的彈性,其實和公眾心目中認知的人工智能天差地別。
其三,神經網絡算法離“類腦計算”還非常遙遠。“類腦計算”,指的是以大腦相似的方式工作,并完成相應的計算工作。
神經網絡是目前人工智能領域最熱的算法,沒有之一。僅從神經網絡的名字就容易聯想到人腦,人腦不就是由億萬個神經元細胞構成的神經網絡嗎?通過神經網絡構造的系統是不是可以完成“類腦計算”,擁有類似人腦這樣的高級智能呢?
再加上Google的AlphaGo系統就是使用卷積神經網絡和相關的深度學習技術構建核心算法,最終超越了所有人類目前能夠達到的圍棋水平,不由得更容易讓公眾以為神經網絡和“類腦計算”有什么關系。
其實神經網絡只是人工智能算法的一種,并且也不是占壓倒性優勢的算法。目前的神經網絡與人類大腦的區別,比算盤和超級計算機的區別更大。主流神經網絡算法包含的單向信息流動和輸入輸出節點模式,更是對大腦神經元工作方式的拙劣模仿。人類目前對大腦的核心工作原理幾乎是一無所知,所以神經網絡和大腦相比只是形似而已。
如果有一天人類破解了大腦的核心工作原理,是非常有可能創造出類似大腦的強人工智能甚至超人工智能系統的。當然,人類也有可能創造出不同于大腦工作機制的全新人工智能系統。但在我看來,擺著現成的智能實物(大腦)抄都抄不會的話,憑空創造一個人工智能體系的難度就更大了。
除了神經網絡以外,目前主流的人工智能算法還包括回歸、聚類、決策樹、隨機森林等。KDnuggets統計,數據科學家們常用的算法包括10種。
所以把目前的人工智能和神經網絡甚至與“類腦計算”相提并論,是公眾認識的誤區。
筆者從1998年就開始接觸數據科學,目前仍然任職某500強企業的高級數據科學家。我的看法是,目前人工智能領域并沒有真正越階的突破。
近幾年人工智能特別火爆的根源一方面是通過一些創新的技術如深度學習等,讓模型在訓練過程中能夠快速逼近,從而支持海量的數據訓練任務并大大縮減模型訓練時間,最終在特定場景下能夠匹敵甚至超越人的智力水平。
此外也是因為云計算向模型提供強大的訓練算力,并為人工智能帶來開放與廣泛應用的平臺。
但目前人工智能所采用的各種模型算法如神經網絡、隨機森林、貝葉斯分類和支持向量機等,都是十幾年甚至幾十年前就已經出現的,并不是新鮮事物。現有的模型算法如果沒有越階的突破,從弱人工智能到強人工智能的階段式跨越是不太可能發生的。
目前,網上流傳的各種關于人工智能的驚悚話題都是以訛傳訛的夸大之詞。試想,目前基于單一任務的弱人工智能系統,怎么可能會產生系統的自我意識,就更談不上“自殺”、“交流”這樣帶有主觀認知的行為了。傳感器故障或者是模型訓練失敗導致的錯誤輸出,才有可能是這些“驚悚事件”發生的最大根源。
人們往往高估某一事件或趨勢的短期影響,而低估其長期效果,對于人工智能也是這樣。
人們在最近十年撿起人工智能這一“石塊”并開始打磨作為智能工具,未來一定會逐步進入智能的青銅時代、黑鐵時代乃至蒸汽時代。但有限的模型和相應的弱人工智能決定了人類還處在人工智能的“石器時代”。
(作者為科技與互聯網資深分析師,編輯:謝麗容)endprint