編譯 陸默
本文作者邁克爾·喬丹(Michael I.Jordan)是加州大學伯克利分校電氣工程和計算機科學系以及統計學系教授,美國工程院、美國科學院以及美國藝術與科學院院士。

人工智能(AI)是當今時代的流行語,技術專家、學者、記者和風險投資家都在使用這個詞。就像許多從學術領域進入大眾領域的詞匯一樣,在這個詞語的使用中也存在著嚴重的誤解。但這并非是公眾對科學家不甚了解的經典案例,科學家常常也會像公眾一樣誤解人工智能(AI)。我們認為,我們的時代在某種程度上見證了從硅芯片中崛起的智能,硅基智能可以匹敵人類的智慧。上述想法讓我們著迷,也讓我們感到恐懼。遺憾的是,這樣的想法會分散我們的注意力。
關于當今時代,存在不同的描述。如下的故事涉及人類、計算機、數據和生死抉擇,但其重點不是硅基智能。14年前,我妻子懷孕時做了超聲波檢查,房間里有一位遺傳學家,她指著胎兒心臟周圍的一些白色斑點對我們說:“這些是唐氏綜合癥的標志,你們孩子患這種疾病的風險現在已經上升到了1/20。”她還進一步告訴我們說,我們可以通過羊膜穿刺術來了解胎兒是否有遺傳性唐氏綜合癥。但是羊膜穿刺術也有風險,手術過程導致胎兒死亡的風險大約是1/300。作為一名統計學家,我決定找出這些數字的來源。結果我發現,英國在這方面已進行了10年的統計分析,這些白色斑點是鈣積累的反映,被認定為唐氏綜合癥的預測因子。但我同時也注意到,我們測試中使用的成像機器比英國研究中使用的機器每平方英寸多出幾百個像素。我回去對遺傳學家說,白色斑點很可能是假陽性,她說,“哦,這就解釋了為什么我們在幾年前開始發現唐氏綜合癥發病率上升的原因,當時正是啟用新機器的時候。”
最終,我們沒有做羊膜穿刺術,幾個月后一個健康的女嬰來到了這個世界上。但這一事件讓我感到困擾,尤其在經過粗略計算之后,我可以確信,世界范圍內有成千上萬的人在同一天也得到了和我們同樣的診斷,他們中許多人選擇了羊膜穿刺術,導致其中許多嬰兒不必要地死去。這樣的事情日復一日地發生著,直到成為一種固定的模式。這一事件揭示的不只是我個人遭遇的問題,而是關乎整個醫療系統,它對不同地方和不同時間的變量和結果進行測量和統計分析,然后將分析結果用于其他地方和其他時間。問題不只在于數據分析本身,還在于數據庫研究人員所稱的“出處”,概括來說,數據來自哪里,從數據中得出什么樣的推論,以及這些推論與當前情況的相關性如何?等等。雖然訓練有素的專業人員可在之前個案的基礎上解決所有這些問題,但我們需要設計覆蓋全球的醫療系統,不需要如此精細的人類監督而完成相關分析工作。
而我也是一名計算機科學家,因此我突然想到了建立這種行星尺度的推理-決策系統的一些原則:建立系統、將計算機科學與統計學相結合、將人類的因素考慮在內等,這些在我所受的教育中是沒有的。在我看來,這些原則的發展(不僅醫學領域需要,而且商務、運輸和教育等其他領域內也需要)至少和棋類比賽和感覺技能中大放異彩的人工智能系統同樣重要。
無論能否在不久的未來完全理解“智能”,我們都面臨一個巨大的挑戰,那就是如何將計算機和人類結合起來,以提高人們的生活水平。雖然這一挑戰被一些人視為“人工智能”的誕生,但我們可以用一個更加平凡和不乏敬意的看法,這種挑戰標志著一個新的工程學分支。就像幾十年前的土木工程和化學工程一樣,這個新學科的目標是融合一些關鍵想法的力量,為人們帶來新的資源和能力,并安全平穩地做到這一點。土木工程和化學工程是建立在物理和化學基礎上的,而這個新的工程學科將建立在20世紀的一些思想觀念的基礎上,如“信息”“算法”“數據”“不確定性”“計算”“推理”和“優化”等概念。此外,由于這個新學科的大部分重點都將是來自于或關于人類的數據,其發展需要來自社會科學和人文學科的視角。
雖然構建模塊已經開始出現,但將這些模塊組合在一起的原則還沒有出現,這些模塊目前只是以臨時的方式組合在一起。因此,就像人類在土木工程學出現之前就建造了房屋和橋梁一樣,人類也在開始著手建造涉及機器、人類和環境的社會規模的推理和決策系統。就像早期的建筑和橋梁有時會以不可預見的方式和悲劇性的后果倒塌一樣,我們早期的許多社會規模的推理和決策系統已經暴露出嚴重的概念缺陷。而且,遺憾的是,我們不太擅長于預測下一個嚴重缺陷會是什么,我們所缺少的是一個擁有其分析和設計原則的工程學學科。
當前關于這些問題的公開對話經常使用“人工智能”作為智力的通用符號,這使得人們很難對這一新興技術的范圍和后果進行推理。讓我們首先更仔細地考慮一下“人工智能”都被用來指代什么,包括最新概念和它的歷史淵源。
如今大多數被稱為“人工智能”的東西,特別是在公共領域內,是在最近幾十年內所稱的“機器學習”(ML)。ML是一種算法,它融合了來自統計、計算機科學和許多其他學科的思想,設計了處理數據、預測和幫助決策的算法。就對現實世界的影響而言,ML是很早就存在的真實東西。
事實上,早在20世紀90年代早期,ML將會成為巨大產業的苗頭就已顯現,世紀之交時,一些具有前瞻性眼光的企業,如亞馬遜等公司已經在他們的業務中使用了機器學習技術,在欺詐識別和供應鏈預測等方面解決關鍵任務后端的問題,創建新穎的面向消費者的服務,如推薦系統。隨著數據集和計算資源在隨后20年的快速增長,很顯然,ML不但為亞馬遜,而且實際上為任何需要在大規模數據基礎上做決策的公司提供幫助。新的商業模式應運而生,“數據科學”一詞開始被用來指代這一現象,反映了ML算法專家與數據庫和分布式系統專家一起合作構建可擴展、強大的ML系統的需求,反映了由此誕生的系統的更大的社會和環境范疇。
在過去幾年里,這些觀念和技術趨勢匯聚在一起,被重新標以“人工智能”之名,但這種重命名還是值得推敲的。
從歷史上看,“人工智能”一詞是在20世紀50年代末創造出來的,代表了當時一種令人振奮的渴望,希望通過計算機軟件和硬件創造出擁有人類水平智能的實體。我們將用“類人智能”,即“模擬人類的人工智能”(human-imitative AI)這個詞來指代這種渴望,它所強調的是這樣一種觀念,即人工智能實體應是我們中的一員,即使不是指身體層面上的,至少是在精神層面上的(不管這意味著什么)。這在很大程度上是一種學術上的追求。雖然一些相關學術領域,如運籌學研究、統計、模式識別、信息理論和控制理論等都已經存在,并且經常受到人類智能(以及動物智能)的啟發,但這些領域主攻的可以說只是一些“低級”的信號和決策。
比方說,一只松鼠能感知它所居住的森林的三維結構,并在林中樹枝間跳躍,這種能力激發和賦予人們靈感。而“人工智能”關注的是一些不同的東西:人類“推理”和“思考”的“高層次”能力或“認知”能力。然而,60年后,人工智能模擬高層次人類推理和思考能力的前景仍然難以捉摸。現在所稱的“人工智能”的發展主要體現在一些與低水平模式識別和運動控制相關的工程領域,以及主要專注于尋找數據模式、做出有根據的預測、對假設和決策進行測試的統計學領域。
事實上,著名的“反向傳播算法”在20世紀80年代早期由大衛·魯梅爾哈特(David Rumelhart)重新發現,如今被認為是所謂的“人工智能革命”的核心,它最早出現在20世紀50年代和60年代的控制論領域內,其早期應用之一是在向月球進軍中用于優化阿波羅飛船的推力。
自20世紀60年代以來取得的許多進展并非來自于對人工智能的追求,而是就像阿波羅飛船的例子一樣,通常是研究人員專注于解決某項特定工程難題的杰作,而關于人工智能的一些想法往往被隱在幕后。雖然不為一般公眾所了解,但在文檔檢索、文本分類、欺詐行為檢測、商品推薦系統、個性化搜索、社會網絡分析、規劃、診斷和A/B測試等領域內的研究和系統構建都取得了重大成功,這些進步成為谷歌、網飛公司(Netflix)、臉書網(Facebook)和亞馬遜等公司發展的推動力量。
人們簡單地將所有這些都稱為“人工智能”,事實上,已達成了這樣的共識。這樣的標識可能出乎優化或統計研究人員的意料之外,他們一覺醒來會驚訝地發現,自己突然被稱為“人工智能研究人員”。但是,撇開對研究人員的標識不當這個問題不談,更大的問題是,使用這個單一、定義不清的人工智能的縮寫詞AI,阻止了人們對智力和商業問題范疇的清晰認識。
過去20年里,在對類人智能的熱切期望中,工業和學術界領域內通常被稱為“智能增強”(Intelligence Augmentation,IA)的人工智能取得了重大進展。在這個領域內,計算和數據用來創建更多增強人類智力和創造力的服務系統。搜索引擎可以看作是IA的例子(增強了人類的記憶和實際知識),自然語言翻譯也是(增強了人類的交流能力)。基于計算機技術的聲音和圖像生成也是藝術家的調色板和創造力的增強器。雖然可以想象得到,這類服務也涉及高層次的推理和思考,但目前它們還不是,它們主要是通過執行各種各樣的字符串匹配和數值運算,捕捉人類可以加以利用的各種模式。
希望讀者能夠容忍最后一個縮略詞,讓我們泛泛地構想出一門被稱為“智能基礎設施”(Intelligent Infrastructure,II)的學科,即一個由計算、數據和物理實體構成的網絡,這個網絡將使人類環境更融合、有趣和安全。這樣的基礎設施已開始出現在交通、醫藥、商業和金融等領域內,對個人和社會都有著巨大的影響。這些經常出現在關于“物聯網”的討論中,但通常指的僅僅是將這些“東西”搬上互聯網,而不是與這些“東西”相關的更大挑戰:分析數據流,發現更多關于這個世界事實的能力;在比二進制更抽象的層次上與人類和其他事物互動。
回到我個人經歷導致產生的一些想法上。我們可以想象,我們生活在一個“社會范圍的醫療系統”中,這個系統在醫生、設備和人體之間建立了數據流、數據分析流,從而幫助提升人類智力,做出更好的診斷,提供更好的護理。該系統內包含:有關人體細胞、DNA、血液測試、環境、群體遺傳學的信息,關于藥物學和治療學的科學文獻。它關注的不只是某個病人或某個醫生,而是關乎所有的人類,就像目前的醫學測試通過對一組人類(或動物)的實驗,為其他人類提供更好的醫療服務,并有助于保持信息的相關性、信息來源的可靠性,就如目前銀行系統在金融和支付領域集中應對這類挑戰的方式。而且,雖然人們可以預見到在這樣一個系統中會出現許多問題,包括隱私問題、責任問題、安全問題等等,這些問題也應該視為挑戰而不是障礙,這才是正確的態度。
我們現在面臨一個關鍵問題是:應對這些更大的挑戰,走傳統的類人智能(即模擬人類的人工智能)發展之路是否是最好或唯一的途徑呢?最近一些廣為宣傳的關于機器學習(ML)的成功例子,實際上都產生于與類人智能相關的領域,如計算機視覺、語音識別、游戲和機器人領域。因此,也許我們應該只是等待這些領域的進一步進展。這里有兩點需要說明:首先,人們不會從閱讀報紙上知道的是:類人智能方面的成功實際上還很有限,我們離實現真正的類人智能的愿景還很遙遠。遺憾的是,即使在類人智能領域取得哪怕有限的進展,引發產生的興奮或恐懼情緒都會導致媒體的過度亢奮和關注,而在其他工程領域內的成功是不會導致產生這種現象的。其次,更重要的是,這些成功既不足以也未必能解決IA和II的一些重大問題。就其充分性而言,以自動駕駛汽車為例,要實現這樣的技術,需要解決一系列的工程問題,這些問題可能與人類能力沒有什么關系,或人類根本就缺乏這方面的能力。整體運輸系統(II型系統的一個例子)可能更像目前的空中交通管制系統,而不像松散結合、只看前方、心不在焉的人類司機組成的系統;這樣的系統比目前的空中交通管制系統還要復雜得多,特別是在通過大量數據和自適應統計建模提供詳細決策方面,這些正是最前沿的挑戰,過度專注于類人智能的研究可能會分散精力。
至于必要性論證,有人認為類人智能(AI)愿景也將IA和II愿景包括在內,因為類人智能系統不僅能夠解決人工智能的一些經典問題(如圖靈測試),同時也將是我們解決IA和II問題的最好辦法。這樣的論據幾乎沒有歷史先例。土木工程難道是通過設想建造某個人工智能木匠或人工智能砌磚工而發展起來的嗎?化學工程的發展是否也應該先創造出一個人工智能化學家來嗎?更值得商榷的是:如果我們的目標是建造化工廠,我們是否應該先創造出一個人工智能化學家,然后再考慮如何建造一個化工廠呢?
一種相關論點是:人類智能是我們所知的唯一的一種智能,我們應該要做的第一步就是要模仿它。但是事實上,對于某種類型的推理人類并不是特別擅長,我們會有失誤、偏見和局限。此外,至關重要的是,我們的智能還未能進化到擁有現代II系統處理大規模決策問題的能力,也沒有具備能夠應對II環境中出現的那種不確定性的能力。
可能有人會說:AI系統不僅會模仿人類的智能,而且還會“糾正”它,甚至還能任意擴展到解決其他更大的問題。但目前我們對于人工智能的推測性爭論,都基于科幻小說的范疇和小說中設定的背景和場景,在面對即將出現的IA和II的關鍵問題時,這些不應該成為我們主要策略的論據。我們需要根據其自身的優劣或價值來解決IA和II的問題,而不是將其看作是類人智能發展的必然結果。
不難發現,II系統中的算法和基礎設施方面的挑戰并不是類人智能研究的中心主題。II系統需要具備管理分布式知識庫的能力,這種知識庫會快速變化并有可能在全局上不合邏輯。這樣的系統必須在做出及時、分布式決策時處理好各種交互作用,并且還必須能夠應對處理長尾現象,即一些人擁有大量數據,而大多數人只擁有極少量數據的情況。系統必須解決跨行政和競爭性邊界共享數據的難題。最后,特別重要的是,II系統必須將刺激和定價等經濟觀念引入到統計和計算基礎設施中,這樣的基礎設施將人們互相連接和對商品進行估價。這樣的II系統不僅可以提供服務,還可以創造市場。一些領域迫切需要這樣的市場,如音樂、文學和新聞等領域,在這樣的市場中,數據分析將生產者和消費者聯系在一起。這一切都必須在不斷發展的社會、倫理和法律規范的背景下進行。
當然,經典的類人智能問題仍然是人們極感興趣的研究課題。然而,當前人工智能研究的重點是收集數據,構建“深度學習”基礎設施,模仿狹義定義的某些人類技能的系統示范,這些往往會轉移對經典人工智能一些懸而未決重大問題的注意力。這些問題包括:將意圖和推理引入到執行自然語言處理系統中的需要,推斷和表示因果關系的需要,開發可計算可處理的不確定性表達式的需要,開發制定和實現長期目標的系統的需要。這些都是類人智能的經典目標,但在當前關于“人工智能革命”的爭論中,人們很容易忘記的是:這些問題還尚未解決。
IA也將繼續保持其相當重要的地位,因為在可預見的未來,計算機在對真實世界情景進行抽象推理方面的能力將仍然無法與人類相比,我們需要通過能周詳考慮的人類與計算機的交互作用來解決一些最為緊迫的問題。同時我們希望計算機能激發人類新層次的創造力,而不是取代人類的創造力(不管這意味著什么)。
曾是達特茅斯大學教授后在麻省理工學院任職的約翰·麥卡錫(John McCarthy)創造了“AI”這個詞,顯然是為了將他正在進行的研究與當時麻省理工學院老教授諾伯特·維納(Norbert Wiener)的研究區別開來。維納創造了“控制論”一詞來指代他自己的智能系統研究愿景,這一愿景與運籌學研究、統計、模式識別、信息理論和控制理論密切相關。而另一方面,麥卡錫強調的是與邏輯的聯系。有趣的概念逆轉是:打著麥卡錫術語旗幟的卻是當今時代占據主導地位的維納的人工智能研究成果,但這種情況肯定只是暫時的,在人工智能領域,鐘擺的擺動幅度比其他大多數領域都要大得多。
但我們需要的是超越麥卡錫和維納的特定歷史視角。我們需要認識到,當前關于人工智能的公開對話(關注的是一個狹窄的行業子集和一個狹窄的學術分支)可能會讓我們有一葉障目、不見森林的風險,忽略了AI、IA和II全景給我們所帶來的挑戰和機遇。
在這個全景范圍內,應該較少關于科幻夢想的實現,或者是超級人類機器給我們帶來噩夢的恐懼;應該更多考慮人類需要理解和塑造技術,因為這些技術日益出現和影響人類的日常生活。而且,在這樣的理解和塑造中,需要來自各行各業的不同聲音,而不只是技術上的對話,只聚焦于類人智能有可能阻礙我們聽到更廣范圍的不同聲音。
雖然產業在推動諸多方面的發展,但學術界也在繼續發揮重要作用,不僅在于提供一些最新的技術思想,而且還在于計算機和統計學科研究人員以及其他學科研究人員的合作,這些學科的貢獻和獨有的視角都是目前迫切需要的,特別是社會科學、認知科學和人文科學。
另一方面,盡管在我們的發展過程中,人文和科學是必不可少的;但我們也不應該認為:我們所談論的是工程領域之外、前所未有的規模和范圍的東西。社會的目標是建造新的人工制品,這些人工制品應該名副其實。我們不希望建立這樣的系統:能夠在醫療治療、運輸工具選擇和商業發展機遇等方面對我們有所幫助,結果卻發現這些系統并不能真正起到作用,它們會犯一些讓人類生命和福祉付出重大代價的錯誤。在這方面,正如我之前所強調的,在以數據和學習為中心的領域中,還有一個有待崛起的工程學科,盡管目前這些領域看起來令人興奮,但它們還不能被看作是一個工程學科。
此外,我們應該接受這樣一個事實,即我們將見證的是一個新的工程分支的誕生。在學術界和其他地方,“工程學”這個詞經常被狹義引用,代表冰冷的、缺乏感情的機器,還有人類對它們失去控制等負面含義。但是一個新的工程學科正是我們想要的,在當前這個時代,我們將真正有機會去設想歷史上前所未有的新東西:以人為中心的工程學科。
我沒有給這個新興學科命名的想法,但是如果要繼續用“AI”這個縮寫詞來占據這個位置,那么我們就要了解這個術語真正的局限性。讓我們擴大我們的眼界,讓炒作降溫,認識未來我們所要面對的嚴峻挑戰。
資料來源 Mudium.com