張梓堃
(北京師范大學第二附屬中學,北京 100088)
人工智能是計算機科學與應用的重要研究領域,它集合了信息學、邏輯學、生物學等眾多學科,以算法、算力與數據為基礎,于機器學習、圖像處理、自然語言處理、智能機器人等領域取得了大量成果[1]。自誕生以來至今的數十年間,人工智能在理論與應用上取得了重大成就。作為“人工智能戰勝人類”的標志性事件,2016年的AlphaGo對戰李世石一役使得人工智能進入了大眾的視野,而近幾年人工智能的大量成果也逐步進入人們日常生活:如各大手機廠商相繼推出的智能語音助手,輸入法中的語音輸入功能,廣泛應用于公安追逃、交通驗票、酒店入住等場景的人臉識別技術,以及2018年6月在谷歌I/O大會上亮相的能夠“以假亂真”的智能助理Google Duplex等。人工智能的這些應用成果令人矚目,為加深對人工智能的理解,探析人工智能在人類社會中的重要意義,本文回顧了人工智能的發展歷史,并就其發展現狀與未來的發展前景進行了探討,希望使讀者對這一領域有更深入的了解。
1955年,在美國西部計算機聯合大會中的在一場名為“學習機器討論會”的討論會上,著名的科學家奧利弗·塞弗里奇和艾倫·紐厄爾分別提出了對于計算機模式識別與下棋的研究,人工智能的雛形得以出現。但“人工智能”一詞的首次使用,則是在次年的達特茅斯會議上。在這次會議上,除前文提到的兩位科學家外,約翰·麥卡錫、克勞德·仙農、馬文·明斯基、赫伯特·西蒙等當時頂尖的科學家也參與其中,確定了人工智能發展的大方向,也確定了人工智能最初的發展路線與發展目標[2]。此外,這場會議也標志著以符號主義學派為主導的第一次人工智能浪潮的開端,隨后符號主義學派的代表紐厄爾與赫伯特·西蒙等人率先于上世紀50年代完成了Logic Theorist程序的編寫,用其成功證明了伯特蘭·羅素與阿爾弗雷德·N·懷特黑德的著作《數學原理》中的38個定理,并提出將解題的過程分為若干步驟的思想,將之推廣至數學以外的更多領域,成功編寫出了GPS(General Problem Solving)通用問題求解程序。而在同一時期,IBM公司的阿瑟·塞繆爾提出了機器學習理論,并制成了能夠挑戰人類的西洋跳棋程序,開創了計算機模擬人類學習過程的先河,于1962年成功擊敗了美國的西洋跳棋大師[3-4]。雖然這些人工智能領域的最初成果離大規模應用仍有不小的距離,但這些發展成就既體現了人工智能這門新興學科的旺盛生命力,又為日后人工智能領域的進一步發展提供了堅實的理論與實踐基礎。
人工智能驚人的發展成就與發展速度,使得當時人工智能學界處于過度的樂觀之中,1958 年西蒙和紐厄爾就曾預測,人工智能在十年內將能夠勝任擊敗國際象棋大師、完成數學理論的發現與證明、進行音樂創作、實現大多數心理學理論這四項任務,但第一項直至90年代末才得以成真[5],而計算機根據一定的需求創作音樂,也直至近一兩年來年來才初步有了如DeepMusic等實驗性的成果。此外,在70年代由于人工智能算力上的不足,且符號主義學派在算法上存在缺陷,再加之計算任務復雜而巨量,人工智能的前景并不為人看好,隨之而來的經費削減使得人工智能陷入了第一次低谷。
上世紀70年代中葉隨著符號主義學派的降溫,以仿生學為主導的連接主義學派漸漸興起。BP算法的廣泛應用使得神經網絡訓練擁有了更為先進的訓練技術,在之前第一次人工智能浪潮中發明的感知器算法也一并得到廣泛的接受,并于80年代大放異彩,推動了神經網絡在這一時期的高速發展[1]。在此背景下,基于已有知識對實際問題進行解決的專家系統大量投入使用,并成功地幫助工業界降低了大量成本,創造了大量收益。例如美國的DEC公司在上世紀80年代通過使用諸如XCON/R1等專家系統,每年在電子設備的生產、組裝等環節節省成本可達千萬美元量級;美國用于地質勘探的PROSPECTOR專家系統成功分析出了價值上億美元的礦藏[6]。值得一提的是,此次浪潮得益于飛速增長的算力與軟硬件發展水平,但這些技術水平終究沒能達到進一步發展的要求,因此深度學習在當時的條件之下仍然無法實現[5]。此外,針對專家系統應用領域較為單一的問題,人們所嘗試研制的通用于各領域的人工智能程序也遇到了危機[6],彼時日本的第五代計算機研制終因不能實現人機對話而宣告失敗,對當時的學術界也是一場打擊,人工智能在上世紀90年代再一次陷入低谷期。
1997年,“深藍”成功戰勝了國際象棋大師卡斯帕羅夫,驗證了西蒙與紐厄爾40年前的預言。此后,由于互聯網及分布式計算的技術發展所帶來的算力增加,以及數據量的不斷增長,基于大數據的深度學習與增強學習成為了可能[5],基于神經網絡下的深度學習算法,為人工智能的這一輪爆發提供了理論基礎。目前,深度學習已經廣泛運用于圖像、語音、文字識別以及數據挖掘等領域并取得一定成果。例如谷歌、百度等公司的拍照翻譯產品運用深度學習,可以做到即時識別文字,并立即給出翻譯;曠視公司等基于深度學習推出的人臉識別技術,可以實現即時的人臉搜索、識別等功能。
GPU的發展,谷歌TPU、寒武紀1H8、1H16等定制化處理器的相繼研制成功與使用等科技的進步所帶來的算力提升,則成為了此輪人工智能爆發的科技基礎。除前述的谷歌、寒武紀等公司之外,百度、阿里巴巴、IBM等國內外科技公司也加入了設計、研發人工智能定制化芯片這一行列。一方面,GPU具有高并發性計算方面的優勢,使之更為適合人工智能領域所需的算法,其在全世界個人與商用計算機上的廣泛使用也為人工智能的下一步推廣應用提供了兼容性上的可能,而GPU計算若與互聯網乃至近期火熱的區塊鏈技術所結合,分布式計算可以帶來算力上的進一步提升,在降低成本的同時可以推動人工智能的進一步發展。另一方面,定制化的芯片使得人工智能得以在更為契合的硬件平臺上運行,相較于傳統的CPU計算,減少了許多計算中因硬件廠商追求商業化所帶來的性能上的浪費,使得人工智能的研發與使用更為高效經濟,有助于人工智能產業規模化發展。人工智能的發展基礎需要海量的數據支持,而移動互聯網的發展方便了大數據的收集與預處理,拓展了人工智能的應用場景,使得諸如Siri、Cortana等語音助手以及如科大訊飛等語音輸入服務得到了廣泛應用。在數據的收集上,如地圖、網約車等應用可以收集如出行、路況等方面的數據,方便在訓練人工智能以及進行進一步的數據挖掘等方面進行應用。
正如1955年皮茨所說,“(一派人)企圖模擬神經系統,而紐厄爾則企圖模擬心智(mind)…但殊途同歸”[7],在“用什么方法發展人工智能”這個問題上,學術界長期以來一直有著“結構”與“功能”兩種路線。
由生物學、醫學與神經科學主導的一派試圖去模擬大腦結構,從而理清智能產生的過程。眾所周知,人類的智慧來源于大腦。這一派學者通過模擬大腦皮層中神經元的結構與功能來復刻出與大腦結構相似的機器,從而造出人工智能[3]。然而人腦的神經元有數百萬,模擬這么多神經元并使它們協調工作具有極大挑戰性,需要人們對大腦及神經工作原理的透徹理解,但迄今為止,科學家仍未真正弄清人腦智能的產生機理[8]。此外,現有的神經網絡只能模擬較為簡單的主干神經元及其功能,相較于人類復雜的神經網甚至是人類的末梢神經都還有很大差距[9],這些障礙使得這一派的研究工作變得十分困難。而由計算機科學家主導的一派則更傾向于跳過對神經結構的模擬,直接復制大腦思考的功能,他們通過利用深度學習對算法進行改進,以達到具有分析、預測和識別等能力的效果。相較于結構路線,他們的研究更適合于實際應用,且研究難度更低,因此也獲得了更多青睞。但無論如何,兩條路線終究殊途同歸:它們都是為建造更為智能、功能更為強大、應用價值更高的人工智能而努力。
今日,人工智能已經大量應用于各行各業。例如,在智慧網絡方面,人工智能進行網絡維護與需求預測;在醫學方面,人工智能可以進行基于圖片分析的檢驗結果分析,從而實現輔助診斷,且在部分診斷領域可達到90%以上;在智能金融方面,人工智能可以通過大數據分析,定制理財方案[10];在人臉識別方面,人工智能也實現了準確率超過99%等一系列的研究成果[11]。
雖然人工智能產業正在蓬勃發展,但人工智能技術上的挑戰更值得我們重視。目前基于人工智能的計算機視覺已能夠在一些情況下準確提取出圖片中的內容,分辨其中的物體,然而在面對針對性的攻擊時,人工智能卻十分脆弱。一個典型的例子則是2015年Ian Goodfellow 等研究者對一幅置信度57.7%的熊貓圖片加入針對性的干擾,生成的圖片人類可以無障礙地正確辨別,然而AI則給出了置信度99.3%為長臂猿的識別結果[12]。人工智能面對針對性的攻擊所體現的脆弱一面,恰恰說明了人工智能在未來還有廣闊的發展空間,并且其未來發展方向不僅要著重于任務的復雜性,更要著重于完成任務的可靠性。在自然語言處理方面,現有的人工智能只能夠進行語義分析,卻不能真正理解文本中所傳遞的信息,而這也體現在機器翻譯上。翻譯真正的要旨,是真正理解語言表達的內容、情感,并以另一種語言表達。但現有的機器翻譯原理是將原文分塊后逐塊翻譯并重新組合,這不可避免地會帶來譯文表述不自然,以及語法、語義上的錯誤,此外,人工智能在基于常識的邏輯推斷上相較于人類也有著較大的不足,從而導致難以處理語言歧義等問題。因此,建造能夠基于常識進行邏輯推斷的算法也是人工智能未來的發展方向之一。
人工智能的發展為社會帶來的新挑戰主要集中在就業與人工智能技術的不當使用等方面。人工智能的發展在達到一定程度后,將不可避免地以其低成本、高效率的優勢取代該領域中的絕大多數高重復性、創新性低的職位,從而造成該行業內大規模失業。對于這些問題,政府方面要加強社會保障,實行基本收入制度[13];勞動者也要注意關注前沿科技變化,終身學習,以應對潛在的失業風險。人工智能由于研發成本較高,因此相關前沿研究主要由少數公司或大學等科研機構進行,而許多大公司在形成技術壟斷后,由于商業競爭等原因不將算法進行公開,由此帶來的算法上的不透明將會導致社會力量難以對其監督,產生技術不當使用、算法惡意利用或不當得利等問題。這方面的先例有YouTube智能推薦算法引發的“艾莎門”事件,滴滴出行等網絡平臺的“大數據殺熟”事件等,這些都體現了算法上的不透明使得消費者乃至公眾利益受到侵犯時人們不能及時有效地作出應對。因此,未來的人工智能發展應在技術的開源與透明化上下功夫。區塊鏈技術或許可成為備選方案,其擁有去中心化、開放等優點,能夠更好地保障算法的透明度。目前,基于區塊鏈的人工智能處于探索階段,已有不少專業人士提出了此類設想[14]。
作為一門新興學科,人工智能在發展歷程中歷經坎坷,并在不斷的失敗中找尋未來的發展方向。人工智能在算法、算力與數據的帶動下正在高速發展并不斷取得新的突破,并在未來會變得更加強大,其影響也將更具革命性。因此,我們應在道德與法律的指引下不斷推動人工智能發展,并使人工智能技術真正起到助力經濟建設、推動社會發展的作用,從而使之更好地造福人類社會。