蘭州大學信息科學與工程學院 郭 睿 宋忠江
人工智能是集控制論、信息論、計算機科學、神經生理學、語言教育學、哲學、心理學、醫學、數理邏輯及模糊數學等多個學科領域互相滲透而成的交叉學科,其研究目標是使機器更加智能,更具有人腦智慧,從而具有識別事物、學習知識、解決實際問題的能力[1]。人工智能技術一般由認知、預測、決策和集成解決方案這四個部分組成,它的研究領域也在不斷擴大,研究的分支包括專家系統、機器學習、進化計算、模糊邏輯、計算機視覺、自然語言處理等。
機器學習是人工智能研究的核心,也是使計算機具備人工智能的根本途徑。在信息時代,信息咆哮現象尤為顯著。網絡中每天都會生成海量的數字化數據,如數字化的聊天記錄、網頁瀏覽記錄等。針對這些海量數據,大數據處理方式必將成為研究的熱門話題。在這種數據爆炸的環境下,如何對海量數據進行處理并依據嚴密的數學定理攝取其中有價值的信息顯得尤為重要,機器學習在日后的學科研究中必將獨有其重[2]。
機器學習是基于嚴格的數學理論經眾多領域的學科交叉融合而成[2],其本質是通過運用計算機強大的運算能力及數據處理能力,借由大批的數據進行訓練,使計算機具備自發模仿人類學習行為,通過學習獲取經驗和知識,在不斷地改進自身性能的同時實現人工智能的能力。針對某種情形或事物所采集的用于訓練的數據樣本集是對其直觀上的描繪,其中包含著大量和該情形或事物相關的先驗經驗和知識[3]。
機器學習的發展經歷了三個階段——“只具有邏輯并不能使機器具有智能,具備智能的同時還必須兼具先驗知識”的萌芽階段、“機器自發學習的設想逐漸成型,從樣本集中主動提取經驗和知識成為可能”的發展階段、“機器學習成為一個獨立的學科分支并開始迅速成長”的機器學習算法呈現多元化的繁榮階段[2]。如今,機器學習持續高溫發展,并已衍生出了數據挖掘、生物信息學、深度學習、語音識別等許多分支,眾多機器學習算法被廣泛應用到信息處理特別是互聯網時代所帶來的海量數據的分析處理當中。
傳統的機器學習算法在指紋識別、基于HoG特征的物體檢測等范疇的運用基本達到了商業化的要求或特定場景的商業化水平,但每前進一步都異常艱難,直到深度學習算法的出現。
自2006年以來,機器學習領域中的“深度學習”課題開始受到學術界的普遍關注,到今天已經成為互聯網大數據的人工智能的浪潮。深度學習的本質是通過構建具有海量的訓練數據和許多隱層的機器學習模型,來學習更多有用的特征,從而最終提高分類或預測的準確性。因此,“深度模型”是手段,“特征學習”是目的。從對實際應用的貢獻來看,深度學習在語音圖像的智能識別和理解方面取得了驚人的進展,從而推動了人工智能和人機交互的大幅度前進,這可能是近這十年來機器學習領域最成功的研究方向[4]。
目前,業界有一種較為普遍的錯誤的認識,即“深度學習最終可能會淘汰掉其他所有的機器學習算法”。這種意識的出現主要是因為當前深度學習在計算機視覺和自然語言處理方面的應用遠遠超過其他傳統的機器學習方法,并且媒體對深度學習進行了眾多夸大的報道。深度學習并不意味著是機器學習的終點,其目前主要存在著以下三個問題:
其一,深度學習模型需要大批的訓練數據才可以顯示出神奇的效果,但在現實生活中經常會遇到小樣本問題,此時深度學習方法無法入手,傳統的機器學習方法卻可以很好地解決;
其二,某些領域采用簡單的傳統的機器學習方法就可以很好地解決,不必一定使用復雜的深度學習方法;
其三,深度學習的思想來源于人腦的啟發,但絕對不是人腦的模擬,因為人類的學習過程往往不需要大批的訓練數據。
近年來,機器學習在很多需要“智能”的領域都取得了非常大的成功,如信貸決策、醫學診斷、天氣預報、城鄉規劃設計、智慧教育、太空探索等。例如,在智慧教育方面,機器學習通過對數據進行自動化分析來發現新知識,實現了在傳統教育中人工難以完成的功能,其應用主要集中于學生建模、失學風險預警、學習行為預測、資源推薦和學習支持評測等方面[5];在城鄉規劃設計方面,機器學習對于非結構性信息的提取和結構性預測模型的結合,可對社會經濟、交通運輸、土地資源利用、產業發展等多目標約束下的發展愿景進行更精細的模擬推演,并逐步實現從靜態分裂的藍圖片段向動態連續的協同化數字平臺成果的轉變,進而將規劃師從繁重的素材梳理、編排、抄寫等高強度工作中解脫出來,更好地發揮人類獨有的創意和思辨能力[6]。
同時,機器學習也漸漸參與到計算機的“底層”研究設計中,如編譯器、處理器及軟件工程等方面的設計開發工作都參照了機器學習理論,同時分布式系統、新的編程語言、面向機器學習的處理器芯片也已經逐步開始借鑒機器學習模型,從而對自身的邏輯設計模式進行不斷學習和改進,眾多互聯網公司更是盡心竭力地興建相關實驗室和招攬人才以研究機器學習的理論并將其投入實際應用中[7]。
在機器學習模型方面,深度人工神經網絡模型近年來取得了很大成功,關注度增長非常迅速,但歷史發展中也同樣曾存在過神經網絡的冷熱交替,因此從長遠來看機器學習的發展道路應當是多種模型優勢互補、強強聯手、螺旋上升[7]。
機器學習的發展前景相當可觀。人工智能技術受機器學習在眾多領域突破性發展的影響,已在實際生活中得到普遍應用,并吸引了眾多專家學者積極投入其中并開展研究,如近年來正在如火如荼開展的人工智能醫療影像研究,這都是機器學習促進人工智能技術推廣應用的表現。
從當前的趨勢來看,接下來機器學習的發展將主要集中在兩個方面展開[2]:
其一是在神經生物學方面,從人類自身出發找出大腦本身的生物學習機制,進而繼續加強對人腦學習動作的探索研究,最終實現對人腦自主學習體系的數字化呈現并應用于機器學習領域;
其二是在算法方面,一方面開展對現有算法的優化和全新算法的開發,與此同時加強各類機器學習算法的聯系統一,避免使用單一算法導致限制系統性能情況的出現;另一方面建立切實可行的算法應用系統,特別是結合當下互聯網時代的背景,對多種學習算法的一體化和集成化進行進一步探索,使眾多的機器算法走出“象牙塔”。這兩個方面的進步都將推動人工智能技術的升級,使其能夠脫離龐大數據庫和程序算法的限制。
雖然機器學習對未來社會的發展至關重要,但并不是沒有自己的挑戰。一方面,機器學習算法的開發和部署在很大程度上都依賴于大量的計算和存儲資源來執行其任務,這種依賴關系使得它們在執行時受限于大數據和云服務。因此,在執行邊緣計算機集成解決方案時它們更具挑戰性。另一方面,機器學習在某些方面具有不透明性。隨著算法復雜化程度的提高,人類越來越難以解釋它們是如何做出決定的。在做出一些關鍵性決定時,它們的透明性是非常重要的。此外還存在一些偏見問題,機器學習往往會吸收它們在接受訓練時數據中包含的一些傾向與習慣,在某些情況下,它們的極深的嵌入度使得人類往往難以察覺和消除。
機器學習在推動人工智能技術革命進步的過程中提供了強大助力,必將在未來的信息化社會取得更為矚目的成就。對此,我認為有以下趨勢:
機器智能終將無法全面超越人類智能。隨著機器學習領域的不斷進步,計算機借由其自身強大的數據運算和存儲能力,對于完成學習人類歷史發展過程中所積累的完整知識的能力將會愈加強大,借助完整的知識庫進行精細預測復雜事務和準確判斷的能力將會全面超越人類。由此可推斷,將來不僅僅是簡單瑣碎的手工、體力勞動將會被機器完全取代,那些需要評估、判斷并預測復雜事務的工作如財務投資和企業管理等也很有可能被機器智能所取代。但同時,與機器相比,人類的最大優勢在于邏輯推理能力和想象創造力。盡管機器智能在未來很可能在某些方面完全超越人類智能,但目前現有的機器學習模型卻不能模仿人類的想象創造力,科學研究和發明創造仍將是人類的最大優勢,社會對每個人的知識積累和發明創造的要求將會隨之越來越高。所以,就目前而言,機器智能全面超越人類智能的預測將不會成為現實[3]。
數據飛輪、算法經濟以及云端人工智能將得到重大發展。當更多的數據日漸產生,提取、存儲和計算數據的成本也隨之下降后,機器學習將開始向云端遷移,其中的機器智能基石將在云端實現,由此產生了算法經濟。在云上,可擴展網絡服務是隨時可用的應用程序接口。相關科學家不再需要編寫自定義的代碼或管理基礎設施,系統將會自動實現這些功能并實時產生新的所需模型,并以最快速度提供更準確的結果。但同時,機器學習也將從云端走向各類本地智能終端、傳感器等設備,云端和本地的機器學習將有機結合。正在涌現的機器智能平臺可以采用以模型作為服務的方式,托管已得到預訓練的機器學習模型,從而使企業能夠更容易地進行機器學習,大規模利用算法智能,從而快速地將應用從原型轉化為產品[8][10]。
機器智能和進化論將聯系發展。在機器學習日漸過渡邁向自主無監督學習,并且在將來形成自主智能時,機器智能自身也將適應達爾文的進化論而具有進化能力,順應適應環境、適者生存的自然規律。將來許多人類行為會被機器日漸取代,人類也許會由于機器智能帶來的互補和競爭而呈現人口減少的趨勢[9]。
倫理、“智控”問題逐漸凸顯。當機器學習還是以監督為主時,機器智能比較容易“受控”。但當機器智能全面邁向無監督學習時,人類將很難繼續控制機器只會自發學習對人類友好有利的知識,這樣很有可能會使機器學習出對人類而言有害的知識。雖然機器智能在很多方面能夠幫助人類,但與此同時機器智能與人類智能的結合也可能會產生負面的影響,甚至引發社會倫理問題[9]。
推理、學習和聯想是如今的人工智能技術中最主要的三大功能[10],推理和聯想的功能都需要通過學習功能的完善來提高。機器學習是人工智能領域發展的基礎,只有不斷完善機器學習的研究,才能使人工智能領域尤其是人機系統發揮巨大的力量。因此,把握機器學習的發展趨勢并進行相應的深入探究,對自主學習過程進行具體歸納分析,并將各類機器學習算法的內在數學原理提高到靈活應用的高度,通過訓練數據樣本集使未來的計算機具備持續自主學習的能力并能自發提升水平,將對人工智能的推動發展產生強大的助力,實現人工智能在更廣闊領域的實際應用,從而為未來社會經濟的發展提供持續動力。
[1]曹雪.機器學習——人工智能革命的助推劑[J].電子技術與軟件工程,2017,(13):255.
[2]余殷博.基于人工智能下的機器學習歷史及展望[J].電子技術與軟件工程,2017,(04):129.
[3]龔怡宏.人工智能是否終將超越人類智能——基于機器學習與人腦認知基本原理的探討[J].人民論壇·學術前沿,2016,(07):12-21.
[4]余凱,賈磊,陳雨強,徐偉.深度學習的昨天、今天和明天[J].計算機研究與發展,2013,50(09):1799-1804.
[5]余明華,馮翔,祝智庭.人工智能視域下機器學習的教育應用與創新探索[J].遠程教育雜志,2017,35(03):11-21.
[6]黃鼎曦.基于機器學習的人工智能輔助規劃前景展望[J].城市發展研究,2017,24(05):50-55.
[7]祝葉華.人工智能革命“助燃劑”:機器學習[J].科技導報,2016,34(07):64-66.
[8]朱煥.2016機器學習三大趨勢:算法經濟將引導人工智能走向何方?[A].科學與現代化,2017(1)(總第070期)2017:8.
[9]黃廣斌.智能革命:人工智能、機器學習、生物學習和智能材料的合力[J].軟件和集成電路,2017,(04):18-24.
[10]姜雅慧.人工智能中的機器學習研究[J].計算機光盤軟件與應用,2013,16(21):237-239.