徐貴寶 中國信息通信研究院技術與標準研究所高級工程師
網絡技術——互聯網新技術、新應用專題
人工智能技術體系架構探討
徐貴寶 中國信息通信研究院技術與標準研究所高級工程師
通過人工智能的定義及其與人類智能的關系,討論了人工智能的內涵。在此基礎上,提出了一個包含核心層與關鍵技術層兩層的人工智能體系架構,并對體系架構中的算法理論、感知環節、思考環節、行動環節等進行了描述。
人工智能;技術體系架構;核心層;關鍵技術
人工智能概念是在1956年達特茅斯會議上首次正式提出的,但當時并沒有給出具體的定義。此后的60年時間里,出現過各種各樣的概念,但這些概念并沒有獲得業界的普遍認可。在此期間,人工智能經過不斷的發展,從計算智能時代發展到感知智能時代,現在發展到認知智能時代;主流學派從符號學派到控制學派,然后又到連接學派;主流技術方案從機器定理證明到專家系統,再到神經網絡、深度學習。但是,不管是哪個時代、哪個流派,都沒有提出過人工智能的技術體系架構,這不僅造成了人工智能領域散亂發展的形象,也造成了各領域對人工智能無法形成清晰的認識,雖然目前人工智能正在進入新一波發展浪潮,但仍然存在無法快速進行產業轉化的發展困境。因此,非常有必要梳理出來一個人工智能的技術體系架構,從而使得業界能夠對人工智能有一個總體的認識,進一步推動人工智能的技術應用和產業發展。
2.1 人工智能的定義
為了便于分析和理解人工智能的技術體系架構,先來看一下人工智能的概念。
麥卡錫在1956年的達特茅斯會議上提出人工智能概念時,曾經表示:“人工智能就是要讓機器的行為看起來就像是人所表現出的智能行為一樣”,這可以說是人工智能概念的最初解釋。
美國全國科學院院士、動態規劃的創始人貝爾曼1978年提出,人工智能是那些與人的思維、決策、問題求解和學習等有關活動的自動化。
斯坦福研究所人工智能中心主任N.J尼爾遜1998提出,人工智能是關于知識的學科——怎樣表示知識以及怎樣獲得知識并使用知識的科學。
谷歌未來科學家雷·庫茲韋爾認為,人工智能是一種創建機器的技藝,使機器能夠執行需要人的智能才能完成的功能。
百度百科中關于人工智能的定義是:“人工智能是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。”
從定義中可以分析出,人工智能的主體是“機器(或者計算機)”,客體是“人類的智力與行為能力(具體來說就是人類的感知、思考、行動等能力)”,途徑是“模擬、延伸和擴展”,目的是“使機器(或計算機)能夠執行需要人的智能才能完成的任務”。因此,不妨對人工智能提出如下定義:“人工智能是用機器模仿和實現人類的感知、思考、行動等人類智力與行為能力的科學與技術,目標在于模擬、延伸、拓展人的智慧與能力,使信息系統或機器勝任一些以往需要人類智能才能完成的復雜任務”。
2.2 人工智能與人類智能的關系
人類智能可以完成的復雜任務主要包括感知、思考、行動3個環節,人工智能實際上是機器(或計算機)對上述環節的模擬、延伸和拓展,也就是機器智能。不妨以功能比較全面的機器人作為人工智能的典型示例,將其與人類來做一個對應,從而對人工智能的內涵加以明確。
人類智能的感知環節包括視覺感知、聽覺感知、嗅覺感知、味覺感知、觸覺感知等,對應的人工智能就是機器視覺感知、機器聽覺感知、機器嗅覺感知、機器味覺感知、機器觸覺感知等。
人類智能的思考環節包括學習、思維、理解等,對應的人工智能就是機器思維、機器理解、機器學習等。
人類智能的行動環節包括語言、表情、動作等,對應的人工智能就是聲音合成、情感計算與智能控制。
因此,如果將人類智能看作是以人腦為基礎的神經計算與控制,人工智能實際上就是以機器存儲為基礎的機器計算與控制。人工智能與人類智能的關系參見圖1。
3.1 基本架構
按照人工智能的定義及其與人類智能之間的關系,人工智能就是要模擬與實現人類智能,這就涉及到機器在感知、思考、行動這幾個主要環節的能力實現方面所涉及到的關鍵技術。
在感知環節,所涉及的關鍵技術包括機器聽覺、機器視覺、機器嗅覺、機器味覺、機器觸覺等。
在思考環節,所涉及的關鍵技術包括機器學習、機器理解、機器思維等。
在行動環節,所涉及的關鍵技術包括聲音合成、情感計算、智能控制等。
對于人類智能——也就是基于人腦的神經計算和控制來說,其能力和智力的提升主要是依賴學習和理解,而學習與理解的核心是算法。對于人工智能——也就是基于機器存儲為基礎的機器計算與控制來說,其能力與智力的提升也主要是依賴機器學習和機器理解,因而其核心也是機器算法和理論。
根據上述人工智能的內涵及上述論述,可以考慮列出一個人工智能技術體系架構,具體參見圖2。該架構包括兩個層面,其中感知、思考、行動等環節的模擬和實現技術屬于關鍵技術層,算法理論屬于核心技術層。

圖1 人工智能與人類智能的關系
3.2 算法理論
之所以將算法理論列為人工智能技術體系架構的核心層,主要是人工智能首要考慮的問題就是算法。算法理論主要涉及最早出現的機器定理證明和后來出現的專家系統、神經網絡、深度學習,以及剛剛開始發展的類腦智能等,算法理論模塊參見圖3。
人工智能中最先應用的算法是機器定理證明以及其他類似問題的求解,這是由于在人工智能發展初期,符號主義學派認為人的智能主要體現在具有推理和思考能力,因此也就自然而然地將機器定理證明作為了人工智能研究的第一個切入點,并將相關成果應用于問題求解、自然語言理解、程序驗證和自動程序設計等方面。至于回歸算法、基于實例的算法、貝葉斯方法、正則化方法、聚類算法、基于核的算法、降低緯度算法以及專家系統等,都是不具備學習能力的算法。集成算法是將多種算法結合起來,綜合運用于人工智能之中。
決策樹學習、關聯規則學習等屬于具備學習能力的算法,但效率上相對較低。人工神經網絡是借鑒了人類神經計算的原理而形成的算法,其效率得到了大幅度提高。深度學習是在人工智能神經網絡的基礎上,通過構建多隱層神經網絡模型和海量訓練數據,來學習更有用的特征,最終提升分析準確性,具備了自動學習數據特征的能力,尤其適用于包含少量未標識數據的大數據集。由于深度學習采用層次網絡結構進行逐層特征變換,將樣本的特征表示變換到一個新的特征空間,從而使分類或預測更加容易,也使其成為了推動本次人工智能浪潮的熱點。

圖3 算法理論模塊

圖2 人工智能技術體系架構
由于神經網絡和深度學習都只是剛剛采用了一點點的腦科學與神經科學中的研究成果,就使得人工智能發展獲得了如此顯著的進步,因此人們相信,大腦中還有非常非常多的計算與控制機制可供人工智能借鑒,這也是業界普遍關注類腦智能的最主要原因。目前的類腦智能研究,主要是借鑒大腦中“內存與計算單元合一”等信息處理基本規律,在硬件實現與軟件算法等多個層面,對于現有的計算體系與系統做出本質的變革,從而實現在計算能耗、計算能力與計算效率等諸多方面的大幅改進。就網絡連接模式比較而言,深度學習是從宏觀角度利用了腦區間的鏈路及其協同特性,而類腦智能則是從微觀角度利用神經元、突觸的工作機制及其特性,深度學習與類腦智能的比較參見圖4。

圖4 深度學習與類腦智能的比較
3.3 感知環節
感知環節包括及其感知所涉及的關鍵技術,主要實現對人的感知能力的模擬和拓展,包括對人的聽覺、視覺、觸覺、嗅覺、味覺等,實現數據的采集和初步處理(見圖5)。由于技術發展的階段性問題,人工智能在很多方面并沒有完成人類感知的所有功能;另一方面,由于人類通過技術實現可以讓機器設備探測到一些人類所不能感知到的現象,因此目前機器感知能力已經有很多方面甚至超越了人類,今后還會有越來越多人工智能發展出比人類更強的機器感知能力。
機器聽覺技術主要實現聲音識別,現階段主要是人類語音識別,而且語音識別已經成為車載語音、智能家居、人機交互、機器同聲傳譯等應用的基礎。
機器視覺技術主要實現圖像識別和視頻識別等,是在自動駕駛、物體檢測等領域發展的基礎。在圖像識別領域,指紋識別已經是一種非常成熟的技術,目前的重點是人臉識別和虹膜識別。在視頻識別領域,主要關注的是動態圖像,目前的重點為體感識別。
機器觸覺技術是一種復合傳感技術,是機器通過自身表面的溫度覺、力覺等傳感器提供的復合信息,來識別物體的冷熱、尺寸、柔軟度、表面形狀、表面紋理等特征。相關技術包括壓電式觸覺傳感技術、壓阻式陣列觸覺傳感技術、成像型觸覺傳感技術、超大規模集成計算傳感陣列技術等。目前,溫度感知和壓力感知技術已經基本成熟,并獲得了廣泛應用;材質感知等技術尚處于研究過程中。

圖5 感知環節關鍵技術
嗅覺感知和味覺感知技術主要是分子層面的感知識別,將會在危險物檢測、礦床探測、食品衛生服務等領域大顯身手。但目前嗅覺感知技術剛剛開始發展,而味覺感知技術還未開始研究。
3.4 思考環節
思考環節主要是對利用算法理論的實現人工智能對知識的學習、對問題的思考和對現象的理解等。因此,該環節主要包括機器學習、機器思維、機器理解等部分(見圖6)。
機器學習部分主要是將所獲得的數據信息利用貝葉斯方法、關聯規則學習、神經網絡、深度學習、類腦智能等高級算法理論來進行處理,挖掘出有價值規律性的知識,提升人工智能的思維和理解能力。
機器理解部分主要是利用一些高級算法來理解所獲得的數據含義,主要包括聲音理解、自然語言理解、圖形圖像理解、運動影像理解、行為動作理解等。目前,RNN(回歸神經網絡)、DNN(深度神經網絡)、LSTM(長短記憶神經網絡)已成為常用的語音識別算法。而在諸多機器視覺技術中,卷積神經網絡(CNN)被人們普遍認為是一種更容易被訓練并且具有更好泛化能力的前饋網絡,已經廣泛運用于自然圖像、指紋、人臉以及物體的檢測之中。

圖6 思考環節關鍵技術
機器思維部分主要是在已經獲得的知識的基礎上,利用回歸算法、基于實例的算法、貝葉斯方法、正則化方法、聚類算法、基于核的算法、降低緯度算法、專家系統以及決策樹學習等算法進行推理,從而得出問題求解、智能搜索、自動規劃、輔助決策、程序驗證和自動程序設計等需要解決的問題的答案。
3.5 行動環節
行動環節主要是實現思考環節的結果輸出、執行與控制,包括決策執行、聲音合成(尤其是自然語音合成)、智能控制、情感表達等(見圖7)。

圖7 行動環節關鍵技術
決策執行概念比較寬泛,依據各自不同的需求執行具體的動作。
聲音合成技術目前已經基本成熟,通過數字化頻率控制,可以將聲音惟妙惟肖地模仿出來。尤其是自然語音合成(TTS)技術能將任意文字信息實時轉化為標準流暢的語音朗讀出來,其技術原理如圖8所示。自然語音合成技術在與聲紋技術的結合后,還可以逼真地模仿出各個人物的聲音。
智能控制包括平衡控制、動作控制等。智能控制(尤其是工業智能控制)在與通信系統的結合后,甚至已經能夠實現遠程智能控制與服務。目前,智能控制技術已經在生產制造領域已經獲得了較大范圍的應用,智能設備以及各類生產型機器人開始在工廠車間出現,甚至出現了無人車間、智能空調、掃地機器人以及其他一些社會服務性機器人也已經陸續產品化。
情感表達主要是讓機器人能夠表達人類的喜、怒、哀、樂、悲、憂等情感,主要用于類人服務機器人,也是目前人工智能領域的研究熱點之一。但由于人類情感表達方式比較復雜,情感識別比較困難,情感計算技術還未獲得本質的突破,情感表達技術還與材料等有很直接的關系,因此情感表達技術雖然已經開始研究,但還尚未取得顯著的進展。

圖8 自然語音合成技術原理
通過建立人工智能技術體系架構,可以理清人工智能技術發展的瓶頸,明確人工智能技術發展路線,促進人工智能的應用,使人工智能研究和應用領域形成共識,從而推動人工智能的持續發展。
[1]KurzweilRay.奇點臨近[M].李慶誠,董振華,田源譯.北京:機械工業出版社,2011,10,1.
[2]徐貴寶.語音控制互聯網交互及其關鍵技術研究[J].電信網技術,2013,01∶31-35.
Atechnological architecture of artificial intelligence
XUGuibao
The connotation of artificial intelligence is clarified firstly by discussing of the definition of artificial intelligenceand its relationship with the human intelligence. Then with this base, a two- layer technological architecture of ArtificialIntelligence is brought with the core layer and the key technology layer. Final, blocks of algorithm and theory, perception,thinking, action are described in detail.
artificial intelligence;technological architecture;core layer;key technology(
2016-11-20)