過馨露
摘 要:人工智能涉及的技術繁多,應用領域廣泛。人工智能技術的核心思想是為訓練集找到一個優化的擬合函數,用以對數據進行預測和分類。從主流技術出發,介紹了不同技術的應用場景,闡述了人工智能技術的核心思想,梳理了不同模型和算法的共性,從而提高學習和應用效率。
關鍵詞:人工智能;機器學習;語音識別;圖像識別
DOIDOI:10.11907/rjdk.173262
中圖分類號:TP3-0
文獻標識碼:A 文章編號:1672-7800(2018)002-0035-03
0 引言
隨著AlphaGo打敗圍棋大師李世石,人工智能逐漸進入了人們的視野。如果說AlphaGo還是基于人類經驗的學習,那么AlphaZero的成功則是顛覆人們認知的,人工智能機器能夠從零開始學習,完全不需要人類經驗的介入,其技術的發展甚至讓人產生了一些恐懼。面對這日新月異的技術革新,國務院發布了《新一代人工智能發展規劃》,將人工智能技術提到了國家發展戰略的高度[1]。其后,教育部考試中心又將Python這一人工智能領域最通用的編程語言納入了全國計算機二級考試科目,全國各地也紛紛將Python加入高考科目,這說明我國進入了人工智能時代。
人工智能概念最早由麥卡賽等[2]于1956年提出,20世紀90年代初發展到了頂峰,然而,受當時神經網絡技術的限制,又一度陷入低迷[3]。2000年,Sharma等 [4]的實驗發現鼬鼠的視覺和聽覺算法是相通的,這給了研究者很大的啟發。其后多個實驗證明,人類的很多活動是靠大腦后天習得的,因而大腦學習算法成為研究的熱點[5-6]。2006年,Hinton等 [7]開發出了高效的深度學習算法,打破了原先神經網絡算法的限制,使得人工智能研究再次成為焦點。
1 人工智能實現方式
目前的人工智能處于弱人工智能階段。所謂弱人工智能是指機器能夠智能學習一些事物的規律,但其本身并沒有人類的知覺和思維。
弱人工智能階段,機器實現智能化主要有兩種方式:①事先給定某種數據處理的規則,機器按照既定的規則編寫程序,處理指定的任務。這種方式從結果上看,機器智能地完成了給定的任務,但實際上其處理數據的過程采用的邏輯并非機器本身習得,而是人為規定的;②另一種方式恰好與之相反,事先并未給機器指定任何規則,而是給機器提供大量與指定任務相關的數據,機器自己通過某種處理方式,從數據中找出規律,并習得解決問題的邏輯,從而完成指定的任務,后者稱為機器學習[8-9]。
舉例來說,想讓機器具有識別鹿的能力有兩種方式,第一種是給定規則的,即需要事先告訴機器,鹿的特征是頭上有角、四條腿、有尾巴等等,然后讓機器將滿足給定特征的圖片識別為鹿。第二種方式是不給定規則,即并未告訴機器鹿有哪些特征,但是提供給機器10萬張關于鹿的圖片,讓機器自己從這些圖片中學習到鹿的特征是頭上有角、四條腿、有尾巴等等,從而具有從不同動物的圖片中識別出鹿的能力。前一種方法會受到人類經驗的限制,也就是說事先給定的規則越多,識別越準確。而事先若提供了錯誤的規則,那么機器無法自行更正。而后一種方法則不受人類經驗的限制,只要提供訓練的數據越充分識別就越準確。因而,機器學習是人工智能研究的重點內容。
2 機器學習
機器學習的本質是數據與算法以及模型的總和。若要讓機器獲得區分鹿和馬的智能,必須具備3個要素。
2.1 數據
數據就是需要準備大量的關于鹿和馬的圖片,并且給這些圖片打上對應的標簽,標明哪個是鹿,哪個是馬,用于訓練機器,讓其自行獲得鹿和馬的特征區別,從而能夠準確地區分鹿和馬。這里需要強調的是,圖片的數量必須多。因為我們知道,鹿與馬有許多相似的特征,例如都有四條腿、都有尾巴、體表都無絨毛等。當數據量不夠充分時,這些相似的特征將會覆蓋各自獨有的特征,例如鹿頭上有角,而馬頭上沒有角等,從而使機器無法準確區分出兩種動物的差別。機器對于鹿或馬的識別是以概率的形式存在的,也就是說,如果給定一張鹿的圖片,即使在數量足夠充分的情況下,還是會有一定的概率將其識別為馬。而數據量越大,識別為馬的概率越低,而識別為鹿的概率越接近于1,測試結果就越準確。
2.2 算法
機器學習根據其學習算法的層次深度,分為淺層學習和深度學習。
淺層學習在其模型中一般不含隱含層或只有一層隱含層。常見的淺層學習有線性回歸、隨機森林、K-mean等,淺層學習主要用于預測數據走向、進行數據分類、實現智能推薦系統等領域[8-9]。
深度學習含有較多的隱含層,因而能夠完成更復雜的學習任務,目前的研究熱點主要有CNN和RNN兩種[8-10]。CNN稱為卷積神經網絡,是通過卷積操作提取數據的特征值,從而降低冗余信息的噪音,提高計算效率,主要應用于圖像識別領域。RNN稱為遞歸神經網絡,該網絡能夠記住過去的信息,可處理具有時序性的數據,主要應用于語音識別等領域。
無論使用哪種算法,其基本原理都是一致的。仍以鹿馬識別為例說明算法的實現方式。用函數Y=f(W,x,b)表示圖片與其對應動物的相關性,其中,x表示向機器輸入的各種關于鹿和馬的圖片,Y表示圖片所對應的標簽,即圖片顯示的是鹿還是馬的標識,W和b是一組參數,W表示權重,即圖片對應于鹿或馬的概率,而b表示權重,即對識別結果的修正,W和b這組參數是未知的,正是需要機器自行學習才能獲得。
2.3 模型
模型就是將事先提供的關于鹿和馬的圖片數據代入到算法中,對其函數模型進行訓練,不斷迭代,得到最優的參數W和b,完成訓練,確定出函數Y=f(W,x,b)關系。在訓練集數據以外再提供一系列關于鹿和馬的圖片數據,代入確定的函數中,輸出該圖片到底是鹿還是馬,用于測試模型的準確率。endprint
人工智能的根本目標是通過數據、算法、模型的有機結合與不斷優化,獲得一個良好的擬合函數Y=f(W,x,b),使得該函數能夠在未知的數據集上有良好的預測表現,如圖1所示。算法優化的最終目的也是為了提高擬合函數的精度,降低計算的復雜度。
3 人工智能應用場景
目前,人工智能已應用到政務、公安、交通、環境、醫療、金融、教育等諸多領域。應用由技術衍生而來,人工智能的主流技術分類并不復雜。表1展示了美國與中國在人工智能領域申請專利的細分領域所占百分比[11]。從表中可以看出,人工智能的應用場景主要對應于機器人、語音識別、圖像識別等技術。下面從主流技術角度進行分類,探究人工智能的應用場景。
3.1 機器人應用
機器人,顧名思義就是要制造出可以模仿人類各種行為舉止的機器[12-14]。目前機器人已經能夠模仿人類的很多動作,除了基本的跑、跳、翻轉外,還可進行細致作業,如開瓶蓋等。圖2展示了本田于2011年發布的“ASIMO2011”機器人[15],他具有視覺和觸覺的識別功能,能根據人類發出的指令完成任務。當然,若要實現機器人對人類的完全仿真,還有很長的路要走。
3.2 語音識別應用
語音識別就是將語音轉化成文本的技術,包括對語義的分析和識別[15-16]。2013年,Hinton與微軟合作開發的同聲傳譯,其錯誤率已經低至17.7%[17]。截止到2016年,運用神經網絡算法制成的同聲速記已經能夠達到95%的準確率,打敗了人類速記員[15]。在語義分詞分析方面,神經網絡算法也有很好的表現。例如,谷歌的翻譯系統目前已經可以完勝人類翻譯。此外,語音識別還被廣泛應用于對話機器人,如Siri等。機器能夠通過對自然語言的學習,識別出語音的含義,并作出合理的回答,從而實現人機對話。將語音識別與家居相結合,則可以實現語音控制,免除了對遙控器的依賴[18]。
3.3 圖像識別應用
圖像識別的重要應用之一便是人臉識別[15]。截止2015年,基于神經網絡的人臉識別已達到99.53%的準確率,超過了人類識別的97.53%[19]。目前,人臉識別已應用于諸多場景,如FaceU等美顏相機,可通過面部的精準捕獲進行圖片美化。圖像識別還可應用于交通方面,攝像頭獲取的車輛圖片可用于識別車輛信息及車牌號。在無人車方面,可通過圖像識別技術判斷行車路線、躲避障礙物等。
4 結語
本文詳細介紹了人工智能的核心思想,數據、算法與模型,介紹了機器學習、神經網絡的基本概念,展示了人工智能的應用場景。人工智能的發展,必將給人們的生活帶來巨大的變化,我們應以擁抱變革的心態迎接新的技術,實現可持續發展。
參考文獻:
[1] 國務院.新一代人工智能發展規劃[EB/OL]. http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.
[2] 沈威.國內人工智能應用研究進展[J].軟件導刊,2007(2):11-12.
[3] 顧險峰.人工智能的歷史回顧和發展現狀[J].自然雜志,2016,38(3):157-166.
[4] SHARMA J, ANGELUCCI A, SUR M. Induction of visual orientationmodules in auditory cortex [J]. Nature, 2000(404):841-847.
[5] VUILLERME N, CUISINIER R. Sensory supplementation through tongue electrotactile stimulation to preserve head stabilization in space in the absence of vision [J]. Investigative Ophthalmology & Visual Science, 2008, 50(1):476-811.
[6] 鐘義信.人工智能:概念·方法·機遇[J].科學通報,2017,62(22):2473-2479.
[7] RUMELHART D E, HINTON G E, WILLIAMS R J. Learning representations by back propagating errors [J]. Nature, 1986,323(6088):533-536.
[8] 張潤,王永濱.機器學習及其算法和發展研究[J].中國傳媒大學學報:自然科學版, 2016, 23(2):10-24.
[9] 何清,李寧,羅文娟,等.大數據下的機器學習算法綜述[J].模式識別與人工智能,2014,27(4):327-336.
[10] 尹寶才,王文通,王立春.深度學習研究綜述[J].北京工業大學學報,2015,41(1):48-59.
[11] 李尊.為什么說目前人工智能主要應用在這七個領域 [EB/OL] . https://www.leiphone.com/news/201610/v4WFmCMykIztIWpG.html.
[12] 劉建軍.淺談人工智能應用[J].現代工業經濟和信息化,2013(52):74-75.
[13] 王國彪,陳殿生,陳科位,等.仿生機器人研究現狀與發展趨勢[J].機械工程學報,2015,51(13):27-44.
[14] HONDA. Honda Corporation again published new ASIMO robot after four years[J]. Sensor World,2011(11):38-39.
[15] 章毅,郭泉,王建勇.大數據分析的神經網絡方法[J].工程科學與技術,2017,49(1):9-18.
[16] 黎亞雄,張堅強,潘登,等.基于RNN-RBM語言模型的語音識別研究[J].計算機研究與發展,2014, 51(9):1936-1944.
[17] GRAVES A, MOHAMED A, HINTON G. Speech recognition with deep recurrent neural networks[C]. Proceedings of 2013 IEEE International Conference on Acoustics, Speech and Signal Processing.Vancouver: IEEE, 2013:6645-6649.
[18] 劉榮輝,彭世國,劉國.基于智能家居控制的嵌入式語音識別系統[J].廣東工業大學學報,2014,31(2):49-53.
[19] SUN YI,LIANG DING,WANG XIAOGANG,et al. Deepid3: face recognition with very deep neural networks[J]. Computer Science,2015(150):873-875.endprint