
人工智能核心產業是基于人工智能技術本身,由對外提供的產品和服務所構成的產業,主要包含對外提供的產品、以平臺的方式對外提供的服務、人工智能解決方案和集成服務三種類型,也是人工智能技術最直接的落地形式。人工智能應用帶動產業是指人工智能技術與其他傳統產業相結合,在傳統產業基礎上打造的新一代的智能產業,人工智能應用帶動產業更多體現了人工智能的帶動性。
人工智能技術內涵
(一)人工智能的定義
馬文·明斯基:將人工智能定義為讓機器做本需要人的智能才能做到的事情的一門科學。
約翰·麥卡錫:人工智能就是要讓機器的行為看起來就像是人所表現出的智能行為一樣。
美國麻省理工學院溫斯頓:“人工智能就是研究如何使計算機去做過去只有人才能做的智能工作?!?/p>
這些說法反映了人工智能學科的基本思想和基本內容,即人工智能是研究人類智能活動的規律,構造具有一定智能的人工系統,研究如何讓計算機去完成以往需要人的智力才能勝任的工作,也就是研究如何應用計算機的軟硬件來模擬人類某些智能行為的基本理論、方法和技術。
(二)人工智能的主要理論范式及技術演進
1.人工智能的發展的早期理論背景。上世紀40年代主要的理論包括:M-P模型,馮·諾伊曼自動機理論,維納控制論。其中,McCulloch和Pitts在人工神經網絡方面做出了突出貢獻,發表了《神經系統中所蘊含的思想的邏輯演算》,提出了形式神經元的數學描述和結構方法,建立了神經網絡最早的M-P模型。馮·諾依曼從上世紀40年代開始直到去世之前,一直是計算機和人工智能的領導者。當時,馮·諾伊曼在 Princeton大學聚集了一批計算理論、博弈理論、智能理論和機器人理論的未來領袖,包括麥卡錫、明斯基等,這些人后來成為人工智能的主要領導人物。
1953年,麥卡錫和香農在編輯《自動機研究》一書時與香農相互爭論。1956年,麥卡錫提出人工智能的概念,現在大部分認為人工智能的起源是1956年的達特茅斯會議,它是第一個以人工智能為名的會議,是在馮·諾依曼的支持下,明斯基和麥卡錫等人召開的。
20世紀50年代,真正重要的會議是美國東西部的計算機大會。分別由MIT和UCLA領導。早期,在M-P,馮·諾伊曼和明斯基的理解中,符號主義和聯結主義是統一的,但因為工程角度很難,線性異或問題很難發現,研究的領域越來越狹窄,人工智能發生了研究范式的分化。
2.人工智能的兩種范式的發展。符號主義和聯結主義平行發展,但在不同的歷史時期,兩種主義相繼占據主流地位:
第一代人工智能:符號主義,又稱邏輯主義和物理符號系統假設。符號主義是以邏輯作為工具,發展起來的人工智能一派理論。符號主
義在剛開始占據主流地位,是因為聯結主義所需要的算法算力數據三
大條件不具備。1969年明斯基和Papert在Perception當中,提出一個重大困難,即單層的MP模型解決不了異或(XOR)問題,造成了人工智能的第一低潮。在該時期,基于符號主義的專家系統,如深藍(Deep Blue)成為當時人工智能發展的典型代表,該系統是一個基于兩人零和組合博弈的人工智能系統,該系統的核心技術是麥卡錫發明的Alpha-Beta剪枝術和專家系統,在1997年戰勝了世界象棋冠軍卡斯帕羅夫。
符號主義沒有產生跟聯結主義一樣強大的工具,因為沒有聯結主義靈活。所以只有專家系統和深藍。而專家系統是在解決讓計算機認識世界的過程中遇到很多困難。第二代人工智能:聯結主義,是一種基于神經網絡及網絡間的連接機制與學習算法的智能模擬方法,核心是神經元網絡與深度學習,仿造人的神經系統,把人的神經系統的模型用計算的方式呈現,用它來仿造智能,目前人工智能的熱潮實際上是聯結主義的勝利。研究重點側重于模擬和實現人的認知過程中的感覺、直覺過程、形象思維、自學習過程。
聯結主義是以統計方法為基礎發展起來的人工智能一派理論。1986年,通過反向傳播(Back Propagation)的方法來訓練,多層感知機解決了單層感知機解決不了的問題,但由于算法、算力和數據三大條件依然均不具備,聯結主義的發展經歷了漫長的復興。上世紀90年代中期,由于核方法和圖模型的效果好于人工神經網絡(ANN),再加上基于ANN的創業公司無法實現其宣稱的預期效果,聯結主義進入第二次低潮。
2006年,Hinton發明了深度訓練網絡,使用的技術是貪婪逐層預訓練,起到了普及了深度學習的概念。深度學習復興了聯結主義。在2012,Hinton小組拿到了李飛飛創辦的ImageNet比賽的第一名。深度學習爆發了,聯結主義回歸。當時,算法、算力和數據得到極大發展,深度學習迎來了春天。2016年AlphaGo戰勝李世石,其核心技術是隨機二人零和組合博弈。其中的神經虛擬自我學習(NSFP),深度強化學習(DRL),蒙特卡洛樹搜索(MCTS),開啟了人工智能發展的新時代。
3.人工智能發展的技術約束條件:算法、硬件算力和數據。算法、數據和硬件算力組成了人工智能高速發展的三要素。三要素缺一不可。人工智能到最近才開始呈現爆發的主要是因為直到今日,人工智能的算法、數據和硬件才滿足了人工智能的基本需求。
第一個是優秀的算法,比如現在最流行的深度學習算法,就是近期人工智能領域中最大的突破之一,為人工智能的商業化帶來了希望;第二個是大量高性能硬件組成的計算能力,以前的硬件算力并不能滿足人工智能的需求,當GPU和人工智能結合后,人工智能才迎來了真正的高速發展;第三個是被收集的大量數據,數據是驅動人工智能取得更好的識別率和精準度的核心因素。以人臉識別為例,在2013年深度學習應用到人臉識別之前,各種方法的識別成功率只有不到93%,低于人眼的識別率95%,因此不具備商業價值。而隨著算法的更新,深度學習使得人臉識別的成功率提升到了97%。這才為人臉識別的應用奠定了商業化基礎。
算法方面,隨著深度學習理論和工程技術體系的成熟,包括通過云服務或者開源的方式向行業輸出技術,先進的算法被封裝為易于使用的產品和服務,越來越多的人和公司能夠開始使用這些算法。人工智能相關的技術包括了水平層和垂直層的技術,水平層面上主要體現在算法方面。進入互聯網時代后,才出現了大數據的高速發展與積累,這為人工智能的訓練學習過程奠定了良好的基礎。比如,在AlphaGo的學習過程中,核心數據是來自互聯網的3000萬例棋譜,而這些數據的積累是歷經了十多年互聯網行業的發展。所以直到今年,基于深度學習算法的 AlphaGo 才取得突破性進展。離開了這些棋譜數據的積累,機器戰勝人是無法實現的。
算力方面,云計算的興起起到了非常關鍵的作用。因為深度學習是極其消耗計算資源的,而通過云計算就可以以低成本獲取大規模的算力,動態地獲取幾千個CPU,甚至上萬個CPU的算力都很輕松。除了云計算之外,GPU計算的進步對深度學習也有很大的推動作用,它能夠加速深度學習中的計算速度,有些情況下甚至成百上千倍的提高。例如,現在深度學習的算法涉及到了大量可以并行化的矩陣運算,而GPU的工作方式就是多核并行計算流的方式,這個特點特別適合于人工智能領域中的計算。此外,一些面向人工智能的專用硬件架構也開始出現,比如說用FPGA去做專用的人工智能加速芯片和加速的基礎設施,微軟的數據中心就大量運用了FPGA技術。在二十年前,一個機器人,當時是用32個CPU, 達到120MHz的速度。現在的人工智能系統使用的是成百上千個GPU來提升的計算能力。這使得處理學習或者智能的能力得到比較大的增強。之前用CPU一個月才能出結果,然后再去調整參數,一年只能調整12次,也就是有12次迭代。 GPU產生后大幅提升了計算量,現在用GPU可以一天就出結果,這樣可以迭代得更快,這是技術大幅發展的條件。
數據方面,近年來由于移動互聯網的爆發,積累了大量的數據,同時物聯網也極大的擴展了獲取數據的數量和類型。事實上,相比較于算法和算力,數據的獲取會更難一點。因為它是建立在已有業務基礎上的,以往我們都是先通過非人工智能的方式積累大量的數據,而現在初創企業要去獲得它就需要一些巧勁。每個時代都要解決不同的問題,今天人工智能公司也一樣需要去解決問題,就怕打著人工智能的旗號,做一些不接地氣的事,不能夠為用戶解決實質性問題。進入互聯網時代后,才出現了大數據的高速發展與積累,這為人工智能的訓練學習過程奠定了良好的基礎。
只有當以上三方面都做好準備的時候,人工智能時代才能真正地到來。而現在是三個要素剛剛開始具備的起點。
人工智能核心產業的定義
人工智能核心產業是基于人工智能技術本身,由對外提供的產品和服務所構成的產業,主要包含對外提供的產品、以平臺的方式對外提供的服務、人工智能解決方案和集成服務三種類型,也是人工智能技術最直接的落地形式。其中,對外提供產品包絡軟件產品和硬件產品,比如語音輸入法、機器人等;以平臺的方式對外提供服務,例如深度學習平臺;人工智能解決方案,通過解決方案的形式,對傳統產業進行升級,例如,在汽車中加入無人駕駛方案構成無人駕駛汽車。
人工智能應用帶動產業是指人工智能技術與其他傳統產業相結合,在傳統產業基礎上打造的新一代的智能產業,例如人工智能與汽車相結合,形成智能駕駛汽車產業,人工智能技術與制造業相結合,形成智能制造產業,人工智能技術與傳統的家電家居行業結合,形成智能家居產業等,人工智能應用帶動產業更多體現了人工智能的帶動性。
人工智能核心產業統計口徑
支撐層主要包括GPU/TPU/FPGA 等計算芯片,人工智能專用芯片和傳感器,其中傳感器占據較大產值。
軟件產品主要包括語音識別平臺、機器視覺系統、機器學習平臺等產品。統計API調用、SDK、解決方案等產值。
硬件產品主要包括智能工業機器人、智能特種機器人、服務機器人,僅統計機器人產值中智能模塊和解決方案部分。
無人/輔助駕駛仍然以輔助駕駛為主,其中,ADAS相關軟硬件占據大部分產值。
智能無人設備包括智能家電、智能可穿戴設備、智能無人機等產品,統計具備人工智能的模塊和解決方案部分。
2017年,中國人工智能整體產業規模超過4000億元。其中人工智能核心產業規模達到708.5億元,人工智能應用帶動產業規模超過3200億元。
預計2020年,中國人工智能整體產業規模將超過1萬億元,其中人工智能核心產業規模將超1600億元,由人工智能應用帶動相關產業規模接近9000億元。
2017年,人工智能核心產業規模達到708.5億元。其中硬件占比最大,達到總產值的55%,軟件規模最小,總產值89億元,占比為14%。由人工智能芯片和傳感器構成的支撐層產業規模為141.8億元,占比31%。在傳統硬件行業中,機器人和家電產業體量大,但人工智能技術在此類行業的滲透率仍然偏低。
人工智能產業鏈分析
基礎層
1.基礎層的構成與特點。基礎層主要包括智能傳感器、智能芯片、算法模型,其中,智能傳感器和智能芯片屬于基礎硬件,算法模型屬于核心軟件。隨著應用場景的快速鋪開,既有的人工智能產業在規模和技術水平方面均與持續增長的市場需求尚有差距,促使相關企業及科研院所進一步加強對智能傳感器、智能芯片及算法模型的研發及產業化力度。
2.國內外基礎層發展情況。芯片方面,近十年來,人工智能的通用計算GPU完全由英偉達引領,該公司2016年收入69億美元,市值1000億美元。AMD也在逐步進入該市場。除了傳統的CPU、GPU大廠,移動領域的眾巨頭在GPU 的布局也非常值得關注。ARM也開始重視GPU市場,其推出的MALI系列 GPU 憑借低功耗、低價等優勢逐漸崛起。蘋果也在搜羅GPU開發人才以進軍人工智能市場,目前蘋果A11提供自主設計GPU,性能比上一代A10提升30%。