◎高文 院士
人類智能就是我們大家都具有的這樣一個智能。人類智能是從哪里來的?首先是從我們生活和社會實踐當中來,其次是我們通過語言、文字、印刷傳承下來的智能。所以不要忘了,語言、文字和印刷在人類智能的發展脈絡當中是非常關鍵的一個技術。根據現在考古的發現,我們人類智能進化到今天,經歷了大約300 萬年,而人工智能其實發展的歷史并不長,只有63年。現在一講人工智能,有的人喜歡得不得了,有的人害怕得不得了,為什么會這樣呢?是因為大家使用的關于人工智能的概念不盡相同。那么首先到底什么是人工智能?
人工智能也可以叫人造智能,是由人制造出來,當然,它是模仿人的一個智能。它肯定要通過一個載體表現出來,這個載體可以是機器人,也可以是一臺計算機。人工智能有兩個很重要的概念,大家不能混淆。一個概念叫做通用人工智能,或叫強人工智能,就是人工智能的系統,如果它的功能、能力和人是一樣的,甚至超過人了,那就叫強人工智能系統。第二個概念叫專用人工智能,或叫弱人工智能,如果這個智能系統只能干一件事,盡管可能比人厲害,沒關系,那它也是弱人工智能。比如說我們現在去乘高鐵,以前還要檢票,現在身份證往那兒一放,刷個臉你就進去了,這就是一個刷臉人工智能系統。語音識別也是同樣的道理,不管它做得有多好,比別人強多少,如果它只是這一項功能的話,這就是一個弱人工智能系統。
1956年被稱作人工智能元年,我們說那是它出生之年。因為在1956年,有十位年輕的學者在美國的達特茅斯市搞了一個暑期研究所。在那個研究所經過兩個月的討論,就人工智能應該干什么、怎么干,進行了一番討論,最后寫了一個報告,大家公認是對人工智能比較完整的一個描述。
這十個人中當時七個坐在草坪上照了張相,最前面這五個人是非常厲害的“大牛”。左邊的四個都是圖靈獎的得主,大家知道圖靈獎是計算機界的諾貝爾獎;第四位是諾貝爾獎獲得者,所以第四位是比較厲害的,他一個人既得了圖靈獎、又得了諾貝爾獎;第五位他不用得任何獎,他叫山農,有的翻譯成香農,他是信息論的創始人,是我們整個信息領域的一個鼻祖。這十個年輕人在兩個月期間討論了七個問題,包括自動計算機、編程語言、神經網絡、計算規模理論,也就是說,做人工智能系統什么樣的計算機能做,然后是自我改進,這就是今天所說的機器學習。然后還有抽象,我們現在所有的大數據,你把數據直接喂進去,它是不能處理的,你要把這個數據提煉出來,這就是抽象。然后是隨機性和創造性,創造性的思維其實現在的機器還是做不了。他們當時就把人工智能領域需要研究的問題列了一下,所以這一年被稱為是人工智能的元年。
從1956年到1976年這二十年,是人工智能發展的第一個階段,主要工作是在模擬大腦是怎么工作的。它這個模擬不是說信號級的模擬,而是在更高層面的、在邏輯推理這個層面上去模擬大腦。那么用什么辦法來模擬呢?用邏輯推理的手段來模擬。現在回過頭來看,在人工智能的第一階段,留下來比較珍貴的一個成果,就是數學定理證明。也就是說,用計算機自動進行數學定理的證明,一個是代數定理證明,一個是幾何定理證明,都是由兩位華人完成的。一位華人叫王浩,他實際上是和楊振寧先生同時代的人,他主要做的是代數的機器定理證明;還有一位非常有名的學者叫做吳文俊,他的幾何定理證明是世界上做得最好的。但是后來發現,僅僅通過模擬人的大腦來實現人工智能這條路太難走,除了機器定理證明做得還不錯以外,當時第一階段設定的其它一些目標都沒有完成,比方說希望能夠戰勝國際象棋的國際冠軍、機器能夠譜曲等等。實際上只有數學定理證明的這件事完成了,其它都沒有完成。后來整個人工智能從高潮跌到低谷以后,學者們就在反思,是不是人工智能走歪路了?技術方法雖然沒問題,但是不是要做點實事兒?
學者們反思完了以后,他們就說大概需要做一點對社會有影響力的系統出來,這樣大家就會開始認可人工智能了。那什么系統行呢?比如說我們能不能做一些醫療診斷專家系統,可以代替醫生診斷疾病。有了這樣一些方向以后,根據剛才的邏輯推理,用這種方法去做專家系統。比如說心理咨詢專家系統,一個人有了抑郁癥或者處于抑郁癥前期,他有心理負擔的時候,并不愿意去找醫生或者朋友說,但如果是計算機,他就可以說了,所以用計算機做一個這樣的系統進行心理咨詢,可能會有用。
又比如說像故障診斷,最好把那些有限的專家的知識抽取出來做成一個系統,然后放到計算機里。這個計算機可以到現場,直接代替專家去做一些故障診斷,這是一條技術路線;另外一條技術路線,就是模擬神經系統來做專家系統。第二條技術路線在哪些領域是比較有效呢?比如說字符識別、文字識別。以前寄一張明信片,寄一封信,前面都要寫郵政編碼,那個郵政編碼最開始是用人去分揀的,需要耗費很多人力。后來就想能不能用機器自動識別、自動分揀,后來發現用神經網絡做這個效果不錯,包括今天我們的語音識別,這些東西基本上都是走神經網絡這條技術路線的。所以這兩條技術路線就導致在第二次人工智能發展專家系統的這三十年,其實真是百花齊放。
但是到了2006年,人工智能又在慢慢跌落,因為當時專家系統雖然做了很多,好用的卻不太多,大部分都是演示還不錯,真的上線去用的時候效果不那么好。因為很多基于邏輯推理的專家系統,實際上還是把人的知識做成規則放進計算機,因為是通過一問一答的方式把東西提煉出來,但可能會忘一些東西。實際上,它會遇到這個情況,人剛好把這個東西忘了,我們把它叫作“掛一漏萬”,這個系統就有點問題了,就是我們經常說的“不堪大用”。專家系統又開始熱度降低,一直到2006年發生了一件大事。那一年一下爆出了至少三篇重量級的文章,一下子轟動了做人工智能的這個圈子。

三位學者發表了三篇重量級文章

神經元結構
這三篇重量級的文章是誰寫的呢?就是圖上這三個人。第一個人叫辛頓,多倫多大學的教授,最能坐“冷板凳”的,研究神經元網絡研究了一輩子,從最開始到成名就做這一件事;第二個人叫楊立昆,他不是中國人,他是美國人,是紐約大學的教授;第三位叫本杰奧,他是蒙特利爾大學的教授。這三個人在2006年幾乎同時發了三篇重量級的文章,從不同的角度闌述了深度神經網絡是可以起大作用的,是可以進行大規模學習訓練的,只要輸入的數據好,它就可以解決問題。換句話來說,我們今天人工智能的原型系統,很多人說就是神經系統。
那什么是神經系統?有一些我們叫做神經元,就是圖片中那個紅的、最中間那個核叫神經元。那邊上綠的連進去的那些呢,我們把很多這種輸入叫突觸。然后它也有輸出,那么我們現在要做的就是輸入、輸出和中間這個神經元,是不是有辦法用數學把它模擬出來,或者說用數學把它描述出來,這個數學模型是有辦法構建的。有了這個數學模型,這是一個神經元,神經元可以是一層的,也可以是N 層的。所以有了數學模型以后,你就可以構造出這樣的一個系統來,這樣一個網絡來。有了這個網絡,你就可以通過演算,模擬仿真這樣一個系統了。所以實際上,現在我們所說的這個深度神經網絡,或者今天的人工智能系統,它的原型就是這個原型。
剛才我說的2006年那三位很有名的人發表了論文以后,大家先是高興了一下,但是后面怎么樣,那要看這個東西能解決什么問題,摸索了幾年小有收獲,但是并沒有說,哇!這東西這么厲害。一直到2010年以后這件事才發生,和兩個中國人有關系。一位是斯坦福大學的華裔女教授,叫李飛飛,另外一位是普林斯頓大學的華人教授,叫李凱。他們兩個在2009年就是想弄一個規模特別大的圖像數據庫,而且標注出來,然后就拿這個數據庫比賽。當時很多大學、公司都派代表隊去比賽,那時候比賽比誰做的系統錯誤率比較低。2010年的時候,成績最好的隊是28%的錯誤率,下一年是26%的錯誤率。2012年的時候有了一個突破,錯誤率從26%一下子降到16%,性能一下子就提高了十個百分點。所有的人都很吃驚,說你到底用了什么招,你怎么能進展得這么快。這個參賽的領隊是一個學生,說我也沒用什么特殊的招,我就用了我老師給我的那個東西做了個網,然后就用這個網來參加比賽,沒有什么,那東西我老師都發表過。那么他老師是誰呀?就是剛才說的那個辛頓,辛頓的學生拿著辛頓的這個東西來參加比賽,2012年第一次就打敗了所有的對手,這是一個很了不得的大進展。
到了2013年的時候,就是深度網絡一統天下的時候了,全是這個技術,沒有別的,剩下就是使用多深的網,有多少個節點,參數怎么設定,這就變成了一些技巧性的東西,而不是方法上的革命了。所以這就是為什么說神經元網絡突然一夜一統天下,開的都是神經元網絡的花了。
到2015年有一個革命性的突破,它的錯誤率變成了3.6%,3.6%是什么概念?人的平均錯誤率是5%,這個系統的錯誤率3.6%,超過人了。在圖像分類這件事上,神經元網絡已經超過了人,那這事是誰做的呢?是一位中國人做的。我們中國有一位學者叫做孫劍,孫劍他當時帶了一個團隊,提出了一個網絡,叫做殘差網絡。他拿這個殘差網絡去比賽,一舉拿了個第一名。而且這個殘差網絡,不僅是在圖像分類比賽里面拿了第一名,圍棋比賽里面它仍然是最厲害的。大家都知道AlphaGo,它和李世石下的那五盤棋,它輸了一盤,回去以后課題組就推演一下,復了一下盤,想弄清楚輸的原因,結果發現是李世石走了一步棋譜上沒有的棋。也就是說,每次AlphaGo 和人下棋,如果人每次都走棋譜上沒有的棋,那人就有很大的勝算。
那到底有多少棋是當時棋譜上沒有的呢?后來他們一算,當時訓練AlphaGo 這個機器的棋譜占所有可能棋譜的20%。也就是說,當時的AlphaGo如果和人下棋,如果這個棋手他腦子真的夠用,能記住哪步棋是棋譜里沒有的話,那么他就有80%的概率獲勝,這是很大的一個概率。
所以回去以后他們就說這不行,這個太容易被人擊破了,怎么辦呢?他們要重新設計AlphaGo 的網絡,然后他們就把原來的網絡重新設計、提升,就是使用孫劍他們提出的殘差網絡。AlphaGo 經過重新設計,從AlphaGo變成了Alphazero 以后,那一個系統和人類棋手下棋就從來沒輸過,因為它把所有的棋譜上沒有的棋全都生成出來,然后用一個完整的數據訓練了系統。
在下圍棋這件事上,應該說深度網絡已經把這個問題解決掉了。基于這樣的一個情況,我們對人工智能的判斷,基本上可以這樣講,在深度網絡適合的那一些弱人工智能領域,人工智能可以廣泛進行應用、研究,做產品、做產業化。
人工智能在智能水平上,它的感知智能日益成熟。我們可以把智能分成感知智能、認知智能和決策智能,所謂的感知智能就是和我們感官直接相連的這些智能,比如說眼睛看的、耳朵聽的、手摸的等等,這些方面其實弱人工智都可以做得非常好。現在不管你是刷臉,還是語音識別,甚至機器翻譯,識別一個病例,識別一個產品有沒有殘次等等,這些方面都發展得非常好,人工智能正在慢慢地從一般的感知智能向認知智能進行升級。
如果做更大規模的或者和認知有關的人工智能產品,或者我們想做強人工智能,靠現有的計算機是做不到的,那怎么辦呢?就要尋找出路,可能的出路有兩個:在技術路線上面,一個出路叫做類腦智能。人其實還是很厲害的,我們一天消耗的能量,相當于一個20瓦燈泡的能量,但是我們要干的事,可是比一個巨型計算機還要厲害。人對信息處理的能效比非常之高,但現在的計算機不行,能效比太低了。我們就希望能找一個能效比更高一點的機器來做這件事,類腦計算能效比可能較高一些。另一個可能的技術途徑就是量子計算。量子計算的能效比也極高,所以把量子計算做成比較穩定的一個系統也是有可能的。當然不管是類腦計算還是量子計算,現在還有很大的不確定性,到底什么時候能夠做出來,像今天的計算機這么穩定、可靠、低價,這個還是需要去做很多研究的積累。
在智能形態方面,越來越多的是人和計算機混合在一起的,我們叫人機混合智能。比如說,你想做一個純粹把人100%甩在環外的無人駕駛系統,其實是非常難的,但如果人介入一下,很多問題解決起來就簡單很多了。機器能做的事交給機器去做,如果機器做得不那么好的事,人就可以介入一下。這樣的人機混合智能,可能是現階段發展人工智能一個比較重要的技術途徑。
以前做研究,大部分是先把技術都做好,然后去轉化技術,去做應用,而現在是靠應用去拉動技術發展,這條路也是人工智能非常重要的一個發展形態。深度神經網絡出來的時候,在哪兒好用,不知道,最后幸虧辛頓的學生拿這個東西去參加圖像網絡的比賽。如果不是參加那個比賽,可能這個深度神經網絡的熱潮,說不定還會再拖一些年才到來,所以說,就是你要找一個很好的應用場景把它用起來。
人工智能它不像別的技術,它有社會屬性,這也是為什么前一段時間有很多爭論說,我們以后會不會被機器、人工智能奴役、擺布?我們會不會這樣?這個社會屬性,恰恰是我們做人工智能的時候要非常認真對待的一個問題,如果你不認真對待,可能就會吃大苦頭。現在其實已經有幾個例子:波音737 MAX 8,波音公司對人工智能怎么用或者對無人駕駛怎么用,就太大意。那兩架掉下來的飛機,駕駛員拼命和飛機搏斗,要往上拉,就是拉不起來,結果飛機就一頭兒栽下來了。這里頭它錯在哪兒?人機混合系統,人是最關鍵的,所以在這個環節里面,你不能讓機器跑到人前面去了,這就犯錯了。所以我們說,在人工智能的社會屬性這方面,一定要擺正人和智能系統它們之間的關系。其實對將來人工智能到底能干什么,不能干什么,我們現在可能就要不停地去做這種研究、立法,從法律上面就給它約束好。所有的技術都是這樣,一定有它的好的一面和壞的一面,要防止壞的一面發生,要通過法律、道德規范等手段去約束它。
人工智能總體上來說,在我們國家是非常受重視,從三個方面來看看中國在人工智能發展的一些大的情況。
第一個方面,我們整體來說,這些年中國人工智能到底是怎么樣的一個狀況?改革開放以后,我們國家在基礎研究方面的投入巨大,人工智能的發展有了非常好的沉淀。
第二個方面,一些核心關鍵技術,中國應該說已經走在了世界的前列。比如說人臉識別技術、語音識別技術,這兩項技術全世界都公認中國是做得最好的。
第三個方面,中國人工智能,它的發展和各行各業的結合越來越緊密,從互聯網往各行各業都在開始推廣和滲透。對于中國來講,人工智能的應用,比世界任何一個國家都做得更好。
第四個方面,人工智能發展的創新生態環境已經初步形成。比如說科技部已經布局了五個開放平臺,包括百度的無人駕駛、阿里的城市大腦、騰訊的智能醫療、科大迅飛的語音識別、商湯的圖像與視頻處理。
第五個方面,我們國家在全球人工智能整個這個領域,占有的位勢非常重要。基本上美國和中國,在人工智能領域就是兩個超級大國。美國可能在基礎研究方面強一些,中國可能在應用方面強一些。全世界在2017年對人工智能企業的投入,中國占了48%,美國只有百分之三十幾。2017、2018年中國人工智能的專利總數都超過美國和日本。
中國發展人工智能有四個優勢:第一個優勢是政策優勢。人工智能現在已經被列為整個中國優先發展的領域,所以我們有非常好的政策優勢。
第二個優勢是海量數據資源的優勢。我們國家人口是美國的四倍多;手機群體全球最大,用手機做支付也是全球最大;在醫院里面看病、在旅游、在物流方面,所有這些數據都是全世界規模最大的。這就是在應用方面,任何一個國家都和中國沒法比的一個主要原因。
第三個優勢是應用場景的優勢。因為我們是發展中國家,從農業社會到工業社會,現代社會發展的時間非常短。所以很多東西,基礎設施都沒有到位,但是恰恰給人工智能的應用提供了一些深的場景。比如說我們城市化,原來就是一個鄉鎮,突然就變成城市了。那里很多基礎設施都不行,要改造成一個完全城市的基礎設施架構的話,那你得花時間,拿錢來吧。但是很多東西,其實如果人工智能介入進去,它的服務一下就上來了,多快好省。現在老齡化非常嚴重,社會服務哪里來?就要靠人工智能系統來做,比如說醫療、教育。所以像這樣一些民生的問題,有人工智能進來以后,都可以快速得到解決。
第四個優勢是青年人才優勢。我們的大學毛入學率現在已經接近40%了,而且中國有一個特點,學理工科的比例很高。不像西方發達國家,它們國家毛入學率高了以后,很多學生學的是法律,學的是文科,學工科的比例很低。那這些學生將來都可以成為我們做人工智能的系統工程師,這個是一個非常大的儲備庫。而且這個儲備庫不是光講一講,因為這些年包括國家自然科學基金委員會,專門給人工智能設立了一個一級學科代碼,專門有一類,很多年輕人都可以申請到人工智能的項目,所以高校里面的年輕老師拿項目沒那么困難。現在你要看大的國際會議或者是最頂級的人工智能的國際雜志,基本上有一半的投稿人和參會者是中國的年輕人。
我們也有一些短板,我們還有四個薄弱環節:第一個薄弱環節,我們在基礎理論和原創算法這方面,我們得老老實實承認,還是有差距的。一個原因本身我們起步就晚,是后來者,好多的積累還是不夠;另外加上這些年我們發展的速度比較快,蘿卜快了不洗泥。對到底誰做得好、誰做得不好,有一些非常簡單粗暴的人才評估體系,比如說就數你發了多少論文,拿了多少科研項目,對于那些長期做基礎研究、肯坐冷板凳的人,客觀上是不鼓勵的。現在這個情況正在改觀,一個是國家在加大投入,大學里面給年輕人的待遇越來越好;另外我們很多有實力的企業自己成立了研究院,在里面養了一批很強的年輕人,這些人工資給得很高。所以我相信再過5 到10年,中國在人工智能方面的基礎理論和算法一點都不會弱。
第二個短板是在高端器件方面,比如說利用GPU(圖形處理器)做深度神經網絡訓練的這個芯片GPU(圖形處理器)芯片,目前英偉達(NVIDIA)一家公司就占了70%的市場份額。中國真正自己的GPU(圖形處理器)的生產廠商占的份額,還是比較低的。
第三個短板就是我們缺乏有影響的人工智能的開源開放平臺。人工智能這幾年能夠發展這么快,和開源開放關系很密切。現在最好的算法有很多都開放了,源程序都在網絡上,你從網上下載下來以后,根據你自己的應用稍微修改一下,馬上你就可以做一個。現在我們經常講笑話說,高中生可以和教授做同樣水平的工作。但是最有影響的前五個平臺,都是美國的企業,包括谷歌、亞馬遜、微軟、國際商業機器公司、臉書,這是五個人工智能開源開放做得最好的平臺。
第四個短板是高端人才我們比較少。所以有統計說,中國最頂級的做人工智能的高端人才數量只相當于美國的20%,什么時候我們的高端人才數量和他們差不多了,我們的人工智能發展就基本上到位了。
未來已來,到底是哪一個未來到來了?我們來簡單地預測一下。
先看過去30年,這是一個變化非常大、非常快的30年。第一個是計算機的算力,就是我們說的CPU,手機里核心處理器或者電腦里核心處理器,芯片的算力增強了100 萬倍;第二個是存儲,30年前的臺式機和今天的臺式機里面的存儲器相差了差不多100 萬倍;第三個就是通信的速度增加了100萬倍,這個我們得益于光纖通信,得益于無線通信的發展。這3 個100萬倍,使得過去的30年我們周圍的整個生活、社會、學習都發生了天翻地覆的變化。所以說下一次的工業革命將會在我們這些人的眼皮底下發生,那么大概是什么時間呢?在2030年到2040年之間會發生下一次工業革命。當然正確的時間和定義,那時候說不出來,可能要等到2050年、2060年,才能回過頭說,那個時間點應該是第四次工業革命的起點。那么題目是什么?我個人的猜測,下一次工業革命的題目就是人工智能。人工智能將是未來一個世紀的核心技術,要想把人工智能發展好,我們就需要在很多事上進行一些好一點的布局。
第一個是人工智能要作為一個全局的發展戰略來布局,不管是國家、地方、企業,都應該把人工智能放在最重要的一個戰略位置上。
第二個是怎么樣健全人工智能的國家研發體系,這是今后人工智能發展很重要的一個布局。
第三個就是人才培養,必須要形成一些人工智能的人才高地。美國在人工智能發展的初期,其實它是有幾個高地的,比如說斯坦福大學是一個高地,卡耐基梅隆大學是一個高地,MIT(麻省理工學院)和貝爾實驗室那一帶也是一個高地,這幾個高地的形成,最后帶動整個美國的人工智能理論和算法的發展。中國也應該形成幾個人工智能人才高地,這樣才有利于人工智能的發展。
第四個就是要加強智能化基礎設施的建設,推動公開數據的開放、共享,這個也非常關鍵。這一輪的人工智能,主要是弱人工智能,如果你沒有非常好的數據,你就談不上人工智能,數據才是最核心的。但是為什么和政府相關的人工智能卻起不來呢?因為它那個數據要么不放出來,要么它只放出來非常窄的數據。怎么樣能讓做人工智能應用的企業和團隊,既能用到這些數據,同時這些數據又不失去它的隱私權、安全性等等,這就要平衡好這些東西。所以說,數據的開放共享,要制定出相應的一些法律法規,要有一些辦法、工具可以操作。在這個前提下,一定要把數據盡快放出來,讓相關企業用這些數據去做應用。
第五個就是人工智能法律倫理問題的研究應該要加強,要引導人工智能安全可控發展。另外一個,就是要深化國際開放合作,要主動參與全球的人工智能的治理。

高文院士在CCTV-2央視財經頻道《中國經濟大講堂》演講現場
怎么樣才能夠真正地把人工智能的這些應用向各行各業賦能?抓手是什么?我覺得人工智能的抓手無非是三個方面:
一個是數據。沒有數據,現在的弱人工智能都沒法做。你要怎么樣去把數據組織起來、清洗出來,另外再加上一些安全保護等等,所以數據是一個非常關鍵的抓手,我認為是排在第一位的。
第二位就是開源平臺。作為一個人工智能大國,你應該要作出自己的貢獻,所以基本上也會有一些有影響的平臺出來,那樣才能與你這個人工智能大國的身份相稱,就是開源平臺需要發展起來。
第三個就是應用場景。現在絕大多數都是投資驅動的應用場景,這個不夠,政府必須要把優先發展的領域想清楚,通過市場經濟就能做起來的事,那就交給市場去做;需要政府的手介入、干預才能做好的事,政府就要果斷地開始去培育、去干預,而且要有手段。比如說網上有太多開源平臺,到底哪個好用,針對哪個應用最合適,其實你讓企業自己去做決定,他是不知道的。所以,最好要有一些有經驗的人,帶著問題、技術和他們去進行對話,給它扶上馬、送一程,然后這個應用就算成了。所以必須要抓應用場景,抓這種賦能,這是非常關鍵的一個步驟。我們需要做的就是要發揮各方的主觀能動性,我們齊心協力把現在中國人工智能發展的短板補上,這個就是我們最需要采取的一個行動。在這個基礎上,我們和全世界的人工智能同步推進,去迎接第四次工業革命、智能時代的工業革命曙光的到來。