我國人工智能發展基本原則包括四點:一是要科技引領,二是系統布局,三是市場主導,四是開源開放。開源開放在國家整體新一代的人工智能發展規劃里占非常重要的位置。既然有了布局,那么我們的長項在哪里?短板在哪里?
四個優勢
第一,政策優勢。所謂政策優勢,國家對人工智能產業發展特別重視,無論從國家層面,還是地方層面,都有很多布局和規劃,具備政策優勢。
第二,數據優勢。中國的數據量非常大,不管是互聯網的數據,旅游的數據,還是老百姓看病的醫療數據,都是全世界規模最大的。有了這些數據,做人工智能就有米下鍋了。
第三,應用場景優勢。聽起來好像全世界的應用場景都是一樣的,其實不是!人工智能要想用,它要有強烈的需求,這個應用場景才能起來,中國人工智能應用場景比任何一個地方都豐富。
第四,青年人多。中國本來人口就多,大學生里面學工科的人很多。工科的里面,現在又是人工智能最熱。后面我們人才的供應會非常充足,而且他們成長的速度也很快。現在不管是在國際上最頂級的人工智能國際會議,還是最頂級的國際雜志,投稿人、參會人差不多一半是中國年輕人,所以這是我們最大的優勢之一。
四個短板
第一,基礎理論和原創算法方面差距還是比較大。一是因為我們起步晚,另外前些年的科研評估體系使得大家都追熱門,很難在一件事上做二三十年、三四十年,能坐冷板凳的人比較少,所以基礎理論方面還是有比較大的差距。
第二,在高端器件方面有差距。不管是GPU、FPGA,還是高端傳感器等,特別是和模擬、射頻有關方面的傳感器都是我們的弱項。
第三,開源開放平臺有差距。現在做人工智能基本上都用開源開放平臺,在開源的基礎上快速搭建一個系統就可以做應用了。但是現在大家用得比較多的都是谷歌、Facebook、亞馬遜、微軟、或者IBM的。排在前六名的開源開放平臺都是國外的大企業。國內盡管有很多互聯網巨頭都在開始這方面的工作,像百度等都在推開源開放平臺,但是從市場影響力和規模來講,還沒有那么大。
第四,高端人才不足。與美國的人工智能高端人才數量相比,我們大概只有他們的20%左右。
云腦 ?建設新一代人工智能開源開放共享平臺
既然存在這四個短板,我們怎么辦?我們要補什么?其實,就是要解決開源開放平臺的短板。現在還有一個很大的事,就是現在大家做的開源開放的源程序放在哪兒?像谷歌、微軟、Facebook的源程序是放在GitHub,如果全放在GitHub上行不行?GitHub原來是基金會管理下的托管平臺,后來被微軟收購了,所以現在是微軟下面的托管平臺。這個平臺的母公司微軟公司是注冊在美國的,按照美國法律,GitHub要受美國法律的管轄。對于中國用戶來講,如果將來所有做的東西都放在GitHub上面,如果有一天GitHub不讓某些企業用,人工智能就變成沒根了,就懸在半空中了。有沒有一個辦法找到一個高效的、風險可控的托管平臺。
我們的應對策略就是這兩件事,第一件事是開源開放平臺怎么辦?我的想法是通過云腦來建設新一代開源共享創新平臺,現在我們的想法是做硬件和做軟件。硬件怎么做?現在已經有15家企業的開放創新平臺,這是科技部布局的。我們要做的是在下面再做一個更廣泛的平臺。
為了做這個平臺,我們成立了一個新一代人工智能產業創新聯盟。這個聯盟希望能構造一個很好的開源開放生態,生態里面包括硬件生態、軟件生態和應用生態。
軟件怎么辦?我們啟動了啟智平臺治理體系。目前,平臺擁有很多核心成員,包括深圳的鵬城實驗室、北京智源人工智能研究院、北京大學、國防科技大學、華為、百度、商湯、京東,等等。同時還有不同領域的社區,既有最底下的基礎設施、硬件和上面的算法框架的布局,在孵化方面也有生態的布局。
硬件怎么辦?現在深圳鵬城實驗室牽頭推出鵬城云腦,準備做開源硬件。鵬城云腦一期是100P操作的大型集群系統,既有英偉達的GPU,也有華為、寒武紀的人工智能芯片等構成的服務器。之后大概就會建成1000P的一臺機器,這臺機器建成了以后,全國做科研的,不管是高校的、研究所,還是中小微創新創業的,都可以用來做訓練。
當前階段,云腦的使命是要聯合全國所有愿意開源資源的群體一起做。然后,通過分布式的資源調動管理系統,把所有的服務器資源調動管理起來,讓它可以為人工智能各行各業的賦能工作。
這是我們關于云腦的對策,希望能做人工智能開源開放共享創新平臺,提供給國內做人工智能研究和人工智能創業的人來使用。
匯智 ?建設風險可控的人工智能代碼托管平臺
剛才的那些東西都說好了,但是大家做的源代碼貢獻放到哪里去,是不是仍然放到GitHub?當然沒有問題。但是放到GitHub上基本上有兩個問題是需要我們考慮的。數據顯示,從國內訪問的工程師占GitHub整體訪問人數的36%左右,就是1/3,但是不到一半。中國的工程師用GitHub的非常多,但是中國的工程師給GitHub做貢獻的不到6%,大概5%左右。也就是說很多人其實只是去拿東西,沒有做貢獻。為什么?有兩種可能性:
第一種可能性是本來他就是要拿東西的,也沒有想要做貢獻。第二種可能性是因為你要做貢獻,你要寫很多文檔,而且要用英文。好多工程師的英文不是第一語言,寫文檔還有障礙,如果用中文寫文檔或者用中文討論問題就簡單了,所以我們要建設一個高效的托管平臺。首先上面用的語言可以是中文,這樣討論就比較方便。同時,這個托管平臺應該放在中國境內。這樣國內所有做人工智能的人,不管是大學的,還是企業的,都可以用。
這個問題我們能不能解決?能解決!怎么解決呢?就是在中國搞一個托管平臺。這個托管平臺我們已經發起了,叫匯智,匯集大家的智慧。匯智的托管平臺已經于2019年的7月18日在深圳上線。當然目前這個服務器也不是放在實驗室的服務器上,而是放在公有云上。但是公有云給我們提供服務,我們花錢在公有云上開一個平臺,大家就可以到那兒去訪問。
現在上邊放的是什么東西呢?剛才我說的像OpenI等,現在有一大堆人工智能框架的東西已經都上線了。除了這個以外,我們還鼓勵人工智能、RISC-V等開源項目和代碼。當然我們不排他,這個托管平臺不僅有自己的東西,我們還可以做GitHub在中國的鏡像,甚至其他的一些開源代碼在中國的鏡像,我們都可以做。通過這樣的托管平臺,大家可以不用擔心,打雷下雨照樣可以種自己的自留地。
總結一下,開源軟件是人類智慧的有效傳承方式,做人工智能必須要做開源,中國要想發展好新一代的人工智能,必須要有高效和風險可控的開源開放平臺。我們現在做了兩個嘗試,第一是做了云腦,希望它能在軟件和硬件方面提供開放的共享創新平臺。第二是匯智,提供一個代碼托管平臺,希望這個平臺能夠高效、風險可控,為中國的人工智能發展夯實基石。
(本文根據中國工程院院士高文公開演講整理而成,未經本人確認。)