祁 麟 公 靜 黃貞靜
(中國電子技術標準化研究院,北京 100007)
新一代人工智能的發展離不開信息采集、傳輸、存儲和計算能力的快速發展和芯片、大數據、存儲器、超算、光纖、算法模型等技術的不斷突破,也離不開各國政府的高度重視與科技巨頭爭先布局。人工智能強大的技術輻射效應,為全球經濟發展注入了新活力。但在人工智能的發展熱潮中,我們必須審慎地判斷我國在全球人工智能發展浪潮中的地位和產業實力。本文旨在從世界主要國家在人工智能領域戰略布局,包括政策、技術、標準、人才等方面深入剖析我國所處的形勢地位及面臨的挑戰,提出具體建議,為后續人工智能產業發展提供研究參考。
隨著人工智能技術的成熟和行業投融資規模的日益增長,全球人工智能市場規模進入了高速增長期。據麥肯錫公司預測,2025年全球人工智能應用市場規模將達1270億美元,到2030年,人工智能新增經濟規模將達到13萬億美元。據統計,超過65%的人工智能企業集中分布在美國、中國、英國,其中,中美兩國占據絕對競爭優勢[1]。美國則主要集中在舊金山灣區,中國則主要集中在北上廣等省份。中國人工智能企業在融資規模上,融資總額約占全球融資總額的70%[2]。
全球人工智能專利申請數量占全球專利申請數量比例一直保持平穩上升趨勢。據統計,從2018年至2021年,全球新申請的人工智能相關專利約為65萬件,我國在人工智能專利申請量上以45萬件居世界首位[3],創新速度實現較快增長。全球人工智能專利技術來源主要在中國、美國、歐洲、韓國和日本,專利申請主要集中于人臉識別、語音識別、深度學習、機器人等應用方面。
人工智能領域人才分布不均勻,美國得益于最早發明集成電路及互聯網領域的絕對優勢,在人工智能高端人才方面占據首位,我國在人工智能總人才數量方面位列第二,但屬于人工智能領域的高端人才,數量落后于英德法等國。從2021年發布的《AI2000-人工智能全球最具影響力學者》榜單來看,美國和中國分別位列前兩名,人數分別為1164人和222人[4]。

圖1 全球主要國家人工智能政策與戰略
從世界主要國家政府對于人工智能發展的戰略布局來看,美國主要側重研發、人才、安全與治理、就業保障等方面的規劃部署,尤其在人才戰略方面注重關注童年以后的STEM教育及終身學習,在互聯網、軍事、金融、能源等領域重點發力。相比較于美國政府,中國政府對于人工智能的規劃更注重細節和應用,能夠從產品到企業到產業層面分別落實發展任務,在制造業、農業、交通、金融等領域重點發力。歐盟在人工智能規劃方面更側重關注道德法律的問題,研究內容也更多涉及人工智能倫理等社會科學方面,在電子政務、道德法律、網絡安全等領域重點發力。德國作為老牌工業強國,相比于其他國家的人工智能規劃,關注數據開放,更注重人工智能技術在推動中小企業發展中得應用,在公共行政、醫療、工業、能源、交通等領域重點發力。英國政府在人工智能發展領域部署可謂面面俱到,在促進人工智能技術創新發展的同時,也高度重視其對社會、經濟、文化、倫理道德等方面帶來的潛在威脅,在海域工程、航空航天、醫療、農業等領域重點發力,注重實踐與實用。日本政府因為人口老齡化與勞動力短缺的原因所致,其發展人工智能產業目的是為提高制造業等相關行業的生產效率。因此,日本人工智能產業發展主張從各領域行業應用角度落實人工智能相關技術,包括采用物聯網、大數據、機器人與人工智能技術的協同發展模式。韓國政府是將公共數據作為人工智能技術研發的核心資源,此外還設置了大學必須開設人工智能相關課程的嚴格規定,足以證明其追趕世界人工智能強國的雄心。
隨著科學技術的不斷發展,人工智能已經成為各國科技巨頭爭相角逐的重點領域,紛紛在產品生態、芯片研發、算法模型、用戶數據、接入平臺、開源生態系統等方面積極布局。一方面,科技巨頭通過開源技術與平臺,不斷優化自身產品、模型和用戶體驗;另一方面,利用自身已形成的優勢,加上不斷加大收購力度,逐步向各個垂直應用場景及重要領域滲透。谷歌通過收購Deepmind使其保持在人工智能領域深度學習中絕對的戰略優勢;Facebook通過設立人工智能實驗室和應用機器學習實驗室,使其研究成果能夠融入到Facebook現有產品中;微軟擁有超過千人的研發團隊,開發的多款人工智能相關應用程序和產品極大的增強了用戶體驗;亞馬遜依托強大的電商平臺,在收購了自動化物流提供商Kiva Systems公司后,充分利用人工智能和機器人技術來提升網絡交付和物流配送的服務效率;百度作為中國最早進入人工智能領域的企業,其在無人駕駛和智能家居方面有著不錯的布局,并通過開源學習平臺Paddle-paddle,不斷強化在圖像與語音識別、自然語言處理、深度學習、機器翻譯等方面的研究;騰訊專注于社交平臺、游戲等方面以典型應用場景驅動為策略的AI探索,人臉識別是其最擅長的技術。
除此之外,還有部分獨角獸企業在各自專長領域默默發力。其中包括領先全球語音識別的Nuance、商業數據分析服務商ThoughtSpot、領跑計算機視覺技術的商湯科技、專注于深度學習技術的曠視科技、國內語音識別的領軍企業科大訊飛、人工智能芯片翹楚寒武紀、智能安防領域的依圖科技等均在不斷加速產品的迭代研發,加快國際國內人工智能產業的戰略布局。

表1 全球科技巨頭與我國科技龍頭企業的布局情況
4.1 優勢
高效的組織機制保障,龐大的數據體量、高水平的科技投入與高質量的研究成果或將為我國人工智能產業的快速崛起提供強大的發展引擎。
4.1.1 我國具備數據模型訓練的基礎優勢。在以高質量數據標注和海量數據為驅動力的數據模型分析方面,我國具有一定優勢。一方面,我國具有龐大的人口規模,在河南、河北等地區已經形成了一定體量的數據標注產業集群。高質量的數據標注是人工智能系統優化的“養料”,但同樣也需要投入巨大的人力,相較于美國硅谷高昂的人工成本,我國在數據標注方面具有成本優勢;另一方面,源自于我國豐富的應用場景帶來的模型訓練所需的大數據基礎。統計公報顯示,我國互聯網普及率為73%,移動支付業務量與交易量保持快速增長,其產生的海量數據為人工智能在基礎設施優化、服務能力提升等方面形成了良好的反饋機制,進而為數據模型的訓練提供了大量的數據積累。
4.1.2 我國部分人工智能領域已具備領先優勢。一是在類腦智能研究方面,由清華大學類腦計算研究中心開發了具有自主知識產權,能夠實現基于1024個氧化物憶阻器陣列的類腦計算的類腦芯片,完全摒棄了馮諾依曼架構的人工智能技術路徑,該芯片能夠實現,功耗不到傳統人工智能芯片的千分之一;二是在大腦成像方面,由華中科技學研究的“顯微光學切片斷層成像技術(MOST)”和“全腦定位系統(BPS)”,在全球已經率先實現了精準成像,對腦機交互等方面的研究提供了無限可能;三是在計算機視覺方面,我國在安防、移動互聯網、金融等領域已經開展大規模的試驗驗證,以安防領域重要的人臉識別技術為例,相比于美國政府對于涉及個人隱私方面采用新技術的強監管模式,我國采用智慧城市、雪亮工程等政策推動,成為了推動計算機視覺技術落地的最大保障。
4.1.3 制度加持和消費者認可度助力的優勢。我國政府密集出臺了《新一代人工智能發展規劃》《促進新一代人工智能發展三年行動計劃》等多項戰略規劃文件,高度的政府支持與協同高效的逐步推進是保證行業穩步發展的重要動力。其次,我國消費者對于新技術應用更包容或者更傾向于嘗試,以手機娛樂為例,AI美顏在國產手機中可能是標配,也是國產手機的賣點,但這一亮點遭受到了美國消費者的大量差評,也間接阻礙了新技術的應用拓展。
4.2 挑戰
在人工智能快速發展的時代,也同樣需要面對來自倫理道德沖擊、基礎理論、技術儲備不足等方面帶來的挑戰。
4.2.1 基礎層支撐力量相對匱乏。按照人工智能產業鏈劃分,分為基礎層、技術層和應用層。我國在人工智能領域基礎層領域基礎理論、關鍵技術積累相對薄弱,一直處于追隨者的狀態。從投資回報角度看,基礎層投資金額大、投入回報周期長,吸引資本入場的能力相對不足,入門壁壘較高也制約了企業在基礎層的布局的意愿。雖然近年來,我國的互聯網巨頭延伸了人工智能領域基礎層的布局,同時加大了對創業公司的投資并購力度,但相較于歐美等地區,趕超難度依然很大。
4.2.2 人工智能的倫理沖擊。當面對醫療診斷結論中,人工智能技術給出的結果與醫生判斷截然相反時,誰來承擔責任的問題;在面對保險公司掌握醫療大數據后,進而提高投保門檻,謀取行業利潤時;在面對機器人走向戰場,它將如何區分普通民眾和軍隊人員時,實際上,人工智能技術的發展都是與社會需求密切相關的。歐盟很早就啟動了人工智能和機器人倫理問題的研究,包括發布了可信AI的倫理準則,英國標準協會(BSI)和美國電氣與電子工程協會(IEEE)在人工智能標準制定方面也相對領先,英國以后果主義倫理為基本框架制定標準,美國則倡導美德倫理框架,加入了大量的跨文化研究。我國曾因為科技發展缺乏倫理監管而受到了國際社會的詬病,倫理的研究相對滯后。
4.2.3 行業數據訓練集不完善成為制約人工智能行業發展的瓶頸。人工智能的深度學習是基于所采用的算法和數據訓練集去預測未知的情形,數據集的質量直接影響人工智能的預測結果,模型的訓練離不開數據集,當算法確定的時候,基本決定了整個數據處理模型準確率的上限,基于以上推斷,數據的質量和數量會直接決定算法的理論上限的接近完成度,但目前,我國大數據包括存儲、處理和分析技術仍處不完善階段,相關高質量行業數據集還未完全建立,這也會阻礙人工智能相關技術的發展速度。
5.1 加大人工智能基礎理論研究。在學習機理、結構、構造等基礎理論方面開展創新研究。一方面可以從網格結構方面進行創新,比如將量子力學和神經網絡的結合;另一方面,在邏輯學、數學、計算機工程學、神經科學等領域注重人才培養與研究投入,人工智能的算法和硬件都離不開以上學科的發展。目前,深度學習算法強烈需要理論層面的重大變革,需要打破條條框框,開展跨學科跨領域的交叉融合研究。
5.2 將倫理問題嵌入人工智能相關支撐技術與產品中。人工智能屬于一個復雜的系統工程,其涉及大數據、云計算、智能傳感器、數據存儲和傳輸設備等多方面支撐技術與產品。在技術發端之初,如果能將倫理問題融入進各支撐技術與產品的設計中,那么在人工智能產業發展中,僅需要考慮本行業特性帶來的倫理問題,就可以減少很多后期不必要的爭端。這也意味著要加強產學研的緊密協同創新,成立跨學科的研究團隊,在設計代碼時,通過聯合研究,把倫理關注的問題轉換成工程師易懂的編碼思維,以此來推動倫理在科技創新中得深度融合。
5.3 不同場景下,建立數據訓練集與模型選取的最優匹配方案。海量數據的規模擴張是建立數據訓練集的基礎,如在工業領域,從數據采集設備數量的增長,到智能傳感器的發展,工業大數據的產生將會被集成到一個封裝系統,這對于下一步的數據分析起到了初步篩選的作用。有了初步的數據集,根據不同場景需求,進行模型的設計及相關參數的調整,達到最優匹配方案,形成工業數據訓練集,進行深度學習。同時,建立技術標準基準和評估體系,開發數據訓練集標準測試環境平臺。將數據訓練集與相關標準體系對標,在測試平臺進行試驗驗證,形成標準數據訓練集,這將為智能模型匹配提供高質量、高標準的分析支撐能力。