美國OpenAI公司推出語言大模型ChatGPT,被業界認為是人工智能從專業智能向通用智能演進的里程碑事件,具有劃時代意義。美國科技巨頭紛紛跟進,微軟推出能處理文本、圖像多種信息的多模態大模型GPT4,谷歌采用多模態大模型開發更具有通用能力的機器人。大模型有望成為通往通用人工智能的可行途徑,或將引發通用人工智能研究范式的根本性轉變,需要加緊布局。我國在人工智能產業的核心技術創新生態,“大模型+統一計算架構+圖形處理器”生態以及數據、算法、算力“三位一體”生態需要加快完善,抓住短暫的窗口期加緊推進。
OpenAI成功將大模型技術轉化為人工智能產品,并加快推動在各個場景的商業化應用。大模型將成為智能時代的“新電力”,為千行百業提供多樣化、泛在化的云上智能服務。ChatGPT的出現,標志著人工智能從研發各種專用小模型的大練模型時代,開始邁向研發超大規模通用智能模型的煉大模型時代。
一是大模型將演變為智能時代新型基礎設施。由于采用“預訓練+微調”模式,大模型具備良好的拓展性。同一模型只需要針對不同特定任務的標注數據進行微調,即可應用于不同任務,可具備內容創意生成、語言互譯、對話、搜索、文本分析等豐富功能,在醫療、營銷、客服、教育、文娛、法律等場景有廣闊的應用前景。大模型功能豐富、性能優越,將有望成為智能時代的底層架構,為各種智能化應用提供智能數據分析能力,大幅提升人工智能的通用性、實用性、泛化性。
二是人工智能產業體系面臨全面重塑。大模型將打破原有的人工智能產業格局,建立起全新的產業體系。在基礎設施層,由云計算平臺、人工智能芯片構成算力底座。在模型層,主要是由資金實力雄厚、數據資源豐富、技術能力突出的科技領軍企業和大型科研機構主導,研發跨場景、多任務的通用型基礎大模型。在應用層,一批深耕特定行業且積累大量行業數據的新銳科技企業,將使用行業數據訓練大模型,調整模型以滿足特定行業和場景需求。提供解決方案的企業,將模型封裝到產品,為電商、文娛、醫療、工業設計等垂直領域用戶提供各種專用化智能服務。
三是人工智能資源分布格局將迎來深刻調整。以ChatGPT為代表的大模型,是數據、算力、算法“三駕馬車”共同驅動的成果,表現出大算力、高質量數據與高性能算法三方面優勢相互強化、相互促進的突出特點。使用超強算力和高質量數據對模型進行訓練,才能得到高性能的模型算法。同時,高性能的模型算法帶來的良好使用體驗又吸引新用戶不斷加入,為模型持續補給高質量的用戶使用數據。ChatGPT在發布后5天內全球用戶破百萬,2個月月活躍用戶破億,為研發團隊帶來超2000萬條高質量的用戶使用數據,這對于大模型的迭代優化至關重要。在虹吸效應影響下,高性能模型算法與高質量數據資源將同時向具有先發優勢的國家和機構匯聚。
四是開源開放成為推動大模型落地的關鍵。各科技企業現已公布的大模型多數未開源,如OpenAI發布的GPT-3以及谷歌的PaLM等。科技領軍企業和大型科研機構恐將堆砌一道普通開發者和中小企業難以進入的高墻,導致資源壟斷和創新受阻的風險日益凸顯。目前正處于推動大模型商業化落地的關鍵時期,迫切需要營造開放的產業生態,讓各類機構和個體都能參與行業創新。眾多有創造力的開發者基于開放的模型、代碼和數據集,從事底層架構研發、模型調整、數據加工、應用開發等各類創新,將顯著加快技術創新速度,最大程度釋放大模型應用潛力,最終帶來大模型在各行業中的真正落地。
大模型的蓬勃發展高度依賴于良好的產業生態,前瞻性、系統性地謀劃布局產業生態成為關鍵。目前,我國面向大模型的AI生態建設存在三大急需解決的問題。
一是核心技術創新生態痼疾尚未得到解決。在本輪大模型的發展浪潮中,我國企業與OpenAI等美國科技企業存在一定差距。國內大模型底層架構創新能力不足,基本上以追隨國外為主,各機構大多開發的是對應單一任務的專用模型,在開發適用于多任務的通用大模型方面實力不強。開源AI框架還面臨著本土開源生態不完善、國際影響力不足、對外依賴度較高等問題,智能計算算法庫與國外開源框架捆綁發展,跟蹤創新趨勢嚴重。在芯片領域,大模型屬于計算密集型產品,算力需求巨大且飛速增長。根據Open AI測算,自2012年以來,全球頭部AI模型訓練算力需求3-4個月翻一番,每年頭部訓練模型所需算力增長幅度高達10倍。而我國在GPU領域缺少自主高端產品,并且面臨美國政府打造的“芯片鐵幕”技術封鎖。
二是“大模型+統一計算架構+圖形處理器”生態與國外差距明顯。“大模型+統一計算架構(CUDA)+圖形處理器(GPU)”是智能時代的“三大件”。OpenAI使用了超2.5萬張英偉達GPU,并基于英偉達強大的CUDA架構和算力才創造出ChatGPT。PyTorch、TensorFlow等主流AI框架同樣嚴重依賴英偉達CUDA,在該架構上才有最佳性能。英偉達有超3000人的CUDA研發者以及300多萬開發者,遠高于我國AI芯片廠商的統一計算架構研發人員數量。國內AI框架和AI芯片適配度不高,硬件和軟件棧碎片化問題突出,導致基于不同AI框架開發的大模型無法實現快速遷移。
三是數據、算法、算力“三位一體”的生態尚未形成。ChatGPT通過數據、算法、算力的精妙融合,打造出強大的技術“護城河”,而國內數據、算法、算力“三駕馬車”分頭行動而不是合力齊驅的問題突出。一方面,我國數據資源生態尚處于培育初期,國內開源數據集普遍質量不高,數據進入AI企業和研發機構以及數據在各機構之間的流通渠道并未暢通。另一方面,數據中心等算力基礎設施與人工智能平臺各自建設,建設數據中心時并沒有考慮AI大模型的算力需求,導致算力基礎設施和AI模型之間出現鴻溝。
大模型這條人工智能新賽道剛剛開啟,我國需要抓住短暫的窗口期加緊推進。
一是保持戰略定力,完善頂層設計方案。堅持《新一代人工智能發展規劃》的系統布局和總體部署,將推動大模型發展納入國家《新一代人工智能發展規劃》中統籌考慮,研究制定具體指導意見,為大模型的發展提供良好的發展環境。工信部聯合發改委、科技部、網信辦等相關部委,定期組織行業產學研各界代表開展協商調研,對頂層方案進行迭代完善。
二是堅持自主可控,加強核心技術創新。引導和支持國內企業和科研院所等開展大模型關鍵技術與產品的研發,包括智能芯片、模型架構設計、跨模態融合、智能計算基礎軟件、智能基礎算法庫等,提高我國大模型關鍵技術自主可控能力。要加強算法創新,探索中國特色的大模型產品。持續加大人工智能基礎科研的投入與建設,支持對核心科學問題與關鍵技術的原創性、基礎性、前瞻性和交叉性研究,重視理論研究范式創新,從源頭和底層解決關鍵技術問題。
三是堅持“三位一體”,打造國產大模型良好生態。加快構建數據、算法、算力資源協同融通的良好生態。加快研究數據確權、定價、交易、流通機制,完善數據治理規則。建立高質量行業數據池,強化優質供給,堅持共享共用,加強高質量行業數據與人工智能研究機構的融合。推進人工智能軟硬件平臺協調發展,盡早實現框架與芯片的適配、框架與框架的適配、技術底座的互聯互通。統籌算力基礎設施與人工智能平臺建設,制定數字基礎設施建設標準。加強自主可控的開源開放生態建設,推動形成領軍企業推進大模型升級迭代、中小企業深度開發應用場景的協同發展格局。