張林山 李葉妍
ChatGPT是由美國OpenAI公司研發生成的一款基于AIGC(AI Generated Content,即利用人工智能技術生成內容)人工智能大模型訓練的聊天機器人應用。該應用以對話交互方式為主,引發了現象級的全球關注,掀起新一輪人工智能浪潮。
一、ChatGPT將引發眾多行業深刻變革
當前,人工智能大模型技術及產業發展成為我國科技巨頭競爭和社會各界討論的焦點。可以預見,人工智能大模型應用將給社會生產和生活帶來重大影響和深刻變革。
(一)人工智能產業將從“手工作坊時代”進入“工業化大生產時代”
在人工智能大模型出現之前,各研發主體基本上是針對特定的場景開發特定的人工智能模型,如人臉識別算法公司主要涉足在線支付領域,智能語音算法公司主要涉足客服領域。單一人工智能場景一般需要一個專門的模型算法團隊進行定制化研發,整個產業基本處于“手工作坊”時代。進入大模型時代后,由于大模型的參數規模是傳統小模型的一萬倍以上,一次完整的模型訓練成本高達數千萬近億元人民幣。同時,大模型各生產環節的分工也更加細化,如OpenAI公司就大量引入外包員工完成數據標注處理工作。大規模、高成本、精細化使得人工智能大模型產業呈現出“工業化大生產”的基本特征。
(二)人工智能大模型將成為新的基礎設施并構建新的生態體系
人工智能大模型具有跨領域與跨行業的特征,其應用生態體系已開始逐步建立。人工智能大模型作為新的基礎設施MaaS(Model as a Service,即模型即服務),可以在2C(消費)、2B(公司)、2G(政府)等領域全方位應用,推動智慧化信息化水平提升,其本身可能發展成為繼移動互聯網之后新的技術平臺。未來,待技術和市場進一步成熟后,“人工智能+”將同“互聯網+”一樣衍生出同各行各業深度融合的新模式,帶來教育、醫療、能源、制造、金融、傳媒、電子商務、戰略咨詢、政務服務等領域新的發展。人工智能大模型及“人工智能+”作為人機交互的新橋梁,可能會帶來新一輪人工智能技術的普及和市場的繁榮。
(三)人工智能大模型將引領新一代信息技術革命和產業變革
對于軟件產業,ChatGPT可以根據用戶輸入的文本提示直接生成和推薦代碼,這會導致從業者越來越依賴人工智能大模型編程并逐步取代人工編程。對于云計算產業,亞馬遜AWS平臺和阿里云平臺分別借助兩國移動互聯網發展浪潮形成了先發優勢,而人工智能大模型的出現可能導致行業重新“洗牌”。對于芯片產業,人工智能大模型會加速其向專用芯片方向發展,亞馬遜、微軟、谷歌以及國內的阿里云、華為云都針對人工智能大模型推出了專用芯片。對于電子商務產業,基于深度學習的人工智能大模型,電商將有能力根據客戶喜好直接生成內容,諸如生成商品描述信息、推出人工智能導購服務等。
(四)人工智能大模型將對國家安全和意識形態安全構成潛在威脅
海外ChatGPT模型主要基于海外文本數據進行訓練,其中包含部分涉政、涉恐以及西方意識形態引導的相關信息。若用戶頻繁使用海外ChatGPT類產品進行輔助辦公、教育學習、趣味閑聊等,將造成不可控的不良內容傳播風險。ChatGPT的模型數據中,以英文世界的數據為主,因此其產生的“共識”也可能僅僅是部分人或者某種意識形態下的“共識”,而非全人類的“共識”。從測試結果看,ChatGPT會刻意回避對某些敏感人物和敏感事件的評價,但是考慮到交互內容的長尾效應,ChatGPT的回答可能包含出于政治目的發表、與事實不符的言論。
二、新一代人工智能是新一輪科技競爭的制高點
目前,和發達國家相比,我國在大模型技術及產業發展方面存在一定差距,但具備相當的技術和基礎儲備,有能力獲得新一輪科技競爭的“決賽入場券”。
(一)我國算力支撐和算法創新能力與國外存在差距,“卡脖子”問題突出
我國在人工智能大模型技術支撐層面與發達國家相比存在差距。一是我國算力建設不足。國外在人工智能算力平臺、模型開發、開放平臺建設方面起步早、投入大,為大量研究者、投資者參與大模型技術研發和產業落地提供便利。同時,受GPU芯片等“卡脖子”技術限制,國內算力建設發展相對滯后,頭部企業算力和谷歌等國際巨頭相比明顯不足。二是算法創新能力受限。目前,ChatGPT背后的算法模型、關鍵核心技術全部是國外公司或科研機構研發的,我國在算法創新和原創性基礎研究方面還存在較大差距。
(二)大模型訓練過程中,中文數據質量水平相比英文數據還有明顯不足
在人工智能大模型訓練過程中,中文數據質量與英文數據質量相比存在明顯不足。造成這一差距的主要原因在于用于大模型訓練的數據主要從互聯網上抓取,而中文互聯網現在缺少很多“小而專”的網站或專業論壇,也缺乏諸多組織協同共建、開放可用的數據集。整體來看,中文互聯網數據相比英文互聯網數據普遍表現出專業性條理性弱、優質數據少,而廣告盈利性強的特質。未來在我國互聯網環境下訓練人工智能大模型,面臨中英文互聯網語料互補、語境互通的難題。
(三)歐美企業在大模型及其試驗方面更領先,我國企業則面臨技術研發推廣的巨大風險
ChatGPT首先在海外爆發是歐美企業長期投入積累形成的。國外較早開始推廣人工智能大模型生態,并在相關產業落地過程中獲得了較多的客戶反饋和數據反饋,從而實現模型效果持續優化。例如,OpenAI公司成立至今,在創新投入、人才儲備等多個方面長期進行巨額資金投入以及包容試錯,才實現了關鍵技術突破。而我國企業大模型研發推廣和產業落地速度整體落后于海外,在上述這些方面還有諸多不足。雖然百度、阿里、騰訊、京東等互聯網頭部企業均發布消息稱已開展相關技術研發或部分模型已進入內部測試階段,但大模型的訓練成本較高,技術應用面臨著億元級研發投入和海量訓練試錯。
(四)我國具備相當的技術和基礎儲備,有能力獲得“決賽入場券”
在發達國家不斷進步的同時,我國也在持續發力。一是我國可供人工智能大模型技術應用的場景廣泛且用戶市場廣闊。我國互聯網和人工智能產業具有服務億級用戶產生的海量數據和多元場景,可以直接轉化為大模型技術發展和行業競爭的絕對優勢。我國互聯網平臺企業持續在人工智能大模型技術研發方面投入,推出極具競爭力的算力平臺和算法團隊。二是豐富的中文數據資源和中文語境塑造了我國人工智能大模型技術和產業發展的差異化優勢。我們可以利用大量的中文語料資源訓練模型,從而增強模型的適用性和準確性。針對中文語境,我國自主研發大模型的表現水平要遠高于國外模型水平。因此,我國具備相當的技術和基礎儲備,只要持續探索創新,就不必擔憂同發達國家的差距進一步擴大,就有足夠的實力參與國際競爭。
三、以“決賽思維”應對“新人工智能時代”挑戰
要充分認識到應對“新人工智能時代”挑戰的必要性和緊迫性,加大對重點企業和研究機構的支持力度,加速國產大模型及綜合應用面市,鼓勵“人工智能+”應用場景融通創新,多舉措加強數據和技術監管,引導人工智能大模型產業安全健康可持續發展。
(一)認識層面:要充分認識到應對新挑戰的必要性和緊迫性
一是要認準大勢,主動求變應變,牢牢把握我國人工智能發展的重大戰略機遇。從思想認識上,要高度重視“新AI時代”對我國科技跨越發展、產業優化升級和生產力整體躍升的重要影響。要充分認識到“新AI時代”人工智能將具有更強的“頭雁”效應,必須緊緊抓住這一戰略機遇,從基礎理論、核心技術、關鍵產業、重要要素等層面,積極構建適應新形勢新需求的科技創新體系。
二是要直面挑戰,增強憂患意識,盡快“自上而下”進行系統性戰略布局。要立足國家發展全局,結合我國產業發展實際需求,找準突破口和主攻方向,整合優質技術和資源,充分發揮我國體制機制、市場規模等多重優勢,以“決賽思維”迎接“新AI時代”的挑戰。
(二)產業層面:加大對重點企業和研究機構的支持力度,加速自主創新的國產大模型應用面市
一是要出臺更多支持人工智能大模型產業發展的政策舉措。制定相關技術標準和行業規范,加大對頭部企業開展大模型核心技術攻關的支持力度,發揮重點企業和研究機構的數據、算力、算法和人才優勢,聯合產業鏈上下游企業、高校院所、國家重點實驗室、新型研發機構,協同開展科研攻關,加快推出國產大模型拳頭產品。
二是著力促進大模型技術創新創業生態優化。提高人工智能大模型產業鏈上關鍵基礎設施的自主可控程度,包括深度學習框架、人工智能芯片、模型訓練平臺等,通過政策扶持、產業基金、創業孵化等方式帶動前沿技術應用,加速技術成果轉化和產業落地。
(三)應用層面:鼓勵“人工智能+”應用場景融通創新,提升社會各界對大模型技術工具的認知水平
一是要充分發揮我國海量數據和應用場景優勢,推動“人工智能+”發展。鼓勵有關部門提供政務服務、交通、教育、醫療等公共服務中涉及內容生成、人機交互的場景,通過“揭榜掛帥”“賽馬”等制度,鼓勵具有一定條件和實力的企業使用更多場景應用自主研發大模型產品及相關服務。
二是有必要向大眾宣傳普及人工智能大模型技術的相關知識和理念。讓大家既重視對新技術的學習和使用,又不畏懼新技術的融入和替代。正確認識大模型工具的價值,明白它們可以成為人類專業的助手,可以為工作和生活減輕負擔、提供便利。積極緩解和應對技術焦慮,縮小技術不平等性可能導致的社會差距,在深度學習和智慧化方面實現全社會各行業跨越式進步。
(四)監管層面:多舉措加強數據和技術監管,引導人工智能大模型產業安全健康可持續發展
一是要創新監管理念和手段,為新業態留足發展空間。構建相關方共同參與的協同治理體系,在技術和模式創新過程中實現規范與發展的動態平衡,一時看不準的,可給予一定時間的觀察期。支持人工智能計算中心、超算中心、“東數西算”樞紐等匯聚成網,推動算力共享,完善數據流通利用規則,制定數據資源開放清單,開展數據資源開放試點,區分“技術研發場景”和“技術應用場景”,擴大面向人工智能大模型的公共數據供給范圍,有序開放公共數據庫、專業數據庫等,優先開放高價值、低敏感、數據量大的民生公共數據。
二是要建立健全大模型技術及應用過程中的知識產權、倫理和安全監管機制。監管部門要結合技術創新應用情況,動態制定人工智能知識產權與數據權益保護規則,深入推進人工智能倫理治理,并嚴格把控信息安全,限制重要機構和組織使用ChatGPT類海外產品,以免造成重要信息泄露風險。
〔張林山,國家發展改革委體管所研究員。李葉妍(通訊作者),國家發展改革委體管所副研究員〕