

我們正在迎來一個屬于AI的新時代。
“沒有大數據,數字經濟便是‘無米之炊;沒有智能算法,數字經濟就不能‘創造價值。”
在日前的2023世界人工智能大會(以下簡稱WAIC)“大模型生產與產業落地合作論壇”上,國務院參事、中國科學院虛擬經濟與數據科學研究中心主任、中國科學院大數據挖掘與知識管理重點實驗室主任石勇說。
近一年來,隨著通用人工智能(AGI)與生成式人工智能(AIGC)的興起,人工智能產業掀開了新的篇章——AI對部分產業的顛覆開始加速,我們正在迎來一個屬于AI的新時代。
縱觀整個計算機科學歷史,進入AI時代后,中國AI產業與國際先進水平之間的差距正在不斷縮小。但業界也清醒地認識到,中國AI產業的基礎設施仍然有很大的提升空間。
正如石勇所言,在AGI時代,數據、算力以及算法、算法開發平臺,都是中國AI產業發展壯大不可或缺的基礎設施。
在今年的WAIC大會上,越來越多的專家、學者以及AI、芯片等領域的從業者們都開始關注到這一問題,并希望能從底層入手,夯實中國AI產業的“地基”。
AI產業需要什么樣的基礎設施?
隨著AI技術進入大模型時代,AI產業對于數據、算力的需求急劇膨脹。
以ChatGPT為例,根據媒體報道及投資、咨詢機構的分析,GPT-3時期的ChatGPT數據量達到了45TB,對于純文本數據而言,這一數字堪稱驚人。
與此同時,ChatGPT的算力消耗巨大,參與訓練的算力在萬張英偉達A100級別,單次訓練成本就高達140萬美元。此外,ChatGPT在運營過程中,用戶的每次互動都會產生一定的算力成本。
而在數據、算力之外,AI從業者,特別是最核心的算法工程師,還需要大量的開發工具。
“算法工程師很多時候并沒有真正研究算法,而是把時間浪費在了環境搭建的工作上。”在WAIC大會上,閃馬智能創始人、董事長兼CEO彭垚說:“我們希望人能更好地利用工具,而不是被工具利用。”
有AI從業者將AI訓練調侃為“煉丹”,可靠的算法訓練平臺,可以有效減輕算法工程師的“煉丹”籌備時間。在這一背景下,越來越多的AI企業開始關注到AI開發平臺,閃馬智能便是其中之一。在WAIC上,閃馬智能發布了新一代的ATOM AI生產力平臺,希望通過更友好的開發平臺,幫助算法工程師提升效率。
據悉,閃馬智能的ATOM AI生產力平臺構建了從標注、訓練、測試到落地的全鏈路自動生產體系,可以實現模型快速生產、迭代與驗證的一站式管理,保障技術成果積累和數據資產沉淀。
具體而言,ATOM AI平臺支持跨云、跨集群靈活調度,基于DataExpress數據多級緩存與數據pipeline,可支撐千卡級大模型訓練及各類場景微調模型的穩定運行。
ATOM AI生產力平臺的前身,是閃馬智能團隊推出的ATOM深度學習平臺。官方資料顯示,該平臺經多年迭代后,已成為1000余位算法科學家和數十所高校師生使用的AI模型開發工具。
視頻大模型方興未艾
與目前AI產業時下火熱的ChatGPT、Midjourney不同,ATOM AI平臺關注的是另一賽道。前兩者通過大模型實現了文本、圖片的AIGC,而后者則關注視頻領域,希望打造出更多視頻專屬的AI模型。
在AI視覺領域,業界現有的模型大多基于靜態圖片。目前,針對人臉、車牌、敏感內容審查領域的AI模型已高度成熟。但在視頻領域,特別是較長視頻中的物體跟蹤與行為檢測,現有AI模型的表現仍然不夠理想。
這背后的原因是,大部分視覺模型針對靜態圖片表現良好,但針對動態視頻,模型需要根據時序模型,對單幀靜態圖片進行空間-時間建模,再提取視覺特征。這一過程的效率極低,且需要大量的算力支持。
此外,相較于圖片數據,視頻數據更稀缺、體積更大、標注也更加困難。因此,在整個AI產業,視頻大模型仍處于方興未艾階段,增長潛力巨大。
針對視頻模型開發的特殊需求,閃馬智能的ATOM AI生產力平臺提供了集成數據管理、標注、訓練、優化和推理功能的一體化服務,并通過打通算力、數據資源的形式,幫助算法工程師專注于模型訓練本身。
事實上,閃馬智能自身也在持續投入模型開發。目前,閃馬智能解決方案已經在智慧交管、智慧高速、智慧軌交、智慧建造、智慧電站和揚塵治理等業務場景中落地應用。
“大模型存在的意義一定是需要應用到實際場景中,為人們解決問題,賦能社會發展。”彭垚稱,“對于大模型本身,我們是理智的——不盲目投入極大參數LLM(大型語言模型),而是結合自身優勢,基于視覺拓展做了感知大模型。”
例如,閃馬智能日前發布的SupreMeta感知大模型,就融合了視覺、激光、雷達等多模態,對于目標及場景擁有更強的泛化能力,針對同一物體的不同視角、光照、遮擋,都能實現準確識別。
聯合算力、算法,打造AI生產生態
作為一家AI企業,閃馬智能以智慧交通解決方案為主營業務。對于ATOM AI開發平臺,閃馬智能更希望借此打造一個AI生態。
在WAIC大會上,閃馬智能宣布與北京國科智算科技有限公司、北京國科未來科技有限公司聯合成立“中科閃馬”,意在借助更多資源,共同推廣ATOM新一代異構人工智能計算平臺和DataOcean新一代存儲系統,打造主可控、軟硬一體的人工智能計算與存貯設備,并為大模型的訓練與實戰提供可靠的計算平臺。
中國科學院虛擬經濟與數據科學研究中心特聘研究員張影飛表示:“中科閃馬智能有限公司具有三大優勢:第一,強強聯合、資源整合;第二,技術融合、拓展應用;第三,聚力發力、突破難點。期待與閃馬智能共同推動自主可控的國產技術發展與創新。”
毫無疑問的是,在大模型時代,算力的意義變得無比重大。在日前的WAIC大會上,閃馬智能便邀請了國產GPU及解決方案廠商沐曦加入ATOM產業生態。
在沐曦創始人陳維良看來,以GPU為代表的芯片產業已經成為了AI產業的發展瓶頸。AI產業旺盛的需求催生出了GPU的廣闊市場,GPU未來的發展架構也將針對AI產業需求進行定義。
閃馬智能的生態圈也在嘗試將更多伙伴拉入自身的生態圈。例如,在WAIC上,閃馬智能宣布將與3D互動內容創作和運營平臺Unity中國合作,基于3D孿生技術和“AI+交通”的算法能力,打造實時全息的智慧交通系統與靈活彈性的渲染云平臺。
以往,Unity大多被用于游戲開發,客戶以游戲廠商為主。但近年來,隨著科技業對于3D引擎需求的增長,越來越多的開發者開始將Unity用于非游戲領域的開發,如汽車智能座艙、數字孿生、元宇宙等等。特別是在汽車領域,包括閃馬智能在內的眾多廠商,都在使用Unity作為3D渲染工具。
而Unity也在積極擁抱AIGC。日前,Unity中國公布了其在AIGC相關領域的規劃——打造U3D Copilot——開發者只需要使用自然語言下達需求,AI就可以通過大語言模型和用戶更自然的交互界面,串起3D的AIGC模型,以及引擎內部能提供的包括資產庫和程序化生成等這種工具。
U3D Copilot同時面向游戲和非游戲行業的開發者。在2023世界人工智能大會上,Unity中國CEO張俊波在接受36氪采訪時表示,以U3D Copilot為代表的3D渲染AIGC工具,對于非游戲行業意義更大。與游戲開發者相比,這些開發者在3D渲染方面的經驗有限,而AI則可以為他們提供更多助力。
不難看出從上游的算力、數據資源,到下游的行業應用,閃馬智能結合自身業務,搭建起了一整套面向大模型開發的生態系統。從某種程度而言,閃馬智能自身也成為了AI大模型產業基礎設施的一部分。
如今,中國AI大模型正在蓬勃發展。根據科技部新一代人工智能發展研究中心發布的《中國人工智能大模型地圖研究報告》,據不完全統計,國內參數在10億規模以上的大模型全國已發布了79個。
對于大模型的未來前景,彭垚給出的答案是,這條賽道如今從業者甚多,但并不擁擠,因為大模型賽道極其廣闊:“今天,仍有很多領域的大模型甚至還沒有完成定義。”
“所以,我們一定要擁有自己的GPU、自己的算力,有更多做模型、做算法、做平臺的公司,這樣,中國的大模型產業才能發展起來。”他進一步解釋到。