2024年,科技界迎來歷史性時刻,在國外,OpenAI正式推出了視頻生成大模型Sora; 在國內,快手率先推出了自研的視頻生成大模型“可靈”。這一創新標志著AI技術從文本生成邁向視頻生成的新階段,也將“視頻生成”從實驗室概念轉變為能夠模擬現實世界的強大工具,預示著AIGC(人工智能生成內容)領域將加速迎來紅利期。
在數字化浪潮的推動下,信息的傳遞與接收渠道變得前所未有的多樣化。視頻憑借其獨特的多維信息展現能力、豐富的畫面表現以及生動的動態特性,已躍升為信息傳播領域的核心力量。與單純的文字描述和靜態圖像相比,視頻能夠無縫集成文本敘述、直觀圖像、生動聲音及精細的視覺效果,于一幀幀畫面中交織出多層次的信息網絡,為觀眾帶來深度體驗與沉浸享受。這種融合多種感官刺激的表達方式,極大地增強了信息傳遞的效果與感染力。
我國龐大的互聯網用戶群體和豐富的短視頻內容資源,為視頻生成大模型的訓練和發展提供了海量且高質量的基礎數據支持,具備發展視頻生成大模型的天然優勢,已經涌現出如快手“可靈”、商湯“Vimi”、智譜“清影”、愛詩科技“Pixverse”等諸多產品。作為短視頻直播平臺,快手“可靈”具有獨特優勢,不僅在生成速度、視頻時長、連貫性、美觀性、逼真性等硬指標上表現不俗,更對復雜指令能夠精準理解和創造性執行,使得AI生成的視頻內容貼近人類創作水平。
Sora和“可靈”等大模型產品的發布不僅彰顯了AI在視頻生成領域的巨大潛力,還極大地激發了人們對于其廣泛應用場景的想象。在教育領域,視頻生成技術讓虛擬實驗、歷史場景再現成為可能,極大地豐富了教育資源的多樣性和個性化;在游戲開發方面,AI生成的游戲場景、角色和劇情降低了開發門檻,提升了游戲可玩性和多樣性;在醫療領域,視頻生成技術輔助模擬手術、展示病灶,為醫生提供直觀的診斷依據;在文娛產業,AI不僅輔助編劇,還能自動生成場景、角色、特效,顯著縮短制作周期、降低成本。目前,李少紅、賈樟柯、葉錦添、薛曉路、俞白眉、董潤年、張吃魚、王子川、王卯卯9位導演正在依托“可靈”大模型制作完全由AIGC生成的電影短片,大模型將展現“電影級”能力。
在短短半年間,視頻生成大模型迅速完成了從技術創新到探索落地,再到廣泛商業應用的轉變。如在電商領域,視頻大模型已經實現了實質性的“賦能”,實實在在的“提質增效”。商家可以利用AI快速生成產品展示視頻,以更直觀、生動的方式向消費者展示商品的特點和優勢。這不僅提升了購物體驗,還促進了商品的銷售轉化。以快手為例,基于“快意”大模型構建的視頻腳本生成、直播實時腳本生成、廣告線索客服等功能,結合數字人技術,幫助廣告主低成本生成高品質內容,提升了線索轉化效率,使得快手AIGC月活躍客戶數從年初至今增長了8倍,月GMV規模提升了64倍,平臺AIGC廣告收入規模提升了12倍,AIGC營銷素材在6月單日消耗峰值突破2000萬。截至目前,“可靈”AI已經累計服務超過260萬用戶,生成5300萬張圖片、2700萬個視頻,顯示了大模型在商業場景中的巨大潛力。

我國高度重視生成式人工智能的發展,《中共中央關于進一步全面深化改革、推進中國式現代化的決定》明確提出要“完善生成式人工智能發展和管理機制”。各級政府也在積極推進相關政策的落地實施,圍繞生成式人工智能的算法、算力、數據、場景、人才等方面不斷部署,多渠道、多手段支持生成式人工智能的發展。
與此同時,視頻生成大模型的廣泛應用,也帶來了一系列挑戰和問題,如創作范式的變革。“文生視頻”“圖生視頻”的創作方式完全不同于原有的電影視頻創作,需要盡快研究相關教程,幫助大模型更好地賦能創作。此外,由于生成內容的逼真性不斷提升和門檻不斷降低,如何確保生成內容蘊含的真實性、避免虛假信息的傳播,如何保護知識產權,這些問題都需要我們共同面對和解決。近日,國家互聯網信息辦公室已經發布《人工智能生成合成內容標識辦法(征求意見稿)》相關規定。在政策的引導下,視頻生成行業將會更加規范、健康地發展,為社會進步和繁榮貢獻更大的力量。
大模型邁入規模化應用期,視頻生成紅利加速顯現,這不僅是AI技術的又一次飛躍,更為我們開啟了一個充滿無限可能的新世界。相信在各方共同努力下,以視頻生成為主導的AIGC將加速落地,賦能各行各業,推動社會向更加美好的未來邁進。
(本文作者所屬單位:國家工業信息安全發展研究中心)
責編:郭霽瑤 guojiyao@ceweekly.cn 美編:孫珍蘭