日前,OpenAI 發布了全球首個文(圖)生視頻模型Sora,一夜之間刷屏全球網絡。
通過Sora,用戶可以通過使用自然語言提示詞,生成長達1 分鐘的視頻,并包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。這意味著,在繼文本、圖像之后,OpenAI 將人工智能技術拓展到視頻領域。雖然Sora 模型目前尚未向公眾開放,但是已經有人感嘆:視頻生產顛覆性革命來了。
OpenAI 官網展現了多段Sora 制作的視頻,身著黑色皮衣、紅色裙子的女子在雨后的夜晚行走在東京市區街道上,女子皮膚上的毛孔清晰可見,路面積水映出路燈倒影。視頻十分真實。
Sora 不僅能夠生成完整的60 秒視頻,還能延長已生成的視頻。更重要的是,Sora 可以生成不同機位、不同景別的視頻,并進行剪輯。這不禁讓人感嘆:“真實和虛幻的差別,到底還有多大距離?”
同時,Sora 也帶有世界模型的特質。所謂世界模型,簡單點說,是要對真實的物理世界進行建模,讓機器像人類一樣,對世界有一個全面而準確的認知,讓AI 視頻更流暢,更符合邏輯。
從AI 制作視頻的流程來看,當前的Sora 需要先輸入一段文字,隨后再生成視頻,視頻的原創性還是依賴創作者的審美,Sora 的工具屬性更加突出。比起原創內容,Sora 的優勢更在于, 可以節省特效片段耗費的大量人力物力。
所以,也有網友預測, 雖然未來視頻制作流程中的剪輯師、特效師等后期崗位會面臨更為嚴峻的處境,但Sora 未來能夠代替更多機械、重復的工作,使得創作者可以集中精力于創新的、深度的解讀,給文化消費者提供更優質的內容。
如果說ChatGPT 是語言的大師,那么Sora 則是一個多模態數據的通才,它通過視頻、圖片等多種數據形式更全面地理解世界。Sora 又有哪些應用場景?
借助Sora 模型,新聞機構可以在幾分鐘內生成一段生動的現場視頻,讓觀眾即刻了解事件全貌。這種快速、準確的報道方式,大大提高了新聞報道的時效。
借助Sora 模型,廣告商可以快速生成多個廣告預覽視頻,使廣告商能夠迅速找到最吸引觀眾的創意方向,打造令人難忘的廣告作品。
Sora 模型為歷史紀錄片的制作提供了全新的解決方案。通過模型重建戰爭時期的城市、戰場和人物,制作團隊可以讓觀眾仿佛置身于那個戰火紛飛的年代。這種沉浸式的觀影體驗,讓歷史紀錄片煥發新的生命力。
借助Sora 模型,體育賽事主辦方可以生成虛擬的球場、球員和觀眾,為球迷打造一場身臨其境的虛擬賽事盛宴。
如果Sora 能夠持續優化,那么未來的電影制作可能就像搭積木一樣簡單。你只需要將這些60 秒的片段巧妙地組合起來,加上一個吸引人的劇本,一個小團隊就能打造出與《熊出沒》《流浪地球》等大片相媲美的作品。
目前的Sora 仍處于1.0 階段,仍然存在一定缺陷,在處理精細的背景時常常出現力不從心的情況,但沒人會否認Sora 在通用人工智能實現路程上的里程碑地位。
(摘自“看電視”微信公眾號,蘿卜葉子圖)