Sora，模糊虛幻與真實

2024-05-24 00:00:00看電視

青年文摘 2024年8期

日前，OpenAI 發布了全球首個文（圖）生視頻模型Sora，一夜之間刷屏全球網絡。

通過Sora，用戶可以通過使用自然語言提示詞，生成長達1 分鐘的視頻，并包含高度細致的背景、復雜的多角度鏡頭，以及富有情感的多個角色。這意味著，在繼文本、圖像之后，OpenAI 將人工智能技術拓展到視頻領域。雖然Sora 模型目前尚未向公眾開放，但是已經有人感嘆：視頻生產顛覆性革命來了。

OpenAI 官網展現了多段Sora 制作的視頻，身著黑色皮衣、紅色裙子的女子在雨后的夜晚行走在東京市區街道上，女子皮膚上的毛孔清晰可見，路面積水映出路燈倒影。視頻十分真實。

Sora 不僅能夠生成完整的60 秒視頻，還能延長已生成的視頻。更重要的是，Sora 可以生成不同機位、不同景別的視頻，并進行剪輯。這不禁讓人感嘆：“真實和虛幻的差別，到底還有多大距離？”

同時，Sora 也帶有世界模型的特質。所謂世界模型，簡單點說，是要對真實的物理世界進行建模，讓機器像人類一樣，對世界有一個全面而準確的認知，讓AI 視頻更流暢，更符合邏輯。

從AI 制作視頻的流程來看，當前的Sora 需要先輸入一段文字，隨后再生成視頻，視頻的原創性還是依賴創作者的審美，Sora 的工具屬性更加突出。比起原創內容，Sora 的優勢更在于，可以節省特效片段耗費的大量人力物力。

所以，也有網友預測，雖然未來視頻制作流程中的剪輯師、特效師等后期崗位會面臨更為嚴峻的處境，但Sora 未來能夠代替更多機械、重復的工作，使得創作者可以集中精力于創新的、深度的解讀，給文化消費者提供更優質的內容。

如果說ChatGPT 是語言的大師，那么Sora 則是一個多模態數據的通才，它通過視頻、圖片等多種數據形式更全面地理解世界。Sora 又有哪些應用場景？

借助Sora 模型，新聞機構可以在幾分鐘內生成一段生動的現場視頻，讓觀眾即刻了解事件全貌。這種快速、準確的報道方式，大大提高了新聞報道的時效。

借助Sora 模型，廣告商可以快速生成多個廣告預覽視頻，使廣告商能夠迅速找到最吸引觀眾的創意方向，打造令人難忘的廣告作品。

Sora 模型為歷史紀錄片的制作提供了全新的解決方案。通過模型重建戰爭時期的城市、戰場和人物，制作團隊可以讓觀眾仿佛置身于那個戰火紛飛的年代。這種沉浸式的觀影體驗，讓歷史紀錄片煥發新的生命力。

借助Sora 模型，體育賽事主辦方可以生成虛擬的球場、球員和觀眾，為球迷打造一場身臨其境的虛擬賽事盛宴。

如果Sora 能夠持續優化，那么未來的電影制作可能就像搭積木一樣簡單。你只需要將這些60 秒的片段巧妙地組合起來，加上一個吸引人的劇本，一個小團隊就能打造出與《熊出沒》《流浪地球》等大片相媲美的作品。

目前的Sora 仍處于1.0 階段，仍然存在一定缺陷，在處理精細的背景時常常出現力不從心的情況，但沒人會否認Sora 在通用人工智能實現路程上的里程碑地位。

（摘自“看電視”微信公眾號，蘿卜葉子圖）