文生視頻模型Sora橫空出世或將引領新一輪行業變革

2024-04-18 00:00:00消費電子編輯部

消費電子 2024年2期

當中國人民仍沉浸在春節歡樂氛圍中時，大洋彼岸的科技界卻帶來了一個足以引爆業界的消息。美國當地時間2024年2月15日，OpenAI正式發布文生視頻模型Sora，并發布了48個文生視頻案例和技術報告，正式入局視頻生成領域。

Sora的發布毫無懸念地再次引發了整個市場的高度關注。據了解，Sora能夠根據提示詞生成60s的連貫視頻，“碾壓”了行業目前大概只有平均“4s”的視頻生成長度。該模型可以深度模擬真實物理世界，標志著人工智能在理解真實世界場景并與之互動的能力方面實現飛躍，也被認為是實現通用人工智能（AGI）的重要里程碑，通過不斷深入研究和發展Sora等先進模型，有望在未來實現更加智能、高效和多樣化的視頻生成與處理技術。

OpenAI 在其網站上解釋說：“Sora能夠生成具有多個角色、特定類型的運動以及主題和背景的準確細節的復雜場景。”“該模型不僅了解用戶在提示中提出的要求，還了解這些東西在物理世界中的存在方式。”。

360集團創始人、董事長周鴻祎在其個人社交平臺對Sora進行評價，他表示，Sora將縮短AGI（通用人工智能）實現時間，從10年縮短到1年。OpenAI訓練該模型應該會以視頻和攝像頭捕捉的畫面為主，人工智能通過觀看大量視頻將對世界有更深入的理解，這離AGI實現不遠。“科技競爭最終比拼的是讓人才密度和深厚積累。”周鴻祎表示，以往文生視頻軟件都是在2D平面上對圖形元素進行操作，可以把視頻看成是多個真實圖片的組合，并沒有真正掌握這個世界的知識。“這次OpenAI利用它的大語言模型優勢，讓Sora實現了對現實世界的理解和對世界的模擬兩層能力，這樣產生的視頻才是真實的，才能跳出2D的范圍模擬真實的物理世界。”

而中國社會科學院法學研究所副研究員唐林垚從行業發展方向考慮，他表示，相較于其他視頻類生成式AI，Sora在畫面清晰度、內容流暢度、表意深度和精彩程度方面均有大幅提升，如果Sora的能力真如官方公布一樣強大，且之后可以像ChatGPT一樣便捷訪問，那么Sora將給廣告行業、影視行業和特效行業帶來極大的沖擊。

新的科學技術總是帶有雙面性，Sora的發布在引爆業界推崇的同時，也引發了關于虛假信息傳播的爭議。其強大的圖像視頻生成能力達到了以假亂真的程度，這不僅改變了人們“眼見為實”的傳統觀念，還可能帶來一系列社會問題，如視頻證據真實性和有效性的驗證難題。針對Sora的橫空出世，也有不少人開始擔心這項技術是否存在另一重隱患。如普林斯頓大學計算機科學教授ArvindNarayanan，其對Sora的橫空出世表示了自己的擔憂，他認為根據OpenAI發布的視頻，Sora似乎比任何其他視頻生成工具都“先進得多”，這可能會導致“深度偽造”視頻，人們更難識別出人工智能生成的視頻。

此外，Sora可能存在引發侵權爭議的風險。一方面，Sora生成的視頻版權是否受到保護尚不明確，這可能導致使用這些視頻的主體面臨侵權索賠和版權保護追溯的風險。另一方面，Sora在訓練過程中使用了相關素材，即使只是用這些素材進行訓練，也可能存在潛在的侵權風險。

Sora的出現掀起了科技巨浪，各界對這項新技術的好奇和激動可見一斑。顯而易見的是，從ChatGPT到Sora，科技更新迭代的速度超乎想象，其迅猛發展的同時也帶來了無法預知的風險和爭議，科技如何平衡“真假”及“善惡”的邊緣，答案或許只有在未來才能獲取。