近日,OpenAI正式發布文本生成視頻AI模型Sora,著實給了打工人一個巨大的開年驚喜,生成視頻的效果很“炸裂”,不僅畫質清晰、細節到位,人物表情和視角也無限逼近于專業水準。
據官網介紹,Sora可以通過文本指令直接生成60秒以內的視頻,在此之前的視頻生成模型一般只能生成15秒以內的視頻。在官網給出的示例中,人物的瞳孔、睫毛、皮膚紋理,都逼真到看不出一絲破綻。
OpenAI在官網中介紹,Sora不是一個單純的視頻生成模型,而是能夠理解和模擬現實世界的模型的基礎,稱之為world simulators(世界模擬器),將視頻生成作為幫助 AI 理解真實世界的工具。或許我們可以理解為,AI吸收數據,通過Sora生成物理世界的影像,并逐漸理解物理世界,最終準確、真實地對物理世界進行反饋和互動。終極目標應該是具身智能體,而視頻生成只是過程中的一部分。這也是Sora與其他文生視頻大模型的本質區別之一。
360董事長周鴻祎說:“Sora只是小試牛刀,它展現的不僅僅是一個視頻制作的能力,而是大模型對真實世界有了理解和模擬之后,會帶來新的成果和突破。”周鴻祎甚至預言AGI實現將從10年縮短到1年,這也是業內人士對Sora感到震撼的縮影之一。
(據澎湃新聞2.20)