摘要:現(xiàn)基于文生類視頻軟件Sora的理論研究,從創(chuàng)作者的角度論述Sora在短視頻制作中的優(yōu)勢(shì)與不足。它能夠?qū)⑽谋久枋鲛D(zhuǎn)換為動(dòng)態(tài)視頻,更加高效便捷,構(gòu)建視覺(jué)大模型的技術(shù)、審美、認(rèn)知新維度,但同時(shí)存在內(nèi)容單一乏味、無(wú)法完全正確解讀指令等問(wèn)題。因此,在短視頻制作中,要合理運(yùn)用Sora,既要充分發(fā)揮其長(zhǎng)處,也要警惕潛在風(fēng)險(xiǎn),尋找人機(jī)協(xié)作的最佳平衡點(diǎn),為短視頻制作行業(yè)書寫新篇章。
作為OpenAI開(kāi)發(fā)的一款文本生成視頻模型,Sora能夠根據(jù)用戶給出的文本提示創(chuàng)建高質(zhì)量的視頻內(nèi)容,以能夠?qū)⑽谋久枋鲛D(zhuǎn)換為動(dòng)態(tài)視頻的能力而備受關(guān)注。它展示了解讀和執(zhí)行復(fù)雜指令的出色能力,并且生成的視頻能夠在不同鏡頭間保持動(dòng)作和畫面的連貫性與一致性,從而具有更強(qiáng)的實(shí)用性和應(yīng)用價(jià)值。在短視頻市場(chǎng)火爆的背景下,智能的Sora幫助人們提高了效率。基于在人工智能領(lǐng)域的研究成果,本文以短視頻為切入點(diǎn),深入探究人工智能Sora在短視頻制作中的應(yīng)用。
構(gòu)建視覺(jué)大模型新維度
技術(shù)維度
Sora構(gòu)建視覺(jué)大模型技術(shù)新維度。視覺(jué)大模型是基于Transformer架構(gòu)的模型,專門用于處理和理解視覺(jué)信息。Sora在圖片和視頻的光感、色調(diào)和氛圍感等方面都能夠展現(xiàn)出人工智能的優(yōu)越性。視頻作品要經(jīng)過(guò)PR、AE、Blander等多個(gè)視頻處理軟件,而Sora能夠一鍵生成短視頻,并且具有初步審美能力。它的智能技術(shù)增強(qiáng)了內(nèi)容的多樣性。創(chuàng)作者可以更快地嘗試不同創(chuàng)意以及迭代內(nèi)容,并且能夠基于文本描述創(chuàng)建多樣化的視覺(jué)效果,這會(huì)鼓勵(lì)短視頻制作者探索更多風(fēng)格和主題,進(jìn)一步增加內(nèi)容的豐富性和新穎性。此外,Sora還提供個(gè)性化定制服務(wù)。Sora可根據(jù)用戶或觀眾的偏好數(shù)據(jù)生成個(gè)性化的短視頻內(nèi)容,滿足不同細(xì)分市場(chǎng)的需求,這對(duì)于短視頻創(chuàng)作者而言,意味著能更好地吸引和留住粉絲。在瞬息萬(wàn)變的社交媒體環(huán)境下,Sora幫助創(chuàng)作者快速響應(yīng)社會(huì)熱點(diǎn)事件,生成相關(guān)短視頻內(nèi)容,搶占流量高地。然而,這也可能導(dǎo)致市場(chǎng)中的熱點(diǎn)內(nèi)容同質(zhì)化現(xiàn)象加劇,促使創(chuàng)作者尋求更優(yōu)的差異化策略。它高效便捷的一站式服務(wù)令人驚嘆,使用率得到大幅提升,甚至引發(fā)人工智能能否終結(jié)人類智慧的思考。
審美維度
Sora構(gòu)建大視覺(jué)模型的審美新維度。Sora能夠根據(jù)文本描述創(chuàng)造出細(xì)致入微的人物、動(dòng)物或物體形象,并讓這些形象與場(chǎng)景進(jìn)行互動(dòng),甚至具體到人物的年齡、服裝,動(dòng)物的動(dòng)作、表情以及物體的外觀等特征,并且能夠設(shè)定和渲染出各種復(fù)雜的場(chǎng)景,為視頻提供真實(shí)的環(huán)境感。Sora生成的視頻在視覺(jué)細(xì)節(jié)上表現(xiàn)出色、畫質(zhì)精良,堪比電影工業(yè)的產(chǎn)物,展現(xiàn)了其在模擬現(xiàn)實(shí)世界方面的巨大潛力。在視覺(jué)細(xì)節(jié)上,可以根據(jù)提示詞營(yíng)造相應(yīng)的情感氛圍;在視頻內(nèi)容上,能夠使視頻內(nèi)容更加豐富和動(dòng)人。視頻制作中,運(yùn)用先進(jìn)的攝影技術(shù),如鏡頭運(yùn)用、光影處理等,使最終的視頻作品具有較高的藝術(shù)水準(zhǔn)。綜上所述,Sora的審美新維度不僅體現(xiàn)在其技術(shù)的先進(jìn)性上,更在于它能夠深刻理解和執(zhí)行復(fù)雜的創(chuàng)意指令,將人類的想象力通過(guò)視頻形式完美展現(xiàn),為用戶帶來(lái)前所未有的視覺(jué)體驗(yàn)。
認(rèn)知維度
Sora的出現(xiàn)提升了短視頻行業(yè)對(duì)大視覺(jué)模型的認(rèn)知新維度。Sora的誕生意味著AI生成的視頻在視覺(jué)和情感表達(dá)上可以達(dá)到與人類創(chuàng)作者相媲美的水平。Sora雖然具有巨大的潛力,但也面臨挑戰(zhàn)。例如,人們對(duì)其實(shí)用性的質(zhì)疑,它能否替代創(chuàng)作者的“靈魂”等。同時(shí),Sora為廣告業(yè)、電影預(yù)告片、短視頻行業(yè)帶來(lái)了顛覆性的可能。從哲學(xué)范疇中物質(zhì)與意識(shí)的關(guān)系來(lái)看,人工智能是人類智能的物化體現(xiàn),在人工智能迅猛發(fā)展的背景下,人們不禁思考人工智能能否擁有人類的意識(shí),但基于馬克思主義基本原理的研究,人工智能是人的意識(shí)能動(dòng)性的表現(xiàn),它可以模擬或擴(kuò)充人類大腦的思維活動(dòng),但始終無(wú)法超越人類,因?yàn)樗鼰o(wú)法代替人類做出知情意統(tǒng)一的整體決策。以Sora為例,其產(chǎn)出的藝術(shù)作品雖然很具觀賞性,但一旦脫離人類的指令控制,就無(wú)法進(jìn)行“藝術(shù)創(chuàng)作”。
重塑短視頻制作新圖景
Sora使短視頻制作更加高效便捷
短視頻行業(yè)可以通過(guò)多種方式合理運(yùn)用Sora,以增強(qiáng)內(nèi)容創(chuàng)作和提升用戶體驗(yàn)。短視頻創(chuàng)作者應(yīng)該不斷學(xué)習(xí)和適應(yīng)最新的AI工具和技術(shù),以保持競(jìng)爭(zhēng)力。首先,在短視頻制作中可以充分利用其文本到視頻(text-to-video)能力。它能夠根據(jù)提供的文本生成長(zhǎng)達(dá)60秒的視頻,快速將腳本轉(zhuǎn)化為視頻內(nèi)容,對(duì)于短視頻平臺(tái)來(lái)說(shuō)是一個(gè)巨大的優(yōu)勢(shì)。同時(shí),能夠基于一張圖片生成視頻,這對(duì)于有特定視覺(jué)概念但缺乏視頻制作能力的創(chuàng)作者來(lái)說(shuō)是一個(gè)有價(jià)值的工具。其次,短視頻平臺(tái)可以利用Sora進(jìn)行視頻擴(kuò)展,無(wú)論是向前還是向后,這為創(chuàng)作者提供了更多的創(chuàng)意空間。例如,在有一個(gè)引人入勝的開(kāi)頭的情況下,它可以幫助創(chuàng)作者完成視頻的結(jié)尾部分,反之亦然。再次,視頻生視頻的能力使其可以根據(jù)現(xiàn)有的視頻內(nèi)容進(jìn)行局部?jī)?yōu)化,如更換演員或環(huán)境,這對(duì)于需要特定場(chǎng)景或角色但預(yù)算有限的創(chuàng)作者來(lái)說(shuō)非常有價(jià)值。最后,短視頻平臺(tái)還可以使用Sora提高內(nèi)容的生產(chǎn)速度和質(zhì)量。由于它能夠生成精細(xì)復(fù)雜的場(chǎng)景和生動(dòng)的角色表情,所以,即使在資源有限的情況下,也能呈現(xiàn)高質(zhì)量的視覺(jué)效果,這使藝術(shù)創(chuàng)作的成本極大降低。綜上所述,短視頻行業(yè)可以利用Sora的多種能力提升內(nèi)容創(chuàng)作效率、質(zhì)量和多樣性。隨著技術(shù)的不斷進(jìn)步,創(chuàng)作者要不斷探索和適應(yīng),以確保最大化地利用其在短視頻制作中的優(yōu)勢(shì),發(fā)揮最大作用,創(chuàng)作出人機(jī)合作、高效優(yōu)質(zhì)的短視頻作品。
Sora帶領(lǐng)短視頻進(jìn)入全新的場(chǎng)景體驗(yàn)時(shí)代
首先,Sora作為OpenAI推出的文本生成視頻式AI模型,其能力在于根據(jù)文本描述創(chuàng)造出既真實(shí)又富有想象力的視頻內(nèi)容。這一技術(shù)的突破性在于它不僅能夠模擬物理世界中的運(yùn)動(dòng)和交互,還能夠處理數(shù)字世界中的復(fù)雜場(chǎng)景,如視頻游戲。這意味著Sora可以在虛擬世界中構(gòu)建起與現(xiàn)實(shí)世界相媲美的場(chǎng)景,并以此產(chǎn)生高質(zhì)量的視頻內(nèi)容。其次,Sora的技術(shù)優(yōu)勢(shì)在于其能夠生成長(zhǎng)達(dá)一分鐘的高質(zhì)量視頻,同時(shí)保持視覺(jué)質(zhì)量并遵循用戶的提示。這一點(diǎn)在短視頻制作中尤為重要,因?yàn)閯?chuàng)作者可以更自由地表達(dá)創(chuàng)意,不受現(xiàn)實(shí)拍攝條件的限制,在達(dá)到理想效果的同時(shí),更加節(jié)約成本。此外,Sora還能夠提供1080P的默認(rèn)清晰度,并且支持視頻的多視角生成,這些都是推動(dòng)短視頻進(jìn)入新體驗(yàn)時(shí)代的關(guān)鍵因素。最后,Sora的應(yīng)用范圍廣泛,從電影制作、短視頻培訓(xùn)到市場(chǎng)營(yíng)銷等多個(gè)領(lǐng)域都有其用武之地。例如,在電影制作中,Sora可以幫助創(chuàng)作者更好地構(gòu)思和預(yù)覽場(chǎng)景,省去美術(shù)設(shè)計(jì)以及現(xiàn)場(chǎng)堪景考察等前期準(zhǔn)備過(guò)程;在短視頻培訓(xùn)領(lǐng)域,Sora可以生成逼真的教學(xué)內(nèi)容,幫助學(xué)生更好地理解抽象概念;在市場(chǎng)營(yíng)銷中,Sora可以幫助品牌創(chuàng)造引人入勝的廣告內(nèi)容。因此,Sora可能會(huì)改變短視頻行業(yè)的創(chuàng)作方式,使一些傳統(tǒng)工序變得不再必要。例如,不需要實(shí)際拍攝和后期編輯,Sora可以直接生成最終產(chǎn)品。作品能夠體現(xiàn)精細(xì)的背景、復(fù)雜的鏡頭運(yùn)用和充滿情感的角色表現(xiàn),這些能力遠(yuǎn)遠(yuǎn)超出了其他AI視頻生成工具。我們有理由相信,Sora的出現(xiàn)將為短視頻的發(fā)展帶來(lái)革命性的變化,將帶領(lǐng)短視頻行業(yè)進(jìn)入全新的場(chǎng)景體驗(yàn)時(shí)代。
挑戰(zhàn)與展望
Sora的泛化生產(chǎn)使短視頻“單一乏味”
Sora的泛化生產(chǎn)是指短視頻創(chuàng)作過(guò)程中,追求高效、快速的產(chǎn)出,而采用模板化、套路化的生產(chǎn)方式,導(dǎo)致內(nèi)容質(zhì)量下降,出現(xiàn)單一乏味的現(xiàn)象,這種現(xiàn)象可能會(huì)對(duì)短視頻行業(yè)的發(fā)展產(chǎn)生一定的負(fù)面影響。從觀眾角度看,觀眾面對(duì)大量相似、重復(fù)的內(nèi)容,容易感到審美疲勞,降低觀看體驗(yàn),可能導(dǎo)致觀眾流失;從創(chuàng)作者角度看,過(guò)度依賴模板化生產(chǎn),可能導(dǎo)致創(chuàng)作者逐漸喪失獨(dú)立思考和創(chuàng)新能力,不利于行業(yè)的長(zhǎng)遠(yuǎn)發(fā)展。泛化生產(chǎn)導(dǎo)致的低質(zhì)量?jī)?nèi)容可能對(duì)整個(gè)行業(yè)產(chǎn)生負(fù)面印象,影響行業(yè)的口碑和發(fā)展。同時(shí),可能導(dǎo)致行業(yè)內(nèi)的創(chuàng)新活力減弱,不利于新的創(chuàng)意和技術(shù)的出現(xiàn),限制了行業(yè)的發(fā)展空間,擾亂了行業(yè)的發(fā)展秩序。
Sora是目前為止性能最強(qiáng)悍的文生視頻模型(很可能短期內(nèi)也難逢敵手),但Sora也有一些比較失敗的案例視頻被廣泛討論。盡管Sora在視頻長(zhǎng)度、一致性、分辨率以及理解力等方面取得突破,但是就文生視頻領(lǐng)域當(dāng)下面臨的重要問(wèn)題,Sora尚未給出完美的解決方案,以其輸出的作品為例。輸入不同的語(yǔ)義指令,有時(shí)會(huì)得到雷同的畫面,甚至在畫風(fēng)或內(nèi)容結(jié)構(gòu)上高度相似。這也是輸出作品風(fēng)格趨于一致問(wèn)題的集中體現(xiàn),如何通過(guò)恰當(dāng)?shù)恼Z(yǔ)義指令輸入,從而得到預(yù)期的內(nèi)容輸出仍有待解決。
辯證看待Sora在短視頻中的作用
短視頻行業(yè)要以辯證的思維看待Sora,既要了解它帶來(lái)的高效便捷,也要意識(shí)到其中的片面性。在短視頻商業(yè)市場(chǎng)中,智能、高效、優(yōu)質(zhì)、網(wǎng)感等關(guān)鍵詞成為人才流通的門檻,數(shù)智化時(shí)代快速發(fā)展,在人工智能“內(nèi)卷”的趨勢(shì)下,如何挑選合適的短視頻人才已經(jīng)成為時(shí)代課題。但不是在Sora和人才之間二選一,而是要挑選能夠熟練駕馭Sora的人才,以發(fā)揮效率和資源的最大化作用。作為短視頻創(chuàng)作人才,不要被Sora局限,要積極發(fā)揮主觀能動(dòng)性,在短視頻制作過(guò)程中,投入主觀情感,發(fā)揮審美功能,了解并駕馭Sora,使其成為短視頻制作中的得力助手。文生視頻因其仿真性及便捷性,受到自媒體以及商業(yè)機(jī)構(gòu)的青睞,一定程度上影響了人們對(duì)客觀世界的了解。雖然以Sora為代表的文生視頻類大模型可以將人工智能對(duì)世界的理解與認(rèn)知投射到現(xiàn)實(shí),但這種投射受使用者意念的控制。因此,高度仿真性的背后依然離不開(kāi)人類的指導(dǎo)與把控。以人工智能Sora創(chuàng)作視頻作品為例,對(duì)其輸出精準(zhǔn)的指令并用客觀的態(tài)度考量AI作品,使其既具有藝術(shù)特色,又不失去原本的特點(diǎn)。
在Sora出現(xiàn)之前,人工智能的發(fā)展已經(jīng)如火如荼。例如,ChatGPT,你給我一個(gè)問(wèn)題,我給你一個(gè)滿意的答案;阿爾法狗(AlphaGo)在圍棋比賽中戰(zhàn)勝了人類冠軍。在強(qiáng)大的高科技基礎(chǔ)上,Sora更上一層樓,基于對(duì)它的充分了解與研究,如何合理運(yùn)用是當(dāng)下短視頻制作的主要研究課題。作為新媒體行業(yè)從業(yè)者,把握時(shí)代潮流,了解并能夠取長(zhǎng)補(bǔ)短,對(duì)Sora高效、穩(wěn)定的內(nèi)容輸出進(jìn)行學(xué)習(xí)和掌握,能夠熟練應(yīng)用,進(jìn)而輔助創(chuàng)作,這必將使新媒體作品實(shí)現(xiàn)質(zhì)的飛躍。御人工智能之“劍”,豐視頻制作之“羽翼”,Sora開(kāi)創(chuàng)了人工智能的生成式路徑,預(yù)示著人工智能正向人類智能靠近,無(wú)論在生成邏輯、哲學(xué)本質(zhì)還是世界圖景上都向前推進(jìn)了一大步。面對(duì)Sora、ChatGPT等高效快捷易使用的人工智能,要秉持客觀開(kāi)放的態(tài)度,觀察、思考人工智能對(duì)社會(huì)的影響以及未來(lái)的發(fā)展。面對(duì)新興科技的發(fā)展,不僅要保持敏銳的洞察力和開(kāi)放的心態(tài),更要積極擁抱科技時(shí)代。首先,需要認(rèn)識(shí)到,科技的每一次重大突破都是對(duì)人類社會(huì)發(fā)展的巨大推動(dòng)。從工業(yè)革命到信息革命,再到如今的人工智能、大數(shù)據(jù)、云計(jì)算等前沿技術(shù)的不斷涌現(xiàn),科技正在以前所未有的速度改變著我們的生活、工作和生產(chǎn)方式。其次,在科技日新月異的時(shí)代,要勇于接受挑戰(zhàn),不斷學(xué)習(xí)新知識(shí),提升自己的科技素養(yǎng)。要敢于嘗試新技術(shù),勇于探索未知領(lǐng)域,通過(guò)實(shí)踐檢驗(yàn)科技的魅力和價(jià)值。同時(shí),要善于利用科技的力量,為短視頻制作帶來(lái)更多的便利和樂(lè)趣。
隨著AI技術(shù)的迅猛發(fā)展,我們需要不斷適應(yīng)新工具和工作流程的變化,秉持開(kāi)放的心態(tài)和持續(xù)學(xué)習(xí)的態(tài)度,與Sora等AI系統(tǒng)的良好相處至關(guān)重要。雖然AI系統(tǒng)可能越來(lái)越“聰明”,但有效溝通仍然不可或缺。需要清晰地表達(dá)自身需求和期望,同時(shí)正確理解AI提供的信息或建議,避免產(chǎn)生誤解和錯(cuò)誤。此外,不應(yīng)完全依賴Sora等AI系統(tǒng)。它們雖然在分析數(shù)據(jù)和識(shí)別模式方面表現(xiàn)出色,但可能缺乏情境理解和道德判斷能力。因此,應(yīng)始終保持批判性思維,對(duì)其輸出的內(nèi)容進(jìn)行謹(jǐn)慎評(píng)估和權(quán)衡。Sora的出現(xiàn)可能會(huì)改變某些工作的性質(zhì),甚至取代部分傳統(tǒng)崗位。面對(duì)這一趨勢(shì),社會(huì)應(yīng)通過(guò)教育和培訓(xùn)幫助勞動(dòng)者適應(yīng)這些變化,鼓勵(lì)他們轉(zhuǎn)向更具創(chuàng)造性和戰(zhàn)略性的工作領(lǐng)域。總之,與人工智能相處是一個(gè)不斷學(xué)習(xí)、適應(yīng)和創(chuàng)新的過(guò)程。負(fù)責(zé)任地使用和發(fā)展AI技術(shù),使其對(duì)社會(huì)的積極影響實(shí)現(xiàn)最大化,共同開(kāi)創(chuàng)更加美好的未來(lái)。
在Sora的應(yīng)用過(guò)程中,關(guān)鍵在于明確其優(yōu)勢(shì)和局限,并找到協(xié)同工作的方式,以實(shí)現(xiàn)最佳效率和質(zhì)量的結(jié)合。明確目標(biāo)和需求,分析哪些任務(wù)適合自動(dòng)化(如Sora擅長(zhǎng)處理的任務(wù)),哪些任務(wù)需要人工介入,合理使用Sora,識(shí)別其在處理數(shù)據(jù)、生成內(nèi)容或執(zhí)行任務(wù)方面的優(yōu)勢(shì),充分利用Sora的自動(dòng)化能力,處理重復(fù)性、預(yù)測(cè)性或標(biāo)準(zhǔn)化的任務(wù)。同時(shí),明確人工制作的必要性。例如,確定需要人類創(chuàng)造力、判斷力和專業(yè)知識(shí)的任務(wù),需要藝術(shù)感、情感投入的環(huán)節(jié)。在短視頻制作過(guò)程中,制訂工作流程,明確Sora和人工在各個(gè)環(huán)節(jié)中的職責(zé)和角色。確保Sora處理的輸出為人工制作提供有價(jià)值的輸入,而人工制作的成果又能為Sora提供反饋和改進(jìn)的機(jī)會(huì)。實(shí)現(xiàn)人類和Sora的優(yōu)化協(xié)同工作,不僅要熟知Sora的性能,并根據(jù)需要調(diào)整其參數(shù)和設(shè)置,優(yōu)化其輸出結(jié)果;還要定期對(duì)人工制作的過(guò)程進(jìn)行審查,提供必要的培訓(xùn)和指導(dǎo),提高效率和質(zhì)量。
通過(guò)對(duì)Sora在短視頻制作中應(yīng)用的深入探究,不難發(fā)現(xiàn),Sora作為一款功能強(qiáng)大、操作簡(jiǎn)便的短視頻制作工具,在短視頻創(chuàng)作領(lǐng)域已經(jīng)占據(jù)了重要地位。其獨(dú)特的創(chuàng)意功能和高效的編輯工具,為創(chuàng)作者們提供了豐富的發(fā)揮空間,使短視頻的制作過(guò)程更加高效、有趣。在探究過(guò)程中,本文詳細(xì)探討了Sora的各項(xiàng)功能及其在短視頻制作中的具體應(yīng)用,在各個(gè)環(huán)節(jié)Sora都展現(xiàn)出其卓越的性能和便捷的操作體驗(yàn)。隨著短視頻行業(yè)的不斷發(fā)展和技術(shù)的不斷進(jìn)步,Sora作為一款優(yōu)秀的短視頻制作工具,必將繼續(xù)發(fā)揮重要作用。期待Sora能夠持續(xù)更新優(yōu)化,為創(chuàng)作者們提供更加豐富的功能和更加優(yōu)質(zhì)的體驗(yàn),推動(dòng)短視頻行業(yè)的繁榮發(fā)展。同時(shí),也希望更多的創(chuàng)作者能夠認(rèn)識(shí)到Sora的價(jià)值,積極嘗試,使用其進(jìn)行創(chuàng)作,共同推動(dòng)短視頻行業(yè)的創(chuàng)新與發(fā)展。
浙江省習(xí)近平新時(shí)代中國(guó)特色社會(huì)主義思想研究中心常規(guī)課題“習(xí)近平青年觀視域下媒介教育數(shù)字化實(shí)踐研究”(項(xiàng)目號(hào):22CCG35);2023年國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目資助(項(xiàng)目編號(hào):202311647046)。