人工智能的作品不只是“好看”

2025-03-16 00:00:00萌主

聰明泉·上半月 2025年2期

近來(lái)，人工智能領(lǐng)域又迎來(lái)重磅產(chǎn)品。OpenAI公司發(fā)布的人工智能模型Sora，可根據(jù)文字生成逼真的AI視頻，引發(fā)了全世界的關(guān)注和討論。

Sora是一款文生視頻模型，生成的視頻精度、仿真度極高，足以“以假亂真”。在Sora生成的視頻中，有清澈靈動(dòng)的眼眸，有活潑可愛(ài)的萌寵，有神秘莫測(cè)的海底世界，有熙熙攘攘的夏日街區(qū)，有充滿科技感的現(xiàn)代都市……由于Sora生成的視頻過(guò)于“好看”，業(yè)界內(nèi)外無(wú)比驚嘆，對(duì)它好評(píng)如潮。盡管目前Sora生成的視頻時(shí)間不長(zhǎng)，短期內(nèi)無(wú)法對(duì)影視工業(yè)等行業(yè)造成影響，但足以沖擊短視頻行業(yè)、新聞行業(yè)等。

Sora最令人震撼的并非制作出了“好看”的視頻，而是制作出了逼真的、符合人們認(rèn)知常識(shí)的內(nèi)容。這意味著它能深入學(xué)習(xí)和了解很多元素之間的互動(dòng)關(guān)系。比如，在Sora生成的視頻里，有一只貓去撓床上的主人，主人一翻身，枕頭就被壓皺了——關(guān)鍵就在枕頭。如果是用計(jì)算機(jī)特效制作枕頭的褶皺，絕對(duì)是一個(gè)噩夢(mèng)——要用什么函數(shù)才能描述枕頭的褶皺？這種逼真的效果很難呈現(xiàn)。事實(shí)上，ChatGPT的問(wèn)世，解決了機(jī)器和人之間相互理解和交互的問(wèn)題，因?yàn)樗斫饬苏Z(yǔ)言——語(yǔ)言是人類獨(dú)有的，理解人類語(yǔ)言意味著非常大的進(jìn)步。Sora則比理解人類語(yǔ)言又進(jìn)步了一個(gè)層次。

這一觀點(diǎn)在OpenAI公司對(duì)Sora的定義中也得到了證實(shí)。OpenAI公司并未將其作為單純的文生視頻模型，而是視作“世界模擬器”，這意味著Sora還能夠不斷“進(jìn)化”去理解世界、理解事物因果關(guān)系，在未來(lái)能夠生成更長(zhǎng)的視頻，以及具備構(gòu)建物理世界通用模擬器的能力。

但是，文生視頻模型作為一項(xiàng)新興技術(shù)，存在一定的潛在風(fēng)險(xiǎn)。首先，它可能被濫用，比如生成假新聞或者誤導(dǎo)性內(nèi)容，對(duì)社會(huì)秩序構(gòu)成威脅。其次，由于它生成的視頻可能與現(xiàn)實(shí)世界難以區(qū)分，可能導(dǎo)致公眾對(duì)真實(shí)性的認(rèn)知產(chǎn)生混淆。最后，它的決策過(guò)程不透明，可能會(huì)導(dǎo)致責(zé)任歸屬問(wèn)題，當(dāng)生成的視頻出現(xiàn)問(wèn)題時(shí)，難以確定責(zé)任方。要想規(guī)避這些風(fēng)險(xiǎn)，還需要科技、法律、監(jiān)管等各方面共同努力，最終實(shí)現(xiàn)“科技向善”的目的。