【摘要】基于大語言模型的生成式人工智能備受關注,在闡述Sora特點與技術路徑的基礎上,分析Sora對融合出版業的賦能及潛在風險,并進行反思。作為全新的文本生成視頻模型,Sora的出現為融合出版行業帶來新的機遇、創新融合出版業態,豐富行業內容制作形式,但同時也沖擊既有崗位,帶來如深度偽造、編碼凝視等風險。因此,在融合出版行業,Sora既是助手,也可能成為潛在的對手,其關鍵在于如何發揮人的主體性以平衡技術應用與人類智慧的協同發展。
【關鍵詞】Sora;生成式人工智能;融合出版;人機協同;主體性
一、Sora:作為“世界模擬器”的生成式人工智能模型
在人工智能的發展背景下,基于大語言模型(LLMs)的生成式人工智能備受關注,諸如聊天式機器人ChatGPT、文本轉圖片模型DALL-E2、Midjourney等模型掀起AI熱潮,席卷各個行業。繼推出大語言模型產品ChatGPT后,2024年2月15日,OpenAI公司發布最新一代的文生視頻人工智能模型Sora,再度掀起熱潮。OpenAI公司對Sora的命名取自日語“天空”之意,在官網介紹材料中稱Sora為“worldsimulator”,指出Sora被設計作為一個復雜的世界模擬器運行,可以依據自然語言文本指令,渲染接近現實并富有想象力的場景。從技術層面講,Sora并不是文本生成視頻模型領域的首創產品,早期的模型包括Runway的Gen-2、StabilityAI的StableVideoDiffusion以及最近谷歌的Lumiere,都為文本生成視頻領域鋪墊了道路,但是由于缺乏具有高質量文本視頻的數據集以及建模高維視頻數據較為復雜,早期模型所生成視頻長度過短、畫面單一、質量較低等。而Sora模型能夠深刻理解人類自然語言,在保持視覺質量并遵守用戶文本指令的前提下,可以生成長達一分鐘逼真且富有想象力的視頻。從3—4秒的切片畫面到60秒的完整短視頻,目前Sora所帶來的媒介生態迭代可以理解為一種漸進式革命,即Sora是定位在生成式AI浪潮下的視頻技術革命層面的一個節點,其發展的技術路徑是對早期生成式人工智能模型技術邏輯的系統性整合,本質上是媒介技術的一次重大升維,使得弱人工智能向強人工智能的躍遷達到了新的高度。
毋庸置疑,以Sora為代表的生成式人工智能模型的出現將改變人們處理任務、解決問題以及與技術交互的方式。首先,Sora不僅可以接受自然語言的文本提示詞,還可以識別視覺領域的圖片和視頻提示。基于此,Sora能夠對輸入的圖像和視頻進行編輯,既可以擴展既有的畫面,保證視頻片段的連貫銜接,又可以給靜態圖像添加動畫效果,提升視頻片段的創意色彩。Sora增強了將文本描述轉換為視覺內容的可訪問性,為更多想要積極參與內容創作的用戶提供了一種創新的解決方案。[1]其次,Sora具備高質量的模擬能力。Sora不但可以理解自然物理世界動態的空間維度,在不依賴3D建模的前提下,將人物和場景元素在三維空間中始終保持與3D一致,而且可以把握現實世界的時間維度,與既定對象有持久以及長距離的簡單交互,比如Sora可以在對象被遮擋或離開畫面時仍然保持時間一致性。此外,Sora能夠大幅降低UGC的門檻,可以消弭專業化壁壘,將專業術語、操作轉化為簡單的文本提示詞,比如在《我的世界》《蛋仔派對》等有較高創作自由度的主流UGC游戲中,玩家的美術功底和操控能力決定了該類游戲可玩性的上限。但隨著類Sora技術的普及迭代,AI技術可以把劇情設計、世界觀構成、交互玩法等內容創作轉換為簡單的文本提示詞,將進一步消融UGC游戲的技術門檻,為玩家和游戲生態提供更多可能。這些功能印證著發掘以Sora為代表的生成式人工智能模型的潛力是朝著構建物理世界通用模擬器的有效路徑。最后,Sora具備更靈活的采樣能力。一方面,Sora可以控制生成視頻的畫面幀率,能夠生成寬屏1920×1080p視頻、豎屏1080×1920p視頻以及介于兩者之間的內容;另一方面,Sora可以改善畫面的構圖和框架,呈現更加貼合專業視頻的幀率,匹配更完美的畫面縱橫比。因此,基于Sora在創建內容生成和從文本轉換到視頻的強大功能,其問世必將為社會各行業帶來變革。在影視創作行業,Sora可以豐富影視產品的敘事手段,增強畫面的視覺表現力,將極具想象色彩的畫面清晰地呈現,比如首部中國原創文生視頻AI系列動畫《千秋詩頌》,聚焦語文教材的200多首詩歌,借助央視聽媒體大模型,還原古詩詞中的場景;在醫療領域,Sora可以模擬多個角色和物體之間的交互,完整構建復雜的醫療假設,促進病患溝通等。綜合來看,Sora不是簡單的視頻生成器,其終極目標是模擬和復刻真實的世界圖景。Sora的出現不僅是從文生文字、圖片到文生視頻的轉變,更是人工智能大模型技術發展邁向通用人工智能發展過程中的里程碑式節點。[2]
然而,除了關注Sora模型的巨大潛力外,如何解決現代人工智能模型中存在的問題仍然至關重要。實際上,生成式人工智能模型的應用前提都離不開數據,離不開數據語料庫的建設,因此,Sora等AI工具在數據抓取、學習以及應用過程中存在的風險是不可忽視的研究議題。[3]美國《連線》雜志的編輯艾倫·亨利(AlanHenry)指出,由于數據集設計不當以及AI工具對自身決策和執行流程的幻覺缺乏認識,目前的人工智能文本生成系統仍然容易出現基本的簡單錯誤。這一言論強調了作為智能媒介技術的Sora在使用過程中帶來的深度偽造、錯誤信息等挑戰(訓練數據集的濫用、用戶隱私泄露、人工智能偏見)。此外,Sora的廣泛使用可能會對各行各業帶來沖擊,是否會影響原有工作者甚至顛覆原有工作等問題也不容忽視。
總體來說,文本生成視頻模型Sora的發展是沿著智能生成文本、圖片到智能生成視頻的路徑進行的,是從以文本為基礎的單模態到以影像為基礎的多模態的變化,代表了人工智能將人類想象力可視化的重大飛躍。[4]這一飛躍也恰巧反映了生成式人工智能研究的目標,即賦予人工智能系統理解和互動自然物理環境的能力。[5]隨著生成式人工智能技術從早期的智能生成文本、智能生成圖片到如今智能生成視頻的更新迭代,AIGC(人工智能生成內容)的可用度和便利度越來越高,生成式人工智能大模型的應用不斷在各個領域鋪展。[6]有學者認為,隨著AI工具的廣泛運用,未來PGC(專業生成內容)將普遍采用AI工具制作,UGC(用戶生成內容)會逐漸被AIGC(人工智能生成內容)取代,內容生產領域將迎來全新的變革。[7]作為注重內容創作的出版行業,Sora的出現標志著一場深刻的變革即將到來,出版業內既有的運行范式將會發生改變。本文結合“可供性理論”的分析框架,聚焦于Sora對融合出版行業的三個核心要素——移動可供性、生產可供性和社交可供性進行分析,主要討論以下問題:一是探討Sora對融合出版行業的賦能;二是分析以Sora為代表的生成式人工智能對融合出版行業帶來的機遇和風險;三是反思在邁向通用人工智能(AGI)發展的道路上,融合出版行業將如何擁抱全新智能媒介技術所帶來的新變化?通過對Sora在融合出版行業的相關機遇、風險的全面了解以及對新技術熱潮的反思,本文的目標是提供應對這些挑戰和緩解風險的實用建議,從融合出版角度看,利益相關者可以采納本文概述中的建議,充分了解并使用以Sora為代表的生成式人工智能模型,為邁向通用人工智能(AGI)時代做好準備。
二、技術升維:Sora與融合出版行業的結合點
智能媒介技術的發展為融合出版的創新賦能,Sora的出現不僅代表了生成式人工智能創意工具的飛躍,更是將出版行業的創新推向新的高度。作為一種新型生成式人工智能模型,Sora克服早期視頻生成模型生成視頻長度短、渲染視頻質量低等限制,為融合出版行業范式的創新提供了巨大的機遇。在出版領域,Sora可以為融合出版提供新質生產力,拓展融合出版行業制作內容的方式,為內容創作提供范式,最終促進融合出版的發展,可以在出版從業人員中落地開花,大幅提升融合出版業的工作效率。在媒體領域,正如AI電影《山海奇境》制作人陳坤所表示的:“在Sora誕生前,其利用AI視頻工具制作科幻電影的成本已經下降了一半,Sora落地后,更加值得期待?!币虼?,未來的Sora還有望進一步降低影視、傳媒作品的創作門檻、成本等,營造更廣泛的媒體生態。Sora在自動駕駛領域引發的變革也不可忽視,現有行業技術可以支撐Sora依據數據庫內容的輸入,實時更新變化自動駕駛汽車的模擬場景,實現更全面、深度且便捷的汽車訓練和測試。無論是藝術創作還是科技模擬,Sora與既有的生成式人工智能不同,其具備理解人類世界因果、時空觀念的能力,這代表著人工智能在將人類抽象思維向具象化視頻轉變過程中邁出的巨大一步。此外,Sora還可以將創意性思維轉換為可視化場景,使得人工智能能夠理解人類的想象力,這印證著以Sora為代表的生成式人工智能不會局限于現有創新技術的框架下,將成為高度智能化的人類助手,以化學實驗中“催化劑”的身份呈現,加速催化社會各行業和領域的發展與變革。[8]
(一)移動可供性:智能驅動產品生成,推動形態創新提質增效
Sora的出現將推動融合出版行業內容創作的多元化和多形態展現,結合3D渲染、元宇宙等技術,創建“人人皆現場,觀眾如臨場”的新時代表達。傳統的出版行業以專業生成內容(PGC)為主,出版物以紙質讀物為主,出版行業承擔著編審等責任。隨著社交媒體的出現,用戶生成內容(UGC)逐漸普及,文字、圖片、音視頻等形態的數字化出版物接踵而來,但是專業界限模糊,生成內容質量參差不齊,出版行業轉向以校審為主。[9]隨著以Sora為代表的生成式人工智能爆火,用戶通過簡單的文本提示詞就能夠生成作品,編輯出版的專業門檻大幅降低,以Sora為代表的生成式人工智能可以輸出高質量產品,在此過程中,融合出版行業可以利用Sora先進的文本生成視頻功能,創作多元、多形態的出版物,通過創新的交互式產品增強趣味性、現場感等以吸引讀者,比如在教育類出版物中可以通過視頻生成技術展現科幻的故事情節以及復雜的科學實驗等,在保證視頻質量的前提下,還可以實現創意的別具一格。
此外,為滿足日益增長的互聯網用戶的在線需求,紙質的編輯出版產品逐漸向數字化的融合出版產品發展,并逐漸與數字化的融合出版行業無縫對接。[10]在融合出版產品領域中,鑒于3D模型、VR/AR/MR等技術高額的應用成本,出版產品的質量不一,融合產品的應用受限。[11]無論是為出版物訂制多維度的視覺風格,還是為融合產品用戶帶來沉浸式的閱讀體驗,Sora都可以依據關鍵詞或文本提示生成高質量的三維實景視頻,從而降低虛擬現實技術應用的成本,為融合出版產品提質增效。[12]因此,將Sora模型應用在融合出版行業內,不僅開辟了新的產品表現形態,還降低了技術應用成本,為融合出版類產品的發展提供更多的可能性。
(二)生產可供性:強化私人訂制意識,驅動用戶體驗升級
Sora的出現將進一步推動融合出版行業從自我中心向用戶中心發展,通過媒體將社交由“人際交互”向“人機交互”擴展,提高生成式人工智能模型使用的靈活性,賦能用戶能動性。相較于傳統編輯出版行業以自我為中心的營銷狀態,隨著媒介技術的發展,用戶逐漸成為融合出版行業應考慮的主要目標。有學者從算法個性化視角出發,指出通用人工智能(AGI)個性化的終極愿景就是實現“用戶自我化”,作為AI驅動工具的Sora,其可以根據用戶輸入的文本指令生成獨特性的視頻產品,實現真正意義上的“私人訂制”。[13]因此,以Sora為代表的生成式人工智能不但可以幫助融合出版行業精準預測用戶需求,實現產品的個性化訂制,還能夠促進用戶與出版商的互動與交流,增強用戶的參與感和互動性,提升用戶使用產品的體驗感。此外,在游戲領域,Sora可以通過實時適應玩家的決策選擇文本對話,動態渲染出高保真的游戲場景,使得過場動畫不再局限于設定好的腳本事件,讓用戶有更多獨一無二的互動體驗。為應對媒介技術生態環境的變革,融合出版行業還可以研發適配出版業務自身的生成式人工智能模型,積極探索新的業務模式和服務形態。例如,通過建立貼合Sora使用模型的用戶行為數據庫,出版商可以分析用戶使用Sora模型生成內容的偏好,進而提供更加精準的內容推薦。同時,出版商還可以利用Sora等工具,開展互動式內容創作,讓用戶參與到內容的生產過程中,進一步提升用戶的參與感和滿足感。
總之,Sora的出現為融合出版行業帶來了前所未有的機遇。通過強化私人訂制意識,并不斷優化用戶體驗,出版商可以在這個數字化、智能化的時代找到新的增長點。未來,隨著技術的進一步發展,我們有理由相信,融合出版行業將能夠為用戶提供更加豐富、個性化的閱讀體驗,同時也將為整個社會的知識傳播和文化發展作出更大的貢獻。
(三)社交可供性:協同社交媒體技術,革新視頻化營銷策略
隨著以Sora為代表的文本生成視頻模型成為前沿技術,它們普遍運用在不同的研究領域,基于Sora根據文本指令生成短視頻的能力,其可以與社交媒體結合,為融合出版行業社交媒體平臺上的內容創作提供新的可能性。[14]對出版社而言,一方面,Sora可以整合出版產品的文本與圖像,將靜態的圖文敘事轉化為動態的視頻敘事,提升用戶閱讀體驗;另一方面,Sora可以依據出版產品生成用戶想象的畫面,既簡化視頻創作流程,又創新畫面視覺元素,極大地提升宣傳效果。有研究表明,Sora能夠突破抽象和現實的界限,實現文本、圖片和動態敘事的整合,使視頻營銷更加大眾化,憑借Sora,融合出版行業可以制作視頻預告片、書籍介紹視頻等多種形式的宣傳內容,通過社交媒體、視頻網站等平臺廣泛傳播,這種視頻化的宣傳方式不但能夠更好地吸引讀者注意,提高書籍的曝光率和銷售量,促進出版社的運營,還能夠將創作內容動態化和沉浸式呈現,助力推動融合出版行業邁入新時代。[15]
總體來看,以Sora為代表的文本生成視頻模型實現了在融合出版行業改變規則的創新,可以滿足出版商與用戶的多樣化需求,為雙方帶來更具定制化的互動體驗,也為改變融合出版行業數字營銷提供可能性。隨著生成式人工智能技術的不斷發展,融合出版行業可以借助Sora實現人機協同的運行范式,持續變革和再造行業工作流程,推動出版全媒體營銷矩陣的形成,補足補強融合出版行業營銷數字化的薄弱環節,提高營銷轉化率,推動智能媒介生態下融合出版行業的轉型升級。[16]
三、風險陳列:Sora狂歡熱潮后的冷思考
任何事情的發展都具有兩面性,雖然以Sora為代表的生成式人工智能催化了社會各行業與領域的發展進程,但是這類工具也有可能成為有害內容的“放大鏡”,放大生成式人工智能模型對社會以及各行業的沖擊與風險。有學者認為,Sora的到來實際上是對人類社會權利的一次重新洗牌,原有掌握在人類手中的權利被更多地分配到了人工智能中,而在向人工智能交付社會行使權利的過程中,不可避免地會出現一系列負面問題。[17]比如,Sora所輸出的內容存在深度偽造的風險,會導致人們的混亂與分裂,破壞社會的信任和凝聚力;Sora模型內還包含有歧視和偏見的訓練數據集,會加劇性別、種族等話題的沖突。此外,鑒于Sora模型對訓練數據集的依賴,其訓練過程中是否存在數據濫用等行為也有待考證。與任何新技術一樣,Sora的出現也會對社會各行業帶來沖擊,比如其快速生成高質量視頻的能力大幅度降低了影視創作的門檻,可能會進一步擠占傳媒行業的工作崗位等??傊?,無論是數據訓練還是擠占崗位,隨著人工智能逐步向通用人工智能(AGI)發展,其自主性權利逐漸擴大,人與機器的關系也發生異化,即從既有的機器模仿人類的行為轉變為人主動學習機器的運行邏輯,人類的思維逐漸向機器化發展,各種社會矛盾也隨之浮出水面。[18]此外,鑒于人工智能逐漸向現實圖像的生成方式發展,其所帶來的有害因素變得不易察覺,因此我們要時刻保持警惕,反思以Sora為代表的生成式人工智能熱潮的背后風險。
(一)深度偽造致使社會恐慌,增加編輯審核的難度
無論是超脫于現實生活的視頻畫面還是與現實世界幾無差別的超真實畫面,Sora都可以依據用戶輸入的文本指令進行創建,既可以將想象畫面真實呈現,提升融合出版產出內容的趣味性,又能夠增強視覺的真實感,提升用戶的體驗效果。但是對融合出版行業而言,Sora創作高保真視頻的優勢同樣也是一把“雙刃劍”,基于Sora生成高保真視頻的特性,超真實的畫面,易消弭真實與虛幻之間的界限,其產出的視頻極易令人相信,當這些內容以“真相”形式進行傳播時,無論是意外的(錯誤信息)還是故意的(虛假信息),都會導致人們認知混亂和社會恐慌。顯而易見,當Sora的深度偽造(Deepfakes)風險嵌入到社交媒體背景下的傳播環境中,不法分子更容易制作并傳播深度偽造視頻,增加編輯內容審核的難度,虛假信息更易于傳播,人們很容易陷入到一個充斥著以假亂真視頻的社交媒體平臺環境中,使媒介上傳播的內容真實與虛構變得無法區分,其結果會使公眾的社會信任和凝聚力遭受破壞。[19]Mvondo等人基于UTAUT2理論,構建用戶Sora使用意愿研究模型,通過對940名受訪者進行調查,發現用戶對Sora模型輸出內容的感知真實性是驅動用戶使用意愿的關鍵因素,這證明用戶對文本生成視頻模型深度偽造的風險表示擔憂,而當用戶發現Sora模型生成的內容真實且引人入勝時,他們會認為文生視頻模型很有用,并愿意使用它。[20]DigiDiplomacy首席人工智能治理負責人埃斯克·蒙托亞(EskeMontoya)指出:“人工智能正在重塑競選策略、選民參與和選舉誠信的結構?!闭渭铱梢岳蒙墒饺斯ぶ悄芗夹g戰略性地制作并傳播有關對手的虛假但令人信服的負面文本、圖片、視頻等來影響選舉的結果。比如,在2024年1月的美國新罕布什爾州初選中,一通由AI生成的模仿喬·拜登(JoeBiden)總統聲音的虛假電話阻止了部分選民的投票行為?,F有的人工智能深度偽造技術已經帶來了不容忽視的風險,以Sora為代表的文本轉視頻技術進一步擴大了深度偽造滋生的空間,提升了融合出版行業審核內容的難度,未來對AI視頻的監管任重而道遠。
(二)技術更迭沖擊工作崗位,侵權、版權界定或成難題
Sora可以低成本、快速地生成高質量的內容,是讓人擺脫瑣碎事物的轉折點,但也存在逐漸僭越權利的界限,擠壓出版行業的生存空間,引起崗位替代、人員失業等風險。生成式人工智能技術背后的底層邏輯是可用度、便利度,Sora的出現能夠更新融合出版產品的創作方式,大幅降低內容創作的技術門檻,改變融合出版行業的傳播格局,即傳播內容生成主體從早期的專業生成內容(PGC)過渡到用戶生成內容(UGC)再變革到當下人工智能生成內容(AIGC),出版產品呈現方式從紙質產品到圖像、音視頻產品,然后過渡到數字融合產品再到當下的極度擬真甚至超越現實的AI產品,智能媒介技術日新月異的更迭不斷打破創作者的專業壁壘,給融合出版行業的發展帶來挑戰,也使整個行業的主體認同遭受沖擊。[21]除變革內容產出方式外,以Sora為代表的生成式人工智能技術還改變了傳統融合出版行業的供給結構,重新定義出版人的身份,即傳統讀者與編輯之間的固有身份被打破,人人皆可通過智能媒介技術創作出高質量的產品,相應地,如文案編撰、視頻剪輯制作等重復性、標準程度較高的工作崗位會面臨被替代的風險。此外,生成式人工智能改變內容產出方式,以對話式的方式獲取知識,作為內容產業的出版業應防范人工智能可能帶來的著作權侵權問題。北京印刷學院副院長陳丹指出,目前難以發現和界定人工智能侵犯版權的行為,出版業的版權資產面臨著被盜用的風險。誠然,ChatGPT、Sora等人工智能模型依賴數據庫存活,如何界定數據學習的版權是亟待解決的問題,正如HarrisX首席執行官DritanNesho所表示的,以Sora為代表的生成式人工智能的復雜性與先進度不斷增長,增加了人們對智能工具影響生活的擔憂,亟須為這個新興行業建立監管護欄,保證技術的可控性。
(三)數據輸入一葉障目,資本的詭譎暗流涌動
生成式人工智能模型的輸出內容并不是憑空產生的,而是高度依賴于訓練它的數據集,有關數據的使用主要有兩方面的風險。其一是訓練數據集的狹窄。與其他生成式人工智能產品一樣,Sora只能從現有的數據庫中獲取數據進行訓練,因此它會不加任何情感價值過濾地吸收互聯網中的內容,這使得它容易受到文化偏見或刻板印象的影響。[22]比如在性別陰影實驗(GenderShadesProject)中,研究者發現部分商業人工智能系統錯誤地將女性和膚色較深的人識別為男性,其實驗數據表明深色皮膚的女性被錯誤分類的概率高達34.7%,而膚色較淺的男性的最大錯誤率僅為0.8%,存在嚴重的性別化、偏見化。[23]因此,生成式人工智能本質上并不是中立的,它們優先反映那些有能力塑造AI的人的偏好和偏見,而對其他群體則存在一種編碼凝視,即AI在用戶無意識的情況下就按照既有的偏見劃分隊列、區別對待。此外,Sora訓練數據集由西方國家設計,其中必定灌輸西方的意識形態以及價值觀,潛移默化地影響融合出版行業,會導致在關鍵領域出現歧視性結果。
其二是訓練數據集的來源。生成式人工智能能夠快速生成高質量的內容歸因于其輸入數據的架構,除去數據訓練集狹窄帶來的歧視與偏見外,以Sora為代表的生成式人工智能的訓練數據集從何而來也是一個值得深究的問題。對此,OpenAI公司僅僅表示Sora的訓練數據是經過許可、公開可用的,并未對是否使用其他社交媒體平臺中的視頻數據作出明確回應。然而數據的“可公開獲取”與“公域”并不總是能畫等號。[24]一方面,Sora的數據可能來源于藝術家、作家等,在未經適當授權的情況下可能會復制、學習受版權保護材料,侵犯版權,致使創作者的創作意愿下降。[25]另一方面,伴隨著數據的跨界流動,Sora可能會收集與國家、科研機構等相關的敏感數據,產生數據泄露、影響數據主權等問題,將國家安全置于風險之中。就融合出版行業而言,現有人工智能的數據來源于西方,在數據的輸入與內容的產出中帶有先天的價值觀傾向,可能會沖擊融合出版行業秉持的頂層設計;此外,以Sora為代表的人工智能技術的發展已經超出當前法律的規定,現有的版權法無法充分顧及人工智能生成內容的細微差別,因此亟須對融合出版作品的版權保護進行重新規定。
四、技術反思:Sora身份的應對策略
人工智能(AI)不僅是技術進步的產物,更是人類社會演變的象征,以Sora為代表的人工智能模型,從前期的降本增效到中期的“入口之爭”,再到后期的范式變革,AI顛覆知識內容供給的方式,既是推動社會發展的“催化劑”,也是揭示社會深層問題的“放大鏡”。道德是人類固有的屬性,技術、機器等屬性是由人對善惡的偏好決定的,關注Sora給世界帶來震驚的同時,我們需要進一步深化自我對人工智能技術的反思??偠灾覀冃枰獜娜说闹黧w性出發,培養一種“中庸”“健康”的技術使用方法,既可以充分發揮Sora的變革潛力,又能夠防范其帶來的潛在風險。對融合出版行業而言,面對文生視頻模型給融合出版領域帶來的風險,亦步亦趨可能會讓技術擠占人類的位置,引發行業危機,因此融合出版行業應當積極擁抱Sora帶來的變革,采取監管與鼓勵并行的舉措。
其一,建立數據輸入的倫理準則,以頂層設計規訓模型使用。生成式人工智能模型的輸出高度依賴其數據集的輸入,然而其獲取的數據集并不是客觀公正的,而是不加過濾地從現有互聯網數據庫中獲取的,是充斥研發者個人價值觀、存在歧視與偏見且包含西方意識形態的數據集。因此,為了確保Sora模型在出版行業的健康發展,融合出版業需要從頂層設計出發,給予AIGC合理的發展空間,面對生成式人工智能模型暴露的風險與缺陷,應當建立行業內生成式人工智能模型數據輸入的多元化監管機制與多維協同治理體系,構建以我國核心價值觀組成的“過篩網”,明確其使用限度、視頻類型以及傳播場景,確保訓練數據的多樣性和公正性,減少輸出內容偏見和歧視的產生。此外,融合出版行業應當積極響應國家有關人工智能的法案,比如,2023年7月正式公布的《生成式人工智能服務管理暫行辦法》,融合出版領域需對其中AIGC的具體應用及管理規則進行細化,進一步強化生成式人工智能模型的邏輯學習,堅守頂層設計對生成式人工智能模型的數據使用的規訓,推動構建融合出版行業防范和制止人工智能風險的共識,實現輸入數據多樣性、公正性的目標,為Sora技術在融合出版行業的健康發展提供堅實基礎。
其二,設立技術監管機制,審核監督AI模型輸出內容。除了確保生成式人工智能模型數據輸入的多樣性、公正性,對AI模型輸出內容的監管也是必不可少的。以Sora為代表的生成式人工智能技術,雖然具有通過文本自動生成逼真視頻的能力,但是它們無法自我“體驗”輸出內容,也不能“自我”審視和理解自身,不具備辨別是非的價值系統和情緒感知。比如Sora快速生成的視頻可以顯著降低深度偽造內容的制作門檻,使得偽造他人言行變得更加容易,從而可能被濫用于詐騙、誹謗、色情等違法行為,對社會秩序構成破壞,甚至對國家安全構成潛在威脅。因此,針對AI生成信息的真實性挑戰,融合出版機構有必要對Sora生成內容的真偽進行嚴格審查和核實,應建立專門機構負責監管和審核AI生成的內容,確保其真實性和準確性。具體而言,融合出版行業一方面要培訓編輯人員,提升其對文本生成視頻審核監督的素養,防止深度偽造等不良內容的傳播;另一方面要善于用技術制約技術,加快打造深度偽造信息檢測系統,提升監管生成式人工智能模型能力。
其三,培訓融合出版人員以適應技術變革,促進人機協作的深入發展。技術逐漸嵌入人類社會的方方面面甚至人類的身體本身,“迫使”人類讓渡些許權利,比如Sora可以將文本描述迅速轉換為視覺上引人注目的內容,并且生成長達1分鐘具有高質量畫面的視頻,搶占融合出版人員拍攝、剪輯等創作的權利;Sora所生成的多模態知識,視頻、動畫、游戲等有很強的交互性,傳統的出版行業所設計的平面形式的圖書毫無優勢,從業者可能會面臨職業危機。但是就目前階段而言,Sora作為一種AI輔助工具,更多的是推動行業革新,促進出版成員調整角色定位、提升專業素養,以適應技術進步帶來的新環境,而非直接導致人員失業。比如賈煜等人通過設計“功能導向”或“娛樂導向”的單因素組間隨機實驗調查用戶對AIGC類產品的使用滿意度,結果表明與AIGC功能特性相比,其娛樂導向更貼合用戶的使用滿意度。[26]這種趨勢可能在揭示著以Sora為代表的生成式人工智能模型首先會涌向娛樂業,在業界的應用暫時不會沖擊相應的工作崗位。此外,在融合出版流程中,AI無法超越人工對內容在意識形態以及價值觀層面的審核,難以復刻人的高級情感和人際溝通能力去與讀者互動等。顯然,人工智能是否會構成實質性的威脅尚需進一步觀察,而Sora未來對人類社會的作用,歸根到底在于如何協調人與技術之間權利的平衡。因此,融合出版業首先應當對人工智能的表現祛魅,明確自身的角色定位,把重心放在內容把關和專業生產上,通過培養數字化、智能化出版人才,將抽象思想轉換為實際行動,保證融合出版人員處于獨立于技術對象之外的位置。其次,要培養融合出版人員主動擁抱以Sora為代表的人工智能技術,以引領融合出版人員的發展方向,深化人機協同,為實現一個更加包容、創新和道德驅動的未來而努力。最后,要始終明確一點:人工智能的存在將持續下去,并且傳統的以人為主導的編輯、文案編輯和校對工作也將繼續存在。[27]
隨著以Sora為代表的AI模型不斷發展,人工智能技術作為異己的力量凸顯,人與技術的關系逐漸從“技術規則”向“技術規訓”轉變,即從人類規訓、使用技術到技術反向馴化、規范人類的轉變。[28]但實際上,生成式人工智能想要產出對內容的提問與引導仍是其必不可少的關鍵環節。面對逐漸變革的智能傳播技術,或許各行業工作方式、崗位發生變動或更改,但是人類的價值和主體性是不可替代的。因此,Sora不應該被視為人類智慧的替代品,而應將其視為增強人類能力的補充工具。盡管Sora帶來了一種全新的內容生產范式,但是鑒于其應用方面的缺陷,如無法完全模擬出自然物理狀況下的場景以及社會事物的因果關系(咬過餅干后卻無咬痕),以及其所帶來的風險,如未知來源的數據集以及帶有歧視和偏見的訓練數據等,因此,從目前開始到很長一段時間,人類仍需發揮主體性對以Sora為代表的人工智能技術進行規訓,將其身份框定在助手而非對手。
[本文為河南省哲學社會科學規劃項目“社交媒體環境下農村地區社會化閱讀行為及推廣效果研究”(編號:2021CXW031);河南省優勢特色學科平臺項目“中國城市國際形象傳播現狀、問題與路徑研究”(編號:24XKJS002)的階段性成果]
參考文獻:
[1]Liu Y, Zhang K, Li Y, et al. Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models[J]. arXiv preprint arXiv:2402.17177, 2024.
[2]黃欣榮.從ChatGPT到Sora:生成邏輯、哲學本質及世界圖景[J].新疆師范大學學報(哲學社會科學版),2024,45(06):72-80.
[3]張新新,孟軼.Sora驅動下的融合出版新技術新業態新模式分析[J].中國編輯,2024(4):29-36.
[4]喻國明,蘇健威.從Sora到AGI:智能媒介的升維與全新場景體驗時代的到來[J].編輯之友,2024(6):39-45.
[5]Liu Y, Zhang K, Li Y, et al. Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models[J]. arXiv preprint arXiv:2402.17177, 2024.
[6]陸小華.Sora技術鏈可用性與新聞出版業智能變革策略[J].中國出版,2024(5):5-11.
[7]Wang F Y, Miao Q, Li L, et al. When does Sora show: The beginning of TAO to imaginative intelligence and scenarios engineering[J]. IEEE/CAA Journal of Automatica Sinica, 2024, 11(4): 809-815.
[8]黃欣榮.從ChatGPT到Sora:生成邏輯、哲學本質及世界圖景[J].新疆師范大學學報(哲學社會科學版),2024,45(06):72-80.
[9]徐敬宏,張如坤.ChatGPT在編輯出版行業的應用:機遇、挑戰與對策[J].中國編輯,2023(5):116-122.
[10]張新新.出版轉型的體系性思考與理論建構[J].中國編輯,2020(9):54-59.
[11]左志紅,丁以繡.如何應對?既不等待觀望也別亦步亦趨:Sora引發的“出版四問”系列報道之四[N].中國新聞出版廣電報,2024-03-05(3).
[12]張新新,孟軼.Sora驅動下的融合出版新技術新業態新模式分析[J].中國編輯,2024(4):29-36.
[13]江潞潞.智能交往,未來已來:“激蕩AIGC”數字交往八人談觀點綜述[J].傳媒觀察,2023(3):48-54.
[14]Kustudic M, Mvondo G F N. A Hero Or A Killer? Overview Of Opportunities, Challenges, And Implications Of Text-To-Video Model Sora[J]. Authorea Preprints, 2024, 10.
[15]Mogavi R H, Wang D, Tu J, et al. Sora OpenAI's Prelude: Social Media Perspectives on Sora Open AI and the Future of AI Video Generation[J]. arXiv preprint arXiv:2403.14665, 2024.
[16]張新新.出版轉型的體系性思考與理論建構[J].中國編輯,2020(9):54-59.
[17]方興東,鐘祥銘,宋珂揚.Sora與新控制危機:理解智能傳播時代風險的新機制、新治理和新邏輯[J].傳媒觀察,2024(5):59-70.
[18]劉海龍.生成式人工智能與知識生產[J].編輯之友,2024(3):5-13.
[19]胡泳.AI視頻的興起:Sora類生成式平臺的可能性與風險[J].傳媒觀察,2024(4):5-19.
[20]Mvondo G F N, Niu B. Factors Influencing User Willingness To Use SORA[J]. arXiv preprint arXiv:2405.03986, 2024.
[21]陸小華.Sora技術鏈可用性與新聞出版業智能變革策略[J].中國出版,2024(5):5-11.
[22]Mogavi R H, Wang D, Tu J, et al. Sora OpenAI's Prelude: Social Media Perspectives on Sora Open AI and the Future of AI Video Generation[J]. arXiv preprint arXiv:2403.14665,2024.
[23]Buolamwini J, Gebru T. Gender shades: Intersectional accuracy disparities in commercial gender classification[C]//Conference on fairness, accountability and transparency. PMLR,2018:77-91.
[24]胡泳.AI視頻的興起:Sora類生成式平臺的可能性與風險[J].傳媒觀察,2024(4):5-19.
[25]Kustudic M, Mvondo G F N. A Hero Or A Killer? Overview Of Opportunities, Challenges, And Implications Of Text-To-Video Model Sora[J]. Authorea Preprints, 2024, 10.
[26]賈煜,韋懿軒,黃玥,等.功能導向還是娛樂導向?ChatGPT使用類型對用戶滿意度的影響研究[J].全球傳媒學刊,2024,11(02):79-98.
[27]Anne McCarthy.The Potential Impact of AI on Editing and Proofreading[EB/OL].[2023-5-10].https://newyorkbookforum.org/blog/the-potential-impact-of-ai-on-editing-and-proofreading/.
[28]胡綿.深度反思人與技術的關系[N].中國社會科學報,2022-08-09.
作者簡介:鄧元兵,鄭州大學新聞與傳播學院教授(鄭州 450001);李菲,鄭州大學新聞與傳播學院碩士生(鄭州 450001)。
編校:王志昭