【摘要】人工智能技術正以前所未有的速度滲透到網絡文學的各個領域,帶來革命性的變革。從數據庫生產與多模態再現,到效率化敘事與容錯性創新,再到個性化交互與定制化體驗,人工智能不僅能幫助創作者構思情節、生成文本,還能結合圖像、音頻、視頻等多媒體元素,創造出更加立體、豐富的敘事體驗。但人工智能賦能網絡文學多模態敘事有其限度,包括模態廣度擴張下原作品故事意義與價值觀念的粗粒化呈現與有損壓縮,造成意義深度的稀釋;基于存量人類世界多模態數據預訓練而生成的多模態內容存在有限想象、價值偏見與價值對齊問題;人工智能缺乏身體肉身體驗的非意向性創作往往造成情感體驗與人性價值可溝通性的匱乏。由于多元主體利益博弈的存在,未來如何實現人工智能與人文精神的深度融合,仍是需要我們進行長期探索的問題。
【關鍵詞】人工智能 多模態敘事 網絡文學 人工智能生成內容
【中圖分類號】G230 【文獻標識碼】A 【文章編號】1003-6687(2025)1-035-06
【DOI】 10.13786/j.cnki.cn14-1066/g2.2025.1.005
基金項目:國家社會科學基金青年項目“網絡文學海外傳播中華文化的多模態敘事與認同引導研究”(24CXW002)
作者信息:陸朦朦(1991— ),女,浙江慈溪人,博士,浙江傳媒學院出版學院副教授,主要研究方向:網絡文學、數字文化產業。
一、人工智能賦能網絡文學多模態敘事的“技術基因”
人工智能(Artificial Intelligence,AI)工具利用自然語言處理和計算機視覺等先進技術增強內容創意產業的創造性,其核心能力之一是實現跨模態生成,能夠深入解析并學習來自文字、聲音、圖像乃至視頻等多種模態的輸入數據,從中提煉出豐富的語義信息和結構特征,進而實現跨模態的創意轉換與生產。多模態概念具有濃重的跨學科色彩,在主流概念定義中有三個理解角度:一是將其視為感官及相應的神經系統;二是將其視為在社會文化中形成的創造意義的符號資源;三是將其定義為人機交互中的信息呈現方式。[1]總的來說,多模態是指通過多種感知通道(如聽覺、視覺、觸覺),借助多種符號系統(如語言、技術、圖像、顏色、音樂)共同編碼來傳遞信息的方式。[2]人類的交流本質上是多模式的,人類用語言、手勢、面部表情和語調來傳達意思,通過模仿人類的交流模式,多模態AI拓寬了創意表達的邊界,展現出更多的靈活性和創新性。
目前,全球多模態AI大模型正處于蓬勃發展的階段。在2023年之前,大模型的預訓練主要聚焦于單模態,著力于文本模式的輸入和輸出。進入2023年,大模型技術逐漸從單一的文本或圖像處理擴展到支持多模態的多任務處理。這一轉變使得大模型公司的競爭重點轉向多模態信息的整合與深度數據挖掘,力求精確捕捉和關聯不同模態的信息。如OpenAI于2023年9月推出的多模態大模型GPT-4V顯著提升了視覺提示功能,在處理復雜的多模態信息時表現突出。[3]Google于2023年12月推出的多模態大模型Gemini,OpenAI于2024年2月發布的文生視頻模型Sora等凸顯了多模態大模型的高歌猛進,為網絡文學的多模態敘事提供了諸多技術層面的可供性。
在學術研究領域,網絡文學研究專家歐陽友權認為,人工智能對網絡文學的賦能之一體現在基于人工智能的多媒體敘事創生新的網絡文學形態。[4]人工智能生成內容(Artificial Intelligence Generated Content,AIGC)能夠有效增強網絡文學在不同媒介語言中的強文本間性,并通過較低的資金成本和時間成本實現文本的意義流動,[5]實現了網絡文學作品從文學景觀到文化景觀的具象表達。[6]在實踐應用領域,2023年6月,閱文集團圍繞“升級AIGC賦能原創的多模態多品類內容大平臺,構建新的IP上下游一體化生態體系”的目標,成立包括“智能與平臺研發事業部”在內的四大事業部,推動IP孵化和生態鏈構建的提效增速,通過貫通“多模態內容—大產品平臺”運營鏈,構建多模態內容與產品的一體化運作模式。文字、聲音、漫畫、動畫等內容生產體系將與用戶體系進一步匹配融合,滿足用戶對于同一故事的圖文音視等不同體驗的需求,生成IP體驗新形態和新的消費場景。無獨有偶,網絡文學領域的頭部公司中文在線也在AI大模型、AI多模態方面加快技術建設并推動商業化落地,其2023年10月發布的AI大模型“中文逍遙”,具有“一張圖寫出一部小說”的功能,即可根據圖片內容撰寫優質小說,展現出其多模態能力。
對于網絡文學產業而言,其本身孕育于網絡世界高歌猛進的進程中,從誕生之初就深深烙印著技術基因。從網絡文學的生發史來看,網絡空間不僅僅是網絡文化對傳統文學進行簡單滲透或復制的場域,其更以獨有的生產性和創造力,賦予網絡文學獨有的形態,遠非作為物質性的承載容器那么簡單。同時,網絡空間是形塑文學創作邏輯與作品形態的動態性裁剪器,其塑造了一套獨特的空間制度,改變了文學的存在方式和傳播方式,深刻地影響了人們的閱讀習慣和審美觀念。對于人工智能賦能的網絡文學創作而言,多模態敘事形成的復合文本也同樣深刻影響著用戶的閱讀體驗與理解深度,不僅革新了敘事符號的組裝方式,更開創性地構建了一個全方位、立體化、情境化、交互性的文本世界,極大地拓寬了文本表達的邊界與影響力。基于多模態數據輸入—融合—輸出路徑的多模態AI,如何影響與形塑未來網絡文學的文本形態、產業路徑與消費場景,值得深入探討。
二、人工智能賦能網絡文學多模態敘事的可能面向
1. 人工智能賦能網絡文學數據庫生產與多模態再現
網絡文學的創作日益依賴于數據庫方式,即將已出現的創作元素和符號當作可共享的數據,模擬數據庫的采集、存儲、提取和更新方式來進行寫作。這種方式提高了創作的效率,重塑了文體結構模式。有學者認為創作資源的共享性、結構性與再生產性形塑了網絡文學的數據庫生產特質,而這一創作方式已經在網絡文學產業中從工具論的存在躍升為本體論的存在。[7]人工智能技術的介入無疑提高了數據庫生產方式的效率,例如閱文集團旗下的AIGC產品“閱文妙筆”,可以通過對輸入的作品類型、角色性別、標簽等細節進行分析,結合對角色的大概設想,獲得人工智能生成的角色稱號、外貌、性格、經歷等信息。以都市小說為例,人工智能可以按照創作者的大概設想,生成人物名稱、人物關系、性格特點等信息,對于部分場景,還可以生成數百字的詳細描寫。[8]多模態AI同時利用各種類型(或模式)數據形成見解、做出預測、生成內容,圍繞網絡文學文本的多種形態媒介內容都可以成為輸入源頭,經由多模態AI輸出內容。從某種程度上說,人工智能賦能的網絡文學多模態敘事是數據庫生產模式的加強版,其可資利用的數據庫元素形態更為多元,可以形成網絡文學多模態轉化的概念描述、故事塑造、風格界定、形態定義。這種通過強大算力處理海量數據,使多模態文學信息模塊與模塊之間的拆裝組合可以精準、瞬間完成的過程,被研究者稱為審美數字編程。[9]在實際應用的多模態AI項目中,其應用操作情境也建立在數據庫式的使用邏輯上,例如由Charima.ai公司研發的Web Comics項目提供內置的頭像生成器,并設置了圖像、GIF、音樂和音效管理器、免費背景圖像庫、高級AI語音資源等供用戶進行選擇、調試、實驗、創作,方便用戶拼貼縫合到故事中以增強用戶的參與度與沉浸感。[10]同樣,一款致力于人工智能藝術作品生成的工具Maze Guru,擁有囊括了超過2000個AI模型風格的龐大資源庫,用戶可通過輸入文本、圖像等方式生成圖像、視頻等結果,探索無限的創作可能性。[11]
2. 人工智能賦能網絡文學效率化敘事與容錯性創新
傳統的網絡文學文本僅僅由單一的文字符號構成,文字符號構成的文本欣賞空間是扁平化的,允許單一的視覺感官進入網絡文學作品的體驗場景,構成了傳統的網絡文學“靜觀式”的審美方式。盡管隨著網絡文學IP產業鏈的延伸,原始文本的創作逐漸轉向多模態符號共同敘事,但是,不同媒介產業的不同生產機制導致文本的多模態敘事存在產業間隔,相應的開發成本也較高,這些固有的掣肘因素導致網絡文學復合符號文本創作難以高效率展開。同時,由于影視創作技術存在一定的應用門檻,網絡文學多模態敘事需要依靠成熟的影視化工業體系才能成型。隨著文生圖、文生視頻等大模型技術的應用,網絡文學多模態敘事的創作門檻進一步降低,普惠性、去中心化的多模態敘事創作成為可能。盡管在技術層面,能夠實現多模態數據的融合與呈現、不同模態數據之間的關系理解,以及有效處理多種類型數據的模型架構還不成熟,但就現有技術應用情況來看,人工智能在賦能網絡文學多模態敘事的工具性使用與輔助性工作上已經顯現出巨大的想象空間。同時,文本內容的即時性多模態轉化與創意想法的高效率效果驗證,為網絡文學文本的多模態敘事轉化提供了巨大的創新容錯,使得多模態敘事可以通過不斷地微調、迭代與優化達到預期的審美要求。在此基礎上,人工智能既能以“生產者”身份調用人類已有的以數據化形式存儲的數據庫并將其作為生產對象,又能被人類用作“生產工具”對數據生產資料進行自動化加工,通過人機協作提升文藝生產的速度和效率。[12]不過,與多模態AI的其他應用方式相比,網絡文學的多模態AI敘事更具創意性和體驗性,其提升創作效率與實現容錯創新的效果需要通過讀者的閱讀體驗與審美感受來評判。相較而言,評判其他任務導向性應用的效果較為簡單直接,例如在智能客服情境中,智能客服只需提供精準的個性化服務,能夠相對快速、準確地回答用戶問題并提供相應的解決問題的方案,即可較好地滿足用戶需求。因此,在作為創意性內容生產的網絡文學多模態敘事方面,多模態AI的完善仍然有很長的路要走。
3. 人工智能賦能網絡文學個性化交互與定制化體驗
多模態AI通過文本、圖像和視頻數據等來學習、理解和分析用戶習慣和偏好,從而為用戶推薦符合其喜好的網絡文學作品、實時創建用戶喜愛的定制故事和敘述,為每個人提供完全獨特的內容體驗。通過對多模態數據進行組合分析,人工智能可以揭示不同媒介之間的內在聯系和潛在規律,為網絡文學提供新的創作靈感和敘事手法,這種賦能不限于對文字內容,還包括對語言風格、情感色彩與多媒體內容等的賦能。有研究者曾在研究網絡文學IP跨媒介內容產品的受眾遷徙行為時,提出跨媒介消費的概念,認為跨媒介消費是受眾以拓展內容消費體驗為目的,基于一定的需求和動機,在同一IP延伸的多種媒介內容產品間流動、遷移、轉化、參與、互動、創作的心理反應與行為變化過程。[13]相應地,網絡文學IP價值開發應關注不同媒介內容的一致性,始終保持其標志性的世界觀設定、角色設計、敘事風格,通過文本間相互的啟示和隱喻,產生多文本、多媒介互文敘事體驗。[14]在多模態AI的技術加持下,對跨媒介消費行為的追蹤可以有效整合用戶圍繞網絡文學產生的一系列多模態行為數據,通過分析用戶的閱讀數據和行為模式,能夠創建用戶畫像,生成符合用戶特定需求的文學作品或媒介內容,包括定制化的故事情節、角色設定或視聽效果等。例如,在描述一個奇幻場景時,人工智能不僅可以自動生成與場景相匹配的視覺畫面和背景音樂,而且能夠為不同的人提供不同的配置,做到“千人千面”,帶給用戶身臨其境且極致個性化的體驗。同時,多模態AI可以檢測和理解人類的情緒,通過分析語音語調、文本情感和面部表情,判斷具體情境下用戶的情緒狀態與心理需求,給予針對性、定制化的響應與反饋,使多模態故事世界的交互體驗顯著增強。例如人工智能算法通過塑造動態游戲環境,可以根據玩家個體行為定制游戲玩法,并創造適應玩家行為的響應性非玩家角色(Non-player Character,NPC)。由Charima.ai公司提供技術支持的全球第一款對話驅動的3D視頻游戲The Kraken Wakes,改編自約翰·溫德姆的科幻恐怖小說。在游戲中,玩家扮演一名記者,在一次可疑的外星人襲擊事件后,采訪目擊者并與政府談判以揭露真相。游戲玩法圍繞對話展開,玩家可以用自然語言回答游戲角色的提問,無須如傳統游戲那樣在多個選項中進行選擇。由人工智能驅動的能夠進行語音互動且具備情感能力的智能NPC,以非常自然的反應和深度互動能力與人類玩家進行交流,玩家可以借此塑造故事的走向,影響角色的行動、決定和關系。[15]
三、人工智能賦能網絡文學多模態敘事的限度反思
1. 人工智能賦能網絡文學多模態敘事的意義深度與模態廣度
盡管網絡文學研究中不乏批評其類型化、同質化的聲音,但網絡文學創作仍然建立在人類個人性與社會性感知、體驗的基礎上,需要融合諸多文化創意元素與社會背景知識,且要設計多種修辭手法與語境轉換方式。人工智能在處理這些復雜的語言和邏輯時往往采用簡化的方式,導致作品的意義被壓縮或扭曲。例如,人工智能可能無法準確理解隱喻、象征等修辭手法背后的深層含義,也無法在作品中靈活地運用這些手法來傳達復雜的思想和情感。而在網絡文學的多模態轉化方面,其多模態敘事作品的價值往往在于對畫面、聲音等細節和微妙之處的處理。這些細節和微妙之處可能是作者情感表達與故事起承轉合的精髓所在,也可能是作品主題和價值的深刻體現。人工智能在多模態內容生成過程中往往忽略這些細節和微妙之處,表現為所生成圖像或視頻的“精致的空洞”。加之多模態AI模型的性能及其泛化到新任務或新領域的能力可能受到訓練標記數據可用性的限制,導致多模態AI工具可能出現對某些特定歷史文化元素的誤解或扭曲,生成在智能機器理解上“自成一體”而在人類主體感知上“四不像”的內容。網絡文學作品故事意義與價值觀念的粗粒化呈現與有損壓縮,最終將造成意義深度的稀釋。
此外,就當前的多模態敘事技術而言,盡管可支持多模態敘事的工具已經在應用層面如雨后春筍般涌現,但應用級的所謂多模態工具往往仍然在某一單模態或雙模態領域進行垂直研發和深耕,例如文生圖、文生視頻等,而一部完整的多模態敘事作品要想實現無縫融合的效果,有賴于人類主體整合各類AIGC工具,為多模態敘事項目配齊最佳技術棧。例如,如果要為科幻類網絡小說制作多模態的故事短片,可能要先用Midjourney生成概念圖片,定義整體藝術風格;再用Runway視頻工具制作三維空間場景,渲染能讓讀者身臨其境的未來感;最后用Mubert等AI配樂工具進行氛圍與節奏的烘托。這個過程中需要對多模態資源進行整合優化,創作者必須熟諳不同類型多模態AI工具的調教和使用技巧,在算法參數值中找到“黃金交叉點”。因此,具有完整敘事表達、意義傳遞與故事世界的多模態作品仍然需要大量的人工介入,對多模態提示文本進行輸入、微調、再輸入、再微調。
2. 人工智能賦能網絡文學多模態敘事的有限想象與價值對齊
在內容生成階段,由于模型訓練語料庫的不可控,可能導致偏見、“觀點霸權”、刻板印象、文化片面性等問題,[16]這在多模態內容生成中依然存在,并不會因為模態的轉變而消除,甚至會因視聽模態敘事內容的廣泛傳播性與滲透性,導致偏見性、片面性觀點更加容易潛移默化地嵌入社會文化中。這些主觀認知通過貌似技術中立的大模型予以客觀化,會進一步強化在社會現實中抽取的大模型底層預訓練數據所帶有的現實偏見與文化霸權,使其成為普遍性的默認慣例與規則。不僅如此,任何一種單一模態中的偏見都有可能在整個多模態敘事中擴散傳播,造成更大的偏差。盡管文生圖工具能夠復制視覺形式,但它們并不“了解”或“熟悉”它們產生的圖像中的參照物,即它們沒有“體驗”過輸出圖像中描繪的物理對象、人物或地點,[17]因此,單純依靠人工智能的多模態敘事事實上難以還原由真實個體所創作的網絡文學文本中人性的體驗部分。此外,應用在網絡文學多模態敘事實踐中的多模態大模型往往是全球主要科技公司研發的產物,其對模型應用的目標必然遵循數字資本主義的邏輯,使得嵌入其中的知識價值體系、符號象征系統、文化多樣性架構等預設被放置于全球性技術擴張的普遍性生產范式中,這種生產范式在本質上以消弭地區、種族、文化等任何不能被資本一體化運作框架所涵蓋的差異性因素為首要原則。[18]針對上述可能的人工智能倫理風險,有研究者提出了人工智能價值觀對齊的觀點,簡而言之,就是讓人工智能的價值觀與人類的價值觀保持一致,以確保人工智能在對人類和社會無害的前提下運行,避免對人類的權利造成干擾和傷害。多模態AI系統涉及多種感知模態的融合與交互,技術實現上更為復雜,增加了價值觀對齊的難度。有研究者通過引入社會學和人類學中提出的基本價值觀來嘗試解決大模型的對齊問題,指出理想的大模型價值觀對齊體系應該具備準確性、適配性和透明性三大特性。[19]具體到多模態AI價值觀對齊,要確保其在模型開發的不同階段都符合人類的價值觀,并具備上述三大特性,例如在數據選擇與預處理上確保訓練數據涵蓋廣泛的文化背景、社會群體和思想觀點,以減少偏見與歧視,從而更全面地反映現實世界的復雜性;移除或修改包含有害、歧視性內容的數據,對數據進行敏感性分析,識別并減輕潛在的偏見和歧視。在模型設計與訓練階段,引入價值觀約束手段,如正則化項或懲罰函數,以鼓勵模型生成符合人類價值觀的輸出內容;使用基于人類反饋的強化學習(RLHF)等技術,根據人類評價調整模型行為。[20]設計有效的多模態融合機制,確保不同模態之間的信息能夠相互補充和增強,從而更準確地反映人類價值觀。利用注意力機制等技術,關注對價值觀影響較大的模態特征。在模型訓練過程中進行跨模態一致性檢查,確保不同模態的輸出內容在價值觀上保持一致。通過對比不同模態的輸出結果,識別并糾正潛在的價值觀沖突。不過在實踐中,上述舉措的落實面臨多方掣肘。就國內網絡文學產業界的多模態大模型訓練與實踐來看,由于不同平臺維護自身商業利益的需要,在數據選擇與預處理階段就難以實現多元數據的跨平臺融合與覆蓋,使得平臺各自所研發的大模型服膺于平臺資本主義的價值觀之下。
3. 人工智能賦能網絡文學多模態敘事的情感體驗與人性價值
雖然人工智能為網絡文學的多模態敘事與跨媒介融合提供了生產力工具與創意可能性,但其缺乏人類創作者獨有的情感深度、生活經驗和主觀意識。從認識論角度看,主體(人類)通過感官和思維活動來認識和理解客體(如網絡文學作品)。然而,人工智能作為一種非生物智能體,其“認識”過程更多是基于算法和數據處理,而非主觀體驗。人類主體的創意生成與審美體驗往往建立在獨有的對社會生活的觸感之上——深刻的情感理解、同理心、敏感性和感受文化細微差別的能力——這在內容創作與生產中是區別于人工智能技術的至關重要的因素。這種主體性的缺失,使得人工智能與人類在審美體驗上難以形成共通感,無法體驗人類世界的情感、意境和象征意義。因此,人工智能賦能網絡文學多模態敘事可能在模態的豐富性與視覺性上有一定的沖擊力,但在形式層面和深層內涵層面具有明顯的限制。在形式層面,人工智能生成的多模態作品往往呈現出某種程式化和同質化特征,缺乏生命力與藝術張力。在內涵層面,人工智能作為沒有肉身性體驗的機器,其創作缺乏人性深度,難以形成對現實世界的經驗性主觀感受與洞察。此外,意識具有意向性,即意識總是指向某個對象或內容。在網絡文學創作與閱讀的過程中,人類的意識活動具有明確的意向性。作者通過創作來表達自己的情感和思想,讀者則通過感知、想象、情感等心理活動與作品產生共鳴。這種意向性體驗使得人類能夠與作品建立深厚的情感聯系。人工智能作為非生物智能體,其“意識”活動并不具備真正的意向性。從某種程度上說,純粹的人工智能多模態敘事是一種“無病呻吟”式的創作,更多體現的是多模態文本的技術性拼貼與增殖,而不是建立在人類主體意向性的交流與表達欲望上。有研究指出,人工智能參與內容生產會引發基礎文本與擴展文本的間性問題,基礎文本中包含人類創作者的真情實感,是有著情感、心態、經驗等感性思維的感性創作,而人工智能生成內容更多基于語義關系及概率計算。[21]如果完全依賴人類世界創造的存量文本進行模型訓練,而將訓練后的模型生成內容作為僅有的增量文本、不經識別把關放入基礎文本,可能出現“人類生成存量文本+人工智能生成增量文本”稀釋后生成的內容質量不斷遞減的傳導效應。
結語
人工智能正以前所未有的速度滲透至網絡文學的各個領域,帶來前所未有的可能性和變革。從數據庫生產與多模態再現,到效率化敘事與容錯性創新,再到個性化交互與定制化體驗,人工智能不僅可以幫助創作者構思情節、生成文本,還能結合圖像、音頻、視頻等多媒體元素,創造出更加立體、豐富的敘事體驗。基于人工智能的多媒體敘事不僅增強了作品的表現力,還拓寬了讀者的感知維度,使網絡文學在形式和內容上實現了前所未有的飛躍。然而,人工智能賦能網絡文學多模態敘事也存在一定的限度。首先,盡管人工智能能夠模擬人類情感與邏輯,但在生命體驗方面仍存在本質上的差距。網絡文學創作及其衍生的多模態敘事作品的深度往往源自真實體驗和情感投射,而人工智能缺乏這種源自自我意識的生命體驗,可能導致作品在情感共鳴和人性探索上有所欠缺。其次,人工智能的創作過程基于預設的算法和模板,可能導致作品機械化與同質化。最后,基于人工智能的多模態敘事作品創作仍依賴于人機的交互與配合,高質量的作品往往需要進行人工潤色和優化,因此創作質量的最終保障仍取決于人類的創作能力。當然更重要的是,在人工智能介入后網絡文學創作機制的變革過程中,諸多利益相關主體存在博弈情況,如在國內首例內容創作者聯合反對人工智能寫作的案例“番茄小說AI協議事件”中,可以看到傳統網絡文學作者、網絡文學平臺、人工智能“作者”、網絡文學閱讀者等多元相關主體的利益糾葛與立場分野。當網絡文學踏上多模態敘事的道路,加入角逐場的利益主體將更加豐富多元。不同讀者的不同閱讀體驗需求也會促使更加多元的網絡文學多模態敘事路徑逐漸出現,類似于番茄小說那樣,采取“免費、量大、管飽”策略的免費小說平臺可能通過下沉市場的策略,從占領細分市場的角度,實現網絡文學多模態敘事的成功。然而面向未來,大浪淘沙后的經典網絡文學多模態敘事要保持進一步發展和成熟,勢必需要人類主體、人工智能“擬主體”、人機交互主體共同采取行動,推動人工智能與人文精神的深度融合。
參考文獻:
[1] 黃立鶴,張德祿. 多核并行架構:多模態研究的范式、路徑及領域問題之辨[J]. 外語教學,2019,40(1):21-26.
[2] 張德祿. 多模態話語分析綜合理論框架探索[J]. 中國外語,2009,6(1):24-30.
[3] 2024多模態AI大模型行業深度梳理[EB/OL].[2024-03-02].https://www.sohu.com/a/761401865_121709768.
[4] 歐陽友權. 網絡文學的AI賦能及其邊界[EB/OL].[2023-11-01].https://cssn.cn/skgz/bwyc/202311/t20231101_5694109.shtml.
[5] 禹建湘,張浩翔. 人工智能文本生成對網絡文藝發展的賦能[J].江西社會科學,2024,44(6):64-71,207.
[6] 宋俊鋒,安仲禹. 基于人工智能生成內容(AIGC)的網絡文學人機協同生產影響動因與生態演替[J]. 昆明理工大學學報(社會科學版),2024,24(3):142-154.
[7] 賀予飛. 從符號、裝置到生產機制:網絡文學數據庫寫作的變革及限度[J]. 中國現代文學研究叢刊,2023(7):242-260.
[8] 押注大模型,閱文前路幾何?[EB/OL].[2024-08-05].https://www.163.com/dy/article/J8RIUN5D0511D2LM.html.
[9] 單小曦. 人工智能寫作與網絡文學重大變革[EB/OL].[2024-06-22].https://www.chinawriter.com.cn/n1/2024/0622/c404023-40261937.html.
[10] Web Comics[EB/OL].[2024-06-24].https://charisma.ai/showcase/webcomics.
[11] Maze Guru[EB/OL].[2024-06-24].https://library.phygital.plus/details/maze-guru/r/recQDVz80psAvNg0P.
[12] 別君華. 人工智能文藝生產方式新變與人機關系省思[J]. 中國文學批評,2024(2):178-185.
[13] 陸朦朦. 跨媒介消費:融合情境下基于IP連接的受眾遷移研究[J]. 出版發行研究,2021(2):42-48.
[14] 陸朦朦. 面向跨媒介消費的網絡文學IP價值開發優化策略[J]. 編輯之友,2022(10):52-57.
[15] The Kraken Wakes[EB/OL].[2024-06-24].https://charisma.ai/showcase/the-kraken-wakes.
[16] 陳昌鳳,張夢. 由數據決定?AIGC的價值觀和倫理問題[J]. 新聞與寫作,2023(4):15-23.
[17] Wasielewski A. \"Midjourney Can't Count\": Questions of Representation and Meaning for Text-to-Image Generators[J]. The Interdisciplinary Journal of Image Sciences, 2023(1): 71-82.
[18] 吳靜.“世界模擬”的擬像迷思——基于通用視覺大模型技術的哲學反思[J]. 南通大學學報(社會科學版),2024,40(3):20-30,159.
[19] 價值觀羅盤:如何讓大模型與人類價值觀對齊?[EB/OL].[2024-04-11].https://www.msra.cn/zh-cn/news/features/value-compass.
[20] 郭全中,張金熠. AI向善:AI大模型價值觀對齊的內容與實踐[J]. 新聞愛好者,2023(11):19-24.
[21] 周榮庭,周慎. AIGC+Web 3.0:面向未來的出版多模態融合[J]. 中國出版,2023(10):3-9.
When Creativity Meets AI: The Possibilities and Limitations of
Artificial Intelligence Empowering Multimodal Narrative in Online Literature
LU Meng-meng(School of Publishing, Communication University of Zhejiang, Hangzhou 310018, China)
Abstract: Artificial intelligence technology is infiltrating various fields of online literature at an unprecedented rate, bringing revolutionary changes. From database production and multimodal reproduction to efficient narrative and fault-tolerant innovation, and further to personalized interaction and customized experiences, artificial intelligence not only assists creators in plotting and generating text but also integrates multimedia elements such as images, audio, and video to create a more three-dimensional and enriched narrative experience. However, the empowerment of multimodal narrative in online literature by artificial intelligence has its limitations. These include the coarse-grained presentation and lossy compression of the story's meaning and values in the original work due to the expansion of modal breadth, resulting in the dilution of meaning depth. Multimodal content generated through pre-training based on existing multimodal data from the human world faces issues such as limited imagination, value biases, and value alignment. Moreover, the non-intentional creation lacking embodied experiences often leads to a scarcity of emotional experiences and communicability of human values. In the future, the game of interests among multiple entities will necessitate a long-term exploration for the deep integration of artificial intelligence and humanistic spirit.
Key words: artificial intelligence; multimodal narrative; online literature; AIGC
(責任編輯:張茂)