孟 可
北京師范大學藝術與傳媒學院,北京 100091
人工智能(AI)作為一種用于精妙模擬和延伸擴展人類智能的技術及應用系統,其目標是使機器能夠勝任通常需要人類才能完成的復雜工作。當前的生成式AI 系統在執行短期任務方面表現出色,而利用AI 模型生成構思完整、規劃嚴密的長篇故事和影視劇集則將具有更廣泛的應用前景。從20 世紀80年代開始,AI 便已介入故事敘述,在經歷了超文本、計算機互動戲劇等一系列AI 敘事的發展,與2010 年代計算機視覺(CV)、深度學習(DL)等技術的崛起后,當前影像藝術正身處這個“試煉場”[1]的漩渦中心。面向技術,有學者提出疑問:“ChatGPT 來了,我們離AI 生成電影還有多遠?”[2]。2023 年7 月,一部由AI 執導的《南方公園》劇集給影視行業帶來巨大震動,引發了業界關于多智能體模擬、AI 編劇等話題的熱烈討論。本文以Showrunner AI 技術創作的《南方公園》劇集為引,深入探析AI編劇的創作邏輯及其在影視制作中的應用前景,希望為我國影視產業“從文本到代碼”的未來探索提供借鑒。同時,本文還將比較AI 編劇與傳統編劇,對傳統編劇的創作主體性進行反思,以期為影視產業的創新和發展帶來更多可能性。
1973 年,影片《西部世界》虛構了一個供機器人生存的巨型高科技樂園,而在2023 年4 月,電影走進了現實:斯坦福大學和谷歌的研究者構建出了一個能夠讓25 個AI 智能體(Agent)在其中生存、進行復雜行為的虛擬小鎮,在這個數字化的沙盒“西部世界”中,每個智能體都有其獨特的背景與個性,進行著自己的社交、工作、休閑行為[3]。這場實驗不僅在游戲領域引起轟動,同樣受到了影視行業研究者的關注。Fable Studio以此為靈感發布了名為“SHOW‐1”的節目統籌智能體(Showrunner),并制作出了新一部的《南方公園》。在這一集中,AI 完成了從編劇、導演到配音、剪輯的全部流程,而觀眾只需要輸入一句話便可以生成自己的《南方公園》影片(圖1)。

圖1 AI制作的《南方公園》劇集
與人類藝術創作基于生活經驗、感性體驗和情感認知不同,AI 的藝術創作基于算法技術和數據分析,通過學習和推理來進行機械、客觀的創作行為。現階段,AI 進行故事生成的方式包括基于關鍵詞生成故事、故事對話生成、基于大數據生成故事、故事情節生成等,這些數字化、自動化的創作方法通過模擬人類思維進行類人化劇本寫作。
基于關鍵詞的故事生成方法利用自然語言處理(NLP)技術自動構建包括背景、人物和情節等故事要素,并通過數據挖掘提取實體信息,搭建龐大的語言模型與知識圖譜。在理解信息的基礎上,AI 根據輸入關鍵詞查找相關詞匯、短語和語法結構,快速生成獨特故事。生成對話形式的故事作為構建故事情節的一種方法,通過模擬多個角色之間的交互對話,展現了其在解決語言連貫及自然性方面的特長。在這一領域,AI 還采用了序列到序列(Sequence‐to‐Se‐quence)模型。通過對模型進行訓練,使其具備預測下一個對話輪次可能性的能力。對話生成任務可視為一個序列到序列的問題,即在結合上下文情況下生成下一個對話輪次,最終生成與之相一致的故事結局序列[4]。
然而,鑒于自動化程度相對較低,上述兩種AI故事生成方法在故事架構和情節編寫方面更適用于教育、廣告、游戲等簡易場景。為使其適應電影、劇集等具備戲劇性和文學性的應用場景,研究者對AI 編劇提出了更為嚴苛的創作要求。基于大數據的故事生成方法運用多層神經網絡模型對海量文本進行深度學習與分析,借助文本挖掘技術提取關鍵人物、時間地點等核心要素,為故事生成奠定基礎。相較于基于大數據的故事生成側重于海量數據學習,AI 故事情節生成更重視模擬人類思維與邏輯,對人類創作經驗與規律進行深入剖析與概括,進而推斷出邏輯通暢、架構完整且內容豐富的故事情節。
要在創作中收獲一部引人入勝的作品,僅依賴完整的架構和豐富的情節是遠遠不足的,“戲劇性”一直是AI 編劇創作道路上難以跨越的瓶頸。“戲劇性”要求編劇在場景之間進行情緒鋪墊、構建懸念、實現逆轉等處理手法,這種效果難以直接被提示鏈(Prompt Chaining)大模型所吸收。然而,在《南方公園》樣片中,觀眾驚喜地發現傳統編劇技巧中的懸念、突轉、延宕等戲劇性橋段以及松弛有度的敘事節奏已被AI 編劇所吸收,這意味著AI 生成的不再僅僅是故事本身,而是一個包含了多種編劇手法的“超級劇本”。Fable Studio 在最新的文章中揭示了這種能夠初步制造“戲劇性”的AI 制作流程[5]:首先,故事系統在獲取了包含主題、梗概以及模擬時間內主要事件的高層次構思基礎上,利用模擬數據作為提示鏈的一部分,自動推斷出多達14 個場景;其次,劇務系統負責為各個場景挑選合適的角色,并依據情節模式推進故事發展,每個場景均與一個情節字母(如A、B、C)相對應;隨后在影像生成中,編導系統會交替運用不同的角色組合,跟蹤他們各自的故事進展,以維持用戶的關注度;最后,在舞臺系統和人工智能攝像系統的協同作用下,場景將按照預設的情節模式(如ABABC)有序呈現。盡管整部影片觀看下來,場景之間的切換尚不連貫,有些甚至稍顯生硬,但這一探索仍為AI 編劇領域提供了重要參考,概念性地展示了生成式大模型(Large‐scale Generative Models)對于“娛樂”的更深層理解,這有助于突破“戲劇性”瓶頸,進一步提升AI創作水平。
相較于傳統編劇,AI 編劇在創作方法上整合了文學、戲劇、電影、游戲及互動作品等多種敘事體裁,形成了獨特的創作思路。這使其運作的底層邏輯從傳統的單向度統籌行為轉變為多向度生成行為,為多樣化的敘事效果提供了技術基礎。
在傳統編劇的創作過程中,線性思維模式占據主導地位,即依照時間順序逐層展開故事情節。此過程涵蓋了對整體故事的全局性規劃與設計,其中包括角色設定、情節推進以及主題呈現等關鍵環節。此類規劃與設計可視為一種單向度的統籌行為,即編劇從整體出發,逐步深入至故事的部分細節。從全局規劃層面,傳統編劇遵循線性思維模式,讓情節、角色與主題在時間軸上呈現出層次分明、邏輯嚴密的態勢。在情節構建層面,傳統編劇也是依據線性思維模式,即編劇需要在構思上一個情節環節的基礎上,方能創作出下一個環節。盡管有時在創作初期,編劇可能抱有特定的結局設定,如悲劇或喜劇,或者因為事先想到某個場景或橋段而促成整個故事的構建,但在整體思路上,仍然遵循“因果”關系進行情節推進。即便在實際寫作過程中,編劇可能會根據正在創作的部分調整前文內容以增強連貫性,但整體寫作依然是區塊與區塊的相對統籌,流程呈現為“螺旋線”狀順序展開(圖2)。

圖2 傳統編劇的創作思路抽象圖
與傳統編劇相較,AI 編劇的顯著區別在于其采用空間性思維。通過運用生成式對抗網絡(GAN)與提示鏈等先進技術,AI 編劇能夠同時處理多個情節線索、角色發展以及主題呈現,展現出傳統編劇前所未有的創作能力。在這個過程中,AI 編劇創作的底層邏輯不再是單向度的統籌行為,而是多向度的生成行為。
生成式對抗網絡(GAN)在AI 編劇領域的應用,為實現高質量、多樣性和定制化的故事情節創作提供了可能性。GAN 是一種“博弈”式的網絡模型,其通過兩個相互對抗的神經網絡(生成器和判別器)生成文本等數據[6]。生成器(Generator)負責從隨機噪聲中生成故事片段,判別器(Discriminator)則負責判斷生成的故事片段是否達到預期的質量。在獲取文本數據的訓練集后,AI 編劇會構建GAN 模型,其中,生成器生成連貫的故事情節或對話,判別器則評估生成的內容是否具備邏輯合理性和趣味性。AI 編劇利用采集的數據對GAN 模型進行訓練,根據先前的提示,生成器概率性地生成后續情節,判別器則會評估生成的內容。根據評估結果,AI 編劇會調整生成器和判別器的參數,以優化生成的內容,使上下文具備基本邏輯(圖3)。

圖3 神經符號性故事生成系統架構①
Fable Studio 認為,當前大語言模型(LLM)訓練的只有角色、對話行、短場景標題與最終的劇本,整體劇本仍然顯得初級與粗糙,時間、角色情感狀態、作品主題、導演筆記等詳細信息均未得到體現。而在《南方公園》AI 項目中,這一問題利用提示鏈技術得到了初步解決。提示鏈作為一種典型的提示交互協同形式,將原有需求分解,相互關聯多個提示(Prompts)數據點,形成一個有序的鏈式結構,共同解決一項復雜任務[7]。為了訓練SHOW‐1 這樣的AI 編劇模型,研究者透露,首先需要收集足夠的數據點,其中提示數據點可以是用戶“一句話”式的初始意圖,也可以是一個已經生成的劇集作品。通過仿真,AI 編劇從用戶的輸入和模擬的代理中連續地收集、處理、鏈接數據點,隨著時間的推移與事件的創建,一個具有完整季節弧線、背景故事、日常生活、角色個性的虛擬世界得以構建出來。同時,角色、背景等元素也會基于用戶反饋或創作方向的變化而不斷變化,比如《南方公園》中的角色Cartman 在反饋與調整中展現出害羞和天真的特性。這種與SHOW‐1 模型互動和微調的反饋循環可以促進新內容的產生,實現“實時劇本”的驚人跨越。
可以看出,AI 編劇進行創作時,劇本元素并非如傳統編劇創作邏輯那樣逐步、逐層浮現,而是相互交織,以一種“塊莖”式的空間網狀結構迅速生成(圖4)。最終故事的誕生也非傳統意義上的“前文總結‐最終得出”,而是結合上下文,通過“由點到體”的擴散膨脹方式實現。這一點也體現在SHOW‐1 項目的口號中——“一句話生成你自己的《南方公園》”。

圖4 AI編劇的創作思路抽象圖
2023 年11 月8 日,長達118 天的好萊塢編劇大罷工終于在“達成初步協議”的結果中落下帷幕。在此之前,AI 音樂制作、AI 圖片生成等AIGC 的席卷就已經給藝術從業者帶來了技術恐慌,他們擔憂AI 會使藝術失去其獨特的創造性。列夫·馬諾維奇(Lev Manovich)與埃馬努埃萊·阿列利(Emanuele Arielli)在《人工智能美學和創造力的人類中心主義神話》中指出“創造力”一詞具有人類中心主義傾向,而這“最后或許會影響到我們對人類智能本身的理解”[8]。面對AI 在創作領域的涌入,在表達態度、轉變身份之前,人們需要對“創造力”進行重新審視。
首先,創造力是否為人類所獨有?抵制者往往認為,AIGC 并非“創造”而是“仿制”,具有自我意識的人類精神才是創造中不可缺少的一環。但也有人提出異議,他們認為在“物質轉向”思潮下作為“活的有機體”[9]的技術同樣具有創造力,任何隨機的、意料之外的過程都應該被看成是創造性的,而藝術則是在此基礎上增加了美學維度,即隨機結果令人感到賞心悅目。當然,科學技術哲學家也給出一個較為中和的答案,即“技術在經由人類精神支撐,通過動機以及意志的抉擇才能引發真正的創造力”[10]。
其次,創造是否也是一種“程序”?心靈計算理論(Computational Theory of Mind, CTM)作為AI 的理論基礎,認為大腦是一臺信息處理機器[11]。哲學家路德維希·維特根斯坦(Ludwig Wittgenstein)提出了圖靈測試(Turing Test)的另一種視角:這不是一個檢驗機器是否能夠騙過觀察者,讓人類以為它是真人的方法,而是一個考察人類的行為和理解究竟在多大程度上“機械化”的測試[8]。圖靈測試在歷史上曾多次被通過,如象棋、圍棋、交談等,每當AI技術達到一個類人進程中的里程碑時,人們便會開始反思人類這種行為背后的底層邏輯——一項項原本被認為具有自主性的人類行為在AI 的介入下展露了“機械化”的一面。現階段,藝術創作正處在被審視的中心。對于編劇而言,創造力無疑是堅實有力的武器,但是當回顧創作過程時,人類編劇們不難發現,劇本寫作也是一種機制(Machanics),編劇大師羅伯特·麥基(Robert McKee)認為“故事并不是憑空產生的,而是脫胎于已經在歷史上和人類經驗中存在的素材”[12],“劇本節拍器”(Script Metronome)、“普羅普結構”(Propp)等的出現為編劇們提供了可靠的程序參考。
藝術的發展離不開對傳統觀念的挑戰,而突破創造力人類中心主義的藩籬正是當下面臨的關鍵一步。在數字化背景下,藝術家們日益意識到,僅以人類自我為中心的創作思維已經無法滿足媒介融合的需求,而采用功能主義的視角既會限制技術的可能性,也會阻滯人類最終的解放[13]。對于“創造力”的反向思考提供了獨特的機會來深入探討人類與AI的關系,并促進傳統創作者對自身在“人機協同”發展中的身份進行重新定位。
事實上,在AIGC 強勢發展的背景下,傳統創作者對新興技術的恐慌源于主體危機。為應對這場前所未有的“海嘯”,傳統編劇亟待重塑自身身份。回看傳統畫師與AI 繪畫的斗爭歷程,傳統編劇或可從中汲取有益啟示:部分畫師成功發掘出作為人類創作者的獨特價值,也有部分畫師作為“訓練者”成為了“能開汽車的曾經的馬車夫”。從AI繪畫的歷史經驗中可以看到,在這場不可逆的發展中,人類創作者從未停止尋找新身份的可能——在影視領域,傳統編劇的角色也將從“創作者”轉變為“藝術指導”。
在“藝術指導”這一角色中,傳統編劇需要運用訓練、審判和評估三個方面的技能。首先,在訓練方面,編劇應具備對海量優質故事素材進行分類和標注的能力,以便AI 學習不同類型故事的敘事特征和創作規律,適時調整AI生成故事模型的參數,如學習率、隱藏層大小、優化器等,使其創作出的故事更符合劇本創作的要求。其次,在審判方面,編劇需對生成情節的邏輯進行審視,確保上下文流暢連貫,角色性格、動機和成長符合故事背景和主題要求。同時,在個性化定制作品中,還需對文化背景、主題內涵、藝術審美進行審判,使之與用戶需求保持一致。最后,在評估方面,編劇需要分析當前市場的需求和趨勢,了解目標群體的口味和喜好,不斷調整、訓練新的AI 編劇模型,以創作出更符合市場需求和觀眾口味的多樣化作品,避免審美單一、效率低下的傳統評估模式[14]。
隨著角色身份轉變的還有創作模式的轉型。作為AIGC 發展的命脈,“人機協同”將成為數字時代重要的工作方式,并體現在三個維度:第一,工作形式從單獨創作轉變為團隊協作。過去,傳統編劇通常獨立完成創作后才與其他工作者合作,耗時較長,然而在AI 編劇的介入下,他們會與數據科學家、AI 工程師等其他工作者更加緊密地合作。第二,工作邏輯從線性創作轉變為非線性創作。AI 編劇的空間性創作邏輯能夠輔助傳統編劇以非線性思維構建不同的情節線、角色和事件,并利用算法模型來選擇和組合這些元素,以生成更加豐富的情節與更加復雜的敘事。第三,工作成果從單一輸出轉變為多元輸出。傳統編劇只能將故事轉化為文字形式呈現給讀者或觀眾,然而隨著大語言模型(LLM)與擴散模型(Diffu‐sion Model)的聯合使用,劇本或許將會在圖片的連續生成與視頻的播放中同步浮現。
當然,正如前文所言,技術的創造力必須由人類的精神作支撐,在這個與機器和諧共生的環境下,即使與AI協同創作,傳統編劇也需要保持作為“人類創作者”的獨特性,即文化角色的最終表達。雖然AI可以模擬人類的情感反應,但是只有人類本身才能夠更深層次地理解角色的情感,真正創作出兼具深度與真實度的作品。另外,想要AI 創作出具有個人風格的故事必然需要獲得傳統編劇的支持。在傳統編劇的提示、訓練、選擇與反饋中,作品方能在最終形成統一的語言特點和美學風格。
雖然SHOW‐1 項目已經在“戲劇性”的營造上進行了初步嘗試,但是對“戲劇性”的根基,即節奏的把控,依然是AI 編劇創作時的盲區。這導致了即使故事本身已經足夠情節豐富,但是仍會讓觀眾在觀看過程中產生疲憊、焦慮或乏味的負面感受。當然,劇本的“節奏”并非無跡可尋,而構建與優化AI 編劇的“節拍器”算法,將成為AI 構建繼幕、序列、場景之后的下一步工作。
羅伯特·麥基(Robert McKee)在《故事》中將一個完整的劇本分解為從故事到節拍共5個層次,一個故事大約會包含1~3 幕、2~5 序列、40~60 場以及若干節拍。其中,節拍作為最小的結構成分,是指動作或反應中一種行為的交替。這些變化的行為構筑了場景的轉折,變化時間的長短、幅度的大小決定了劇本的基本節奏。動作小節拍可以串聯成情節大節拍,最終形成規律的節拍器,指導編劇將簡單的故事編寫成跌宕起伏的劇本。縱然不同編劇心中的節拍器各不相同,但是大體結構趨于一致。運用劇本節拍器能夠協助編劇把握懸念的釋放時機、適時延緩劇情的發展、制造突如其來的轉折,將人物情感、角色動作、具體事件等元素錯落有致地編排在一起,形成張弛有度的節奏——而這就是戲劇性的來源。
AI 編劇在進行《南方公園》劇集創作時最多可以生成14 個場景,通過剪切再穿插的方式模擬出戲劇性的效果,但是僅僅使用這種方式進行創作,“戲劇性”的出現將會如“猴子打字機”一般屬于偶然事件。為了穩定、流暢地生成出具備起承轉合、張弛有度的故事,傳統編劇作為藝術指導可以通過訓練讓AI 編劇構建可靠、適用的節拍器,幫助其在劇本生成的過程中及時評估情節節奏,以進一步提高模型的質量。
在當今信息爆炸的時代,人們對內容的需求日益多樣化,個性化定制已成為滿足這一需求的關鍵。AI 編劇憑借其強大的數據處理和智能分析能力,能夠精準地捕捉到觀眾的文化消費習慣和心理需求,為每一位觀眾量身定制獨特的故事情節和角色設定。
事實上,人們通常認為,藝術品的價值很大程度上取決于是否滿足觀眾的意向投射,在欣賞作品中,觀眾并非被動接收者,同樣也發揮著自身的主觀能動性。意向投射是指觀眾在接觸藝術作品時,根據自己的生活經驗、價值取向、審美傾向等,對作品進行解讀和賦予意義的過程:他們以自身的情感賦予作品人物的性格與內涵,使人物行為具有多樣化的詮釋空間,又將作品中的各種元素(如形式、色彩、文字等)加以整合[15],形成對作品的獨特理解和把握。這就解釋了為什么“一千個讀者就會有一千個哈姆雷特”。在這個過程中,藝術品的“靈魂”是雙向流動的,即藝術家通過作品表達觀點和情感,觀眾根據理解和感受與藝術家進行交流。隨著比特(Bit)打造的數字環境愈發精細與多樣,數字時代人們的審美觀念出現了虛擬化傾向,虛擬角色承載了觀者的自身意志與個人欲望[16],相比于擁有意識與瑕疵的真實人物,更能夠滿足每個觀眾的個性化需求。
追求意向投射的觀眾正如皮格馬利翁,更能夠愛上代表著自身情感與理想的少女雕塑,在AI 編劇的幫助下,每個人都將成為獨一無二的藝術家,將自己的想象和向往賦予獨屬于自己的“少女雕塑”。AI故事生成技術提供的個性化故事定制服務,可以精準滿足人們的精神需求,使意向投射變得更加豐富和多元。無論是追求浪漫愛情、冒險刺激,還是尋求慰藉與啟迪,AI 編劇都能量身定制出符合內心期望的情節。值得期待的是,在AI編劇的助力下,人們還可以跨越時空、虛實,與不同背景、不同年代的角色共同進行故事冒險,《西部世界》里的高科技樂園將在計算機里真正照進現實。
從《南方公園》劇集的“一鍵生成”中可以初見端倪,在未來,劇本的呈現方式將發生重大變革。傳統的劇本主要以文本形式呈現,存在于排演與拍攝之前,是故事創作流程中不可或缺的一環(圖5)。然而,隨著AI 技術的快速發展,尤其是大語言模型(LLM)與擴散模型(Diffusion Model)的迭代賦能,電影創作流程將發生顛覆性的改變。在AI故事生成與電影虛擬制作的技術結合下,編劇、設計、導演、攝影、特效、配音、剪輯等工作模塊從傳統的線性流程變為同步進行[17],屆時,故事將在被觀眾看到的那一刻才開始出現,并在敘述過程中生長完整(圖6)。

圖5 電影傳統創作流程

圖6 AI編劇與虛擬攝制結合后的電影創作流程
基于此,AI 故事生成技術還可以與VR 影像跨媒介融合,劇本、圖像、音頻、視頻的同步生成效果將在360 度的影像空間中大放異彩,在實時生成與實時交互中極大地拓寬觀眾對故事的感知邊界,應用于電影這一重要的高端領域[18]。
AI 編劇可以根據觀眾的需求和興趣,創作出適合VR 影像的故事情節,并結合高擬真度的虛擬場景與個性化定制的虛擬角色,為觀眾量身打造VR 沉浸體驗。同時,在AI 技術的支持下,VR 影像能夠實現實時的交互式敘事。“VR 影像敘事可以利用深度學習技術,分析觀者在看到某些故事情節時的反應數據,據此設置出針對不同反應類型的多種敘事方法,從而引導觀者進入不同的故事發展方向,增強VR 影像的交互性與豐富性。”[19]跨媒介的多元融合還將促進如空間位置敘事、基于視聽與觸感[20]的立體敘事等全新敘事方式的誕生,為觀眾提供前所未有的觀影體驗:在追蹤技術錨定觀眾在VR 空間中的位置后,AI 編劇可以根據方位、朝向來實時生成畫面內容,讓觀眾獲得真正的故事參與感;通過AI故事生成技術,VR 影像還可以根據觀眾的動作和情感變化來調整聽覺和視覺元素,將視聽體驗帶入敘事之中,為觀眾營造更逼真的環境。例如,有些觀眾在看到恐怖或刺激鏡頭時會害怕地閉眼或轉頭,從而錯失部分情節和細節,這時AI 編劇可以通過增強聽覺信息來代替視覺信息,以維持觀眾內容接收的連貫性與完整性。
隨著AI技術的迅猛發展和AIGC 的逐步應用,可以預見未來劇本的創作方式與呈現形式都將發生重大變革,這是大科學時代學科和技術交叉滲透與融合發展的要求,也是我國影視行業的一次重大機遇。當然,機遇與挑戰并存。面對AI編劇的發展,傳統編劇不僅需要深入理解技術的創作原理,進行科學實操,還需要了解如何利用技術來增強藝術效果,而非被技術所縛。在“人機協同”的創作模式下,兼具技術與藝術素養的傳統編劇將作為新型創作人才,更好地發揮自身的文化角色。此外,在積極推動AI 故事生成技術發展的同時,研究者還需關注其在倫理、版權等領域的潛在挑戰。積極應對挑戰,才能夠充分挖掘AI編劇的潛能,締造健康、有序的“科藝交融”可持續發展生態環境。
注釋
①圖片來源:https://www.psyxel.com/mark‐riedl‐intro‐ai‐story‐generation/。