徐麗芳 左濤



摘 要:隨著互動敘事浪潮的興起,游戲逐漸成為互動敘事實踐的競技場。作為一款智能化的純文字冒險游戲,AI Dungeon采用OpenAI發布的語言預測模型GPT-2、GPT-3和來自冒險類互動小說生產社區choose your story.com的訓練文本,創建了高度自由的開放性敘事結構。它首次展現了玩家與NPC用自然語言交流的可能性,并初步擁有了模擬人物性格的能力;它自動生成的文本具有更完整的邏輯和更仿真的情感;而它采用的半監督學習模型則可大大節省游戲開發的人力成本。盡管對AI Dungeon的游戲性仍存在爭議,但它對人工智能的創新應用依然值得關注。
關鍵詞:AI Dungeon 人工智能 互動敘事 數字出版
隨著人工智能技術、動作捕捉技術與軟件開發水平的進步,互動敘事產品形態日趨多元。從早期的超文本小說、文字冒險游戲,發展至添加了更多元素的交互紀錄片、互動電影、電子游戲,[1]互動敘事產品越來越成為大眾娛樂產業的重要組成部分。在眾多媒介中,電子游戲無疑是互動敘事實踐的最佳場域,其中不乏《生命線》(Lifeline)、《底特律:變人》(Detroit: Become Human)等可讀性與可玩性兼備的佳作。這是因為電子游戲能夠實現文字、聲音、影像等多種敘事符號的完美融合,為讀者傳遞最佳的視覺效果與沉浸感。
作為互動敘事發展初期誕生的產品形態,文字冒險游戲又被稱為電子小說或互動小說(Interactive Fiction,IF),其作為游戲的最大亮點是對故事的承載和表達能力。最早的文字冒險游戲《巨洞冒險》(Colossal Cave Adventure)①誕生于1976年,設計靈感來自桌面角色扮演游戲②《龍與地下城》(Dragon and Dungeon,DND)。這種全新的交互設計在當時的游戲領域引起廣泛關注,并出現了不少模仿之作。1987年,《巨洞冒險》資深玩家羅貝妲·威廉斯(Roberta Williams)、肯·威廉斯(Ken Williams)夫婦共同開發了世界上第一款有圖像的冒險游戲《謎之屋》(Mystery House),一經推出便大受歡迎,并對日式文字冒險游戲的發展產生了深遠影響。[2]此后,冒險游戲不再局限于單純的文字描述,不斷加強在視覺和聽覺方面的呈現效果,并融合動作、策略、卡牌等多種玩法。最終,以《古墓麗影》(Tomb Raider)為代表的動作冒險游戲逐漸成為美式冒險游戲的中堅力量,而推理類和戀愛類冒險游戲則在日本、中國的游戲市場中展現出旺盛的生命力,出現了諸如《命運之夜》(Fate/ stay night)、《迷霧之夏》(The Vigilant Villa)等代表性作品。相較之下,AI Dungeon(見圖1)更像是原始版文字冒險游戲,與讀者的交互方式只有文本的輸入與輸出,其創始團隊則是名不見經傳的研究人員,也幾乎沒有宣傳推廣措施。但是,在第二版上線的6周內,AI Dungeon便獲得100多萬用戶,并產生了約600萬個故事。[3]目前,它的用戶規模已突破150萬,[4]平均月營收約1.5萬美元;[5]其所在公司更被數字出版資訊平臺“數字圖書世界”(Digital Book World,DBW)列入2020年度“最佳新興出版公司/技術”候選名單。[6]
一、AI Dungeon概況
AI Dungeon是尼克·沃爾頓(Nick Walton)在一次“黑客馬拉松”(hackathon)中突發奇想的產物。當時他還在楊百翰大學(Brigham Young University)的深度學習實驗室工作,研究方向主要是自動駕駛技術。他一直深為《龍與地下城》中玩家所擁有的高自由度而著迷。那么,能不能利用人工智能技術來設計一款類似的冒險游戲呢?這個想法很快成為現實。AI Dungeon 1(亦稱AI Dungeon Classic)于2019年5月上線。它采用最小GPT-2模型(Generative Pre-Training,即生成式預訓練),玩家只能在由人工智能生成的有限的交互動作列表中進行選擇,最終形成的故事連貫性也較差。與以往的互動敘事產品相比,AI Dungeon 1的表現形式并無多大突破,在敘事設計上甚至比大多數作品更加粗糙。2019年11月,人工智能研發公司OpenAI發布完整版GPT-2模型,其參數從初期1.26億個增長到15億個。這意味著AI Dungeon做出針對性反饋的準確性將大大提高。1個月后,應用了全新機器學習模型的AI Dungeon 2上線。它的訓練文本主要來自冒險類互動小說生產社區choose your story.com。[7]這使得新版本能夠更好地把握目前冒險故事的流行趨勢。一開始,AI Dungeon 2以開源形式發布于谷歌云端服務器Colab上,玩家只有下載5GB的模型后才能試玩游戲。但是,這個充滿實驗性的作品以爆炸般的速度吸引了大批玩家,其強制性下載所產生的帶寬費用在幾天內便超過2萬美元。[8]沃爾頓不得不因此暫時封存游戲。
這次事件后,沃爾頓意識到AI Dungeon所擁有的商業潛力,于是成立一家初創公司Latitude,由團隊中的其他成員負責公司長期戰略規劃,他則擔任首席技術官一職。此后,AI Dungeon 2陸續發布了更為方便的網頁版和移動端游戲,并在著名的眾籌網站Patreon上推出會員服務來維持公司長期運轉,這也是公司目前主要的營收來源。AI Dungeon將會員分為銀、金、鉑3檔,每月依次須交會員費4.99美元、9.99美元、29.99美元。用戶在支付會員費后即可解鎖相應專屬服務,如語音旁白解說、自定義場景和角色,甚至創建非游戲內容。在穩定的資金支持下,AI Dungeon 2的基本功能日漸豐富,陸續上線了多人游戲模式、交流社區、用戶生成內容(user generated content,UGC)以及個人故事庫等,而這些也進一步延長了游戲壽命。2020年7月,開發人員引入OpenAI最新發布的GPT-3模型。該模型支持的參數達到了1750億個,其學習能力與維持故事連貫性的能力都遠超GPT-2。這個全新版本被稱為AI Dungeon Dragon,目前尚處于測試階段,僅對會員開放。
二、技術賦能:完全開放的敘事結構
玩AI Dungeon的流程并不復雜。以網頁版為例,玩家在注冊并登錄后便可開始選擇游戲模式,如單人模式、多人模式或特色方案。在單人模式中,玩家首先需依次確定故事背景如“幻想”“世界末日”,人物形象如“公主”“幸存者”等。玩家可以對預先給定的故事背景和人物設定進行自由組合;付費玩家還可以自己創建背景和人物。在輸入角色姓名后,AI Dungeon會自動生成故事開端和主線任務,玩家需要不斷輸入文本來續寫故事,以完成主線任務并最終逃出地下城(如圖2)。在每次輸入文字后,AI Dungeon會在瞬間給出相應反饋文字,來阻止玩家快速通關。這聽起來有點像枯燥的人-機版故事接龍,因此AI Dungeon添加了一些傳統文字冒險游戲的小功能來優化體驗:當玩家不知道輸入什么文字時,可以從游戲提供的4個選項中選擇;如對當前敘事支點的情節不滿意時,玩家可不斷點擊“刷新”按鈕來使游戲生成新的故事情節;玩家還可以回到上一個動作處重新輸入文字,以更好地把握故事走向。而在多人模式中,發起游戲的玩家需要手動設置故事背景和人物,再以短代碼或超鏈接形式邀請其他玩家加入。此外,付費玩家可將自定義的游戲故事發布于名為“特色場景”(Featured Scenarios)的游戲內置社區中(如圖3)。其他玩家則可在點擊“播放”按鈕后,無需接受邀請直接體驗該故事世界,并在下方留下評論以幫助創建者完善故事世界。
與常見互動敘事產品相比,AI Dungeon最大的特點在于完全開放的敘事結構。故事語法理論認為,可以把故事情節中的事件或狀態切割成一個個節點;節點可按照故事環境、發生事件、反應、行為(解決)、結果的順序依次串聯起來,最終使故事呈現穩定的線性結構。[9]但是,由于互動元素的引入,敘事節點的次序、關聯和組合方式不再固定,并且通常在交互過程中臨時構成;[10]敘事結構因此變得更為復雜和多元。總的來看,目前大部分互動敘事作品采用類線性敘事結構和樹狀結構。前者是線性敘事結構的變形。玩家在故事推進過程中的所有行動都不會影響主線劇情的發展,敘事分支的指向大多殊途同歸。后者則是大多數互動游戲采用的敘事結構,即單一視角下的多支線選擇。開發者預先設計幾條劇情線,玩家選擇將會影響劇情走向,但故事也無法脫離預定結局。然而,AI Dungeon是完全開放的敘事世界。它沒有特定開端,角色和故事背景均可由玩家自定義;敘事支點處不存在選擇限制,支點間沒有權重區別,也就沒有預先設定的故事走向;雖然生成的故事總是以逃出地下城結束,但逃出地下城的方式并沒有限制。也就是說,AI Dungeon的游戲時長與趣味性完全取決于玩家的想象力,而非開發人員的敘事設計。
GPT-2、GPT-3技術是這種高度自由的開放性敘事結構得以實現的關鍵。它們是由OpenAI發布的語言預測模型,基于2017年提出的Transformer模型而架構③,使用非監督預訓練和監督式微調相結合的機器學習方式來處理語言理解任務。基本原理是根據句子的一部分預測下一個有可能出現的詞匯及概率,然后自動生成下一個詞匯,如此循環往復,直到形成一段完整文本。目前最常見的例子是輸入法的智能聯想功能。原始Transformer語言模型由編碼器(encoder)和解碼器(decoder)組成,而GPT-2和GPT-3是通過一套堆疊得盡可能多的Transformer解碼器模塊構建的;為了保證預測的準確率,需要用海量文本和算力來對其進行訓練。在訓練過程中,模型通常會學習更長的文本序列,并且一次處理多個詞(token)。完整版GPT-2使用的是從網上爬取數據的名為“WebText”的40GB超大數據集。AI Dungeon 2在此基礎上還額外增加了冒險類文本的訓練。GPT-3的訓練文本達到45TB,其自動生成的文本具有更完整的邏輯和更仿真的情感,因此可為AI Dungeon玩家提供更優質的閱讀體驗。由于GPT-2、GPT-3都采用半監督學習模型,因此大大節省了游戲開發的人力成本。
當然,最新版AI Dungeon仍無法在內容質量上與《底特律變人》等互動敘事佳作相媲美。首先,由于現有GPT模型無法保持長期的邏輯連貫,AI Dungeon 2至多只能根據玩家最近8次輸入的文本給出反饋。因此,當游戲進程過長時,故事很難擁有完整而連續的世界觀——即便玩家一開始便限定了故事背景。其次,一般而言富媒體互動敘事作品能夠為讀者提供多感官體驗,并賦予其主動參與甚至操縱環境和對象的權力,因此讀者在閱讀時更容易混淆現實與虛擬的邊界,從而進入沉浸狀態。但受限于成本,AI Dungeon 2的敘事符號只有單一文字,沒有音樂和音效,也沒有能造成視覺沖擊的動態影像,因此互動敘事作品本可具有的優點無法充分體現。最后,AI Dungeon 2僅可在開頭用一段話來簡單交代背景,無法通過圖像、聲音、關卡、人物等環境因素間接傳遞游戲內容和情感,因此玩家的代入感并不強,很難從“旁觀者”視角轉換為主動參與者身份。[11]
三、真實度VS游戲性:開放一定好嗎?
盡管玩法上仍顯粗糙,但不可否認AI Dungeon獨特的敘事結構讓一直熱衷于打造更加開放、更逼近現實的游戲開發者看到了希望的曙光。游戲的魅力本就來源于玩家在其中所獲得的“被賦權的感覺,源自于可以在世界中采取行動的能力,并且這種能力或傾向可以切實改變此一世界”[12]。當前,游戲玩家可操縱“身體”來完成奔跑、跳躍、攀爬、種植、畜牧、戰斗等各種動作,也可以通過不同選擇來影響故事走向。看起來,他們似乎已經成為游戲世界的主人。然而,還缺少了最關鍵一環,即通過與游戲世界里的“人”(非玩家角色, Non-Player Character,NPC)互動來“改變世界”。一般而言,NPC在游戲中充當玩家與游戲世界的介質,起著提供信息或者道具的作用,其與玩家的良性互動可有效提高故事可信度。但受限于人工智能的發展水平,現有NPC有時反而破壞了游戲的真實感:盡管NPC視覺逼真度不斷提高,但其行為模式仍過于簡單,往往沿著預定路徑推進游戲;而由于NPC無法理解自然語言,玩家與之進行的對話通常是人為的、受限制的,只能在固定語句選項中進行選擇。顯然,NPC需要更加豐富的行為類型,并應能響應玩家的各種話題。[13]AI Dungeon首次展現了玩家與NPC用自然語言交流的可能性,并擁有了初步模擬人物性格的能力。可以設想,當GPT模型強大到可以模擬多個人物、自動生成的文本更符合人類表述和情感模式時,架構玩家與玩家、玩家與NPC、NPC與NPC之間完整的社交系統將不再是幻想,而游戲的真實程度也將因此得到極大提升。
然而,這種開放敘事結構也飽受爭議。拋開人工智能倫理問題,僅從游戲性角度來看,如果每次選擇都很重要,就意味著每次選擇都沒那么重要。因為很難在每一條敘事線上都創造足夠大、足夠多的波動,來使每一個分支故事都具備強大的戲劇張力。因此,在許多互動敘事作品中,用戶選擇的樂趣并不來自行為本身,而來自對相關信息的掌握量和選擇后得到的差異化回饋。據此,柯瑞斯·克勞福德(Chris Crawford)曾提出應該賦予互動故事世界用戶的能力:一是用戶需要能夠做出戲劇性的重大決策;二是呈現給用戶的選擇必須是經過權衡的;三是故事必須向用戶提供足夠多選擇,但其中大部分選擇的權重都應該相對較小;四是互動敘事不能只提供促成圓滿結局的決定,必須允許用戶做出可能導致各種結果的選擇。[14]他認為只有這樣,才能充分激發用戶持續體驗多種故事可能的積極性,而這與AI Dungeon的敘事結構可謂南轅北轍。另外,開放互動敘事的內容質量在很大程度上取決于玩家的藝術素養和邏輯能力,無疑變相拔高了作品進入門檻,縮小了受眾范圍。
問題根源在于互動與敘事之間似乎天然存在矛盾。互動敘事賦予讀者做出敘事決策的權力,使原本屬于作者的敘事權部分轉移給了讀者,由此產生的作品具備了不同于傳統敘事的非線性結構,同時也引發了敘事性差、敘事難度增大等問題。而這些問題在作為互動敘事競技場的游戲領域格外突出。部分游戲學研究者認為,游戲與敘事文本歸屬于完全不同的媒介。盡管游戲中也存在時間、角色、環境、事件等敘事元素,但因其更強調競爭、任務、動作、探索等游戲性元素,因此不能將傳統敘事規則和經驗完全移植到互動環境中來。面對質疑,敘事學研究者指出這種判斷犯了將游戲整體視為一個敘事而存在的錯。實際上,敘事只是游戲設計的一個層面。這派學者提出,可以將游戲理解為“一個可以提供跨媒體敘事功能的環境”;就像敘事在文學和電影兩種不同媒介中的差異化表現,以計算機為載體的電子游戲也可以有自己獨特的敘事特征。[15]游戲同樣可以講故事,只是敘事模式與傳統線性敘事模式不同,由此產生多種敘事結構。正如媒介研究學者亨利·詹金斯(Jenkins Henry)所說:“如果游戲講故事的話,那么它講故事的模式不可能像其他敘事媒介一樣,故事不是一個可以從一個媒介管道任意傳送到另外一個的空泛的內容。”[16]
四、小結
大眾對互動性、個性化內容的集體追求,使互動敘事越來越成為數字內容產業的風口。AI Dungeon利用GPT-2、GPT-3技術,為讀者提供了一個完全開放的故事世界,使人機之間的自然語言交流成為現實,也為游戲設計師們打開了開放式敘事結構的大門,并因此贏得廣泛關注和好評。實際上,它并不是唯一應用GPT-2的產品。AI Dungeon 1出現不久,與沃爾頓同為神經學博士的內森·惠特摩爾(Nathan Whitmore)開發了一款名為GPT-2 Adventure的游戲,其流程與AI Dungeon幾乎一模一樣,但它所生成的文本比后者更加機械,重復也更多;另外一家名為“Talk to Transformer”網站的人工智能可參照用戶提供的文本示例自動完成故事,[17]但這種互動是一次性的,用戶與人工智能之間無法通過長期交流來調整故事發展方向,因此其對敘事的控制權極其有限。最終,只有AI Dungeon順利完成了從實驗品到商品的轉型。在文字冒險游戲之外,玩家還能通過它的自定義功能來進行其他活動,如和虛構的名人互動[18]、與心理學家交流[19]等。這是因為除冒險內容外,AI Dungeon的訓練文本還包括大量的萬維網內容如整個英語維基百科,因此其足以模仿任何已知的人物形象。盡管目前語言預測模型還不夠完善,其游戲性也還存在爭議,但AI Dungeon的開放性敘事結構顛覆了長久以來的游戲敘事設計理念,其對人工智能的創新運用依然存在可取之處。因此,其未來走向值得持續關注。
注? ? 釋:
①《巨洞冒險》,由美國程序員威爾·克羅瑟(Will Crowther)研發。游戲只有單純的文字描述,玩家的主要任務是找到一個傳說中藏有大量寶藏和金子的洞穴并活著離開,其間可輸入簡單的指令來推進故事發展和切換視角,如“look”“take”“go left”等。
②桌上角色扮演游戲(Tabletop Role-playing game,TRPG),是當前常見的電腦角色扮演游戲(Computer Role-playing game,CRPG)的基礎。玩家分為主持人和扮演者,主持人負責描述和維護游戲規則,扮演者通過各種方式來扮演和還原故事角色。
③2017年,谷歌在一篇論文《Attention is All You Need》中創造性地提出了一種注意力(Attention)機制,通過堆疊編碼器和解碼器來形成Transformer模型架構。與以往常用的RNN系列模型相比,Transformer模型可以更好地完成時間序列任務,現已廣泛應用于神經語言程序學(Neuro-Linguistic Programming, NLP)領域。轉引自:【NLP】Transformer模型原理詳解[EB/OL].[2021-01-07]. https://zhuanlan.zhihu.com/p/44121378.
參考文獻:
[1]徐麗芳,曾李.數字敘事與互動數字敘事[J].出版科學,2016(3):96-101.
[2]一機游戲.AVG冒險游戲消亡史(一):源于跑團桌游 亦是恐怖游戲鼻祖[EB/OL].[2021-01-07].https://zhuanlan.zhihu.com/p/283419298.
[3]Nick Walton.How we scaled AI Dungeon 2 to support over 1,000,000 users[EB/OL].[2020-09-26].https://medium.com/@aidungeon/how-we-scaled-ai-dungeon-2-to-support-over-1-000-000-users-d207d5623de9.
[4]Hengtee Lim. Can AI Make Video Games?– How Nick Walton Created AI Dungeon[EB/OL].[2020-09-26].https://lionbridge.ai/articles/can-ai-make-video-games-how-nick-walton-created-ai-dungeon/.
[5]Adi Robertson.The infinite text adventure AI Dungeon 2 is now easy to play online[EB/OL].[2020-09-26].https://www.theverge.com/2019/12/30/21042942/ai-dungeon-nick-walton-openai-gpt2-text-adventure-game-web-version-launch.
[6]The 2020 DBW Awards[EB/OL].[2020-09-26].https://www.digitalbookworld.com/the-dbw-awards.
[7]Jason Boog.How the Creator of AI Dungeon 2 Used GPT-2 To Create Neverending Adventure Games[EB/OL].[2020-09-28].https://towardsdatascience.com/the-creator-of-ai-dungeon-2-shares-gpt-2-finetuning-advice-e5800df407c9.
[8]John Harris. Creating the ever-improvising text adventures of AI Dungeon 2[EB/OL].[2020-09-28].https://www.gamasutra.com/view/news/356305/Creating_the_everimprovising_text_adventures_of_AI_Dungeon_2.php.
[9]王鈺.電子書互動敘事結構研究[J].出版科學,2018,26(04):84-88.
[10]Hartmut Koenitz. Towards a Specific Theory of Interactive Digital Narrative[A]//Hartmut Koenitz, Gabriele Ferri,Mads Haahr,Di demSezen and Tonguc brahim Sezen,eds.Interactive Digital Narrative: History,Theory and Practice.New York and London: Routledge,2015:99-100.
[11]淺談游戲的互動敘事設計[EB/OL].[2020-09-30].https://gameinstitute.qq.com/community/detail/129027.
[12]Michael Mateas.A Preliminary Poetics for Interactive Drama and Games,Digital Creativity,12:3, 2001:140-152.
[13]Mateas M,Stern A.Structuring Content in the Fa?ade Interactive Drama Architecture[C]// Proceedings of the First Artificial Intelligence and Interactive Digital Entertainment Conference,Marina del Rey,California:AAAI Press.June 1-5,2005,2005.
[14]克里斯·克勞福德.游戲大師Chris Crawford談互動敘事[M].方舟,譯.北京:人民郵電出版社,2015.
[15]甘鋒,李坤.從文本分析到過程研究:數字敘事理論的生成與流變[J].云南社會科學,2019(1):170-177.
[16]Jenkins Henry.Game Design as Narrative Architecture[A]//Noah Wardrip-Fruin and Pat Harrigan,eds,First Person: New Media as Story,Performance,and Game.Cambridge:The MIT Press, 2004:117-131.
[17]Tarpley Hitt.Meet the Mormon College Student Behind the Viral A.I. Game That Took Dungeons & Dragons Online[EB/OL].[2020-09-30].https://www.thedailybeast.com/meet-the-mormon-college-student-behind-viral-artificial-intelligence-game-ai-dungeon?ref=scroll.
[18]Loukia Papadopoulos.10 of the Most Entertaining AI Dungeon Stories Out There[EB/OL].[2020-09-30].https://interestingengineering.com/10-of-the-most-entertaining-aidungeon-stories-out-there.
[19]Alexander Kriss. I Talked to an AI About Life, Death, and Happiness[EB/OL].[2020-09-30].https://www.psychologytoday.com/au/blog/virtually-alive/202001/i-talked-ai-about-life-death-and-happiness.
(作者單位系武漢大學信息數字出版研究所;武漢大學信息管理學院出版科學系)