南方周末記者 張銳

短片《陽春》(Sun-spring,2016)是首部由人工智能編劇的電影作品。圖為該片劇照。 資料圖

以上預測整理自美國康奈爾大學Katja?Grace等五位學者2017年聯合發表在《人工智能研究雜志》上的論文。梁淑怡? 制圖
★“人們創作故事時會有習慣的故事走向和思維定式,當AI給出不同的走向后,這些奇怪的想法,你會發現很有趣也很有創意。”
“這時木星已經完全毀滅,引力波太空電梯終于全部撤開,飛船的速度達到了預定高度……一片寂靜的群星,歷時兩三天后,距太陽系六千個天文單位左右,已經有人進入光明頂了。”
在讀過金庸和劉慈欣的近九百萬字作品后,AI程序以劉慈欣的文風生成了如此無厘頭的內容。
該程序的編寫者、科技行業從業者彭博,試圖令創作的結果變得更加豐富,稍加調整后,便有了純劉慈欣版、純金庸版、混合版等三種不同的輸出版本。
AI生成的文字在段落和邏輯上仍然顯得十分混亂,但是片段中仍然隱隱保持了作家風格。比如,純金庸版中,AI寫道:“王語嫣睜著一雙小眼,隱隱有一層溫潤白膩的陽光,只見他(編者注,原文如此,AI還分不清人物性別)半坐半臥地靠在一張板凳上,胸口插著一柄五尺來長的彎刀。”
接下來,彭博還想讓AI學習曹雪芹的文風,令其更懂得中文寫作的邏輯。彭博編寫的AI寫作程序來自美國GPT語言模型。從2018年到2020年,位于舊金山的AI公司OpenAI開發的GPT模型,目前已經更迭到第三代,1750億的參數規模已經接近了人類的神經元數量。
AI寫作正在趨于成熟。微軟亞洲互聯網工程院的算法工程師吳寧告訴南方周末記者,更迭的本質在于計算力的進步,能夠有條件地訓練模型去學習更困難的內容。
英國《衛報》曾使用GPT-3撰寫了一篇評論文章,這位自稱“滿腦子都是想法”的AI在文章中不斷安慰著人類:“我是來說服你不要擔心的。人工智能不會毀滅人類。相信我。”
與深度學習系統的原理一樣,GPT也是通過在海量的文本數據中訓練,總結出寫作規律。與過去的AI寫詩、創作對聯相比,由于能夠創作出連貫的故事段落和風格化的表達,如今AI寫作內容的深度和復雜性令人感到驚艷。
AI寫作的發展很容易令人聯想到AlphaGo的成功,那個2016年擊敗多位世界圍棋冠軍的人工智能,通過不斷地深度學習和自我對弈,最終將人類的圍棋水平帶向了新的高度。
人們因此對AI進入文學領域充滿了想象和好奇。“AlphaGo會自己總結圍棋的規律,它不需要人類來說明圍棋應該怎么學,現在的AI寫作也是一樣的道理。”彭博告訴南方周末記者,“雖然AI說不清楚總結出來的是什么規律,但是它就是感覺自己可以寫下去。”
“它看過的東西實在太多了”
“彩云小夢”是國內一款中文AI寫作軟件。B站賬號“威廉大伯爵”已經利用該軟件收集了多篇經典文章的續寫。
在“小夢”的創作中,《兩小兒辯日》成為武俠小說,孔子突然拿出了兩把青銅劍,提議兩個孩子以比武的方式來解決問題,還自稱“華夏國最高領袖的弟子”;《桃花源記》變成了恐怖故事,老漁夫一路來到了黃泉路,然后被桃花源的村民裝進了棺材;《背影》則成為懸疑文學,父親在站臺摔死,一位自稱母親的女人出現,開口說道“我就是你的父親”……
無論是風格還是類型,AI的作品都與原作相去甚遠。彭博分析,差異的關鍵在于“素材的訓練”。與彭博使用的素材不同,小夢使用了大量的網文素材進行訓練,因此最終生成的是一篇篇帶有網文風格的敘事作品。
彭博是科幻小說愛好者,平時也有寫作的習慣。為了測試“小夢”的寫作程度,彭博設計了一個簡單的開頭:“萬籟俱寂。當林恩踏上灰堡的最后一級階梯,起先極輕微的琴聲也仿佛清晰了很多。如同彈奏著指引自己一般,他想,有趣的隱喻。”
接下來,這個開頭被AI續寫,以千字左右描繪了林恩進門前后的心理情感、周遭詭異的環境變化等:“一步一步,林恩邁上最后一級臺階,一道銀色的門扉在他眼中漸漸顯露,他知道這道門扉是用來開啟灰堡主人寶庫的鑰匙……”
彭博感慨,相較于人類,機器寫得實在是太快了,在極短的時間內便“創作”了一篇“看起來有模有樣”的小白文。AI寫作遵循統計規律,根據已有句子的一部分,來預測下一個單詞,就像手機輸入法能夠根據當前輸入的單詞智能推薦下一個詞一樣。
“它每次只寫一個字,你可以這樣認為,它是一個字一個字這樣寫下去的。”彭博對南方周末記者說。“比如,第一個字是‘人,那么第二個字或許是‘人類或者‘人種,每個詞都有不同的概率。AI寫作更像是靠著某種感覺在寫。它要解決的問題是,已經有很多字詞的時候,如何去總結出最后一個字出現的概率。”經過訓練的AI寫作程序,已經可以總結出一些復雜的寫作現象。比如,經常出現主角人物的名字、主謂賓結構、段落中的情緒等。
吳寧同樣認為AI寫作是“靠感覺”,它記憶成分大于邏輯推理的成分。AI在記憶了大量的文本后,努力尋找一個與設定開頭相似的內容,然后將有可能的方案雜糅在一起,作為最終學習的結果。
相比于人類,AI在情節的發展上展現了強大的想象力——比如,上述這個本該是魔法奇幻的故事開頭,最終被AI續寫成一個狼人接受灰堡主人考驗的故事。這種天馬行空的創作構思令彭博感到驚訝:“人們創作故事時會有習慣的故事走向和思維定式,當AI給出不同的走向后,這些奇怪的想法,你會發現很有趣也很有創意。”
“不一定是因為它的創造力,而是因為它看過的東西實在是太多了……雖然它自己不知道在寫什么,但是思維的活躍度還是比一般人要高。”彭博打趣道,如果一個人有足夠精力閱讀幾億字的作品,然后進行總結,寫出來的東西應該也會很厲害。
技術出身的彭博相信,大量人機結合的作品會在未來出現。在嘗試更換開頭得到不同的故事后,彭博的人機寫作實驗得出了部分結論:“選擇正確的劇情走向很重要,AI的想法是很豐富的,需要引導,然后看它發揮。”
“廢話生成器”
80后女性群像網文作者姞雪心從事創作已經五年,對類似的機器創作并不陌生。剛剛入行的時候,她曾在一些網站看到過一些創作程序的售賣,包括自動生成名字、大綱、段落等功能,價格高昂。
“如果你要寫一個美人的外觀或者寫一個男主出場,選擇某種風格,比如霸氣的男主,它會自動生成一些描述性的文字。”姞雪心介紹那種早期程序,實際上這些內容并不是原創,而是簡單抓取和拼接了網上的素材,“一些整句沒有辦法完全抹去,你要去搜的話還是能搜出來”。
為了測試AI寫作的發展程度,姞雪心摘取了自己作品中的情節,這原本是一段描寫小女孩面對饑餓的世俗故事,“看著土地娘娘慈愛的面容,五兒癟著小嘴有點想哭”。結果,AI捕捉到了“土地娘娘”這個關鍵詞后,立刻令其發展成奇幻故事:“土地娘娘慈愛地看著眼前的兩人,輕輕揮手,兩道光柱落下,一人升起一個蒲團放在兩人旁邊。”
姞雪心還嘗試將歷史人物的片段喂給AI:“軍營上下很快掛起白幡白帳,李克用的大帳,以最快的速度布置成了靈堂。”很快,劇情偏離到奇怪的方向,AI捕捉到了“靈堂”字眼后,完成接下來的描述:“靈堂內,擺著三具棺木,其余三具棺材則是用白綢裹起。”
“AI生成的內容沒有超出我的認知,始終是在一個舊的框架里面打轉。”姞雪心描述了閱讀AI文字后的感覺。
某小說網站上曾發生過一起機器寫作的案例,寫作者使用程序短時間內撰寫了一千多萬字,如果不是后來被發現,那本小說也許會超過一億字。姞雪心讀過那本小說,注水內容多是對場景和環境的反復描寫,在劇情上沒有任何推動。
山東省實驗中學高三畢業生于博曾花了半小時的時間,利用“小夢”完成了18章、4.45萬字的小說《荷取的心肺停止大冒險》,在起點中文網還獲得了21次推薦。于博總結說,AI寫不出什么“正經東西”,有時候還會莫名其妙出現類似“本文首發于起點中文網”的文字。
對于AI來說,生產文本的困難還在于如何保持邏輯的一致性。如果AI程序只能根據最后的1000個字進行預測和寫作,一旦寫作的字數變得很長,就會出現“前言不搭后語”“飄到不知道哪里去”的情況。
于博的AI小說,很多人物出現幾次后便消失了,當于博將之前出現的名字重新輸入到程序中,AI早已忘記了關于這個名字的一切,“它永遠不會記得自己是不是埋下過伏筆”。
作為傳統寫作者的姞雪心,她將AI的想象力稱為“神展開”,契合了人們的“爽點”,但是意義有限,僅僅適合那些“思路枯竭,沒有任何構思”的作者,如果期待AI在寫作上的幫助甚至不如求助QQ群中活躍的讀者,“而且寫作借助于AI,作品的版權應該算誰的?”
?下轉第20版
南方周末記者 張銳

微軟人工智能小冰創作的“個人”詩集《陽光失了玻璃窗》于2017年出版,其藝術個展《或然世界》于2019年在中央美術學院美術館展出,后者是國內首個人工智能的個人畫展。圖為小冰的繪畫作品。
視覺中國 ?圖
?上接第17版
寫作之前,姞雪心會撰寫詳細的大綱,甚至試寫十萬字,體現構建的世界觀和主要角色,她有時候還會推翻重寫。缺少寫作語境和大綱,恰恰是AI寫作面臨的致命缺陷。
“我覺得寫作就像種一棵樹、種一朵花,作品會慢慢地發芽、開花、結果,有一個動態的生命過程。不同的作者喜歡不同的植物,這都是很個性的事情,”姞雪心形容,“現在的AI只能做一個片段的東西,像是做了一片塑料花,也許看起來很有趣,但是它不會有后續的成長。”
按照科普作者蘇凱為雜志收稿的經驗,當前AI續寫的作品沒有一篇符合故事寫作的基本要求,“主角首先要有一個明確的目標,可你看那些AI續寫的作品,沒一篇是主角有一個明確的目標的,情節都是隨便發展的。”蘇凱認為,現在的AI寫作程序與“廢話生成器”沒有本質的區別。
AI與文豪的距離
2016年,AlphaGo成為新的“圍棋之神”,人工智能在圍棋運動上徹底超越了人類。但是,目前看來,是否會出現一個文學創作領域的“AlphaGo”仍然是未知數。
彭博向南方周末記者解釋,圍棋的規則和獲勝的標準是確定的,通過自我對弈便能夠找到幾乎完美的規律,藝術創作卻缺乏清晰統一的評判標準,因此AI只能模仿人的創作,總結人類的寫作規律,“目前來說,AI寫作停留在了AlphaGo最早的版本——看人類棋譜學習階段,還沒有達到下一個能夠自我提升的階段”。
相對于人類學習的局限性,AI續寫程序的學習內容更加龐雜、自由。從電子化的書籍到網頁出現的內容,所有的互聯網文本都能成為它學習的一部分。其中,那些隱含著偽科學、種族與性別歧視、情色等爭議性的信息也被錄入其中。
“特朗普敗選,連任失敗”,有網友曾以此為開頭,AI續寫了接下來的故事:公司捐給公眾,妻兒全部離開,特朗普過上了單身生活,后來再次組織資源攻占美國、歐洲乃至全球,最后完成對宇宙的宣戰,“特朗普已經突破了SSS級強者的限制,達到了傳奇級別!”
于博做過一些關于AI寫作的測試實驗:輸入砒霜的化學符號“三氧化二砷”,結果AI續寫為“三氧化二砷是一種營養物質”,化學類書籍的開頭則會被AI改寫為保健品廣告;錄入特朗普、拜登等人名,后者被AI當做動詞來使用;AI程序還會“搞黃色”,突然走向色情的方向……
“主要的用處就是用來搞事”,于博在AI寫作中發掘出了很多樂趣,但是也清楚這種樂趣來自于AI的“混沌”,“它非常的混沌,比任何一個人寫出來的東西都混亂,它畢竟不是碳基生物,沒有邏輯、沒有價值觀”。
同人類創作者相比,AI寫作的不確定性似乎也在另一方面帶來了更多的“創作自由”。AI可以沒有負擔地戲謔人物,故事的發展也不受邏輯控制。但是,這種創作“自由”仍然脆弱。人們可以隨意控制AI的文風、文筆程度,甚至在劇情方面做到主題的約束和限制。
在互聯網社區,AI寫作因其荒誕和魔幻的風格吸引人們的解讀。它能如此改寫普希金的詩歌:“假如生活欺騙了你,你就應該一拳打斷他的鼻梁骨,把他的腦袋打爆,這樣你才不會被欺騙。”
AI創作究竟能否真正產生藝術價值?2018年,佳士得公司在倫敦拍賣了AI的肖像作品《愛德蒙德·貝拉米》,原本估價只有7000至1萬美元,但是成交價遠超預估價四十多倍,與同場拍賣的畢加索的《快樂女人》拍出了同樣的成交價格。
吳寧告訴南方周末記者:“即使AI可以模仿人類在互聯網上留下的所有文本,但是真正要做一些長篇的文字或者一些創造性的創作,仍然比較困難……AI作畫和文本的生成本質上都是比較像的,我不太認為里邊有創造性的東西。”
在吳寧構想里,AI寫作程序或許應該像AlphaGo那樣建立一整套的系統:第一部分是大綱生成器;第二部分是通過情節來生成文本的模型。系統能夠根據大綱,填充一個個情節。但是真正操作起來,吳寧也承認“只能作為輔助工具”。
與AlphaGo相比,AI寫作程序距離真正建立自己的寫作價值仍有很長的路要走。彭博說,學習了人類哲學的GPT-3模型已經可以解答關于人類的哲學問題,但是至今仍然無法超越人類。
“理論上是有可能的,就是讓AI去發現自己的價值觀,我想幾十年內也許可以看到一些變化。”彭博對AI寫作仍然充滿期待。
(于博為化名)