收稿日期:2023-09-01
作者簡介:楊逸云(1992—),女,武漢大學文學院博士研究生(湖北武漢,430072);宋時磊(1982—),男,文學博士,武漢大學漢語寫作研究中心研究員,文學院副教授,中國寫作學會副秘書長(湖北武漢,430072)。
基金項目:武漢大學人工智能問題融通研究專項課題“人工智能寫作的技術路徑、倫理困境與法律風險”(2020AI005)的階段性成果。
①參見楊俊蕾:《機器,技術與AI寫作的自反性》,載《學術論壇》2018年第2期;楊丹丹:《人工智能寫作與文學新變》,載《藝術評論》2019年第10期;劉欣:《人工智能寫作“主體性”的再思考》,載《中州學刊》2019年第10期。
摘要:人工智能寫作雖經歷了從理性主義到經驗主義的范式轉變,但始終具有以下三種特質:首先,寫作過程由人機共同合作完成,計算機是人工智能寫作的顯性作者;其次,其基礎是語言模型,理性主義范式采用基于語法規則的模型,經驗主義范式則采用基于統計的語言模型和基于神經網絡的語言模型;最后,人工智能通過計算寫作生成自然語言文本。這三種特質彰顯了人工智能寫作的實質,即計算機以語言模型生成自然語言文本的過程。基于現有學術成果,研究者可在進一步明確研究邊界、拓寬研究視野、改進研究方法等方面著力,促進人工智能寫作的理論發展。
關鍵詞:人工智能寫作;理性主義;經驗主義;語言模型;自然語言文本
中圖分類號:I04;TP18" " " 文獻標識碼:A" " " 文章編號:1003-8477(2024)04-0038-09
人工智能寫作是人工智能(Artificial Intelligence,AI)技術的應用之一。近年來,人工智能已寫出了不少引人注目的作品,如微軟“小冰”的《陽光失了玻璃窗》,“快筆小新”、Dreamwriter等生成的新聞報道等等。自2022年始,國內外又推出ChatGPT、kimi、文心一言等基于大語言模型的寫作工具,人工智能寫作迅速成為億萬民眾矚目的對象和全球學界討論的焦點。人工智能寫作勇立21世紀信息技術的潮頭,攜手人文藝術,成為溝通“兩種文化”[1]的橋梁。在人文社科領域,學界已廣泛探討了與人工智能寫作相關的諸多理論問題,包括寫作主體、技術生成機制以及審美創造等。①不過,關于如何認識人工智能寫作的本質,怎樣理解人工智能寫作科學實驗與人文實驗的雙重屬性,并在跨學科視域下找尋有利于觀察人工智能寫作現象的立場、獲得溝通科技與人文的交互性視角等問題,學界還未取得廣泛共識。本文擬從理性主義與經驗主義兩種自然語言處理研究范式出發,回溯人工智能寫作歷史,嘗試界定人工智能寫作的概念,展望人工智能寫作研究的發展前景。
一、歷史回顧
1956年,約翰·麥卡錫(John McCarthy)在達特茅斯會議上,首次提出了人工智能的概念。而人工智能寫作實踐卻可追溯至1952年,當時英國計算機學者克里斯托弗·斯特雷奇(Christopher Strachey)用計算機程序生成文本,拉開了人工智能寫作的序幕。人工智能寫作深受理性主義和經驗主義兩種研究范式的影響,理性主義方法以阿夫拉姆·諾姆·喬姆斯基(Avram Noam Chomsky)的語法理論為基礎,又稱基于規則的方法(rule-based approach),即通過專家編制規則,構造相應的寫作程序,旨在通過手工編碼大量的先驗知識和推理機制,復制人類大腦中的語言能力。[2](p10)但是,理性主義方法面臨著知識瓶頸,有關研究進展緩慢,于是經驗主義方法隨之興起。經驗主義方法以香農(Claude Shannon)的信息論為理論基礎,又稱基于統計的方法(statistic-based approach),主張通過建立特定的數學模型學習復雜、廣泛的語言結構,[2](p10)并很快在機器翻譯1、漢語對聯寫作2等方面取得驕人成績。
20世紀90年代,基于理性主義方法的人工智能已在詩歌、戲劇、小說等文體寫作領域嶄露頭角。21世紀以來,基于統計和神經網絡的經驗主義方法后來居上,并在人工智能寫作方面不斷推出令人震驚的學術成果。總體來看,國內人工智能寫作的實踐雖起步較晚,但自20世紀80年代開始,其進程基本與國外同步。
(一)理性主義范式下的人工智能寫作
20世紀八九十年代,國內人工智能寫作實踐主要在詩歌領域展開。1984年,上海育才中學的梁建章設計了一款詩詞創作軟件,獲得首屆青少年計算機程序設計競賽初中組四等獎,這是我國最早的人工智能寫作實例。梁建章設計的詩詞創作軟件,平均不到30秒即可創作一首五言絕句。為設計這一軟件,他學習了《唐詩三百首》《千家詩新注》《學詩百法》,根據語法句式結構、對偶、韻律等設計出詩歌寫作規則,再將500多個詩詞常用詞匯納入計算機數據庫。[3](p39)與梁建章的軟件不同,1989年劉慈欣設計的“電子詩人”專產現代詩歌。它用VF編程,含5個程序模塊、6個詞庫、1個語法庫,產詩量為每秒200行(不押韻)或每秒150行(押韻),產詩的方式絕對全自動,除了告知行數外,不需任何人為干預。3劉慈欣認為現代詩歌講究朦朧和自由,沒有絕對的標準,因此現代詩歌的生成也不需要嚴格的專家知識。程序員獵戶與劉慈欣持同樣看法,他認為現代詩歌的規律是主謂賓的“亂搭配”及形容詞、名詞、動詞的“亂搭配”,并據此開發出“獵戶星”免費在線寫詩軟件。工程師張小紅則對現代詩歌的生成有著不同看法,1994年,他開發出智能寫作軟件“GS文章自動生成系統”,并把軟件生成的作品結集為《心訴無語——計算機詩歌》和《中國機器詩》,其中《中國機器詩》以電子形式出版,獲得國家版權局計算機軟件著作權。張小紅的寫作軟件采用“詩歌坐標構思法”生成現代詩,這一方法類似于雅各布森詩歌理論中的對等原則,即將詩歌中的詞語分別對應到坐標軸,x軸為組合軸、y軸為選擇軸,將x軸與y軸上的信息進行強化聯結,就生成了詩歌。與此相似的還有林鴻程(稻香老農)開發的古典詩歌智能寫作軟件“電腦作詩機”、“大作家”自動寫作軟件等等。
人工智能的寫作實踐,引發了學界關注。對于這個嶄新事物,學者們采用了多種不同的指稱方式,例如“計算機輔助寫作系統”“智能輔助寫作”“電腦自動寫作”“機器智能寫作”等等。值得指出的是,當時學界并未將其作為獨立的研究對象,而是普遍認為人工智能寫作是電腦寫作的高級發展階段。1
(二)經驗主義范式下的人工智能寫作
21世紀以來,基于經驗主義的人工智能詩歌寫作實踐令人矚目。這類寫作程序均建立了數據集,通過學習和分析其中的詩歌,搭建寫詩模型。當用戶輸入詩歌題目時,模型便會通過概率計算出與該題目相關的字詞,組合成最終的詩歌。如微軟“小冰”學習了1920年以來519位中國詩人的現代詩,通過不斷訓練擁有了寫作現代詩的能力,并于2017年出版了首部由人工智能寫作的詩集《陽光失了玻璃窗》。同年,清華大學開發的人工智能詩歌寫作軟件“九歌”登上中央電視臺科技類挑戰節目《機智過人》,與青年詩人比拼詩詞創作,并成功通過現場圖靈測試。2019年,封面團隊的“小封”通過學習數百位詩人的詩歌,來創作現代詩和古體詩,出版了詩集《萬物都相愛》。京東、百度等網絡平臺也開發了相應的詩歌寫作軟件。目前,網絡上較為活躍的人工智能寫作平臺還包括“詩三百”、華為“樂府”等。
同一時期,人工智能新聞寫作也取得了較大成功。國內機器新聞寫作在2015—2019年出現一個小高峰,媒體紛紛開發了自己的寫作機器人。2015年,騰訊新聞上線了寫作機器人Dreamwriter,它從國家統計局網站中獲取數據,并選擇一些高級統計師的評論建議,僅用一分鐘就完成了國內第一條由機器寫作的稿件《8月CPI同比上漲2.0%,創12個月新高》。同年,新華社使用“快筆小新”為體育部、經濟信息部等部門和《中國證券報》等報刊提供財經、體育類新聞稿件。2016年,中國地震臺網在四川發生地震的幾分鐘后就使用寫稿機器人發布了新聞。同年,今日頭條的“張小明”在奧運會報道中也嶄露頭角,它主要從文字直播數據中進行語句篩選與融合,進而生成賽事報道。隨后幾年間,《南方都市報》《封面傳媒》《廈門日報》、百家號等媒體紛紛使用寫作機器人批量生成新聞。2
在小說領域,陳楸帆使用自主研發的人工智能寫作程序“AI 科幻世界”完成了人機交互寫作《恐懼機器》《出神狀態》等短篇科幻小說,并發起了首次華語科幻AI人機共創寫作實驗項目“共生紀”。華東師范大學王峰團隊采用“國內大語言模型+提示詞工程+人工后期潤色”的方式發布了超過100萬字的人機融合式長篇小說《天命使徒》。此外,經驗主義范式還催生了不少輔助寫作軟件和平臺,如“筆神”“彩云小夢”“WPS智能寫作”“法律文書智能輔助”“在線劇本智能寫作”等,為寫作者提供了數據庫聯想、續寫等功能,只要使用者輸入相關文字,平臺便會推送關聯文本信息,以供參考。
2022年,OpenAI推出的ChatGPT可以按照人類提示自主完成詩歌、小說、新聞、學術論文等各種文體的寫作,通用人工智能不再遙不可及。隨著技術進步,基于經驗主義的人工智能寫作質量大幅提升,相關研究課題數量也顯著增長。在諸多研究中,不僅有針對寫作基礎問題的研究,如人工智能寫作的主體、原理、文本形態、讀者接受情況等;還有針對不同文體寫作的研究,如對人工智能詩歌、人工智能小說、機器新聞等的專題討論。然而,有關人工智能寫作概念的研究幾近缺位。從理性主義到經驗主義,人工智能寫作已經積累了足夠的研究樣本,進行概念界定的條件早已具備,但多數研究忽略了這一基礎問題,轉而直接投入具體理論研究中。厘清概念是開展系統理論研究的基礎,只有通過明確的定義,才能深入探討人工智能寫作的本質、挑戰及應對措施,推動相關研究向前邁進。ChatGPT等大語言模型的火爆出圈使人工智能寫作現象再次成為各界焦點,人文學者如何充分吸收自然科學的研究成果,從跨學科的角度理解并界定人工智能寫作的概念,成為21世紀中國寫作研究的當務之急。
二、概念界定
人工智能寫作是計算機科學自然語言處理技術的應用之一,人文社會科學界則傾向于將人工智能寫作理解為新技術詞匯“人工智能”與舊藝術概念“寫作”的疊加,[4](p85)該如何界定人工智能寫作概念?筆者認為,首先要考慮人工智能寫作的特殊性,避免簡單類比人類寫作概念的傾向;其次要充分考慮人工智能發展的技術路徑,盡量從技術與藝術的交互角度切入。基于這兩點,筆者將從誰在寫、怎么寫、所寫為何這三個維度探究人工智能寫作概念的內涵。
(一)誰在寫?——計算機
談到人工智能寫作,首先遇到的問題就是誰在寫?是人還是機器?對此,學界多從主體性角度予以討論,如,張強等認為主體性是人獨有的,只認可人的作者地位;[5](p42-46)又如,劉欣、[6](p153-158)畢日生等、[7](p69-75)周建瓊[8](p145-150)則將當前的人工智能寫作主體視為一種人機間性主體。人工智能寫作由人機合作完成,人類的參與主要體現在前期人工智能寫作程序的開發及后期對寫作結果的刪選中,而人工智能生成文本的整個過程都由計算機在“中文屋”1中完成,并不需要人類直接干預。因此,筆者認為有必要強調計算機的顯性作者2地位。近兩年GPT模型的發明與運用更加凸顯了人工智能寫作這種自在自為的性質。
計算是人工智能寫作與人類寫作最根本的區別。人類寫作由人腦構思成文,而人工智能寫作則是計算機通過計算完成的。人工智能將自然語言轉換成數值,通過計算得出結果,然后再轉換回文本形態。誠如美國硅谷人工智能研究院院長皮埃羅·斯加魯菲(Piero Scaruffi)所言:“到目前為止,無論何時人工智能解決了一個問題(例如,在圍棋比賽中戰勝人類大師),人們都會發現這種解決方法并沒有任何特別之處,只是在高速計算機上進行了非常復雜的數學運算罷了。”[9](p31)在以往的人工智能寫作研究中,學者往往選擇重視計算的方法,將人工智能寫作定性為程序寫作或算法寫作,而忽略了實施計算的主體——計算機。雖然人工智能寫作程序承載著人腦的思想,是實現人工智能寫作的靈魂,但如若沒有計算機這一平臺,再好的程序也無法發揮作用。
作為計算的主體,計算機在人工智能寫作中扮演著十分重要的角色,它為程序和算法的實現提供了硬件和軟件環境,使人工智能能夠處理大量的數據、完成復雜的任務。當前人工智能寫作對計算機運算能力的要求越來越高,例如谷歌在2018年開發的用于人工智能寫作的BERT語言模型只有3.4億模型參數量,而到了2020年,由OpenAI 公司開發的GPT-3語言模型已超過了1750億個參數量。目前,人工智能寫作正處于以計算能力換取寫作效果的階段,創造龐大的模型似乎成為人工智能寫作不可逆轉的趨勢,計算機的計算能力也直接決定了經驗主義范式下人工智能寫作未來發展的可能。
(二)怎么寫?——建立語言模型
語言模型是人工智能寫作實現的具體方法。在人工智能寫作過程中,計算機難以直接處理復雜的自然語言,因此需要將自然語言用數學方法形式化,建立語言的形式模型,簡稱語言模型。[10](p17-24)語言模型的發展經歷了從理性主義方法到經驗主義方法的轉變。在人工智能寫作發展初期,理性主義通過歸納語言規則來實現語言的表示和推理,雖然在特定領域取得了成功,但其在處理人類語言的復雜性方面存在局限。隨著大規模語料庫的出現,經驗主義逐漸在發展中占據主導地位,并在處理大規模文本數據方面成績顯著,ChatGPT等大型語言模型便是其代表。
1.理性主義范式語言模型
“情書生成器”是理性主義范式語言模型的代表性實踐。1952年,克里斯托弗在第一臺商用通用計算機“馬克1號”(Ferranti Mark I)上開發了“情書生成器”,專門用于情書寫作。克里斯托弗想讓計算機模仿人類思維生成多樣化的成果,于是自制了一套情書寫作規則,并將這些規則轉換為計算機指令。首先,他從羅杰英語同義詞詞庫中選擇了70個左右的基本詞匯,然后根據語法規則編制出了五句話的情書生成模型。他主要設計了兩種句型,一種是“我的lt;形容詞gt;lt;名詞gt;lt;副詞gt;lt;動詞gt;”,另一種是“你是我的lt;形容詞gt;lt;名詞gt;”。生成器可以隨機選擇使用哪種類型的句子,但如果有兩個連續第二種類型的句子,則第一句以冒號結尾,第二句前面的“你是我的”被省略。整封情書一共有五句話,最后以“你的lt;副詞gt; M. U. C.”結尾。句型確定后,再將對應詞性的詞語隨機填充到規則當中,便可產生一封情書,如下所示:[11](p25-31)
親愛的甜心
你是我的狂熱伙伴。我的感情奇怪地緊緊抓住你的熱情愿望。我喜歡你的心。你是我渴望的同情:我溫柔的喜歡。
你美麗的 M. U. C.
克里斯托弗的這一嘗試,開啟了人工智能寫作的先河。上文所述梁建章、劉慈欣、張小紅等人發明的文本生成軟件均使用這種寫作方法。
2.經驗主義范式語言模型
與理性主義不同,經驗主義認為大腦并沒有先天的語言知識,語言知識是基于經驗發展而來的,完成自然語言處理任務不一定要經過“理解”的階段。經驗主義研究范式將人工智能寫作視為概率求解問題,通過概率確定自然語言出現的可能性,概率越大,句子的合理性越充分。經驗主義范式下的人工智能可以在大規模文本數據上進行訓練,生成的內容質量相對較高,由于其底層邏輯為概率統計,被姜峰楠(Ted Chiang)等學者稱為“應用統計學”。[12]
(1)基于統計的語言模型
經驗主義最初采用的是基于統計的語言模型(statistics-based language model)。這種模型通常依賴于數據集,通過分析數據集中的文本數據來計算單詞序列出現的概率。假設給定一個語料庫詞典V,所有的單詞w都是詞典V當中的,wi∈V。統計語言模型計算的就是任意單詞序列合理的概率p(w1,w2,…,wn),其中,p≥0。假設訓練集中共有N個句子,接下來數一下單詞序列(w1,w2,…,wn)出現的次數n,即可得出概率p(w1,w2,…,wn) =[nN]。但是,一旦這個單詞序列(w1,w2,…,wn)沒有在訓練集中出現過,模型的輸出概率就會變成0。為了解決這一問題,人工智能研究者采用了概率論中的鏈式法則,將長句子的概率分解為多個簡單部分的乘積,并假設每個詞的出現概率僅與它前面的詞相關。通過這種方式,計算機可以逐步計算每個詞的條件概率,并將它們相乘得到整個句子的概率,即p(w1,w2,…,wn)≈ p(w1)p(w2|w1)p(w3|w2)…p(wi|wi-1),這就是二元語法模型(Bigram Model),同理可推廣至三元語法模型(Trigram Model)、N元語法模型(N-gram Model)。1
由于統計語言模型學習能力有限,需要學習的詞組太多,如果訓練集中缺少某些詞組,這些未出現的詞組將導致計算出的概率值為零。即使采取平滑技術解決,將所有詞組出現的次數加1,仍會出現諸如維度災難2的問題,于是基于神經網絡的語言模型(neural-network-based language model)3應運而生。
(2)基于神經網絡的語言模型
神經網絡語言模型的基礎仍然是概率計算,但它使用詞向量表示單詞或單詞組合,并在此基礎上通過神經網絡表示語言模型,提高了語言表達效率,成為當前人工智能寫作使用的主流方法。
首先,神經網絡語言模型提出詞向量的概念,采用具有一定維度的實數向量表示單詞的分布式,以此代替統計語言模型中使用的離散變量,解決了維度災難問題。其次,神經網絡語言模型用神經網絡建模語言,對于從來沒見過的單詞搭配也能通過詞向量擬合出對應的概率,避免了零概率問題。神經網絡是一種模仿人腦神經元連接方式的計算模型,它由許多相互連接的神經元組成,每個神經元都與其他神經元相連,并通過這些連接傳遞信息。2003年,約書亞·本吉奧提出第一個前饋神經網絡語言模型(FFNNLM),該模型先在輸入層輸入詞向量,然后通過隱藏層對詞向量進行加權和轉換,最后由輸出層給出可能出現的單詞的概率。在訓練過程中,神經網絡會調整連接權重,以便更準確地預測單詞序列。之后,為了更好地捕捉和分析單詞序列特征的信息,其他學者又提出了循環神經網絡模型(RNN)、長短期記憶模型(LSTM)、序列到序列模型(Seq2Seq)等等。目前,人工智能寫作最先進的神經網絡語言模型為雙向編碼器表示模型(BERT)和生成式預訓練模型(GPT)。
對于人工智能而言,建立語言的形式化模型,并使之能以一定的數學形式嚴密規整地表示出來是最有困難和挑戰性的一步,因此,語言模型直接決定了人工智能寫作的質量。目前,理性主義和經驗主義方法下的語言模型各有優勢,在不同文體寫作領域都取得了一定成績。
(三)寫的是什么?——自然語言文本
人工智能寫作的文稿可以稱為“作品”嗎?由于涉及知識產權,法學界重點關注了這一問題,并形成兩種鮮明的觀點。1文學界的多數學者則仍然使用傳統的“作品”一詞來指代人工智能生成的內容。筆者認為,人工智能寫作與人類寫作存在本質差異,為凸顯二者區別,建議將人工智能寫作的文稿稱作“自然語言文本”。
人工智能通過數據、算法、算力完成寫作任務,其本質是計算寫作,并不具有主觀精神與意識。人類寫作由“心”生發,與人工智能依靠的“機芯”有著根本區別。[13](p94-99)下文以“云松”主題為例比較人工智能生成的詩歌文本與人類詩歌的差異。
云松[14](p263)
鑾仙玉骨寒,松虬雪友繁。
大千收眼底,斯調不同凡。
這首《云松》由前述梁建章設計的詩詞創作軟件生成,屬于理性主義范式下的人工智能寫作。該詩夸贊了云松的高大聳立及其不同凡響的氣質,文字看似對偶工整,實則缺乏內在邏輯,如“松虬雪友繁”一句,松樹盤曲的枝干與“雪友繁”之間似乎并無聯系。
在“詩三百”平臺中輸入古詩主題“云松”,選擇五言絕句,即可快速得到下面這首基于經驗主義范式的文本:
云松
白鶴舞清秋,云松共偃休。
何時歸去此,長伴赤松游。
該平臺擁有較大的古詩數據庫,當用戶輸入詩歌主題后,平臺通過概率計算推測出首聯的首字“白”,然后利用“白”和語義向量繼續推測出第二個字“鶴”,再根據“鶴”和語義向量推測出第三個字“舞”,依此類推,直到預測出終止符。這首《云松》前兩句描述了一只在深秋起舞的白鶴站在云松旁休息的情景;后兩句追問白鶴何時回到仙人身邊,陪伴仙人游歷。雖說題目為“云松”,但詩歌內容并未圍繞云松展開。可見,人工智能生成的詩歌內容與題目的關系并不緊密,似未達到詩歌寫作的基本標準。
同樣是描寫松樹,李白的《南軒松》以其超凡脫俗的意境和深邃的情感,將松樹的高潔品質與詩人的志趣相融合,展現了一幅生動而富有哲理的畫面。從寫作技巧上看,既展現出清晰的邏輯層次,又對詞句進行了精心雕琢。詩歌的首聯即破題,頷聯和頸聯寫景,尾聯借孤松寄托詩人高遠灑脫的情懷。
南軒松[15](p962)
南軒有孤松,柯葉自綿冪。
清風無閑時,瀟灑終日夕。
陰生古苔綠,色染秋煙碧。
何當凌云霄,直上數千尺。
比較三種文本,就可以發現人工智能寫作與人類寫作之間的差異。首先,從作詩動機看,人工智能只是在完成一項以“云松”為主題的寫作任務,并不理解自己的操作有何意義;而人類的寫作則是“情動于中而形于言”,[16](p34)是李白在觀察到南窗外的松樹時產生了感悟,繼而運思和行文。一個是“要我寫”,動力來源于外部;一個是“我要寫”,有強烈的內在動機。其次,從作詩過程看,人類的寫作受到作者性格、閱歷及文化環境影響,李白寫作《南軒松》時正棲止于安陸,雖隱居山中,但仍在尋求復出時機,因而寫出“何當凌云霄,直上數千尺”的詩句,以孤松自喻,表達出對未來的期盼;而人工智能寫作的詩歌主要受數據庫和算法制約,在“詩三百”版本的《云松》中,“何時”“歸去”“長伴赤松游”等都可在先前的詩歌中找到原型。可以說,人工智能寫作并非嚴格意義上的原創,不具有人類寫作的創造性,只是一種制作。如果嚴格對標人類寫作的概念,人工智能寫作就成為了一個不言自明、不攻自破的偽命題。[17](p137-144)因此,人工智能寫作的結果更適合稱為“自然語言文本”。
筆者提出“自然語言文本”的概念,還有以下兩方面的考慮。其一,文本是作品的存在形態,它與作品的關系可以用一個短語來說明——某某作品的文本。文本是低級的,同時也是基礎的,它可以是一句話、一個段落或一個篇章;而作品則是高級的,往往蘊含了豐富的精神價值。當前人工智能生成的文稿并非都能達到作品的水平,文本的用法顯然更加貼切。其二,從技術層面上看,文本生成本身就是自然語言處理中的一個重要研究領域,它曾被認為是人工智能寫作的學術性說法。[18]但僅僅使用文本來代替作品,仍容易產生歧義,因為計算機領域中的文本除了指主流意義上的語言文字外,還包括代碼等其他編碼化的電子信號。因此,有必要在文本前面加上自然語言的限定,使表述更加精確。
通過探究誰在寫、怎么寫、所寫為何等寫作學基本問題,筆者認為,人工智能寫作的實質是計算機以語言模型生成自然語言文本的過程。基于人工智能技術來對人工智能寫作進行概念界定,更符合人工智能寫作的本質,且有利于確立觀察人工智能寫作現象的穩定立場,進一步深化人工智能寫作的研究。
三、研究展望
人工智能寫作及其研究既受技術迅猛發展的影響,也與人文社科多學科交叉互動,處于科技與人文交匯的前沿。當前,人工智能寫作及其研究仍處于起步階段,概念界定僅僅是人工智能寫作系統性理論研究的第一步。在厘清概念的基礎上,還需要明確人工智能寫作的研究對象;開闊研究視野,警惕僅僅研究某種人工智能寫作范式的傾向;同時注意研究過程中跨學科方法的運用,避免從單一的人文或科學角度開展研究。
(一)明確研究對象:厘清人工智能寫作研究的邊界
一直以來,人工智能寫作都沒有一個明確統一的概念,相關研究的邊界不甚清晰。在以往研究中,人工智能寫作或被理解為一種技術,或被當作一種寫作現象。如若將其看成一種技術,那么,只有計算機以語言模型生成的自然語言文本才屬于人工智能寫作,與此相關的事物皆為人工智能寫作研究的對象。基于此原則,需要指出以下兩點注意事項:第一,不應將所有自稱為人工智能寫作的軟件或平臺都納入研究范圍。由于人工智能已成為時尚的標志性用詞,市面上一些偽原創軟件也想搭乘人工智能的快車獲取商業利益,但這些軟件只能對寫作素材進行同義替換或順序調整,并不符合人工智能寫作的定義,不能作為人工智能寫作研究的對象。第二,一些符合人工智能寫作概念但并未以此命名的機器寫作現象應當納入研究。例如生成式聊天機器人經常被學者忽略,但它的工作原理其實與人工智能寫作的原理相同。聊天機器人有兩種類別,一種是檢索式,一種是生成式。檢索式聊天機器人有明確的問答數據庫,使用語句匹配的形式查找答案,并不涉及文本生成;而生成式聊天機器人是在大量的語料訓練基礎之上,利用語言模型生成回答文本的,故也應該納入人工智能寫作研究的范圍。
倘若將人工智能寫作視為一種寫作現象,那么,應該明確寫作研究本身的范圍,而不能隨意擴大或縮小。寫作基礎理論中的寫作主體、客體、受體和載體,都是可研究的對象;文體寫作中的審美性文體、析理性文體及應用性文體也都屬于可研究的領域,包括人工智能詩歌、人工智能小說等等。在機器新聞寫作的文體研究中,部分學者默認機器新聞寫作包含了寫作本身以外的新聞分發及傳播等環節,這就擴大了研究對象的范圍。在文學寫作研究當中,有些學者又縮小了研究對象的范圍,將人工智能寫作僅僅定義為一種文學生產,但事實上,人工智能寫作不僅包括文學寫作,還涵蓋了非文學寫作。
(二)開闊研究視野:以全面的眼光看待人工智能寫作
當下,大語言模型在人工智能寫作中取得了顯著成績,但不能僅將研究視野局限于此,而應認識到技術是不斷演進的,未來的“鐘擺”也許還要回歸至理性主義,1理性主義范式下的文本同樣具有重要研究價值。
一方面,對比基于理性主義和經驗主義方法生成的文本,可以深入揭示人工智能在特定文體寫作中的發展趨勢和獨特屬性。例如在新聞文體寫作領域,隨著技術方法的轉變,機器新聞寫作的發展并未日趨向上,而是面臨著趨冷的狀況。理性主義方法指導下的新聞寫作,往往可以以秒級的速度生成新聞,文稿質量雖然一般,但符合新聞的基本原則;而經驗主義方法下生成的新聞如若未經人工審核,十分容易違反新聞寫作的原則。2023年由ChatGPT生成的一則杭州限號假新聞在網絡上廣泛傳播,引起了較大反響,該新聞的結構與內容并無明顯錯誤,卻違背了新聞的真實性原則,因此在ChatGPT被各個行業爭相使用之時,新聞行業并未表現出過多的熱情。因此,未來是否應使用理性主義與經驗主義結合的方法來生成新聞以及假新聞傳播所造成的系列衍生問題,特別是安全治理問題都可成為學界討論的重點問題。
另一方面,將基于理性主義與經驗主義方法生成的文本進行文體間的分析,有助于進一步深入理解各種文體的特點及其與人工智能的獨特關系。例如,ChatGPT一經出現,學術教育領域便面臨著巨大的沖擊和變革,一些學生使用其完成學術論文寫作,這說明基于經驗主義的人工智能在學術論文寫作領域取得了較好成績。對比來看,學術論文與新聞兩種文體在人工智能寫作的應用發展過程中呈現出了不同的效果,而兩者的差異具體體現在哪些方面,為什么會存在這些差異等也是未來人工智能寫作研究者需要關注的問題。
(三)更新研究方法:促進技術和人文的對話與合作
人工智能寫作是科技與人文的結合。學界對人工智能寫作的研究,不僅應立足于科學原理探討和技術層面分析,而且還要重視人文學科的基礎理論,通過人文學科的視角審視人工智能寫作的技術挑戰,為科技進步提供富有啟發性的建議,實現人文研究對技術的反哺。
首先,從技術角度考察人工智能寫作的基本原理,研究者能更清晰地理解人工智能寫作的底層邏輯。學界對人工智能寫作的研究,存在一些人類中心主義[19](p8-14)的預設立場,對從技術視角提出的相關問題重視不夠。例如,在探究人工智能寫作原理時,學界偏重以人類寫作的特點和水平為評價標準,一定程度上忽視了人工智能寫作內蘊的創新意義。再如,關于人工智能寫作主體的研究,部分學者引入“作者之死”等文學理論觀照當前的人工智能寫作。然而,先前的理論討論的是寫作主體與作品、讀者的關系,而人工智能寫作主體首要關注的卻是一種寫作主體與另一種寫作主體間的關系。如果從技術角度出發,可以把人工智能寫作的主體問題轉換為人機交互的技術考察。
其次,人工智能寫作是人類寫作的鏡像,人文研究者同樣可以從文學藝術角度對技術的開發和改善提出合理建議。例如趙汀陽在研究大語言模型時,大膽假設如果有一種“動詞邏輯”可被用來分析事件和問題的生成關系與客觀結構,就能夠與分析真值關系的“名詞邏輯”(即現代形式邏輯)形成配合,從而幫助我們更為充分地理解意識和語言,理解語言何以成為自身的自我解釋系統。如果人工智能學會了動詞邏輯,或許就能夠發展出自我意識從而成為真正的主體。[20](p41-45)未來,如果人文研究者能從語言學和寫作學的角度提出更多設想,也許會反向促進人工智能寫作技術的發展,在真正意義上實現科技與人文的結合。
四、結語
人工智能已開啟自動寫作的時代,由此引發的劃時代革命將寫作理論提升到了全新高度,傳統以人類為中心的寫作研究范式已無法充分解釋由此引發的新寫作現象。面對人工智能寫作帶來的新問題,從技術原理出發對其展開全面剖析,進行明確的概念界定,便成為研究的首要任務。人工智能寫作經歷了從理性主義到經驗主義的范式轉變,寫作水平逐步提升,不少人工智能專家認為人工智能已經出現了智能“涌現”1能力。但實際上,當前以ChatGPT為代表的人工智能寫作本質上仍然是計算寫作,計算機是通過編程展現人類智能水平的,[21](p417-424)還未實現從制造到創造的飛躍。只有進入強人工智能時代,人工智能才會發生質的改變。屆時,“機器人成立作家協會”便會成為現實,當前的概念界定及系列研究也將同步更新。總之,科技同人文的跨學科融合研究已是大勢所趨,如何在研究中既充分考慮到技術的本質及發展方向,又保持人文學者的特質,是每一位人工智能寫作研究者都應思考的問題。只有在理論和實踐中不斷探索人類寫作的優勢,時刻保持居安思危的憂患意識,才能更好地應對人工智能時代寫作學面臨的挑戰。
參考文獻:
[1][英]斯諾.兩種文化[M].紀樹立,譯.北京:生活·讀書·新知三聯書店,1994.
[2]陳鄞.自然語言處理基本理論和方法[M].李生,主審.哈爾濱:哈爾濱工業大學出版社,2013.
[3]周新英.“計算機普及要從娃娃做起”——記上海市中小學生電子計算機教育[J].人民教育,1985,(1).
[4]耿弘明.AI時代藝術概念的產生方式及其反思[J].藝術學研究,2022,(2).
[5]張強,王超.人工智能時代的寫作主體性位移[J].當代作家評論,2020,(5).
[6]劉欣.人工智能寫作“主體性”的再思考[J].中州學刊,2019,(10).
[7]畢日生,宋時磊.人工智能文學寫作“作者”問題之思[J].寫作,2020,(3).
[8]周建瓊.人工智能寫作背景下作者主體性的消解與重構——以陳楸帆人機交互寫作實驗為中心[J].當代文壇,2021,(4).
[9][美]皮埃羅·斯加魯菲.智能的本質:人工智能與機器人領域的64個大問題[M].任莉,張建宇,譯.北京:人民郵電出版社,2017.
[10]馮志偉,丁曉梅.計算語言學中的語言模型[J].外語電化教學,2021,(6).
[11]Strachey C.The“Thinking”Machine[J].Encounter,1954,3(4).
[12]Murgia M.Sci-fi Writer Ted Chiang: ‘The Machines We Have Now Are Not Conscious’ [EB/OL].https://www.ft.com/content/c1f6d948-3dde-405f-924c-09cc0 dcf8c84,2023-06-02/2023-08-10.
[13]陶鋒,劉嘉敏.文心與機芯:中國古代文論視閾下的人工智能文學[J].文藝爭鳴,2020(7).
[14]張壽萱,徐建毅,張建生.中文信息的計算機處理[M].北京:宇航出版社,1984.
[15](唐)李白.李太白全集(下)[M].(清)王琦,注.北京:中華書局,2011.
[16](明)郝敬.毛詩原解 毛詩序說(上冊)[M].向輝,點校.北京:中華書局,2021.
[17]楊丹丹.人工智能寫作的“鏡像”與“正名”[J].廣州文藝,2019,(9).
[18]宋睿華.好玩的文本生成[EB/OL]. https://www.sohu.com/a/123411822_472869,2017-01-04/2023-08-17.
[19]余謀昌.走出人類中心主義[J].自然辯證法研究,1994,(7).
[20]趙汀陽.替人工智能著想[J].哲學動態,2023,(7).
[21]Searle J R.Minds,Brains,and Programs[J].Behavioral and Brain Sciences,1980,3(3).
責任編輯" "孔德智
11988年計算語言學會上,國際商用機器公司(IBM)的Thomas J. Watson研究中心機器翻譯小組發表了關于統計機器翻譯(Statistical Machine Translation, SMT,一種機器翻譯方法)的論文,并推出法語/英語的翻譯系統Candide,標志著大數據時代統計學派的興起。參見顧駿、郭毅可編:《人與機器:思想人工智能》,上海大學出版社2018年版,第124頁。
2統計機器翻譯被借用到人工智能寫作實踐中,微軟亞洲研究院將其用于對聯的自動寫作,可以在開放條件下生成較高質量的對聯,在當時取得了頗為震撼的效果。參見孫茂松:《詩歌自動寫作芻議》,載《數字人文》2020年第1期。
3參見劉慈欣新浪博客博文《電子詩人》,https://blog.sina.com.cn/s/blog_540d5e8001000329.html。
1參見袁明光:《語文建設的新課題——電腦寫作》,載《語文建設》1992年第1期;閆俊清主編:《現代科技寫作簡明教程》,天津科學技術出版社1995年版。
2更多關于國內新聞寫作機器人的信息參見楊逸云:《人工智能寫作的應用現狀與問題》,載《寫作》2021年第1期。
1“中文屋”是美國哲學家約翰·塞爾(John Searle)提出的思想實驗。塞爾假設一個人位于房間中,這個房間只有一個出口和一個紙片槽。房間內的人不懂中文,但是他可以使用一本中文翻譯書以及一些規則,根據接收到的中文問題編寫中文答案并將其放在紙片槽中。雖然他不理解中文,但是通過翻譯書和規則,卻可以回答中文問題,從而給人以他理解中文的印象。塞爾通過這個思想實驗來說明,雖然計算機可以執行各種復雜的計算任務,但它們就像中文屋的人一樣,并沒有真正理解所處理的信息。見[美]約翰·塞爾:《心、腦與科學》,楊音萊譯,上海譯文出版社2006年版,第23—24頁。
2筆者認為,計算機是人工智能寫作的顯性作者,人則是計算機背后的隱性作者。
1對統計語言模型更具體的描述可參見馮志偉、丁曉梅:《計算語言學中的語言模型》,載《外語電化教學》2021年第6期。
2維度災難指的是隨著數據特征(維度)數量的增加,數據點在高維空間中的分布變得稀疏,導致機器學習模型的性能下降和計算資源需求呈指數級增長的現象。
32003年,約書亞·本吉奧(Yoshua Bengio)等人的文章“ANeural Probabilistic Language Model”(《一種神經概率語言模型》)提出了神經網絡語言模型,該文通常被認為是深度學習在自然語言處理中應用的開始。深度學習能夠對數據進行精準建模,提高了語言生成精度,基本淘汰了基于統計的語言模型。
1以李偉民為代表的部分學者認為人工智能生成的內容能構成作品,以王遷為代表的部分學者則持相反意見。參見李偉民:《人工智能詩集的版權歸屬研究》,載《電子知識產權》2019年第1期;王遷:《論人工智能生成的內容在著作權法中的定性》,載《法律科學(西北政法大學學報)》2017年第5期;王遷:《再論人工智能生成的內容在著作權法中的定性》,載《政法論壇》2023年第4期。
1自然語言處理專家丘吉認為,經驗主義和理性主義應該像鐘擺一樣,每隔二十多年來回振蕩一次。參見Church K. A Pendulum Swung Too Far. Linguistic Issues in Language Technology, 2011,6(5).
1人工智能的“涌現”指人工智能出現的出乎意料的新行為和功能,這些行為可能與初始訓練目標無關,是隱式歸納而不是顯式構造的。參見Bommasani R, Hudson D A, Adeli E, et al. On the Opportunities and Risks of Foundation Models. arXiv 2108.07258 [Preprint] April 8, 2024 [cited 2021Aug 16]. Available from:https://doi.org/10.48550/arXiv.2108.07258.