一、記憶與邂逅:項楚先生其人其學
我第一次見項楚先生是在1993年8月底。那時,我剛好結束了第一次在上海復旦大學的留學生活,回到本已有一段時間,但仍希望能繼續在中國開展研究活動。于是,我與前輩三浦理一郎先生一同走訪了中國各地。我們作為代表,代替受邀出席由夏傳才先生主辦的“首屆《詩經》國際學術研討會”的東洋大學教授新田幸治先生,一起前往石家莊。之后又經過北京,前往成都的四川大學。當時,明海大學的游佐升先生正好也在成都,我們借助這層關系,有幸拜訪了項楚先生。
說到項楚先生,我在赴中國留學之前,就已經通過《敦煌文學研究論叢》以及《敦煌變文選注》等著作知曉他的名字。在我完成本科畢業論文《地獄變文》的研究之后,偶然在《敦煌文學研究論叢》中讀到了項楚先生關于“地獄變文”的論文,驚訝于他的研究興趣與我如此接近,因此一直希望有朝一日能親自拜訪這位學者。在1993年前后,我們曾邀請當時在駒澤大學留學的湛如先生到東洋大學東方學研究所進行演講,當時他也曾提及項楚先生,將其與陳允吉先生、孫昌武先生并列為中國佛教與文學研究領域的一流學者。因此,在游佐先生滯留四川期間,我們東洋大學“金岡一門”的五位師生決定一同拜訪項楚先生。這五人除我、三浦先生、游佐先生外,還有游佐教授的夫人彌生女士,以及東方學研究所研究員柿市里子女士。值得一提的是,彌生夫人也是“金岡一門”的一員。
面對我們五位外國人突然登門拜訪,項楚先生以自然、溫和的態度接待了我們,這使得我們的內心感到非常溫暖。據說他當時剛從美國歸國,途中還順道訪問了日本。我曾聽說他通讀佛教經典,對學術要求極其嚴格,原以為是一位極為嚴厲的學者,但出乎意料的是,他為人極其溫和,臉上總帶著發自內心的笑容,給我留下了極其深刻的印象。確實,在拜讀項楚先生的研究成果時,我深切感受到他在嚴謹的調查與文獻引用之外,在關鍵之處亦展現出極具平衡感的審美與學術趣味,甚至可以說是一種帶有“游戲精神”的學問樂趣。在那次拜訪之后,我才開始逐漸意識到這些特質的存在。之后,當我得知他創立了四川大學“中國俗文化研究所”時,更加深了這種印象。“俗文化”這一名稱本身就體現出他不僅關注嚴肅的學術研究,同時也試圖深人探討作為“人”的另一面——或者說,更為本質的日常性與內在性。我由此更加感受到,他是一個具有高度平衡感的人,其人格魅力亦由此可見。
此后,我在中國的學術會議上多次與項楚先生重逢,也逐漸與他建立了親密的關系。每次想起他總是與夫人一同,以溫和的笑容示人的模樣,心中便涌上一股溫暖之情。我記得在某次學術會議的外出參訪活動中,中午休息時,大家偶然看到休息室里有一張麻將桌,于是他與夫人及幾位同齡的與會者便馬上興致勃勃地開始打起麻將來。許多在場的研究者都很驚訝,原來項楚先生也會打麻將,而我卻反而覺得:“這才是項楚先生啊!”
二、詩與“游”的探尋:杜甫、李白與生成式AI
話說至此,在回憶項楚先生的同時,我也該逐步進入正題了。本文既是為了紀念項楚先生,也回應了《杜甫研究學刊》方面的約稿。我作為一名從事敦煌學、唐代文學與唐代文化研究的學者,在思考該談何種主題時,決定聚焦于唐代詩人的游興與娛樂。所謂“游玩”,形式多樣,但若從日常娛樂、日常樂趣的角度來看,我個人希望以“酒”作為切入點,展開一番探討。
另外,若只是單純地談“杜甫與酒”或“李白與酒”,作為一種“游玩”便顯得乏味無趣,更容易流于俗套,缺乏新意。因此,作為一位現代研究者,我希望在“游”中再添加一層嘗試——那就是引人近年來廣受關注、在坊間流行的“生成式人工智能”(GenerativeAI)作為本次實驗的一部分。生成式AI一經問世,人文學界的研究者便多持負面看法,例如“學生會讓AI代寫報告”“學生將不再努力學習外語”等觀點。在大學內部,也不乏將使用AI視為“惡”的聲音。然而,另一方面也有不少聲音指出,“如今企業普遍使用生成AI”“不會操作AI就找不到工作”等。也就是說,原本被視為高等教育“敵人”的工具,竟成了社會的現實需求,這無疑是一個值得深思的矛盾現象。從社會現狀來看,這種局面無疑對大學教師,尤其是人文學研究者而言,是一種不利的趨勢。那么,為何會出現這種狀況呢?原因或許在于,生成AI尚未成為人文學研究者在學術研究中“不可或缺”的工具。但回顧過去,我們曾經習慣以手寫方式撰寫論文(在日本的文學系,畢業論文必須用鋼筆寫在稿紙上提交),也主要依靠紙質資料進行研究。到了90年代中期,計算機迅速普及,人文學者也逐漸習慣了這一工具,甚至開始視使用電子書籍為理所當然。而這一轉變,所用時間不過十年左右。因此,我認為,如今的生成AI將來也很可能像當年的計算機那樣,成為研究者日常工具的一部分。我相信,許多人也會與我有相似的看法。然而,目前的問題在于,我們在人文學研究中該如何具體運用生成AI,尚未有太多深入的討論。我本人也正處于探索階段,思考如何將其作為研究工具加以活用。說實話,目前為止,我自己還未能找到特別有效的用法。順便一提,現在大家讀到的這篇約六七千字左右的文章,表格之外的文字部分并非手寫而成,也并非通過鍵盤敲打出來,而是完全借助語音輸人完成的。這也可以說是當代技術進步帶來的又一項“新玩具”,一種具有革命性的創新。
關于生成式AI如何能夠應用于中國文學、唐代文學研究,我其實一直在思考這個問題。我也曾直接向生成AI請教過這一點,但在“提出全新構想”這一方面,AI似乎還難以超越人類的腦力,目前尚未提供真正令人驚艷的創意。這也并不奇怪,畢竟現階段的生成AI,其功能仍主要是搜集網絡上的既有信息,再將其整理呈現,而不是創造出人類從未思考過的觀點。因此,在這樣的前提下,我想借此機會介紹我所構思出的一個想法,并由此正式進入本文的主題探討。
三、使詩人語言“可視化”:文本挖掘的嘗試
我最初所想到的一種較為簡單的思路,是基于現有的文本數據,運用所謂“文本挖掘”(textmining)的方法,從而以機械化手段探究作者的意圖與寫作傾向。這種方法在歐美以及日本的新聞界早已被廣泛采用,比如將某國領導人的講話或官方聲明按時間順序轉化為文本,通過分析特定時期詞匯的使用傾向,來推測該國的政策動向及其未來走向。由于該方法如今已能處理海量文獻資料,因此不僅適用于語言學研究,也被廣泛應用于近現代文學作品的風格分析,甚至利用海量學術論文來探測學術研究的趨勢。就我的看法而言,這一方法完全可以運用于對漢詩的分析。
基于上述思路,我制作了下方的“表一”。該表羅列了唐代詩人在詩作中偏好使用的漢字,僅憑這一點,便可在一定程度上揭示出各位詩人的用字特點。接下來,我將簡要說明制作這張表的過程。
首先,需要做的是收集文本數據。目前,網絡上公開了各種各樣的文本數據。嚴格來說,這些數據在沒有經過文本校勘之前,尚不能作為嚴肅研究的資料來使用。然而,在本次嘗試中,由于實驗性質強且時間有限,盡管本人對此略感遺憾,仍選用了公開在“維基文庫”上的資料,所使用的文本為《全唐詩》。在進行文本挖掘時,文本量越大,所得數據就越客觀。因此,這里僅選取《全唐詩》中至少留下三卷作品的詩人,且以中唐以前的詩人為對象。若用于正式研究,可根據需要選定具體的研究對象。將收集到的文本輸入到如KH-coder之類的文本挖掘軟件中,即可進行數據分析。但KH-coder在默認設置下無法僅提取單字,常將兩個或多個字組合為一個詞來識別(盡管可能有對應的設置可以調整)。因此,我首先借助生成式AI對文本進行了預處理。處理方法是在提示詞中指示AI在每個漢字后加上句號“。”,以將其隔開。如此一來,就不會將兩個字誤識為一個詞語。將這樣處理過的文本輸人到KH-coder中后,就可以對所用漢字種類進行統計。將該處理過程應用于每一位詩人后,便可得到一份包含各詩人用字頻率的Ex-cel表。隨后,再將各自獨立的Excel文件進行整理,按使用頻率排序,最終匯總為一個總表。至于具體的表格處理方式,我是向生成AI提問后得知的。根據生成AI所提供的步驟,我將所有的Excel數據一一輸人,最終生成了表一。僅通過羅列詩人偏好使用的字,也能一定程度上揭示出他們的創作傾向。這便是本次嘗試的第一項成果。表中左側列出的是詩中所用的漢字,右側數字則表示該字在各詩人詩作中的使用頻率排名。整體順序以杜甫為中心進行排列。從中可看出,在杜甫的詩中,“酒”字的出現頻率排名為第77位。乍一看似乎偏低,但從全表來看,“酒”字在唐詩中的使用頻率并不算高,進入前50名的只有李白和白居易兩位。此外,還可以看出杜甫詩作中“老”字的使用頻率排名第18位,尤為突出,這也成為其詩風的一大特點。
接下來進行的工作,是在前述分析所得的傾向基礎上,進一步聚焦于特定漢字。例如,以“酒”字為例,我們可以從詩集中篩選出所有包含“酒”字的詩篇,并分析這些詩中還出現了哪些其他字詞。通過這種方式,我們便可進一步探究“酒”在該詩人作品中的意義與象征。順帶一提,只需向生成式AI發出指令,便可快速匯總出所有含有“酒”字的詩篇。當然,也可以利用傳統計算機的搜索功能,對結果進行核對與確認,以確保其準確性。
就這樣,我從杜甫描寫“酒”的詩中提取了相關詞匯,整理成了“表二”。這些詞匯按詞性分類,這是KH-coder軟件所具備的功能之一。本表中也包含了兩個字以上的詞組。每個詞語旁邊的數字表示該詞在詩中出現的次數。
在這些與“酒”相關的詩作中,可以看到如“成都”“蜀”這樣的地名,也能發現如“草堂”這樣的常見名詞,這對于《杜甫研究學刊》而言可能是有價值的信息。不過更引人注意的是,“晚”字作為名詞或形容詞共出現了21次,“老”字則有13次之多。這一用字趨勢正體現了杜甫詩風的特點。正如前文所述,“老”字在杜甫全詩中使用頻率也顯著高于其他詩人,而即便是在描寫飲酒的詩中,這種傾向依舊保持不變。
隨后,我又嘗試分析了李白詩中描寫“酒”的作品,并整理成“表三”。巧合的是,李白與杜甫在“酒”字的使用次數上均為61次,這使得兩者之間的比較更具可比性。通過比較不難發現,正如前表所示,李白詩中“月”字的使用頻率極高,而在這些描寫酒的詩中,“月”與“明月”合計出現的次數高達46次,依然居于高位。
至于接下來的分析部分,正是其中最有趣之處,不過我想將其留給各位讀者自行體會。通過對這些表格的瀏覽、聯想與思考,從中把握其用詞與風格的傾向,再重新回到詩作本身進行賞析,也許會是一種別有風味的樂趣。
四、技術與人文學的交匯點:AI應用的未來展望
綜上所述,本文嘗試利用被譽為“人類新工具”的生成式人工智能技術,探討像我們這樣的人文學者可以如何加以活用。作為從事人文學研究的人,我們肩負著理解人類活動、滋養人類精神的責任。本文所提出的構想,也正是我作為一位研究者在這一背景下的一個實踐嘗試。如文中多次所述,本稿并非旨在確立某種研究定論,而是一種以創意為導向的探索,也希望為學習與欣賞唐詩者提供一種新穎的視角。當然,本文所使用的數據尚未經過嚴格的文本校勘,若要將其提升為可靠的研究資料,仍需進一步的分析與驗證。但就欣賞唐詩的角度而言,我相信這已是一份頗具參考價值的素材。采用這種方法,甚至還可以分析某位詩人隨年齡增長而在詩作中產生的變化,或者聚焦某一主題,對不同詩人間的完成度進行比較等。雖然筆者在正文中并未詳細論述,但出于個人興趣,曾嘗試將杜甫描寫飲食的詩作按年代進行分類,結果顯示出某種程度上的風格差異,頗為引人人勝。本文原為紀念項楚先生而寫,但愿這種新興技術所帶來的研究方法,能讓人們重新思考人文學科的樂趣、其作為精神滋養之源的重要性,這些方法蘊含了未來研究的無限可能。
責任編輯 賈兵
Professor Xiang Chu,Tang Poetry, and Generative Artificial Intelligence: Remembrance and Experimental Analysis,an Attempt to Connect the Past and Futureof Literature
ARAMI HIROSHI
Abstract:This paper honors the late scholar Professor Xiang Chu and,inspired by his scholarlyspirit,explores the themes of“travel”and“wine”in Tang poetry.It further experimentswithgenerative artificial intelligence(Generative AI)asa researchtool. Through text-mining methods,the author conducts statistical analyses of“wine”poems by DuFu and Li Bai in the Complete Tang Poems,illustrating eachpoet’slexical preferencesand stylisticdifferences,and exploresthepotential applicationsofAI technology in humanities research.This paper serves both as a tribute to Professor Xiang Chu’sacademic legacy and as an initial experiment in merging modern technology with traditional literature,oering new perspectives and methods for future studies of classical Chinese literature.
Key Words: Generative AI; Tang poetry text mining;“wine” poems by Du Fu and Li Bai