陶建明
(武漢文理學院,湖北武漢 430345)
《雪國》作為亞洲首位諾貝爾文學獎獲得者川端康成的代表作品之一,極具美學與藝術價值,深受國內外學者的研究和關注。該作品主要以主人公島村兩次前往雪國為主線,講述了其與駒子和葉子之間的故事以及在雪國的所見所聞[1]。作品中的故事脈絡以島村前往雪國火車中巧遇葉子為開端,又以島村目睹雪國火災中死亡的葉子為結尾,構思新穎,跌宕起伏之間,無形中將讀者帶入作品的高潮。然而整部作品中,關于葉子的文字介紹,相比較島村和駒子的詳細描述,整篇文檔并未投入大量筆墨,因此作者關于葉子這一人物形象的設定一直充滿著神秘的色彩,值得廣大學者的關注以及進一步開展相關的數據挖掘和深入研究,揭開存在于這部作品中的層層面紗。
在關于《雪國》文學作品的先行研究中,歷來多采用近讀以及主觀分析等方法,對文學作品中的人物形象特征、物哀思想以及文學作品展現的悲與美等方面進行綜合分析,然而對作品中主線脈絡細節方面深挖不足,并缺乏相關數據支撐。尤其在對文章中筆墨投入相對較少的葉子這一典型代表人物的系列研究,如葉子之死必然性,葉子死亡與火災的關系等細節方面仍需深入分析研究。基于數字人文視角,該文結合KH Coder 分析軟件,對《雪國》文本進行數據挖掘,利用文字編碼功能,以折線圖的形式,宏觀把握文章主線脈絡的發展走勢,將圖形中的相關數據與對應文本內容相結合,對葉子之死的偶然性和必然性,葉子死亡與火災關系等方面進行客觀詳細的實證分析。
首先,將日語原版《雪國》文學作品文本,以txt形式進行保存。然后,利用HTML 方式,參照文本中島村兩次前往雪國的主線脈絡,將整篇文本文檔劃分為上下兩部分,上部分進一步細分為01~04,四大章節,下部分進一步細分為01~05,五大章節。最后,分別以
啟動KH Coder 軟件,將處理好的文本文檔添加導入至KH Coder 之中,測試運行環境以及進行詞頻詞匯的相關數據分析。如圖1所示,在導出的文本前150 個高頻詞匯列表中,可以清晰發現 “葉子”和“火”作為文章中高頻出現的名詞,分別位于詞頻列表中的第16 位和36 位,上下兩部分中共計出現頻次依次為81 次、41 次,這一系列數據,再次印證了該文研究內容的可行性和必要性。
“葉子”作為文章中重復出現的3 個主要人物形象之一,在詞頻統計列表中,自然會出現在次數靠前的高頻詞匯行列。而“火”在文章中共計出現41 次,作為高頻詞匯,到底為何且以怎樣的形式分布在整篇文章主線脈絡中? 另外“火”在整篇文檔中出現的頻次如此之高,是否能夠證明最終的“火災”設定,作者其實在前文中早有暗示,葉子死于火災是必然結果并非偶然意外所致? 針對以上問題假設,單憑圖1難以得出確切結論,因此針對相關文本內容以及文章主線脈絡,仍然需要持續進行深入挖掘。

圖1 《雪國》文本高頻詞匯統計效果圖
為驗證以上假設,進一步探究相關因素在文本主題脈絡中的分布狀況,導出更加詳細的分析數據,利用KH Coder 中的編碼功能,將提前準備好的關于“人の死”“火”“病 ”三大因素的編碼文件作為參照文件,編碼單元設定為字句,單元格內容以頻率和百分比的形式進行交叉匯總分析,效果圖如圖2所示。
根據圖2可明顯看出,文本主題脈絡發展中的“人の死”“火”“病 ”三大因素,在文章各個部分章節的具體排列分布。左邊熱力分布圖,可以直接觀察到三大因素在各個部分章節中的分布數據大小,右邊折線圖則進一步從宏觀角度,將三大因素在文章整體層面以及細節發展趨勢上進行綜合把控。針對前文提出的假設,通過圖2折線圖中的第一個線條,可清晰判斷出前文中的高頻詞匯“火”覆蓋出現在整篇文檔中。除了在文本結尾,即下半部分的第四章節頻繁出現,在文本上半部分中的第一章、第三章、第四章、第五章出現頻率都很高。

圖2 《雪國》文本主題脈絡交叉分析效果圖
2.3.1 葉子與火的關系
結合KH Coder 文本查找功能,可明顯發現詞匯“火”高頻出現在文末部分,是由于葉子死于火災的情節設定中,有大量關于“火”的相關描寫。結合文本查找功能,文本上半部分的第一章中,“火”的高頻出現,均與對葉子的描寫有關。如《雪國》原文漢譯文中的下列描述,“特別是姑娘的臉龐映襯著山野里的燈火時,那種描繪不出的美,使島村不由得怦然心動”“此時姑娘的臉上有燈火閃爍”“燈火就這樣從她的臉上閃過,但并沒有把她的臉照亮”“當她的眼睛與燈火重疊的那一刻,宛若在夕陽的余暉里飛舞的夜光蟲,妖艷而美麗”等文本內容,可以發現作者在文本開端對葉子描寫的字里行間中,早已將“火”字圍繞在葉子周圍,與其形影不離。而在第三、第四、第五章的文本內容中,同樣出現了相關內容,如“雖然是從病人房間里拿來的,但據說火是干凈的”“島村的眼里一直閃耀著葉子的那雙眼睛,宛如遠去的燈火,冷凄凄的”“山野的燈火從她臉上一一掠過,燈火融進了她的眼睛,亮閃閃的,美的無法形容,島村的心也被牽動了。”
基于以上文本內容細讀分析,可明顯發現葉子與火的聯系十分緊密,作者將“火”字時刻圍繞在葉子周圍,讓彼此形影不離。作者在文本內容中早有多處暗示設定,有葉子的地方,定然有火的出現。從島村的視角來看,葉子宛如火的化身,作者讓其多次出現在文本內容中,使寒冷漆黑的雪國多了一絲暖意,而這種暖意美好卻不會持久,如同冬夜的火光一般短暫凄涼[2]。
2.3.2 葉子之死且死于火災的必然性
根據圖2信息,可明顯看出除了“火”貫穿于文本主題脈絡外,“人の死”“病”作為文本主題脈絡的兩大因素同樣如此,從開端到結尾,使得整個文本籠罩在一種凄涼、悲傷的氛圍中。同時也為葉子凄慘結局的必然性提供了一層有力的證據。然而這只是從宏觀角度進行的初步斷定,仍然不足以說明葉子之死的必然性,文本相關細節仍需進一步挖掘分析。基于上文對高頻詞匯“火”的分析,采用KH Coder 相關詞匯搜索功能,匯總單元設置為H2,將“死ぬ”輸入搜索欄,在此條件下,對文本中與“死ぬ”有關的名詞進行統計和中心性網絡可視化分析,結果如圖3所示。
由圖3可見,在與“死ぬ”相關的詞匯中,火和葉子分別位列第一位和第三位,而在中心性網絡可視化效果圖中,葉子、火、死亡三者緊密排列在核心區域,中心媒介值極高,這一發現為葉子之死且死于火災的必然性進一步提供了參考依據。

圖3 《雪國》文本中死亡相關詞匯統計分析效果圖
基于以上內容發現,重新審視文本細節,相關結論可以得到進一步佐證。如文本上半部分的第一章中,當島村和葉子初次見面時,就對葉子的聲音有如下描述,“她的話音既柔美動聽,又有些悲凄,在這寒冷而又寂靜的雪夜中,久久回蕩著”,文本上部第三、第四、第五章中,島村再次和葉子見面時,同樣有類似描述,“這聲音是如此優美,如此清澈,透著一種悲凄之感,像是從什么地方傳來的一種回響”“這時傳來了那位葉子低沉,清澈而優美的喊聲”“葉子近乎悲戚的優美的聲音,仿佛是某座雪山的回音,至今依然縈繞在島村耳邊,揮之不去”。文本下部前三中,均有類似細節描述,第一章中“葉子一邊打紅豆,一邊哼著歌,歌聲純凈透徹,近乎悲戚,仿佛立即就能引起回聲似的”,第二章中出現了更加直接的暗示,在葉子受駒子請求,第一次遞送紙條后,駒子在醉酒的狀態下和島村的對話中,無意間出現了針對葉子的描寫內容“だれか”“殺されちゃいますよ”(誰呢?要燒死人的。)“葉子那副過分認真的樣子,看著像是總處在一種異常事態之中。”第三章中“這笑聲清越得近乎凄慘,聽起來不像呆癡的樣子”“葉子像要扔掉那只捏死的飛蛾似的打開了窗戶”[3]。
由以上大量文本內容數據分析可見,整篇文本以島村視角對葉子進行描述中,不管聲音還是狀態,總是呈現一種悲慘、凄涼的狀態[4]。甚至在文本下半部分的相關內容,根據駒子和島村的描述,更是直接出現了與“死亡”相關的苗頭和預示。在這種悲慘凄涼的氛圍烘托下,結局中葉子之死具有必然性[5]。而結合上文中的文本內容,以及相關數據可視化分析,作為火之化身的葉子,其死亡的原因必然和火有密切關系,綜上,葉子之死且死于火災并非偶然,是必然的結果。
該文基于數字人文視角,采用KH Coder 文本分析軟件,對川端康成文學作品《雪國》文本中,歷來研究關注度相對較低的葉子這一形象及相關系列內容進行了文本數據挖掘和可視化分析。通過對高頻詞匯“葉子”和“火”的文本數字頻度統計,確定研究主題的可行性和必要性。利用KH Coder 交叉分析功能,將文本進行編碼后,參照文本主題脈絡發展中的“人の死”“火”“病 ”三大因素,對整篇文檔進行交叉分析,以熱力度、折線圖的形式,從宏觀角度對文本內容以及相關細節進行綜合把控,再利用KH Coder 文本查找功能,結合各個部分章節的具體文本內容分析,可以得出葉子如同火的化身,其與火形影不離,作者在文本內容中早有多處暗示設定,有葉子的地方,定然有火的出現[6]。通過KH Coder 相關詞匯搜索功能,制作出與“死ぬ”相關的詞頻統計效果圖,根據圖形提供的參考數據,可見葉子、火、死亡三者緊密排列在核心區域,中心媒介值極高。結合細節文本內容,葉子死亡的結局,在前文中早有多處暗示,而綜合之前其與火的關系分析,可以得出葉子之死且死于火災并非偶然事件,是必然的結果。