陶建明
(武漢文理學院,湖北武漢 430345)
《雪國》是一部將日本的傳統美學與現代西方文學創作手法巧妙結合的經典文學作品。文本內容以島村兩次前往雪國為主線,描述了這位來自東京的已婚成年男子在雪國與兩位女性的感情羈絆,以及其在雪國的所見所聞。主線內容簡單,卻以生動細膩的人物形象刻畫、巧妙的故事情節構造,成為川端康成獲獎代表作品之一,具有極高的美學與藝術欣賞價值,深受海內外文學愛好研究者的追捧。因此國內外針對《雪國》文學作品的研究熱度極高,層出不窮,碩果累累。尤其是在《雪國》文學作品呈現出的悲與美方面,積淀了大量的先行研究成果,然而,歷來的先行研究,多傾向于主觀方面判斷,客觀實證研究較少。
近年來,數字人文研究方法在文學領域的廣泛應用與開展,為研究者采用新的手段方式解讀研究文學作品提供了可能性。該文結合研究發展新趨勢,基于數字人文視角,采用KH Coder 文本分析軟件,對標記后的整篇文本文檔進行了相關系列數據挖掘,并以數據圖的形式重新解讀《雪國》文本內容,把握文本內容發展主線。結合建立起的網絡效果分析圖,整合相關數據,進一步對《雪國》文本內容及高頻詞匯進行數字編碼分析,為開展文本內容呈現的悲與美的系列研究提供數據支撐,以期豐富發展先行研究中的實證研究成果[1]。
將《雪國》日語原版文本內容,輸入整理成txt 文檔形式進行保存。采用HTML 形式,對保存好的txt文檔,依次進行部分章節的歸納劃分。將文檔劃分成上下兩部分,以<H1>形式進行標記,上部分進一步細分為01~04,四大章節,下部分進一步細分為01~05,五大章節,以<H2>形式對上下兩部分中的各個章節進行區分標記,以便將處理好的文本文檔順利導入分析軟件KH Coder,方便其進行后續的操作使用以及相關數據的統計處理[2]。
該文是基于數字人文視角下,針對《雪國》文本中悲與美的數字化實證研究,因此,為結合對應文本內容的數據挖掘,需要提前做好編碼文檔的相關內容設定。即將文本主線脈絡中,高頻出現的“人の死”“病気”“美しい”作為悲與美的代表性因素,以各自形式,提前做好編碼內容設定,并單獨以txt 形式進行文本保存,方便后續編碼文檔的導入和相關數據的挖掘分析[3]。
將整理好的《雪國》文本文檔內容手動導入KH Coder 中,運用其文件預處理功能,自動進行對象文件的檢測。如果檢測過程中出現無法識別或者亂碼等現象提示,亦可采取自動處理方式進行修復。系統檢測無誤,即可執行預處理,處理結果會自動展示匯總單元即H1、H2、段落、字數的相關數據[4]。
利用KH Coder,對預前處理好的《雪國》文本進行數據挖掘與統計分析。首先,在不進行詞匯類別詳細區分的條件下,對文本內容中的高頻詞匯進行篩查統計。由KH Coder 自動導出的文本高頻詞匯Excel 表格中,可明顯統計出“島村”(位次1,頻率370)、“駒子”(位次2,頻率263 次)、“雪”(位次9,頻率106)、“葉子”(位次16,頻率81)等涉及文本內容主線發展的高頻詞匯及相關出現頻率數據。除此之外,還可清晰直觀看出形容詞“美しい”在整個文本中,共計出現頻次26 次,在前150 個高頻詞匯統計圖中位居第71 位。而在對“美しい”相關詞匯搜索統計中(見圖1),形容詞“悲しい”的Jaccard 值最高,位居第一位。為進一步驗證上述搜索數據,對“悲しい”的相關詞匯進行KWICK 索引統計,部分結果如圖1所示,很明顯可看出,在索引圖中“美しい”位于右2 位置上,共計出現4 次,分值居于索引圖首位[5]。
圖1 相關詞匯搜索效果部分圖
結合統計數據,亦可明顯發現,不管是針對“美しい”的相關詞匯搜索,還是對“悲しい”的相關詞匯進行KWICK 索引統計,雙方都在彼此統計數據的首要位置。因此,單從《雪國》文本內容中的高頻詞匯數據的初步統計方面,便可發現“悲”與“美”存在的影子,為該研究主題開展的必要性提供了一定的數據支撐,同時,也進一步推動了后續文本主題脈絡走向方面的數據挖掘及相關研究的開展[6]。
此外,通過對圖1的相關數據進一步分析比較,還可明顯發現,“葉子”“聲”等詞,同時存在于彼此關聯的詞匯表格中,且統計數據均位居前列。而在完整效果圖中,不管是“美しい”的相關詞匯搜索,還是對“悲しい”的相關詞匯進行KWICK 索引統計,亦可發現與之關聯的名詞中,除了典型人物及人物特征詞匯外,同時,還出現的有“木”“花”“山”“船”“雪”“蟲”等物象的詞匯。基于以上數據結果統計,文本內容中,除了以葉子為代表的主要人物形象設定外,文本類構造出的動植物等物象同樣也賦予了悲與美的系列特征[7]。
基于以上針對《雪國》文本中高頻詞匯初步分析結果,為進一步挖掘該研究主題在文本主線脈絡走向方面的相關數據,利用KH Coder 對文本內容進行編碼分析。將提前準備好的編碼文檔手動導入,制作出對應因素的熱力圖與曲線分布圖(見圖2)。
圖2 文本內容編碼分析效果圖
圖2更加直觀地展示了“悲”與“美”相關因素在《雪國》文本內容中的整體走向,以及具體章節分布情況。通過圖2左側的熱力分布圖可以看出,“美しい”貫穿于整個文本,除文本下-03 部分之外,在其他各個章節內容中均較廣分布,“人の死”“病気”這些悲傷因素的典型代表性詞度,同樣貫穿于整個文本中。且“人の死”在整個文本主題脈絡發展中,出現頻率波動較大,而“病気”則呈現出逐漸縮小的變化趨勢。再結合右側折線圖的分布情況,從整體上把握悲與美的發展趨勢。代表“悲しい”的紅色折線和代表“美しい”的藍色折線,交叉分布在整個文本內容中,兩者均在文本開端出現一個高峰值分布。而代表“悲しい” 的紅色折線在整個文本脈絡中波動性較大,代表“美しい”的藍色折線則整體呈現下降趨勢,且在文本下部分后一直低于紅色折線的數值。兩者在文本內容中的上-03,上-05,以及下-02 部分均出現交集,且在文本結尾處,再一次出現集體上升趨勢。
結合對應文本內容進行驗證分析,作者在文本開端,無論是對雪國環境的描述,還是以島村視角,在火車上對初次遇見陪伴照顧疾病纏身的葉子的相關系列描寫,均包含了“悲”與“美”的情節設定,由此可見,從一開始作者便賦予了文本內容悲與美的感情色彩基調,所以兩條曲線在文本開端便呈現了高峰值。文本上半部分,在對駒子以及雪國美麗環境刻畫的同時,伴隨文本內容發展需要,還有對相關物景以及人物際遇的悲慘刻畫,其中便包括駒子成為藝伎的無奈,純潔美麗的葉子悉心照顧行男,而行男卻最終難以避免死亡命運的安排。而下半部分當中,縱然行男去世,美麗的駒子不用再為醫藥費而奔波勞累,卻依舊難以擺脫殘酷的現實,繼續生活在燈紅酒綠之中,因此,整個文本內容交織著悲與美的客觀存在,兩條曲線也多次出現交集點。而葉子之死作為文本結尾設定,實際是在一個悲慘火災結局中,重新塑造了超脫現實、實現自由的美麗葉子形象,即文本結尾是悲與美的再次交織,所以兩條曲線再次呈現上升趨勢。
基于以上針對《雪國》 文本內容得出的數據分析,結合文本內容主題脈絡走向的相關圖例證明,《雪國》中的悲與美是廣泛存在的。從文本高頻詞匯統計數據,可以看出,其不僅存在于像對葉子這種典型的文本人物形象的細節刻畫中,而且還存在于如飛蛾、蟬、樹木、雪、村落等自然景物的描寫中。結合主題脈絡走向的相關圖例證明,亦可明顯發現,作者從一開始便奠定了悲與美的感情基調,且貫穿于整篇文本內容,雖未達到逐字逐段的地步,但是在各個章節中均廣泛呈現。在文本內容結尾,從島村視角出發,以葉子慘死于火災結局,塑造了美的永恒,首尾呼應,再次實現了悲與美的完美交織。
該文基于數字人文視角,采用文本分析軟件KH Coder,對《雪國》文本內容進行數據挖掘與相關分析。通過文本高頻詞匯的數據統計,發現形容詞“美しい”存在于整個文本前150 個高頻詞匯中,“悲しい”位居“美しい”的相關詞匯搜索表中的首位,相關數據進一步挖掘后,發現這兩個形容詞在文本內容中的互關性很高,且文本內容中具有悲與美的特征詞匯,除了對文本人物形象描述外,眾多物象的描寫同時兼具,也從一定程度上,側面反映了文本內容悲與美的客觀存在。該文基于以上數據挖掘,進一步對文本內容進行編碼分析,從宏觀角度把握文本主題脈絡走向,基于制作出的相關效果圖例,把握各個因素在文本章節中的分布情況,結合文本內容驗證后,直觀證明出悲與美貫穿于文本始終,作者在一開始便奠定了悲與美的感情基調,并在文章結尾處,再次實現了悲與美的完美交織。