王子炫
(廣西大學,廣西南寧 530004)
《追風箏的人》[1]是美籍阿富汗作家卡勒德·胡賽尼的第一部長篇小說,一經出版便廣受好評。該書是獲得法國《ELLE》讀者票選的年度最佳小說,卡勒德·胡塞尼也憑借這部作品獲得了2006年的聯合國人道主義獎。整本書以其深刻的主題思想和細膩的寫作手法吸引著不同民族、國家的讀者,令人印象深刻。“語料庫現在一般是指存放在計算機里的大量語言材料和定位檢索管理軟件的組合。”語料庫語言學自20 世紀60年代開始發展,迄今已有近60年的歷史。“文體是個人或集體在談話或寫作中運用語言的方式。”[2]“文體學源自古代亞里士多德的修辭論,是一門結合文學和語言學的交叉學科,是運用語言學的理論去闡釋文學內容和寫作風格的一門學科。”[3]文體學這一古老的學科同語料庫語言學相結合產生的語料庫文體學,“是近年來隨著語料庫語言學的發展新生的一個研究途徑,旨在借助語料庫工具,以實證的手段對各類文本的文體特征進行定量描寫和定性分析”[4]。基于語料庫的分析方法在文學文體學中的應用,為研究文學文本提供了一種新的視角和理論依據,有利于提高解讀文學作品的客觀性與準確度。該文將運用語料庫的研究方法,結合語言學理論和文學理論,對《追風箏的人》進行定量、定性分析,探討該小說在詞匯層面的文體特征。筆者將從數據統計與詞匯分布層面展開具體分析,并試圖解釋這些文體特征背后產生的原因。
該文將《追風箏的人》 英文原版作為自建語料庫,簡稱為“風箏語料庫”,其文本為純文本。該自建語料庫共有9 028 個類符和107 850 個形符。美國當代英語語料庫 (Corpus of Contemporary American English, COCA)是美國最新當代英語語料庫,也是當今世界上最大的英語平衡語料庫。該文將從COCA 小說語料庫中隨機抽取2001—2008年等量的純文學小說作為參照語料庫,其中文本均為純文本。該參照語料庫有11 583 個類符和123 206 個形符。以COCA 小說語料庫作為參照語料庫的合理性在于:該語料庫在文本類型、時間范圍和文本詞匯總數方面與風箏語料庫有著極大的相似性。
該文主要運用AntConc3.4.3 和WordSmith6 作為語料庫檢索工具,運用卡方檢驗作為檢驗工具,以協助探究《追風箏的人》在詞匯層面的文體特征。其中卡方檢驗是用途非常廣的一種假設檢驗方法,在該文中將用于檢測詞項在兩個語料庫中出現頻數的差異。顯著性水平(significance level)大于5%則說明無明顯差異,顯著性水平小于5%則說明有明顯差異。
該文將在數據統計方面比較兩個語料庫在詞匯密度、平均詞長和動詞名物化現象上的異同,在詞匯分布層面比較二者最高頻率詞和關鍵詞的差異。
首先,在數據統計方面,該文將運用Word-Smith6 軟件得出類符/形符比和標準化類符/形符比值,用以解說兩個語料庫中的詞匯密度與詞匯使用情況。WordSmith6 軟件還將用于分析平均詞長。此外該文將運用AntConc3.4.3 軟件分析兩個語料庫中的動詞名物化現象,分析-ment、-ness、-tion/-sion(包括其復數形式)3 種最常用的名詞后綴,并使用卡方檢驗檢測兩個語料庫中的動詞名物化現象是否具有顯著性差異。
其次,在詞匯分布層面,該文將運用AntConc 3.4.3 軟件中Word List 功能和Keyword List 功能,分析兩個語料庫前100 位最高頻率詞的異同以及《追風箏的人》中關鍵詞的特性。
2.1.1 詞匯密度
對詞匯的研究有助于我們了解文本的特定風格。在對詞匯密度展開分析前,有必要闡明形符和類符兩個概念。形符(token)是一個語言單位,它在文本中指詞元化之前的單詞總數。類符(type)指不重復計算的形符數。類符/形符比(type-token ration,TTR,即形次比)是衡量文本中詞匯密度的常用方法,它能反映出文本中詞匯的豐富程度。但貝克指出,“當所比較的文本長度不同時,類符/形符比值可能因為類符聚集的均勻程度不同而受到影響,所以在相關研究中一般使用更為可靠的標準化類符/形符比(standardized TTR)衡量語料庫文本的詞匯變化。”運用WordSmith6 軟件中的Word List 功能即可得出兩個語料庫的標準化類符/形符比,其結果如下。
就類符/形符比而言,風箏語料庫(8.37) 小于COCA 語料庫(9.40),在標準化類符/形符比中,風箏語料庫(44.93)大于COCA 語料庫(43.06)。由于兩個語料庫在文本長度上并非完全一致,因此該文采取標準化類符/形符比作為衡量標準。貝克指出,“類符/形符比值的高低與寫作者詞匯使用的豐富程度和多樣性成正比”[5]。因此,風箏語料庫的標準化類符/形符比高于COCA 語料庫,顯示出在相同文字數量的情況下,風箏語料庫的詞匯使用相對更加豐富多樣,詞匯密度相對較高。這一結果其實在預料之中。《追風箏的人》講述的是阿富汗兩個小男孩關于背叛與救贖的故事。小說故事情節,以及深受作者卡勒德·胡塞尼阿富汗文化背景影響的寫作風格,使這一部小說在語言使用上呈現出獨特的異域風情,故而在用詞方面也顯示出豐富多樣的特性。
2.1.2 平均詞長
詞長是詞匯分析的一個重要手段,也是影響文本可讀性的一個重要因素。平均詞長也是最為實用的一種衡量參數,它是類符的平均長度。WordSmith6中的Word List 功能將用于分析平均詞長,其結果顯示風箏語料庫中的平均詞長(4.16)只略短于COCA語料庫的平均詞長(4.17),兩個語料庫的平均詞長都在4~5 詞之間,二者沒有明顯差異。《追風箏的人》中平均詞長,一方面是受作者希望提高故事易讀性的影響[6]。《追風箏的人》是一部以背叛與救贖為主題的成長類型小說,小說側重對故事的敘述、情節的推動,為讀者清晰地呈現主人公的內心成長過程與救贖之旅中的探險,因此可讀性對《追風箏的人》這部小說而言十分重要。文本中使用的單詞越短越簡單,語言就越簡單易懂。因此適中的平均詞長是作者期望達到的閱讀效果所致。另一方面《追風箏的人》中平均詞長是受作者經歷的影響。作者卡勒德·胡塞尼是美籍阿富汗作家,青年時期便移民美國,在美國的長期居住使卡勒德的英語水平越來越美國本土化,因而《追風箏的人》在平均詞長方面與同時期的美國小說并沒有顯著差異。
2.1.3 動詞名物化現象
動詞名物化是指與動詞相關的名詞,即從動詞形態上派生出來的名詞。該部分將用AntConc3.4.3軟件研究以-ment、-ness、-tion/-sion(包括其復數形式)3 種最常用的后綴結尾的動詞名物化情況。操作步驟如下。
第一步,使用表達式“w+ments?”,即可把所有以“-ment”和“-ments”結尾的詞檢索出來。第二步,將所檢索的索引行導出并進行檢驗,去除其中并非由動詞加后綴變來的名詞和以“-ment”結尾的非名詞,提高研究準確性。第三步,再次運行AntConc3.4.3 軟件,重復第一步操作,最終得出所需數據。其他后綴在兩個語料庫中的情況以上述相同的方法檢索。
提取最終數據后,該文將運用卡方檢驗檢測兩個語料庫的動詞名物化現象是否存在顯著性差異,顯著性水平以5%為標準。檢驗結果如下,其中數據欄中“Corpus 1”代表風箏語料庫,“Corpus 2”代表COCA 語料庫。P 值中出現的星號(*)代表顯著性水平,星號越多表示顯著性水平越高(見圖1)。

圖1 動詞名物化卡方檢驗
首先需要明確的是,大多數名物化是用來反映概括的狀態、過程,或個人品質與情感,其中大多數是不可數名詞。就讀者而言,一般小說讀者注重故事情節,因此小說也會注重對狀態和過程的描述。兩個語料庫中動詞名物化出現的不低的頻數,就說明了文本作者對描述概括的狀態、過程的重視,以迎合讀者需要。《追風箏的人》中運用大量抽象名詞來描繪人物性格與狀態,成功地把讀者對人物外在特征的關注轉移到其言行舉止上,從而實現了解人物內心世界的目的,使讀者感同身受。
其次,從上圖提供的數據可知,雖然兩個語料庫中都存在著不少的動詞名物化,但由于名物化總數的P 值小于5%,因此兩個語料庫在名物化使用上存在顯著差異,風箏語料庫的動詞名物化頻數總數(328)小于COCA 語料庫(563),風箏語料庫在動詞名物化使用上存在使用不足的情況。就具體數據而言,除-ness(es)以外,風箏語料庫各后綴的動詞名物化頻數都小于COCA 語料庫,-ness(es)在風箏語料庫中出現過多使用的情況,而-ment(s)和-tion(s)sion(s)則使用不足。
為了更深入地研究小說《追風箏的人》在詞匯層面所具有的特征,有必要對文本中的最高頻率詞與關鍵詞進行分析。該部分將用AntConc3.4.3 軟件中的Word List 功能截取風箏語料庫與COCA 語料庫中前30 位的最高頻率詞,并用Keyword List 功能抽取風箏語料庫中排名前30 的位關鍵詞,用以分析兩個語料庫在詞匯分布層面的異同,探究《追風箏的人》所獨具的特征(見圖2)。

圖2 各語料庫中前30 位高頻詞
通過觀察兩個語料庫中前30 位的最高頻率詞,可以發現在兩個語料庫中排在前面的高頻詞大多數都是功能詞,或者說是表達語法意義的虛詞。比如,限定詞(“the”“a”)、介詞(“to”“of”,“in”“on”)、代詞(“he”“you”“that”“it”)、連詞(“and”“or”)與一些基礎動詞(“be”“have”)。這一現象傳達的是一個基本的語言事實,即語言最基本的功能在于傳達信息。這是兩個語料庫在高頻詞使用上的相似之處。
而兩個語料庫之間的差異,首先,體現在人稱代詞的使用情況上。結合圖2 與表1 可知,在風箏語料庫中,“I”排在第二位(4 178 次),相對于COCA 語料庫(2 525 次)而言有過多使用的情況,說明采用第一人稱視角的寫作手法是《追風箏的人》的一大語言特色。這樣的敘事手法增加了小說的真實性,提高讀者的代入感,從而引起讀者共鳴,為小說增添了無限的感染力。其次,在風箏語料庫中,與男性有關的代詞出現頻率較高,如 “he”(1 781 次)、“his”(1 492次)、“him”(679 次),這三個代詞也是排在前30 位的關鍵詞。而與女性有關的代詞均未在風箏語料庫前30 位的最高頻率詞與前30 位關鍵詞之列。相比之下,在COCA 語料庫中,男性與女性的相關代詞在頻率上相對均衡。出現這樣的數據,是受《追風箏的人》故事主題影響所致,故事講述的是關于兩個男孩之間的故事,因此男性的相關代詞占了很大比例。

表1 風箏語料庫前30 位關鍵詞
結合表1 可知,兩個語料庫之間的差異,還體現在風箏語料庫所具有的阿富汗地域文化詞匯上。《追風箏的人》中人物取名頗具阿富汗民族特色,如“Hassan” “Sohrab” “Soraya” “Khan” “Amir” “Farid”“Assef”“Rahim”。前30 位關鍵詞中,地點名詞如“Kabul”“Afghanistan”“Afghan” 都與阿富 汗 相 關。“jan”“agha”作為阿富汗特色的稱謂也在文中反復出現。這些都表達了作者濃厚的民族情結,是小說作者的阿富汗文化背景的影響所致。
該文在數據統計方面比較風箏語料庫和COCA語料庫在詞匯密度、 平均詞長和動詞名物化現象上的異同,在詞匯分布層面比較二者最高頻率詞和關鍵詞的差異。研究結果如下。
在數據統計方面,《追風箏的人》 的詞匯使用相對更加豐富多樣,詞匯密度相對較高。在平均詞長層面,《追風箏的人》 與同時期美國其他小說沒有明顯區別。在動詞名物化層面,雖然兩個語料庫中都存在大量動詞名物化,但在具體使用上《追風箏的人》與同時期美國其他小說存在顯著差異。在詞匯分布層面,兩個語料庫前30 位高頻詞中都存在大量功能詞,這是二者的共性。《追風箏的人》的特性一方面體現在第一人稱與男性的相關代詞的使用情況上,另一方面體現在阿富汗地域文化詞匯的使用上。研究發現,這些特性與小說作者卡勒德·胡塞尼的美籍阿富汗身份有關,受他的生活經歷與阿富汗文化背景影響,由作者寫作風格、小說故事情節與作者期望達到的閱讀效果決定。這些特性使讀者在領會阿富汗異國風情的同時,又不至于過于“陌生化”,因此提升并保留了小說的趣味性與可讀性。基于語料庫的研究方法為研究《追風箏的人》增添了多樣性,通過該文研究,筆者希望為研究文學作品提供新的視角和研究方法。