陳秀美
查爾斯·狄更斯和托馬斯·哈代都是19世紀英國的偉大作家,兩人都以寫實見長。但兩位作家的家庭情況和生活環境不同,導致他們的寫作風格也略有差異。狄更斯的作品描繪了底層社會,而哈代的作品則體現了地方特色。那么,兩位作者在寫作風格上有什么差別呢?本文擬從語料庫文體學的視角,來分析這兩位作家文體風格上的差異,從可讀性、詞匯密度、平均詞長、名詞化手段密度、常用介詞密度五個角度對兩位作家的四部作品:《霧都孤兒》《我們共同的朋友》《一雙藍眼睛》《無名的裘德》進行文體風格分析,以此揭示兩位作家文體風格的異同,以及他們早期和后期文體風格的變化。
語料庫文體學是一個新興學科,它隨著語料庫語言學發展而來,利用語料庫的檢索功能,將文本的特征和屬性用一種量化的方式體現出來[1],這從一定程度上能夠反映出作者的文體風格。語料庫文體學的理論基礎分為兩個方面:形式與意義、頻率與意義。每個文本在語言使用或者表述方式上都有其特點,每個文本的特點都有所不同,甚至同一個作家不同時期的作品之間也有所差異,我們稱之為“個體屬性”[2]。語言形式在一定程度上反映了文本的這種個體屬性。不同的作者選擇不同的語言形式,這其中必定隱藏著特定的意義。對其文本構成的語料庫進行檢索,能夠在一定程度上揭示這種意義。語料庫文體學研究認為意義上的顯著性就是用語料庫中的出現頻率來體現的[3]。因此,運用語料庫對作者的文體風格進行研究有一定的理論基礎。
國內外語料庫文體學的研究領域主要集中在文學和翻譯領域。Burrow通過研究簡·奧斯汀作品中的單詞分布情況,對主人公性格進行了分析[4]。陳建生、付濤通過構建語料庫,對比分析哈代“環境與性格”小說和其他類小說,以及與其同時期作家的小說,揭示了哈代“性格與環境”小說的特點。華信敏從類符/形符比、詞匯密度、句子層面等角度分析十九大報告英譯文體風格[5];彭發勝和萬穎婷從平均詞長、詞長分布、高頻詞和標準化類符/形符比等方面研究《邊城》三個英譯本文體特色[6]。
狄更斯和哈代作為19世紀英國的偉大作家,其文學作品描繪了當時的社會狀況,能夠幫助讀者更好地理解和研究當時的社會情況。但目前國內外的研究多側重于對其一部作品的研究[7]。或將其作品中的某一人物形象與中國的文學大家做對比[8]。對這兩者的文體風格的對比研究匱乏,從語料庫文體學的角度進行的研究更是少之又少。
因此,本文將從可讀性、詞匯密度、平均詞長、名詞化手段密度、常用介詞密度五個角度對狄更斯和哈代兩位作家的作品的文體風格進行對比分析,以此揭示兩位作家文體風格的異同,以及他們早期和后期文體風格的變化。
本文旨在研究狄更斯和哈代兩位作者作品的文體風格差異以及他們的作品在前后期文體風格的差異及其原因,具體的研究問題如下:
1.狄更斯和哈代的小說在可讀性、詞匯密度、平均詞長、名詞化手段密度、常用介詞密度五個方面有什么異同?
2.狄更斯和哈代前期和后期的小說在可讀性、詞匯密度、平均詞長、名詞化手段密度、常用介詞密度五個方面有什么異同?
用Readability Analyzer2.0對語料進行檢索,得到四部小說的可讀性和平均詞長。本文用Flesch Kincaid Grade Level來表示可讀性。它通過計算每個句子的平均單詞數和單詞的平均音節數來表示文本的復雜程度。然后它將復雜程度轉換為分數。其產生的結果越高,文本的復雜程度就越高,讀者閱讀起來就越困難。直接讀取文本的平均詞長,平均詞長是4個字母左右的文本屬于難度中等的,高于4個說明該文本用詞復雜,閱讀難度高,反之則較為簡單,易于通讀[9]。
用Antconc3.5.7對語料進行檢索,得到四部小說的詞匯密度、常用介詞密度和名詞化手段密度。筆者選取四部小說中最頻繁出現的10個介詞(to,of,in,with,as,for,at,by,on,from)為檢索目標詞,得到四部小說的常用介詞密度。并選取4種常用的名詞化手段(*tion,*sion,*ity,*ness)為檢索目標,得到四部小說的名詞化手段密度。獲得的數據錄入SPSS對數據進行t-檢驗分析。
1.可讀性
可讀性,也稱易讀性,指書面材料易于閱讀和理解的程度,可讀性越高,說明這個文本的閱讀難度越低,越容易被讀者理解,反之則閱讀難度越高,讀者越不容易理解。
經過數據分析,得出狄更斯小說的可讀性(4.4)比哈代小說的可讀性(7.5)高,且存在顯著性差異(p=.000)。可見,哈代的作品閱讀難度比狄更斯的作品高。
2.詞匯密度
詞匯密度是文本信息量大小的一個衡量標準。本研究用標準類符/形符(TTR)來表示詞匯密度,以此來衡量文本的復雜程度。
經過數據分析,得出狄更斯作品的詞匯密度(42.49%)比哈代作品的詞匯密度(44.05%)小,并且存在顯著性差異(p=.006)說明哈代作品實詞密度較高,信息量大,閱讀難度更高;狄更斯作品的實詞詞匯密度較低,閱讀難度更小。
3.平均詞長
平均詞長指特定文本中詞匯的平均長度。平均詞長反映了文本的詞匯難度。平均詞長越長,說明該文本中的長詞越多,閱讀難度越大。反之則表明該文本的長詞越少,閱讀難度越低。
經過數據分析,得出狄更斯作品的平均詞長(4.58)比哈代作品的平均詞長(4.47)大,且存在顯著性差異(p=0.001),說明兩位作者的作品用詞都較為復雜,且狄更斯的作品中長詞用的比較多,閱讀難度更高。
4.名詞化手段密度
名詞化是跨范疇的語言現象,它用名詞的形式來表示動詞的過程、形容詞的特征。這些由動詞或者形容詞轉化過來的名詞詞匯密度大、信息濃縮,因此,增加了讀者的理解難度。名詞化蘊含較大信息,理解它們需要花費大量的時間,甚至有時會出現語言歧義。如果一篇文章充滿了這些名詞,可讀性就會大大降低。
經過數據分析,狄更斯作品的名詞化手段密度(1.06%)比哈代作品的名詞化手段密度(1.10%)小,但是不存在顯著性差異(p=0.554)。
5.常用介詞密度
筆者選擇了10個常用的介詞進行檢索,得到結果如下:
狄更斯作品的常用介詞密度(9.02%)比哈代作品的常用介詞密度(8.88%)大,但兩者之間不存在顯著性差異(p=0.463)。
1.可讀性
經過SPSS數據分析得出,狄更斯作品后期的可讀性(4.16)比前期的可讀性(4.66)大,閱讀難度更小,且兩個時期的可讀性存在顯著性差異(p=0.043)。而哈代的作品在后期的可讀性(7.56)比前期的可讀性(7.46)相比,略有減小,閱讀難度略微變大,但變化程度不大(p=0.881)。
2.詞匯密度
經過數據分析,這兩位作者作品的詞匯密度都有所下降(狄更斯:前期42.81% vs 后期42.18%;哈代:前期44.34% vs 后期 43.76%),且不同時期的詞匯密度之間不存在顯著性差異(p=0.431, p=0.451)。因此,可得出兩位作者在創作的前期和后期作品的詞匯密度都有所下降,但相差不大。
3.平均詞長
經過數據分析得出,狄更斯的作品后期的平均詞長(4.58)比前期(4.57)略大,但前后期的平均詞長之間不存在顯著性差異(p=0.951)。哈代的作品后期的平均詞長(4.39)比前期的平均詞長(4.55)更小,且前后期的平均詞長之間存在顯著性差異。(p=0.000)。
4.名詞化手段密度
根據數據分析結果得出,狄更斯作品后期的名詞化手段密度(1.03%)與前期(1.09%)相比,略有減小,但兩個時期的名詞化手段密度之間不存在顯著性差異(p=0.515)。哈代作品后期的名詞化手段密度(1.01%)與前期(1.23%)相比,也有所降低,且存在顯著性差異(p=0.026)。
5.常用介詞密度
由數據分析結果可知,兩位作者在兩個不同時期的作品的常用介詞密度都有所增大(狄更斯:前期8.31% vs后期9.66%;哈代:前期8.46% vs后期9.20%),且都存在顯著性差異(p=0.000.p=0.000)。
從上述數據分析得出:在可讀性上,狄更斯作品比哈代的閱讀難度更低,且狄更斯的作品在后期閱讀難度有所降低,而哈代的作品在后期的閱讀難度變化不大。造成兩位作者作品可讀性差異的原因可能是兩人的教育背景不同造成的。狄更斯出生在一個普通的家庭,他只上過幾年學校,主要靠自學和從生活中獲得文學知識,因此,他的文字比較貼近生活。而哈代曾就讀于由朱麗亞·馬丁資助建立的國立學校和多切斯特的不列顛學校。兩個人的教育背景的差異導致作品的閱讀難度有所差別。
在詞匯密度上,狄更斯作品的詞匯密度比哈代的小,說明狄更斯作品的詞匯復雜度比哈代小說的詞匯復雜度低,可讀性更高。并且兩位作者在創作后期的作品詞匯密度都有所下降,但差異不大。
在平均詞長上,狄更斯作品的平均詞長比哈代作品的大,說明狄更斯的作品中長詞用的比較多,文本較為復雜。且狄更斯的作品的平均詞長在后期變化不大,哈代的作品的平均詞長在后期有所減小,說明其后期作品的閱讀難度顯著減小。
在名詞化手段密度上,兩位作者的作品相差不大。且狄更斯作品的名詞化手段密度在后期的變化不大,哈代作品的名詞化手段密度有所降低。說明哈代的作品在后期的可讀性有所增大,閱讀難度有所減小。
在常用介詞密度上,兩位作者的作品相差不大。且兩位作家后期的作品的常用介詞密度都有所增大,說明兩位作家在創作后期的作品閱讀難度有所降低。
本文從可讀性、詞匯密度、平均詞長、名詞化手段密度和常用介詞密度五個方面對兩位作家的四部作品:《霧都孤兒》《我們共同的朋友》《一雙藍眼睛》《無名的裘德》的文體風格進行對比分析。分析得出:狄更斯的作品普遍比哈代作品的閱讀難度低,且兩位作者在創作后期作品的閱讀難度都有所下降。這可能與作者的教育背景和生平有關。通過語料庫對這兩位作者的寫作風格的分析更具客觀性,更有助于讀者了解兩位作者獨特的文體風格。