王楠
摘 要:本文利用個人文學作品語料庫,借助FOXPRO程序和SPSS軟件,對西奧多·德萊塞和簡·奧斯汀的文學作品進行類符/形符比和平均句子長度的統計分析,以期通過文學作品的語料庫檢索結果,挖掘作品背后的文化差異。
關鍵詞:形符 類符 平均句子長度 文化差異
中圖分類號:G4 文獻標識碼:A 文章編號:1673-9795(2014)03(a)-0115-02
隨著語料庫語言學在我國的興起,越來越多的學者開始采用語料庫語言學的研究方法和手段對英美文學作品進行語料檢索和文本解讀。由于語料庫具有容量大、語料真實、檢索準確快捷等獨特的優勢,運用語料庫手段來分析文學作品可以減少研究者主觀因素的影響,為研究結論提供更為客觀、科學的數據支撐。基于語料庫的文學作品研究大多是運用語料庫檢索軟件,從詞匯分布,句子特征,人物刻畫和修辭手法等角度對文本進行檢索分析,從而更直觀地了解作品的主題內涵和作家的寫作風格。本文借助語料庫技術和計算機程序(FOXPRO),以文本的類符/形符比和平均句子長度為切入點,從一個全新的角度來挖掘作品背后的文化差異。
1 語料來源和研究方法
本文采用定量和定性相結合的方法,自建語料庫,對西奧多·德萊塞和簡·奧斯汀這兩位作家文學作品的類符/形符比和平均句子長度進行比較分析。語料庫的建構主要包括文本收集、文本整理以及文本的標注等步驟。本研究分別選取西奧多·德萊塞和簡·奧斯汀兩位作家的小說類作品為語料建立小型的個人文學作品語料庫A和B,包括了《嘉莉妹妹》、《珍妮姑娘》、《理智與情感》、《傲慢與偏見》等著名英語文學作品。在文本處理中,刪除所有冗余信息,只保留文章的題目和正文。運行FOXPRO程序1,得到兩位作家文學作品庫的形符數和類符數,分別計算出文本的類符/形符比。然后,運行FOXPRO程序2,將兩個文學作品庫中的文本分成句子,每個句子占一行,得到每個文學作品庫中文本所含句子的總數,分別計算出語料庫A和B中文本的平均句子長度。最后,用SPSS對所得數據進行差異的顯著性檢驗。
2 研究結果
兩個作品庫的文本檢索統計結果顯示:西奧多·德萊塞作品庫(A)的形符數為266552,類符數為8792,類符/形符比為3.30。簡·奧斯汀作品庫(B)的形符數為167296,類符數為5088,類符/形符比為3.04。根據梁茂成等(2010)對形符、類符的定義:“形符(token)是一個語言單位,類似于我們日常所說的詞,文本有多少個詞,就有多少個形符??傂畏麛凳钦Z料庫容量的最常用的測量單位。類符(type)是一個統計單位,指不重復計算的形符數。在一個文本中,重復出現的形符只能看作一個類符。一個文本的類符數就是該文本不同詞形的數量?!鳖惙?形符比常用來計算文本的詞匯密度。詞匯密度在一定程度上反映了文本的某種本質特征,即用詞的多樣性。通過卡方檢驗,對于形符數、類符數以及類符/形符比在0.05的顯著性水平上只是接近具有顯著意義的水平。由以上統計數據可以看出,兩個作品庫在詞匯密度上的差異并不顯著,西奧多·德萊塞作品庫(A)的詞匯量相對豐富,詞匯使用相對靈活。運行FOXPRO程序2,得到西奧多·德萊塞作品庫(A)的句子總數為22752,平均句子長度為12個詞,屬于中短句范疇;而簡·奧斯汀作品庫(B)的句子總數為7380,平均句子長度為23個詞,屬于中長句范疇。最后,用SPSS進行統計得到作品庫A和B中最長句分別為75詞和128詞,標準差分別是8.36和19.40。標準差是各數據偏離平均數的距離平方的平均數,它能反映出一個數據集的離散程度。兩組數據的標準差反映了A組數據分布相對集中,而B組數據分布離散,即簡·奧斯汀作品庫(B)中句子較長,且句子長度的差異較大。
3 結果分析
由以上統計結果,兩個作品庫文本的平均句子長度和最長句子長度差異顯著,即西奧多·德萊塞作品庫的平均句子長度要小于簡·奧斯汀作品庫的平均句子長度。中短句并不是德萊塞作品的風格。同其它美國文學作品相比,德萊賽的作品充滿長句,對細節有著極大的關注。然而,同英國作家簡·奧斯汀的作品相比,美國文學中以長句著稱的德萊賽作品的句子似乎短了許多。本文嘗試從兩位作家所屬文化和生活時代這兩個方面來解讀其作品句子長度的顯著差異。首先,西奧多·德萊塞和簡·奧斯汀有著不同的文化背景,即英美文化差異。在不同的文化背景下,人們的觀念各不相同,而觀念的差異又會造成語言使用方面的差異。比起美國人快速緊張的生活,英國人的生活節奏相對悠閑,做事情喜歡按部就班、不緊不慢。英國人喝下午茶的習慣就是一個很好的體現。有著很強的時間觀念的美國人在使用語言上往往簡明扼要、直截了當。無論是日常交際還是書面表達,他們都主張開門見山、直接切題。他們認為時間是一種有限的資源,要想方設法在有限的時間里完成更多的工作,甚至覺得花過長的時間對話是一種浪費。受各自觀念的影響,美國人更喜歡簡短易懂的短句表達,而英國人偏愛華麗復雜的長句表達。其次,作家所處的時代也會影響作品風格。奧斯汀所處的年代正是浪漫主義方興未艾之際,但是她的作品比較接近新古典主義風格。新古典主義推崇理性,強調明晰、對稱、節制、優雅,追求藝術形式的完美與和諧。德萊塞是美國自然主義文學的代表人物。由于受自然主義創作原則的影響,其作品的語言相對樸實,缺少藝術的加工與提煉。因此,不同的時代背景也是一個造成兩個作品庫的語料庫檢索結果差異的可能原因。
4 結語
通過上述分析可以看出,不同的文化及時代背景所造成的文學作品語言特點的差異在其語料庫的檢索結果中都會有所體現。基于語料庫的文學作品語言特點的對比分析具有獨特的優勢.為我們更加客觀、科學的分析、欣賞作品提供了便捷的操作工作,也為該領域的學術研究開辟了一個獨特的視角。無論是作品的語言特點、情節構建、思想內涵還是藝術風格,在語料庫檢索分析中都能一目了然。本文通過對比分析西奧多·德萊塞和簡·奧斯汀文學作品的語料庫檢索結果來挖掘造成差異的可能因,也從另一個角度印證了使用語料庫分析文化差異的可行性。
參考文獻
[1] 楊惠忠.英語語料庫語言學導論[M].上海:上海外語教育出版社,2008.
[2] 梁茂成,李文中,許家金.語料庫應用教程[M].北京:外語教學與研究出版社,2010.
[3] 王立非.計算機輔助第二語言研究方淺與應用[M].北京:外語教學與研究出版社,2007.
[4] 徐欣.基于多譯本語料庫的譯文對比研究——對《傲慢與偏見》三譯本的對比分析[J].外國語,2010(2):53-59.
[5] Graeme Kennedy. An Introduction to Corpus Linguistics [M]. Beijing: Foreign Language Teaching and Research Press, 2000.
[6] Lillian H. Chaney & Jeanette S. Martin. Intercultural Business Communication [M]. Beijing: Higher Education Press, 2002.
[7] Zhang, B. X. Selected Readings in English and American Literatures [M]. Beijing: Foreign Language Teaching and Research Press, 1998.