楊朵朵
鄭州西亞斯學院堪薩斯國際學院
本研究隨機抽取的托福閱讀理解30篇共22485字和考研英語一(以下簡稱英一)的閱讀理解文本40篇共19343字,自建兩個小型語料庫分別為語料庫1(托福閱讀文本語料庫)和語料庫2(英一閱讀文本語料庫)。研究所用的語料庫軟件為Range32,Antconc3.2.4,WordSmith,Wordart和卡方檢驗等。本研究采用定量研究與定性研究相結合的方法對比分析托福閱讀理解文本與英一閱讀理解文本的難度差異。
1.表層結構。
篇章的長度、句長、詞長、語篇中的生詞數量等影響著文章的可讀性,所以首先從這幾個方面對文本進行解讀。
(1)文本長度。英一的閱讀理解文本共有40個,文本的平均詞數為472個。其中最短的文本為457詞,最長的文本為507詞,極差為52詞。托福的閱讀理解文本共有30個,文本的平均詞數為708個。其中最短的文本為676詞,最長的文本為754詞,極差為78詞。托福文本長度的變化略大于考研文本,但是托福文本的平均長度遠大于考研文本,如果單純從文章長度來看,可以推測托福閱讀理解的難度要遠遠高于考研英語的閱讀理解。但是單從文本的長度來判斷難易度并不十分可靠,所以接下來還會對文本的詞匯等級水平進行考察。
(2)詞匯密度。形符一般是指語料庫中出現的所有的詞,類符指的是語料庫文本中任何一類獨特的詞,排除重復、忽略大小寫和曲折變化。標準類符形符比是文本中每1000詞計算出類符形符比再求出其平均值。比值越高說明文本的詞匯量越豐富,詞匯涉及范圍越廣。平均詞長為文中類符的平均長度,一般而言平均詞長越長表明文本中的長詞較多,文本更深奧復雜。(李敏杰,朱薇 2012:177-180)平均句長是能夠表達一個完整意思的語言單位所包含的平均詞數。托福閱讀理解文本的平均詞長與英一的平均詞長都為5,二者保持均衡;而標準類符形符比為50.64大于英一的標準類符形符比45.35,說明托福閱讀文本的詞匯豐富度大,文章的詞匯涉及范圍更廣,這就會使讀者更不容易掌握;平均句長為23也略大于英一的平均句長,說明文章中長難句的比例要高;長難句的出現會減慢讀者的閱讀速度,甚至造成誤解或不解。以上兩項都會造成讀者閱讀的障礙,所以可以推測托福的文章難度要大于英一。
(3)詞匯難度。三級詞表中,第三級和詞表外詞匯(not in the lists),特別是第三級詞表對文本整體的詞匯難度有較好的判別能力。(梁茂成、李文中、許家金2010:138)數據顯示在一級和二級詞匯上不管從類符還是形符上說英一的使用情況都要高于托福的使用情況,而在三級和詞表外詞匯的使用上,托福的使用情況都要高于英一。這說明英一閱讀理解中低級詞匯比較多,而托福閱讀理解中高級詞匯比較多,這就會給閱讀造成很大的障礙,所以可以推測托福文章的難度要大于英一。
2.小結。
經過對表層結構進行分析,可以得出結論:托福文章詞匯和句子難度都要大于英一。這似乎大家的普遍認識是一致的。但是現在下結論似乎為時過早,因為影響文本難度的因素不止語篇的詞匯難度、句子長度和復雜度等,還包括語篇涉及的主題、文章的體裁句子的結構等深層因素。下面會繼續對文本進行深層次的解讀。
3.深層結構。
文本的題材和體裁特征對讀者的認知要求有很大的不同,因而從深層次影響文本的難度。
(1)文章題材。Wordart在生成詞云圖的時候已經去除所有的功能詞和數字,并把所有的詞進行詞形還原。其中單詞越大說明該詞在文章中出現的頻率越高。首先,從詞云圖中的 water,plant,area,change,century,rock,fossil等詞可以看出來:托福考試閱讀理解的題材以生物、歷史、化學、地理、環境、考古等學科性文章為主。而另一詞云圖中的company,world,research,public,change,busy,educated,job等詞可以看出來:英一則是以一些有關經濟、管理、社會、文化、科普等為題材的描寫敘述科技進展,社會變化,公眾生活等社科類的文章為主。雖然兩者的主題有所不同但都偏向于自然科學和社會科學等題材。
另外,由于托福文本的文章題材涉及生物、歷史、化學、地理、環境、考古等方面,而在這些學科領域有大量的術語和專有名詞,比如在生物學上DNA分子的雙螺旋結構的表述及其構成成分的術語都是一些我們不常見的長難詞;如在化學學科領域,元素周期表上的各種元素名稱及組成也都在術語的范疇內;在考古領域,各種已經滅絕了的生物名稱如寒武紀的恐龍等等也都是非常復雜的不在低級詞匯的范圍的單詞。而考研英語里雖然也有一些長難詞但像這些偏僻的高級專業詞匯就沒有那么多。這就造成了前面的數據表里呈現的:托福詞匯里出現的高級詞匯遠大于考研英語。但是實際上,這些單詞并不影響我們對文章的基本理解,只不過是考生心理感覺特別難。一旦克服自己的心理障礙,我們做題的正確率就會有顯著的提升。
(2)文章體裁特征。文本語體可分為五種:莊嚴文體、正式文體、商議文體、隨意文體和親密文體。(曾用強 2001:3)發現托福文章高頻動詞集中在:indicate,record, perform, reflect, observe, represent,measure 等偏正式和書面化的文體風格的詞匯。英一的文章高頻詞匯也集中在:publish,perform,observe,record, regulate 等偏正式或書面化的文體風格的詞匯上面,所以二者在體裁上都屬于正式文體。
正式文體講究句式的規整,詞語的搭配,層次的遞進。以上述高頻詞中record和research為節點詞,隨機從托福文本和英一文本中抽取兩個句子。Eg1 為托福文本中的句子。Eg2為英一文本中的句子。從結構上來看,這兩個句子都是復合句,結構都很復雜但條理清晰,句子雖長但表意明確,要理解這樣的句子均需要較高的英語水平,而這正是正式文體在句法層面上的表現。在這一點上托福文本與英一文本并無差異,說明兩者在難度上均衡。
Eg1:To the extent that the coverage of the global climate from these records can provide a measure of its true variability, it should at least indicate how all the natural cause of climate change have combined.
Eg2:To those who are unaware that animal research was needed to produce these treatments,as well as new treatments and vaccines, animal research seems wasteful at best and cruel at worst.
(3)共現詞的差異性分析。傳統語法和語言學研究都把動詞作為核心,認為動詞的信息量最大,是預測句子語義的首選詞。(劉潤清 2013:461)故而從英一高頻詞中在頻率>3的高頻動詞中隨機選擇10個,并找出其在托福文本中出現的相應頻率,經過卡方檢驗進行差異性對比生成表四,發現其中7個詞(也就是70%)在使用上無差異,其中2個(也就是20%)有差異但差異性不大,只有一個(也就是10%)出現了顯著性差異。這說明在文章的可讀性上二者基本上保持均衡。
4.小結。
雖然在題材上托福文本和英一文本側重點有所不同但都是偏向于自然科學和社會科學的取材,學術性比較明顯;在體裁上,兩者都屬于正式文體;在高頻動詞的使用上很大程度上也沒有太大差異,所以從深層結構分析來看,托福文本和英一文本的難度基本相當。
基于語料庫的視角,本研究采用定量和定性研究相結合的方法,從表層結構和深層結構兩方面對托福閱讀理解文本及英一閱讀理解文本進行比較,發現在表層結構方面托福文本的難度要大于英一的難度,這也解釋了大眾的錯誤印象,但是經過深層剖析,發現造成表層結構難度差異的原因以及深層結構的相似性,得出結論:托福閱讀理解文本的難度與英一持衡,難度基本相當。希望可以借此糾正大家的誤區并給廣大考生提供一些建設性的備考方案。