周加林
(肇慶學院 外國語學院,廣東 肇慶 526061)
詞組,是英語中具有固定意義的多詞組合。詞組具有多種稱謂:“語串”“詞組”“詞匯短語”“統計短語”“多詞項”“詞叢”“語鏈”和“語塊”等[1]9,還有研究者將其稱之為“預制語塊”。研究者通過語料庫的數據發現,大約有70%的自然話語都是由預制語塊構成的。也就是說,人們實際使用的語言是通過儲存在記憶中的語塊來實現的[1]14。對詞組或語塊的掌握直接影響語言使用者的語言交際能力,它決定了語言使用的正確性、連貫性和流暢性,可見,詞組的應用能力是語言能力的重要組成部分。國家教育部高等教育司《大學英語課程教學要求》(以下簡稱《課程要求》)列出的共有1 870個詞組的“大學英語詞組表”,對大學生的英語詞組應用能力提出了一般、較高和更高三個不同層次的要求,根據這三個不同層次的要求,大學生應掌握的英語詞組數量分別為700個、1 200個和1 870個[2]。大學英語四六級考試是以《課程要求》為設計依據的大學英語水平考核體系。《課程要求》詞組表中的詞組(以下簡稱《課程要求》詞組)在四六級真題中的實際應用數據是很值得探討的問題。本研究通過中國知網數據庫以“四六級真題”“詞組”和“詞塊”作為關鍵詞進行了檢索,結果表明在近10 年來有相當數量的、與英語詞組研究相關的論文發表在不同的學術期刊上,但暫未發現針對《課程要求》詞組在大學英語四六級真題的應用特征做系統性研究的論文或其它研究成果。因此,本文運用語料庫檢索的研究方法,依托計算機軟件對2006 年6 月至2014 年6月的大學英語四六級真題進行了統計與分析,以觀察《課程要求》詞組在四六級真題中的應用數量、頻率、跨度、類別和結構等特征,以填補這一研究領域的空白。
《課程要求》是國家教育部針對大學英語的教與學而設立的標準。大學英語四級考試是衡量大學生是否具備《課程要求》中所規定的“一般要求”的測試體系,而大學英語六級考試則是檢驗大學生在英語上是否達到“較高要求”和“更高要求”的測試體系。本文的研究對象為2006年6月至2014年6月大學英語四級真題與六級真題各25套,共50套,目的是通過統計分析觀察《課程要求》詞組在過去9年來在四六級真題中的應用特征,從而檢驗《課程要求》詞組在四六級真題中的應用是否符合《課程要求》中所提出的各項標準。
1.四六級真題中《課程要求》詞組的應用數量。
2.四六級真題中《課程要求》詞組的使用頻率與跨度。
3.四六級真題中《課程要求》詞組的重合度比對分析。
4.《課程要求》詞組及四六級真題中《課程要求》詞組的類別及結構特征。
本研究使用的計算機軟件主要有三個:Antconc3.4.3w,Range 和Excel。Antconc 是由日本早稻田大學科學工程學院科學工程英語教育中心的Laurence Anthony博士開發的一款綠色免費語料庫檢索工具[3]。從龐大的語料中檢索提取某個詞語或短語的所有詞條,是Antconc 的基本功能。Antconc 的檢索分為基本檢索和高級檢索。基本檢索功能可以實現對固定詞和詞組的檢索[4]。Range是由新西蘭維多利亞大學語言學與應用語言學院的Paul Nation 與Averil Coxhead 教授設計,由Alex Heatley 編程的免費軟件。該軟件可通過系統自帶的、或者是研究人員自制的基礎詞表(Baseword Lists)來分析文本中的詞匯情況;可統計出基礎詞匯表中的單詞在文本中出現的頻率(frequency)、單詞在不同文本中的使用跨度(range),等等[5]。Range是用于詞匯檢索的工具,本身并不具備對詞組的檢索功能,但是經過人工的特殊處理(將基礎詞表和語料中的各詞組內的單詞用連字符連接起來使系統默認該詞組為一個單詞),也可以達到檢索詞組的目的。Excel 是微軟公司Microsoft Office 辦公軟件系列的一個子軟件,主要用于數據的統計、計算和排序。
本研究首先將2006 年6 月至2014 年6 月的50套四六級真題(含聽力原文、譯文以及作文的參考答案)輸入計算機并保存為適合計算機語料庫檢索軟件使用的純文本(txt)格式備用。將《課程要求》詞組表的詞組存為純文本格式作為對語料檢索的基礎詞表。在制作基礎詞表的過程中,本研究在基礎詞組表中加入了所有動詞詞組的屈折形式,以便Antconc可以把語料中同一詞組的各種變化形式都能統計在內。例如:在fall off 這個詞組下增加了falls off,fell off,fallen off和falling off四個詞組。這樣,語料中fall off這個詞組無論以何種形式出現都會被軟件檢索出來。
本研究將已經轉化為文本文檔的四六級真題逐套導入Antconc 的語境共現(concordance)欄中,將《課程要求》詞組表的詞組作為對語料進行檢索的目標,軟件檢索之后會把語料中出現過的基礎詞表中的詞組以高亮方式顯示出來并報告檢索出的詞組總數,從而獲得《課程要求》詞組在各套真題中的應用數量(含詞組的屈折形式以及重復使用的數據)。為了能夠在Range軟件中統計各套真題中《課程要求》詞組的使用跨度和頻率,本研究將在Antconc檢索到的詞組以及《課程要求》詞組表里的詞組都進行了人工處理(即用連字符將各詞組內的單詞連接起來),使Range軟件在統計時將一個詞組視為一個單詞來進行統計。本研究首先將50 套四六級真題中所使用過的《課程要求》詞組的文本文檔逐套導入Range,以自制的《課程要求》詞組表作為基礎詞表對其進行檢索,排除了詞組的屈折形式和重復使用的數據,得出詞組在各套四六級真題中實際應用的數量。
最后,將25套四級真題的《課程要求》詞組作為一組被檢索的語料,而將25 套六級真題的《課程要求》詞組作為另一組語料,分別導入Range中,以《課程要求》詞組表作為基礎詞表對被檢索語料進行再次檢索,從而得出《課程要求》詞組在歷年四六級真題中的使用頻率和跨度等相關數據。經過使用Excel軟件對各種檢索結果的排序整理,得到各種數據與結果。
運用上述方法對2006 年6 月至2014 年6 月的50套四六級真題進行分析處理,《課程要求》詞組在四六級真題中的應用情況如圖1所示。

圖1 《課程要求》詞組在歷年四級與六級真題中應用數量統計柱狀圖
圖1 表明:在25 套四級真題中,每套真題使用的《課程要求》詞組大致在100~110 個之間;而25套六級真題中,每套真題使用的《課程要求》詞組約在100~120 個之間。另外,在25 套真題中,有7 套六級真題的《課程要求》詞組的數量少于同年同月的四級真題。其中,2010 年6 月的六級真題中,《課程要求》詞組的應用數量比同年6 月的四級真題少了80個。以上數據說明兩個問題:
1.在每套四級或六級真題中,總數為1 870個的《課程要求》詞組只有100 多個得到了應用,這樣的應用量大約等于《課程要求》詞組表中詞組總數的6%左右。這表明在各套四六級真題中只有少量的《課程要求》詞組得到了應用。《課程要求》詞組在單次考試中的使用率相對偏低。
2.大學英語六級是考核學生是否具備“較高”或“更高”能力的測試體系,其試題的難度應該比大學英語四級考試更高。但是,在9 年的25 套試題中,大部分六級真題的《課程要求》詞組的應用數量與同年同月的四級真題非常接近;另有7套試題的《課程要求》詞組的數量低于同期的四級真題,這樣的現象顯然不符合常理,表明六級真題在詞組考核的難度上沒有與四級真題拉開應有的距離。這只能說明六級真題的設計,至少在考核詞組應用能力的試題設計方面尚有待改善。
通過分析處理,《課程要求》詞組在四六級真題中使用頻率情況如表1所示。
《課程要求》詞組在四六級真題中使用跨度情況如表2所示。
表1 與表2 數據統計顯示:大部分四級真題與六級真題中的《課程要求》詞組使用跨度和頻率都相對較低。在使用跨度方面,只在1 套至5 套四級真題中使用過的《課程要求》詞組為563 個,占使用過的《課程要求》詞組總數量的82%。在1至5套六級真題中使用過的《課程要求》詞組為609 個,占六級真題中使用過的《課程要求》詞組總數量的81%。在使用頻率方面,86%的《課程要求》詞組在四級真題中的使用頻率為1~9 次,87%的《課程要求》詞組在六級真題中的使用頻率為1~9次。大部分的《課程要求》詞組使用頻率和跨度都比較低說明四級與六級真題文本的內容都比較豐富,每套試題的內容都不雷同,所以才會出現每次考試所使用的詞組都不一樣的現象。

表1 四六級真題中《課程要求》詞組使用頻率統計表

表2 四六級真題中《課程要求》詞組使用跨度統計表
使用Range軟件,將每套四級真題使用過的《課程要求》詞組作為Range的基礎詞表,將同年同月的六級真題使用過的《課程要求》詞組作為檢索對象,導入Range后得出表3中的各項數據。

表3 六級真題《課程要求》詞組與四級真題《課程要求》詞組應用重合度對比統計表
從統計結果發現,《課程要求》詞組在25套四級真題與25 套六級真題中的重合度約為30%,有約70%以上的詞組為非重合詞組并在歷年的考題中基本保持這一比例。詞組重合度小,說明兩個級別的試題文本內容存在差異。同時,在歷年25套試題中均基本保持這一比例,顯示了試題設計的穩定性。
為了觀察四六級真題應用過的《課程要求》詞組的在類別特征與結構特征上是否與《課程要求》詞組表里的詞組相同,本研究用Excel 軟件把歷年50套四六級真題使用過的《課程要求》詞組以及《課程要求》詞組表里的詞組進行篩選排序后,得出如下統計結果(見表4,表5):

表4 四六級真題中《課程要求》詞組與《課程要求》詞組表詞組的類別特征
在表4 中,我們用A 表示四級真題中《課程要求》詞組數量;B 表示占詞組總數的百分比比例;C表示六級真題中《課程要求》詞組數量;D 表示占詞組總數的百分比比例;E 表示《課程要求》詞組表詞組數量;F表示占詞組總數百分比比例。

表5 四六級真題中《課程要求》詞組與《課程要求》詞組表詞組的結構特征
在表5 中,用A 表示四級真題中《課程要求》詞組的數量;B表示占詞組總數的比例;C表示六級真題中《課程要求》詞組數量;D表示占詞組總數比例;E表示《課程要求》詞組表詞組的數量;F表示占詞組總數比例。
表4與表5數據顯示,四六級真題應用過的《課程要求》詞組與《課程要求》詞組表中的詞組在類別與結構特征上基本相符。動詞詞組在三者中的比例都超過50%,其次為介詞詞組,占21%~26%左右。在結構上二詞詞組在三者中數量最多,約占詞組總數的62%~73%,三詞詞組占21%~27%左右,四詞詞組約占5%~8%。這些數據信息對大學英語教師把握《課程要求》詞組的教學重點以及廣大考生復習掌握《課程要求》詞組備考四六級具有一定的參考價值。
本研究將《課程要求》中的“大學英語詞組表”作為語料檢索的基準,利用計算機軟件對25套四級真題以及相同套數的六級真題的文本進行了檢索、篩選和排序后,發現在9 年來的50 套四六級真題中,每套考題里只有約6.4%的《課程要求》詞組得到了應用。25 套四級真題應用過的《課程要求》詞組相加后為684 個,基本達到《課程要求》中大學生需掌握700個詞組的“一般要求”。問題比較明顯的是25套六級真題,首先在《課程要求》詞組的應用數量上與四級真題并無太大的差別,有7 套六級真題的《課程要求》詞組數量甚至還少于同年同月的四級真題的詞組數量,這明顯是不合理的倒掛現象。25套六級真題應用過的《課程要求》詞組共743 個,距《課程要求》規定的大學生需掌握1 200個詞組的“較高要求”相差甚遠,更無法達到《課程要求》規定的大學生需掌握1 870個詞組的“更高要求”。這是六級真題在考核詞組能力的試題設計方面存在的比較明顯的瑕疵。
另外,本研究發現80%以上的《課程要求》詞組在四六級真題中呈使用跨度窄、使用頻率低的狀態,說明四級與六級真題的文本內容的豐富性,文本沒有雷同現象。在同年同月的四級與六級真題的比對中發現《課程要求》詞組使用的重合率僅為30%,非重合詞組約為70%左右,從另一角度說明四級真題與六級真題文本內容的差異性。
本研究還發現,在詞組類別上動詞詞組和介詞詞組占四六級真題中所應用過的《課程要求》詞組總數的70%以上。在詞組結構上二詞詞組的數量占四級真題《課程要求》詞組使用總數的73.54%,在六級真題中,二詞《課程要求》詞組的數量占使用總數的72.27%。四六級真題的《課程要求》詞組的類別與結構特征與《課程要求》詞組表的詞組特征基本一致。這提示大學教師和考生:在《課程要求》詞組的教與學中,動詞詞組、介詞詞組以及二詞詞組是需要注意和把握的重點。
研究者期待本研究的數據可以為四六級試題設計者提供客觀的參考依據,同時也能對大學英語教師和考生在《課程要求》詞組的教與學中提供有益的幫助。
[1]周正鐘.語塊教學法新探——理論、實證與教學延伸[M].蘇州:蘇州大學出版社,2014:9-14.
[2]教育部高等教育司.大學英語教學課程要求[M].上海:上海外語教育出版社,2007:3-5.
[3]何安平.語料庫輔助英語教學入門[M].北京:外語教學與研究出版社,2010:12.
[4]王春艷.免費綠色軟件Antconc在外語教學和研究的應用[J].外語電化教學,2009(1):45-48.
[5]周加林.大學英語四級考試真題的詞貌特征——基于2006 年6 月—2013 年6 月大學英語四級考試真題的統計與分析[J].大學英語教學與研究(《考試與評價》大學英語教研版),2014(3):82-87.