袁哲琨
(香港理工大學 中國香港 999077)
在1862年中國的考試系統進入現代考試階段(modern examination period)的初期,對于外語的考察就已經出現了??忌梢栽诙碚Z、德語、法語、日語、英語以及西班牙語這6種外語中選擇一門來進行考核。然而,隨著英語作為第二語言在世界范圍內被推廣,學習英語在中國受到了廣泛的重視。因此,很多大學只招收在高考中選擇了英語作為外語考核目標的學生,隨之而來的就是超過99%的學生選擇英語作為他們的第二語言。本文基于Wmatrix對自建的“高考英語試卷”語料庫進行語料庫分析,旨在通過分析出現在高考試卷中的高頻詞匯、詞性和語義域來研究高考英語試卷作為英語學習材料模板的可靠性(authenticity)。
考試對教與學過程產生的巨大影響,被稱為“反撥效應”?!胺磽苄睅淼挠绊懣赡苁欠e極的,也可能是消極的,這主要取決于考試的內容。積極的反撥是指,“學習者相信教與學過程中進行的練習對英語學習有幫助。”當將正面的反撥效應細分為不同的題型時,這種對特定題型的反撥效應可以為教師提供有效的教學建議,為學生提供合適的學習策略。
因此,為了確保高考英語能夠對中國的英語學習和教學產生積極的影響,我們應該考慮到高考英語試卷作為英語學習材料模板的可靠性。
由于高考英語能對學生的英語學習過程產生強烈的反撥效應,它對學習過程中所使用的英語學習材料也會有很大的影響。因此,高考英語試卷的可靠性是保證這些學習材料可靠性的關鍵。
在教育領域有一個共識,即“學習材料在語言學習和教學的過程中是很重要的一點”。教材和學習材料是語言課程中不可缺少的工具。正是由于這種學習材料的廣泛使用,才能在世界各地建立起成功的外語學習環境。Hutchinson和Waters更是聲稱英語學習材料“能夠激勵英語學習;展現語言學習的本質;反映語言學習任務的性質;有效拓展教師培訓的基礎,并提供正確及適當的語言使用方法”[1](Hutchinson & Waters,1987)。
優秀的學習材料被Widdowson定義為“讀者對它的反應比它是否被簡化更重要”[2](Widdowson,1978)。在他看來,連貫性對于材料的可靠性很重要,這是由讀者的反饋決定的。只有讀者能夠理解材料并做出回應,材料才能被判斷為可靠的。因此,在分析學習材料的可靠性時,學習者應是一個必須考慮的重要因素。另一方面,Richards主張“可靠的學習材料應該作為課堂活動的基礎。”他認為可靠的學習材料能夠提供目的語的文化信息,使學習者置身于真實的語言環境中。從學習和教學過程的角度來看,這些教材能夠更好地滿足學習者的需求,為教師提供一種更有效、更有創造性的教學模式[3](Richards,2006)。
Brandl對Richards的觀點也有類似的認可,即學習材料應該是真實情況和需求的反映[4](Brandl,2008)。Brandl認為,可靠的學習材料能讓學生在現實世界自然發生的語境中接觸到真實的語言情境,并將課堂練習與真實世界聯系起來,以滿足學生的需求??煽康膶W習材料為課堂活動提供了基礎,使教師設計的活動更符合自己的教學風格和學生的學習風格。
Gilmore回顧了對語言學習材料可靠性的研究,總結出8種評判標準:“由本族人發明在一個特定語言社區中的本族人之間所使用的語言;由真實的演講者或作者為真實的聽眾所使用的語言,用以傳達真實的信息;由接受者賦予文本的品質,即它不是文本本身固有的東西,而是由讀者或聽眾反饋給文本的;師生互動;選擇的任務類型;課堂的社會情境狀況;與教學評估相關。文化,以及像目標語言群體那樣的行為或思維能力,以便被他們認可和驗證?!盵5](Gilmore,2007)。他認為語言學習材料的真實性應該體現在文本、參與者、社會文化情境、交際行為目的或是其中三者的結合上。
之后,McKay從基于內容和基于交互兩個方面對學習材料可靠性的定義進行了補充:基于內容是指可靠的語言學習材料是為特定的學習群體設計的,具有教學目的;交互性方面表明,這種可靠的語言學習材料的目的是訓練學生為課堂外的實際語言交流做準備[6](McKay, 2013)。
根據Pinner在這方面的觀點,“可靠性是一個重要的概念,它可以賦予學習者和教師權力,因為可靠性將學習者個體與用于學習的內容連接了起來”[7](Pinner,2015)。因此,雖然關于可靠性和可靠的學習資料的爭議尚未統一,但其重要性不容忽視。本文通過對高考英語試卷進行語料庫研究,分析其中的高頻詞匯、詞性和語義域,與上述的對可靠的學習資料的定義進行對比驗證來研究高考英語試卷作為英語學習材料模板的可靠性。
“關鍵度”的概念在20世紀90年代中后期被引入,而進行關鍵度分析的程序首先被納入Wordsmith工具中?!瓣P鍵詞”一詞通常用于描述語境中重要的詞語,但在語言學領域對其的定義與此不同。Scott將“關鍵詞”的概念定義為“與某種參考語料庫相比,在給定文本中出現頻率異常的詞”[8](Scott, 1997),這表明對關鍵詞的研究主要集中在文本特征上。Scott的目的是在語料庫中建立能夠代表特定社會意義的詞匯,并將它們以具有文化意義的方式組合在一起。因此,這里的關鍵詞被定義為,“一個在給定的文本或一組文本中,體現出重要性的高質量單詞,它們反映了文本的真正含義?!?/p>
需要明確的是,在關鍵詞分析中,詞語并不是唯一可以進行分析的語言單位。頻率比較也可以在其他類型的語言單位中進行,特別是當語料庫已經標注了語法、句法或語義類別時。
對關鍵詞進行分析雖然可以體現文本特征,找出目標語料庫中突出的詞項,但存在一定的現實局限性。其中一個被Baker證實為過度關注詞匯而導致的。他指出,關鍵詞分析只關注詞匯差異,而不是語義、語法或功能差異是有缺陷的。他進一步聲稱,有些詞可能在較低的頻率下產生了足夠的影響,但由于它們沒有被包括在關鍵詞列表中,因此會被忽略[9](Baker, 2006)。例如,在對莎士比亞的《羅密歐與朱麗葉》中六個人物的說話方式進行分析時就出現了類似的情況,將每個人物的說話方式與同一部戲劇中的另外五個人物進行對比,預期的結果能夠體現出每個人物的不同風格。然而,對比關鍵詞列表和關鍵詞性列表的結果,似乎有一些關于角色風格的重要特征被忽視了。因此,將關鍵詞分析擴展到詞性或語義范疇,可以為理解特定的語言使用提供有用的信息,反映語料庫中的文本更傾向于哪些語義領域。
本文自建的“高考英語試卷”語料庫由2015年至2019年的高考英語試卷組成。在這五年中,每年全國范圍內的高考英語試卷共8個版本。包括:全國卷1、全國卷2、全國卷3、北京卷、天津卷、上海卷、江蘇卷和浙江卷。在這8個版本中,上海卷的題型和考點都與其他7個版本有所不同,因此從研究對象中被剔除。對剩余的7個不同版本的試卷作為一個整體進行分析,高考的英語考試有9個類型的問題,包括:聽力、單項選擇、完形填空、閱讀、改錯、語法填空(根據上下文,使用所給單詞的正確語法形式填空)、情境填空(根據上下文,在7個句子中選擇5個正確的句子填在文中空處)、寫作和口語。
在對這些不同類型的問題進行文本選擇的過程中,需要注意3點:第一,在寫作部分,這些試卷中都是用中文描述寫作要求的,所以寫作部分不能包含在語料庫中。第二,由于高考英語的口語考試是按照教育部的規定由各地區設計的,因此也由于缺乏普遍性而被從研究對象中剔除。第三,在過去的五年里,江蘇卷的聽力部分與全國卷1和全國卷2是完全相同的,并且浙江卷從2017年增加了聽力這一題型后,也使用相同的聽力材料和問題測試學生的聽力水平。因此,在7個版本的高考試卷中只有3個版本的聽力部分:全國卷1、全國卷3和北京卷。然而,從2018年起,北京不再將聽力納入考試范圍,在過去5年中,北京的聽力部分只有3年。這使得北京的聽力測試與其他兩個版本的聽力測試相比變得沒有參考價值。因此,本語料庫僅以全國卷1和全國卷3,近五年來的聽力測試為例。語料庫中的聽力部分包括聽力材料和問題。
按照上述標準收集文本后,建立起的語料庫組成表如下:
這個語料庫總共有113,667個文本,上面的表格給出了文本在3種分類方式下的分布情況。從表3.1中可以看出,該語料庫主要由完形填空、聽力和閱讀組成。尤其是閱讀部分,一般由4篇文章及相關問題組成,占整個語料庫的一半以上。雖然各題型所占比例不夠平均,但對研究目的沒有影響。表3.2和表3.3分別按照年份和地區對文本進行分類,在這兩種分類下文本較為平均,這意味著每個地區近五年的高考英語試卷都是具有研究價值的。因此,這是一個平衡的語料庫。

表3.1 根據題型 語料庫文本分布情況

表3.2 根據年份 語料庫文本分布情況

表3.3 根據地區 語料庫文本分布情況
Wmatrix是由英國蘭開斯特大學語料庫研究中心開發的用于語料庫分析的工具。它是一個基于網絡,可以通過密碼訪問的工具。與其他語料庫分析工具一樣,它具有生成頻率列表和索引的功能。本文使用Wmatrix4進行語料庫分析,它的獨特之處在于它的“標簽向導”功能。利用嵌入式工具CLAWS(the Constituent Likelihood Automatic Word-tagging System)和USAS (UCREL Semantic Annotation System),Wmatrix4能夠分別根據語法詞性和語義類別對語料庫進行標記。它的語義賦碼集以《朗文多功能分類詞典》為基礎,包括“情感”“糧食與農業”“政府與公眾”“建筑與房屋”“教育”“時間”等21個語義域。這些語義域還可以再細分為232個子語義域,并分別進行標注。
本研究使用Wmatrix4對“高考英語試卷”語料庫進行分析,生成單詞、詞性和語義域的頻率列表。這些結果將表明高考英語試卷的內容主要由哪類詞匯構成以及更傾向于哪種主題。
從高頻詞表(見表4.1)可以看出,語料庫中出現頻率最高的是定冠詞“the”和不定冠詞“a”。單詞“a”也被廣泛地用來表示單數。緊接其后的是介詞和連詞,如“to”“And”“of”“in”“for”“with”和“on”。這種情況是可以預料到的,因為它們是組成句子的重要元素。此外,“that”和“what”出現的頻率很高,說明高考英語試卷中包含了很多疑問句和從句。
為了更深入地分析語料庫中的文本,擴展到詞性范疇對語料庫進行分析。與在高頻詞表中觀察到的一些結果符合(見表4.2),如“AT”類中的“the”“AT1”類中的“a”“to”類中的“to”“CC”類中的“in”等。此外,還在高頻詞性列表中發現了一些新的信息。雖然在20個最常見的單詞列表中沒有常見的名詞或動詞,但它們在整個語料庫中出現的頻率很高。尤其是“NN1”這一常見單數名詞在榜單中出現頻率最高。與名詞相關的還有“NN2”,代表普通名詞的復數形式。

表4.2 高頻詞性列表(前10)
在“NN1”和“NN2”的列表中,有很多高頻詞匯可以描述學生的生活,如:“school”“family”“book”“home”“children”“student”“kids”等。這些名詞出現的頻率高,說明高考英語考慮到考生的身份,更傾向于選擇他們比較熟悉的話題。以“school”這個詞為例。(見例證1)與“school”相關的句子描述了學校生活或與學校有關的成長經歷。這些東西對學生來說很熟悉,可以使他們更容易理解文章和問題,并對材料做出反饋。這符合Widdowson對優秀的學習材料的觀點。另一個高頻詞“author”也值得注意。例證表明(見例證1),作者的態度、目的、傾向、理解和思維都被問及,這意味著高考對學生英語學習的要求不僅是詞匯和語法的掌握,還包括理解文章深層面的語用能力。高考英語希望學生具有以英語為母語般的思維能力。這樣的能力是為他們將來在真實的語言環境中所準備的。這一點與Gilmore對“可靠學習材料”的定義是一致的,即擁有“像目標語言群體一樣行為或思考的能力”。

例1 “NN1”和“NN2”中高頻詞的頻率及例證
結合題型,與動詞詞性相關的高頻率也說明,正確使用動詞和組織從句的能力也很重要。這說明高考英語的目標是培養學生能夠在不同的真實語言環境中正確使用英語。這種能力需要學生能夠組織出更優美、更地道的句子,在語法和句子結構上接近母語標準。而不是簡單的只有主語、謂語、賓語的句子。
分析進行到語義域的范疇時,可以通過高頻語義域列表來確定高考英語更傾向的語義。(見表4.3)

表4.3 高頻語義域列表(前20)

9 A9+(Getting and possession) 1 257 19 A2.2(CAUSE & Effect/Connection) 667 10 T1.3(Time:Period) 1 245 20 A2.1+(Change) 660
從“P1”(Education in general)的高頻率,可以看出高考英語試卷在本質上是教育性質的?!癙1”中出現的高頻詞匯,如“students”“school”“study”和“college”,進一步說明選擇的文本可以使學生更好地做出反饋。
此 外, 從“Q2.2”(Speech acts) 和“Q2.1”(Speech:Communicative)的高頻率可以看出高考英語試卷中使用英語作為交流媒介的思維?!癚2.2”和“Q2.1”是由多種表達形式組成的,如:“tell”“report”“explain”和“advice”。學會使用這些詞,學生可以在英語語言環境中進行交際行為,表達自己的觀點。
本文通過對自建語料庫“高考英語試卷”的分析,驗證了高考英語試卷作為英語學習材料模板的可靠性。分析結果表明,高考英語注重英語的正確性和實用性。它的目的是幫助學生掌握英語,為真實的語言環境做準備,使他們盡量能用英語進行母語水平的交流,并得到母語者的認可。因此,高考英語試卷的確是學生學習地道英語的一個很好的榜樣,它也為學生學習地道英語指明了正確有效的方向。以高考英語試卷為模板設計英語學習材料,可以培養學生用專業詞匯和正確語法構建句子的能力。更重要的是能激發學生學習英語的興趣。因此,在學習和教學過程中,學生和教師都應該更加注意語法的使用和從句的組織。更多的口語練習是必要的,而不僅僅練習在寫作中使用英語。
最后,雖然本文驗證了高考英語試卷作為英語學習材料模板的可靠性,但仍存在一定的局限性。本文將除上海以外所有地區的高考英語試卷作為一個整體分析,盡管這些地區之間的差異沒有與上海之間的差異那么大,但這些地區之間的試卷仍存在一定的差異。因此,我們可以進一步研究不同地區的高考英語試卷在可靠性上的差異,這將有助于高考英語的改革。