吳穎周 焦芳寧 黃瑩
目前國內大學中的英語教學是我國高等教育的一個重要組成部分,肩負著為國家培養大批優秀國際型人才的重任。 目前我國正在推進高校英語教學改革,大學英語教材的出版呈現欣欣向榮的局面,教材不論在設計還是出版上都更為嚴格。 雖然現在在用的高校英語專業教材在編寫手法和文體選材上都有所完善和進步,但仍存在內容更新不及時、文本難度層次性不鮮明等問題。 因此,文章選用《現代大學英語》精讀系列為研究對象,擬對其詞匯語法特征銜接性進行基于語料庫的多維分析,評估該系列教材內容的漸進性特征,為英語專業教材的編撰和修訂提供必要的借鑒,為高校英語學習者對于教材選取和使用提供必要的參考。
多維度/多特征分析法(MD/MF model) 是由Douglas Biber 在1988 年正式提出的,該方法以語料庫和計算機為基礎。 基于LLC(London Lund Corpus)英語口語語料庫和LOB(Lancaster-Oslo-Bergen)英語書面語語料庫,Biber 從67 個語言特征出發分析口語和書面語中這些特征的分布狀況和共現模式,繼而對不同的文本進行對比分析。 使用多維度分析方法應遵循如下步驟:首先基于語料庫,統計出67 個特征在各語篇文本中的頻數,折算成每千詞標準化頻率;然后結合因子分析法對所得到的數據進行分析,根據67 個語言特征在相應語域中的共現情況計算出“維度”(dimension),比較維度分數的變化或差異,可以得到相關結果。 Biber 一共確定了6 個語言維度,分別是:維度1“交互性/信息產出”;維度2“敘述性/非敘述性文體”;維度3“所指明確/所指有賴情景”;維度4“顯性勸說”;維度5“抽象/非抽象語體”;維度6“實時信息精細度”。 每一個維度分別包括一組語言特征,一般包括正特征與負特征,每個語篇的維度分等于該維度內正特征與負特征的因子分之差。 該研究模型是現如今涉及語言特征最多、分類最細致的研究語域變異的方法,結合定量與定性研究,基于統計分析,可被用于多領域的語料差異對比。 因此,文章擬通過多維度/多特征分析法對目標教材的文本銜接性進行基于語料庫的分析。
本研究選取《現代大學英語 精讀》第二版的第一、二、三冊內的部分課文內容作為語料庫文本。 該系列教材的設計初衷是為了滿足英語專業的教學需求以及培養比較高級的外語類人才。 在編寫過程中,編者也考慮到了課文安排前后次序的合理問題以及難度梯度的承接問題,因此第二版教材較第一版做了較大調整。 編者強調,該系列教材的選取比較偏向文學題材,因為文學類作品語言現象豐富,基本詞匯、常用短語多,句子形式也多樣,對學生理解和欣賞能力的提高有很大幫助。 正是因為這些突出的特征,加上其廣泛的影響力,精讀系列很適合被選用做多維分析的語料。考慮到研究目的是為了評估教材的文體特征發展水平,故僅選取連續的部分文本作為研究對象,若沒有發現顯著性差異,則再進行整體探究。 基于此設計初衷,文章從《現代大學英語 精讀》第二版的第一、二、三冊中共選取56 個文本,組成了精讀1 和精讀2、精讀3 Text A 和精讀3 Text B 兩個對比語料庫A 和B。
本研究采用的是Nini(2014)開發的多維標注與分析工具Multidimensional Analysis Tagger 1.1(MAT),已證實借助該工具可以實現Biber 提出的多維度/多特征分析過程。 通過MAT 內置的“斯坦福詞性賦碼器”(Stanford POS Tagger),完全可以進行標注詞語詞性、提取語言特征、計算因子分數等一系列多維/多特征分析所需步驟,通過自動化操作提升了語料庫文本分析的效率且保證了結果的精確性。
本研究利用多維標注與分析工具MAT 處理語料庫數據,基于6 個維度和67 個詳細語言特征的數據結果進行獨立樣本t 檢驗,考察目標語料間是否存在維度和特征差異。 若存在顯著差異,則可針對特定的指標提出相應的建議;若不存在顯著差異,則證明該系列教材確實符合設計初衷。
語料庫A 內的文本選自《現代大學英語 精讀》第二版,全部是來自第一、二冊的Text A 部分。 首先,在進行獨立樣本t 檢驗前,先對MAT 工具所得的維度分進行正態檢驗,結果顯示顯著性均大于0.05(見表1),符合正態分布,適合進行獨立樣本t 檢驗。

表1 基于語料庫A 的正態性檢驗

續表
隨后,對語料庫A 所得的維度得分進行獨立樣本t 檢驗,結果均顯示p>0.05(表2),表明精讀1、2 的Text A 部分在6 個維度上并沒有存在顯著性差異,即教材文本的難度設置比較均衡,在一二冊上沒有突顯很大的難度階梯。
在結束6 個維度的獨立樣本t 檢驗后,本研究還對67 個語言特征的MAT 數據進行了顯著性差異分析,便于進行數據結果的細化處理。 同上述操作步驟,本研究首先選取符合正態性檢驗p>0.05 的特征進行獨立樣本t 檢驗操作。 按照表3 匯總的檢驗數據,語料庫A 中的文本在“AWL(詞長)”“CAUS(因果狀語從句)”“FPP1(第一人稱代詞)”“NN(名詞)”“PEAS(完成體)”“SUAV(勸說動詞)”“VBD(過去式)”特征中表現出顯著性差異。 雖然在6 個維度層面沒有表現出得分的顯著性差異,但是在細化的語言特征上仍舊展現了部分不同,說明教材的一二冊Text A 系列整體的難度銜接性較為均衡,在課文內容選擇上仍有部分特征指標可以納入考慮范圍。

表3 基于語料庫A 特征得分的獨立樣本t 檢驗

續表
語料庫B 內的文本選自《現代大學英語 精讀》第二版,全部是來自第三冊的Text A、Text B 部分。 首先,在進行獨立樣本t 檢驗前,先對MAT 工具所得的維度分進行正態檢驗,“K-S”結果sig.均大于0.05,服從正態分布,適合進行獨立樣本t 檢驗。 據表4 結果顯示,教材第三冊Text A 和Text B 在維度2 所得p=0.014<0.05,因此存在顯著性差異。 維度2 是敘事性和非敘事性的對立,此項低分數則表明文本是非敘事性的,而高分表明文本是敘事性的,比如小說就是典型的敘事性文體。 綜上所述,同一冊教材同一單元內的Text A 和Text B 在“敘事性”這一維度上存在顯著性差異,其余表現則比較均衡。

表4 基于語料庫B 維度得分的獨立樣本t 檢驗
同樣,本研究對語料庫B 內文本的語言特征也進行了獨立樣本t 檢驗。 在滿足正態性檢驗的基礎上,通過獨立樣本t 檢驗篩選出5 個存在顯著性差異的特征,分別是“CAUS(因果狀語從句)”“DWNT(弱化詞)”“PIT(it、its、itself)”“PROD(主動詞do)”“STPR(滯留介詞)”,說明第三冊課文A、B 部分的選取仍有部分特征指標可以納入考量。

表5 基于語料庫B 特征得分的獨立樣本t 檢驗
研究結果表明,《現代大學英語精讀》(第二版)系列教材在Text A 部分的難度銜接性上基本不存在“交互性/信息產出”“敘述性/非敘述性文體”“所指明確/所指有賴情景”“顯性勸說”“抽象/非抽象語體”“實時信息精細度”這六個維度上的顯著性差異,但仍舊可以在編寫時將詞長、因果狀語從句、第一人稱代詞、名詞、完成體、勸說動詞和過去式這幾個常見語言特征的文本表現納入選擇課文的標準之中。
除此以外,同一冊教材的Text A 和Text B 部分難度銜接性也比較均衡,基本沒有特別突出的差別,只在“敘述性/非敘述性文體”該維度上存在顯著性差異,說明Text A 和Text B 的選文題材有所不同,但正好作為兩個板塊供學生學習。 在此基礎上,兩個板塊選文的難度差異集中體現在因果狀語從句、弱化詞、代詞it/its/itself、主動詞do、滯留介詞這幾個語言特征指標上,會對學生的階段性學習體驗有所影響。
整體來看,《現代大學英語精讀》(第二版)在教材文本難度的銜接性上有所完善且較為連貫,基本沒有難度特別突出的選文,適宜學生用于階段性學習。而且Text A 和Text B 部分的選文題材具有顯著差異,證明這兩個板塊的內容確實有所區分,能夠滿足學生的多元化學習需求。 雖然總體表現較好,但選文部分在某些語言特征指標上仍具有顯著性差異,編者在進行版本更新時可以多加考慮該方面的問題,從而使教材更具市場競爭力。