麥春萍 張曉鵬
(北方民族大學外國語學院 寧夏·銀川 750021)
在過去二十年中,學界對第二語言學術寫作質量與句法復雜性之間的關系進行大量深入的研究,發現句法復雜性與二語寫作質量密切相關(Crossley et al.,2016ab,Cumming et al.,2005,2006;Grant&Ginther 2000;Kim&Crossley,2016,2018;Schoonen et al.2011;V gelin et al.2019)。隨著語料庫語言學的不斷發展,語言學家指出,語言主要由語法化的詞匯組成(Lewis,1993)。按習語原則,語言使用者傾向查出大量預制短語或固定搭配,這些短語和搭配構成了語言產出中的單一選擇。換言之,無論是口語還是書面語,人們的語言使用包含了大量的N元詞組短語,例如習語、搭配、預制詞組等。考察N元詞組短語在語言發展中的作用,尤其是對第二語言寫作質量的影響具有重要的意義。Coxhead&Byrd(2007)建議,在二語學術寫作教學需要重點關注N元詞組短語的使用上,并進一步指出二語學習者使用N元詞組短語是提高語言產出流利的主要因素。然而,少有研究考察N元詞組短語如何影響二語寫作質量,目前僅有Garner et al.(2019)考察了N元詞組短語的頻率和連接強度對韓國英語學習者英語議論文寫作質量的影響,發現關于N元詞組頻率和連接強度可有效預測二語寫作質量。鑒于此,本研究試圖考察N元詞組短語與中國英語學習者英語實用文體寫作質量之間的關系。
N元詞組包括詞塊、搭配、預制詞組等?;谑褂玫恼Z言學習理論認為,N元詞組的使用頻率和其構成詞之間的關聯強度是語言使用是否地道的兩個計量指標。日常使用的較高頻率的N元詞組更有可能被存整體儲存,在語言產出中會降低提取難度。N元詞組的連接強度是其組成成分之間共現概率的量化,可反映語言使用自然地道的程度。學界常采用互信息(MI值)和t值量化N元詞組的連接強度(Ellis,Simpson-Vlach,&Maynard,2008;Ellis&Simpson-Vlach,2009;Evert,2004,2009)。MI可有效衡量由低頻詞組成的N元詞組的連接強度,而t值可有效衡量由高頻詞組成的N元詞組。Hsu(2007)發現中國英語學習者議論文寫作質量與N元詞組頻率呈正相關。Granger&Bestgen(2014)發現中級二語言學習者傾向于使用t值較高的N元詞組,而高級二語學習者傾向于使用MI值高的N元詞組,他們還發現二元組的MI值與二語寫作質量之間呈正相關。Garneretal.(2019)也指出,N元詞組的使用頻率和關聯強度可有效預測韓語英語學習者議論文的寫作質量,即得分較高的論文包含了更多連接強度更高的二元組和三元組。盡管現有的研究很大程度上提升了我們對N元詞組與語言使用關系的認識,尤其是對書面語產出的影響,但此類研究數量有限,并且主要囿于對二語議論文寫作質量的考察。到目前為止,鮮有研究考察N元詞組的頻率和聯想強度測度與其他文體寫作質量的關系。不同體裁的文本語言特征不同,因此很有必要分析其他文體中N元詞組的使用與寫作質量有何關系。
本研究回答以下兩個研究問題:N元詞組使用頻率在多大程度上可預測二語實用文體的寫作質量?N元詞組關聯強度在多大程度上可預測二語實用文體的寫作質量?
本研究抽取中國大學二年級、三年級學生限時作文50篇(見表1),文本為求職信,是一種常用的實用文體。被試用300單詞完成寫作任務。所有文本由研究者進行評分,總分10制,其中內容占60%,語言使用占40%。

表1:二語實用文體寫作文本描述性統計
研究采用自然語言處理軟件TAALES 2.0來分析目標文本(Kyle&Crossley,2015)。提取了每篇文本中所有N元詞組的使用頻率和聯系強度。所有頻率和連接強度指標值來自英語本族語COCA語料庫(Davies,2009)。使用目標語N元詞組使用參數可有效檢測二語文本中N元詞組使用特征。
本研究采用COCA學術子庫中出現的二元組和三元組的原始頻率和對數頻率。以往研究顯示,高水平的二語寫作者傾向于使用頻率較低的單詞和N元詞組,N元詞組頻率與二語詞匯水平顯著相關(Garner et al.,2019)。
本研究采用COCA學術子庫中出現的二元組和三元組的t值、MI值和P值。前兩者是對N元詞組中單詞之間雙向關聯關系的度量指標,后者是對N元詞組中單詞之間單向關聯關系(右向)的度量指標。此三類指標衡量第一個詞和后兩個詞的連接強度。以往研究顯示,此兩類指標與二語詞匯水平顯著相關(Granger&Bestgen,2014)。
首先,研究對N元詞組頻率和連接強度指標與使用文體寫作質量進行Pearson相關分析,檢驗此類指標是否與文本寫作質量顯著相關。其次,使用逐步回歸模型分析N元詞組頻率和連接強度指標對文本寫作質量的預測效應,然后使用5折驗證檢驗回歸模型的可靠程度。
在4個頻率指標與實用文體寫作得分顯著相關(見表2),說明寫作質量較高的文本包含更多實用頻率更低的 N元詞組。由于二元組和三元組對數頻率和原始頻率存在貢獻文體,逐步回歸分析中只包含與寫作質量相關系數最高的兩類對數指標。逐步回歸結果顯示,二元組和三元組頻率對數可有效預測應用文寫作質量差異的14%(r=.37,R2=.137)(見表3)。5折驗證結果顯示,該模型可以解釋應用文寫作質量差異的13.4%差異(r=.366,R2=.134),說明此模型可靠。

表2:N元詞組頻率與寫作質量相關系數

表3:N元詞組頻率與寫作質量相關系數
在4個N元詞組關聯強度指標中,二元組連接強度(MI值)、三元組連接強度(MI值)和三元組連接強度(t值)與使用文體寫作得分顯著相關(見表3),說明寫作質量較高的文本傾向于包含更多由低頻率詞構成的 N元詞組和右向關聯度高的 N元詞組。這5類與寫作質量顯著相關的指標不存在共線關系,因此均參與到逐步回歸分析,結果顯示二元組連接強度(MI值)和三元組連接強度(t值)可有效解釋約8%的寫作質量差異(r=.276,R2=.09)。5折驗證結果顯示,該模型可以解釋應用文寫作質量差異的9%差異(r=.30,R2=.09),說明此模型可靠。
本研究初步考察了N元詞組與中國大學生英語實用文體寫作質量的關系。結果如下:第一,二元組和三元組對數頻率和原始頻率與寫作質量顯著負相關,二元組和三元組頻率對數可預測應用文寫作質量差異的14%;第二,二元組MI值、三元組MI值、三元t值與使用文體寫作得分顯著相關,二元組MI值和三元組t值可解釋8%的寫作得分差異量。
第一個研究問題考察N元詞組頻率在多大程度上可以預測二語應用文寫作質量。研究發現,二元組和三元組原始頻率和對數頻率與寫作質量呈負相關。該結果與已有發現相同,N元詞組頻率反映了其在日常語言產出中使用的多寡,使用頻率高的N元詞組頻率容易接受,難度相對較低,反之使用頻率低的N元詞組頻率,難度較大,容易被用在學術語篇,適合比較正式的體裁(Bestgen&Granger,2014;Durrant&Schmitt,2009;Groom,2009)。本研究中寫作任務需要學習者描述求職的緣由,自己的條件、特長、求職目標。將自己的基本信息、教育背景和工作經歷做一個簡單的介紹,描述自己的求職目標,職業發展等。文本所需較多的學術詞匯才能達成交際意愿。因此,評分員對文本質量的考察較多關注詞匯使用是否適合目標文體。頻率較低的N元詞組正好偏向學術化語言,適合應用文的學術文體?;貧w分析顯示,二元組和三元組頻率對數可有效預測應用文寫作質量差異的14%,就詞匯和短語層面,N元詞組頻率是影響應用文寫作質量的首要因素。
第二個研究問題考察N元詞組連接強度與二語應用文寫作質量的關系。研究發現,二元組MI值、三元組MI值、三元組t值與使用文體寫作得分顯著正相關,說明得分較高的文本傾向于包含由低頻詞構成的二元組和三元組,包含較多右向關聯度高的二元組和三元組。關聯強度越高說明詞匯共現的概率越大,常被作為固定詞塊使用的機會就越高,可反應語言使用的地道程度。該發現與上述N元詞組頻率的作用一致,MI值較高的N元詞組傾向于包含頻率較高的詞匯(Gablasova,Brezina,&McEnery,2017;Garner,Crossley,&Kyle,2018)。多元回歸結果顯示,二元組連接強度(MI值)和三元組連接強度(t值)可有效解釋9%的寫作得分差異量,說明評分員對文本質量的考察較多關注N元詞組中詞匯共現概率的高低,使用的地道性是對寫作質量影響的重要標準,這與Garneretal.(2019)的發現基本一致,得分較高的文本中N元詞組的MI值較高,含更高級的詞匯。本研究含發現,三元組t值與寫作質量存在正相關關系,有效預測寫作得分2%的差異量,說明寫作得分較高的文本傾向于包含較多的由高頻詞構成的三元組。綜合回歸分析顯示,就頻率和關聯強度對寫作質量的預測而言,評分員主要關注的是頻率作用,因為頻率可直接反應N元詞組使用的多寡,是否適合目標文本文體的語言要求。
本研究考察了N元詞組與二語應用文寫作質量之間的關系。結果表明,二元組和三元組對數頻率和原始頻率與寫作質量顯著負相關,可有效預測應用文寫作質量差異的14%;二元組MI值、三元組MI值三元組t值與使用文體寫作得分顯著相關,可有效解釋9%的寫作得分差異量。上述結果顯示,N元詞組頻率和關聯強度是影響二語應用文寫作質量的重要指標。今后的研究還可以考察N元詞組使用與其他變量(如句法復雜性等)對其他不同文體(如記敘文等)寫作質量的影響,借此全面評估N元詞組對語言產出的影響效應。