(華東理工大學外國語學院,上海 201424)
預制語塊的概念首先由Becker(1975)于20世紀70年代中期提出。他認為語言的記憶和存儲、輸出和使用并不是以單個的詞為單位,那些固定和半固定的模式化了的語塊結構才是人類語言交際的最小單位。因此預制語塊現在多被認為是一種由兩個或兩個以上的單詞組成,兼具語法與詞匯雙重特征,且具有一定的穩定性和約定俗成性的多次詞匯現象。在國外,對于預制語塊的研究自上世紀70年代中期已經展開了。在國內,預制語塊則是在上世紀末開始得到國內學者的重視并開始逐步展開研究。近年來,預制語塊的教學與學習策略是國內二語語塊研究的一大熱點。一些研究者采用實證研究的方法驗證語塊教學與學習的有效性,如肖武云(2011)以非英語專業學生作為實驗對象,結果發現語塊教學能顯著提高實驗班學生的英語口筆語表達能力。然而現今國內學者在語塊教學與學習策略上的實證研究也存在突出問題,如研究結果以描述現象為主,且大多基于產出的語塊出現頻率的統計,缺少對語塊使用特征的深入剖析。而本文則在證明語塊運用對于外語寫作能力的正相關性的基礎上,深入探討我國外語學習者在寫作學習中預制語塊的使用特征,以期能抓住我國外語學習者在語言運用方面的問題,從而對現今外語學習者的預制語塊學習策略提出有益的意見。
本文采取雅思寫作Task1和Task2作為研究對象。相關資料可從雅思考試中文官方網站、劍橋大學出版社出版的《IELTS》叢書等處獲取。所選取的研究材料及評分均由雅思官方所提供,具有權威性、代表性和新鮮度。本文所構建語料庫含文本80篇,平均每篇約為200詞左右,總詞數達到了16139個。
本文所選用的語料庫檢索軟件為AntConc,是近年來相關學者進行語塊研究所廣泛采用的免費綠色軟件。為了驗證 AntConc檢索結果的可信度, 王春艷(2009)曾使用AntConc對一組介詞 (38個)在語料庫Brown中進行了檢索, 其結果和語料庫語言學界公認的權威軟件Wordsmith 4.0的檢索結果進行對比, 統計計算得到二者相關值為1.00,這表明兩個軟件的檢索結果在0.01的水平上達到了顯著相關。進而可以論斷AntConc的檢索結果可以信賴。本文所使用的軟件版本為AntConc 3.5.0。
本文所選用的統計分析軟件為SPSS。SPSS作為IBM公司旗下的一款重要的商務型統計分析軟件,近年來在語料庫語言學學者對于語塊運用和外語聽、說、讀、寫、譯能力的相關性研究上被廣泛應用。本文所使用的軟件版本為SPSS 19.0。
本文研究根據語言學對語塊的定義,參考以往文獻中的提取標準,將標準頻數為2詞≥20詞/每萬詞,3詞≥ 10詞/每萬詞,4-6詞≥ 5詞/每萬詞。語塊的提取采取軟件檢索和人工標識相結合的方法。具體的研究步驟如下:

表1 圖表書信類作文和議論型作文各分段詞頻統計

表2 按性質分類的語塊分布

表3 按長度分類的語塊分布
(1)將素材按分數段分為<5、5~5.5、6~6.5、7~7.5、≥8這5個相互對照的組分。
(2)利用軟件AntConc 3.5.0將語料庫中所有符合頻率要求的詞語序列提取出來。
(3)進行人工過濾,剔除軟件無法分辨的非語塊類詞語組合。例如Too many people are addicted to smoking, leading to a sharp rise in lung cancer. 按照前文的提取標準,該句中的too…to…會被計算機識別為語塊,然而事實并非如此。
(4)按組對檢索結果進行統計整理,并用SPSS 19.0進行相關性分析。
為了便于進行統計分析,本文規定每100個單詞中出現的預制語塊個數為詞頻,單位為“個/100詞”。
語塊標識完畢,從標識結果中我們可分別計算得到圖表書信類作文(Task1)和議論型作文(Task2)中不同分段的詞頻,整理結果如表1:
為使兩類作文中不同分段的詞頻變化趨勢看上去更為直觀,將以上數據制成折線圖如圖1所示:
從上述統計數據及圖表,不難看出無論是Task1圖表或書信類作文,還是Task2議論型作文,其作文分數均隨著預制語塊使用頻數的增加而呈現明顯的上升態勢。
兩類作文中分數與預制語塊的詞頻的相關性分析結果如圖2,圖3。
從上述分析結果可知兩類作文分數與預制語塊的詞頻在0.05水平(雙側)有顯著的相關性。進而可以推斷出,預制語塊的使用有效提升了外語學習者的寫作水平。
現在國際上對于預制語塊的分類依舊沒有一個統一的標準。而本項研究則采取目前國內應用最為廣泛的Nattinger和DeCarrieo(1992)的四類分類法:1)多元詞語塊(Polywords),指功能像單個詞項的短語.具有典型的英語結構特征,如“動詞+名詞”、“介詞+名詞”、“名詞+介詞短語”、“副詞+形容詞”等。作為語篇銜接的形式,它們不僅在理解上而且在書寫時都作為像單詞一樣的整體形式來看待,形式不能改變,例如for the most past, in a nutshell, by the way等;2)習俗語語塊(Institutionalized expressions),主要指說話中可以用來整體儲存的語言組塊,包括諺語、警句、交際套用語等形式,通常用作獨立話語,例如a watched pot never boils, the public seldom forgives twice, how do you do等;3)短語架構語塊(Phrasal constraints)。這類詞匯短語允許有詞及詞組范疇的變化,是具有固定結構形式的框架式短語,人們可以根據需要替換相應的詞,通常是一些可以填空的不太長的詞塊。如A _(day/year/very long time) ago,to _(tie/wrap) this up,as I was _(saying/mentioning)等等;4)句子構建語塊(Sentence builders)。指為整個句子提供框架的詞匯短語。根據所需表達的思想內容填入形式可變化的短語和從句。例如I think (that) X, my point is that X,I’m a greater believer in X, 其中X為可變化的短語和從句。

圖1 圖表書信類作文和議論型作文各分段詞頻

圖2 圖表書信類作文分數與語塊數量相關性分析結果

圖3 議論型作文分數與語塊數量相關性分析結果
對四大類語塊進行分類統計,統計結果如表2:
而其中占比最高的預制語塊分別為in my opinion (1.49‰),in conclusion (1.12‰),on the other hand (0.97‰)。
從上述的統計結果我們不難發現,在四大類語塊中多詞語塊(Polywords)的詞頻占比最高,遠超其他三大類語塊,且其中多數為起承前啟后的銜接作用的語塊,同時占比最高的三個預制語塊也均屬上述之列。可見承上啟下的銜接詞為國內語言學習者運用預制語塊的主要場所。而習俗語語塊(Institutionalized expressions)的詞頻占比不僅為四大類語塊中最低的,且相較其他三大類語塊都有巨大的差距。拋開習俗語語塊中交際套用語由于寫作要求的因素而很少出現的原因之外,也能看出國內外語學習者對于國外諺語警句相關知識的匱乏。如果以本國的母語學習作聯想對比,我們不難發現在語文寫作中,引用諺語警句等習俗語語塊是十分常見的舉動。換句話說,諺語警句等習俗語語塊在增強語言的地道性和表現力上起著錦上添花的重要作用。雖然相較其他類型的語塊,習俗語語塊并非缺之不可,但是應用得當則會起到畫龍點睛的作用。所以,在身居象牙塔之外,接地氣地適度了解外國文化熟悉經典的名言警語,對于廣大的外語學習者,尤其是那些對自身寫作有較高要求的外語學習者來說,是至關重要的。
按長度分類的語塊總體分布如表3所示。
從表3中可以看出,不同長度語塊的分布總體上符合正態趨勢,即語塊的數量與語塊的長度呈反比,隨著語塊的長度增加,語塊數量總體上呈下降趨勢;同時,伴隨著語塊長度的上升和數量的下降,語塊的種類總體上也呈下降趨勢。語塊運用的這個特點基本支持了以前的研究發現:在標準頻數相同的情況下,語塊的長度越長,出現的種類和使用的總頻數就會越少(De Cock et al 1998:78;Biber et al 1999:69)。
如果進一步分析可發現,各長度語塊的種類之比與其數量之比之間存在不小差異。這說明對于不同長度的語塊,其重復運用的概率不同。其中尤以2詞,3詞的重復使用率最高。這在某種程度上反映出了我國英語學習者偏重于單個詞匯的記憶,而缺乏對整體語塊的學習記憶的特征。再對各分段作文中語塊重復使用的規律進行分析,發現在低分段作文中同個語塊重復使用的現象十分頻繁,例如在表述觀點時重復使用my point is that X這樣的句子構建語塊(Sentence builders)等;不過隨著作文分數的提高,語塊的重復使用現象大體上呈現減少趨勢。特定某個或者某種類型語塊的過度重復使用,是外語學習者語塊掌握能力低下的表現;反之,語塊的重復運用越少,某種程度上可以認為學習者對于語塊的掌握量越多,掌握程度高。語塊的重復使用現象隨著作文分數的提高而減少從側面證明了寫作能力與語塊的掌握程度呈正相關。
在外語學習尤其是寫作學習的過程中,預制語塊的重要性不言而喻。單個詞匯的記憶固然是英語學習的基礎,但是在寫作這樣強調語言運用能力的載體上,預制語塊這樣的語法和詞匯有機結合體則是語言學習者的不二之選。對于語塊相關知識掌握較差的學習者,在寫作的學習與練習過程中當回避過度重復使用同一或同類型語塊的做法。如果外語學習者對于語塊運用有更高程度的追求,那么合理運用不同類型,不同長度的語塊可使句式段落看上去錯落有致,語意更加生動鮮明,結構更加連貫緊湊。
縱向對比同一分數段下圖表書信類作文和議論型作文的詞頻,我們可發現前者的詞頻相較后者平均少1.244個/100詞。對此現象進行分析,可以得出,圖表書信類作文與議論型作文相比對于語塊豐富度的要求較低。對于議論型作文,在闡釋觀點的過程中,語塊的豐富使用不論對于上下文的流利銜接還是明晰意義的表述或是對于增強觀點的說服力都有重要作用,對于增強語言的準確性、流利性和地道性有著無可比擬的作用。反觀圖表書信類作文,對于高難度詞匯或是復雜語句的要求并不高,而更加注重對圖表所表現信息的敏感捕捉以及分析所得結論的清晰簡潔的表述,語塊的應用除了必要的上下文銜接之外起的是畫龍點睛的作用。綜上,可知對于寫作能力的提升,盲目地追求語塊的豐富使用并非明智之舉,深入了解不同作文類型所暗含的對語塊的不同要求,對癥下藥才是關鍵所在。
另外,有部分外語學習者為了追求高難度的語句應用,常常以預制語塊為基礎(如以so that等連接詞引導復合句,或以in order that等詞塊引導從句)建構極長的語句,甚至不乏單句成段者,使語句意義十分晦澀難懂,語句的解讀費時費力。更有甚者單純為了展現自己的詞匯量或是避免用詞重復而強行塞入與上下文語境格格不入的語塊,以致破壞了文章整體的平衡感。事實上,寫作并不是簡單的語塊堆砌,語塊的應用亦不是單純地以數量多類型多見長。語塊的應用不僅要考慮所選語塊的質量和豐度,更要考慮語塊與上下文語境的相互適應。語塊應用得當自然是有錦上添花之妙,但濫用語塊又不免畫蛇添足之嫌。所以,廣大外語學習者在學習與應用語塊時切記關注語塊本身的語義韻以及與上下文的聯系,回避盲用窮用濫用語塊現象的做法。
本文以語料庫語言學的方法,采取了實證研究的方式在證明了語塊運用對于外語寫作能力提升的正相關性的基礎上,對部分英語學習者對于預制語塊的使用特征進行了歸納總結。但本研究仍存在以下幾點不足:(1)語料庫的文本數量還需補充。因為本文在探討語塊對于寫作能力的相關性時,所選取的統計對象是詞頻和作文分數。然而作文分數是由多方面因素決定的,為了削弱其他因素的影響,凸顯語塊的影響,則需要建立文本量較大的語料庫,力求在大數據中找到普遍的現象。(2)統計的方式還需改進。隨著語料庫容量的不斷增大,人工復查的工作量也將越來越大,且人工復查將不可避免地伴隨著遺漏和錯誤,如果基于語料庫語言學的基礎更進一步研究,就需要改進統計方式,提高計算機檢索的精準度,減少疏漏和錯誤。
[1]楊麗,王玲,熊可.國內近十五年二語語塊研究述評[J].雞西大學學報,2016,(9):84-87.
[2]章華霞.國內二語語塊研究十五年:回顧與展望[J].外國語言文學,2014,(4):240-246.
[3]文秋芳.應用語言學研究方法與論文寫作[M].北京:外語教學與研究出版社,2001:89-93.
[4]陳艷,趙倩倩.語塊習得與口語交際能力的相關性研究[J].山東外語教學,2010,(2):52-55.
[5]王春艷.免費綠色軟件 AntConc在外語教學和研究中的應用[J].外語電化教學,2009,(1):45-48.
[6]丁言仁,戚焱.詞塊運用與英語口語和寫作水平的相關性研究[J].解放軍外國語學院學報,2005,(3):49-53.
[7]王立非,張巖.基于語料庫的大學生英語議論文中的語塊使用模式研究[J].外語電化教學,2006,(4):36-41.
[8]王文宇,黃艷.語塊使用與口譯產出關系的實證研究[J].外語電化教學,2013,(4):28-34.
[9] Biber,D. et al. Longman Grammar of Spoken and Written English[M]. London:Person Education Limited,1999.
[10] De Cock,S. et al.An Automated Approach to the Phrasicon of EFL learners[A].In Granger,S.(ed.).Learner English on Computer[C].London:Longman,1998.