左葳岳
(寧波大學科學技術學院,浙江寧波 315300)
作為衡量英語學習成效的重要指標,寫作一直被視為英語教學的重中之重。雖然學生與教師在英語寫作方面投入了大量精力,但目前國內多數高校學生的英語寫作仍停留在較低水平。不少學生表示影響他們寫作的主要問題之一是 “無詞可用”,這表明學生除掌握基本語法結構和培養自身邏輯思辨能力外,還要加強詞匯積累、提升詞匯量。實際上詞匯是限制學生提升寫作水平的直接因素之一。Engber(1995)認為詞匯量與外語寫作相關性較強,譚曉晨(2006)也認為英語水平與產出性詞匯發展關系密切。對詞匯進行研究能夠促進二語習得的進一步發展,因此我們有必要對高校學生的英語寫作詞匯進行進一步研究。
目前二語寫作詞匯研究引起了國內外學者的廣泛關注,其中一個重要議題與詞匯豐富性有關,這一術語指語言使用者在產出言語過程中使用詞匯的豐富程度,它是衡量二語寫作水平的重要指標之一(Read,2000),具體包括詞匯變化性、詞匯密度、詞匯復雜性、詞匯錯誤等范疇。
國外關于詞匯豐富性的研究始于20世紀末。Linnarud(1986)比較中學生二語學習者與同年級母語學生作文后發現,學習者的詞匯變化性和詞匯錯誤與本族語者有顯著差異,本族語者作文明顯優于學習者。Engber對國際留學生的作文進行研究,結果發現詞匯變化性越強,寫作文本質量越高。Hyltenstam(1988)則認為詞匯密度與二語寫作質量之間相關性不強。Lu(2012)研究了詞匯豐富性和二語英語學習者口語文本質量之間的關系,結果發現詞匯密度與口語文本質量之間相關性不大,詞匯復雜性與口語文本質量呈弱相關,而詞匯變化性與文本質量相關性較強。
國內的英語寫作詞匯豐富性研究起步相對較晚。馬廣惠(1999)對133名非英語專業學生進行測試,結果發現詞匯表達能力是影響寫作能力的重要因素。萬麗芳(2010)對不同高校的英語專業學生進行研究,指出詞匯變化性與英語水平密切相關,詞匯復雜性不能以詞頻衡量,詞匯錯誤的數量隨寫作任務的復雜度增加。朱慧敏(2013)對30名英語專業學生進行了長達四年的跟蹤,發現高頻詞的使用隨著學習的深入逐步下降,同時高級詞匯的使用呈上升趨勢,平均詞長和寫作水平密切相關。此外,實驗發現詞匯密度不能有效反映詞匯發展水平,因為詞匯密度不能有效區分同一實詞在文本中的重復使用。何微微(2016)認為詞匯密度是測量實詞量的有效指標,實詞量隨文章長度的增長而增加,過低的實詞率會使文章難以理解。
當前關于英語寫作詞匯豐富性的研究呈上升趨勢,近年來隨著語料庫技術的興起,大部分研究者從語料庫視角展開詞匯研究(Laufer 1994;王立非 2007)。目前學界普遍認同詞匯錯誤與寫作難度密切相關,但對于詞匯變化性、詞匯密度、詞匯復雜性是否與寫作水平相關的討論仍然各執一詞。此外,除朱惠敏外,目前國內極少有人將詞長作為詞匯豐富性的指標進行研究。鑒于此,本研究將從詞匯變化性、詞匯密度、詞匯復雜性、詞長四個維度入手,對中國英語學習者的寫作詞匯豐富性進行研究。為分析二語寫作詞匯豐富性特征,我們還將對比學習者的寫作語料與本族語者的寫作文本。研究問題包括:
1.與本族語者相比,學習者的詞匯變化性是否存在顯著差異?
2.與本族語者相比,學習者的詞匯密度是否存在顯著差異?
3.與本族語者相比,學習者的詞匯復雜性是否存在顯著差異?
4.與本族語者相比,學習者是否傾向于使用長詞?
詞匯豐富性這一概念是基于二語寫作提出的,在這一背景下,前人已建立了多種理論框架,例如Laufer認為可以從詞匯變化性、詞匯密度、詞匯復雜性和詞匯新穎性四個角度考察詞匯豐富性;Engber又在此基礎上加入了詞匯錯誤這一概念;而Read認為詞匯新穎性不適合評估學習者的詞匯能力,因為詞匯新穎性很大程度上取決于對照組的詞匯能力,因此他將詞匯豐富性定義為詞匯變化性、詞匯密度、詞匯復雜性和詞匯錯誤。此外,Medero&Ostendorf(2009)首次提出詞長可以衡量詞匯難度的觀點。
綜合以上觀點,本研究將基于Read和Medero &Ostendorf的理論框架,將詞匯錯誤排除在外并加入詞長這一指標,將詞匯豐富性定義為詞匯變化性、詞匯密度、詞匯復雜性和詞長四個維度。其中詞匯變化性指文本中的類符與形符的比值(type-token ratio,TTR),但是該值受文章長度影響較大。為進一步提升精確性,本研究將采用標準化類符/形符比(standardized type-token ratio,STTR)衡量詞匯變化性。詞匯復雜性指復雜詞匯在文本中所占比例。本研究采用BNC/COCA詞頻列表統計復雜詞匯,該列表將英語詞匯分為25個級別,如最常用的1,000詞匯為K-1級,次常用的1,001-2,000詞匯為K-2級,依此類推;詞匯密度指實詞在文本中所占比重;詞長指單詞長度,即單詞字母的多少。
本研究的語料來自寧波某高校二年級學生的277篇專四模擬作文,這些學生均為英語專業且有十年以上的英語學習經驗。本族語者語料來自BNC語料庫,這是全球最具有權威性的英語語料庫之一,BNC語料來源廣泛,具有較強的代表性。本研究采用BNC語料庫的寫作部分,容量為100萬詞,主要來源有小說、雜志、報刊和學術文本。
本研究首先收集學生作文,用文字識別軟件轉寫后通過WordSmith 8.0統計STTR;利用Compleat Lexical Tutor統計復雜詞匯占比;借助Free CLAWS web tagger對語料進行標注,再用AntConc 3.4.3計算詞匯密度。
分析表明,本族語者的詞匯變化性高于中國英語學習者(見表1)。

表1 詞匯變化性
如表1所示,學習者的STTR為33.35%,而本族語者為42.44%,這意味著學習者的詞匯變化性遠低于英語本族語者。這一結果驗證了Engber和萬麗芳的結論:在不同水平的學習者中,詞匯變化性存在差異。這可能與學習者的學習方式有關。對學習者而言,英語是第二語言,他們經常以漢語思維方式學習英語,且大部分學生沒有積累單詞的習慣,這就造成了接受性詞匯(receptive vocabularies)輸入過少,用于書面語的產出性詞匯(productive vocabularies)相應更少;而本族語者長期處于英語環境下,詞匯量不斷積累,用詞也更加地道。同時,由于學習者長期處于漢語環境,極少主動習得英語,因此他們在英語寫作中總是感到“詞不達意”甚至“無詞可用”。
中國英語學習者的詞匯密度和本族語者相差不大。

表2 詞匯密度
側面說明詞匯密度并不適合作為衡量詞匯豐富性的指標。在實際寫作中,大量重復使用實詞雖然能夠提高詞匯密度,但這會使文章用詞反復,從而降低詞匯變化性。
英語學習者的詞匯復雜性低于本族語者。具體來說,學習者的詞匯高度集中在英語常見的前3,000詞,覆蓋率達到95%;而本族語者的詞匯高度集中于前4,000詞,覆蓋率為97%。此外,中國英語學習者使用最常見的前1,000詞匯頻率為82%,本族語者為77%,這表明學習者在寫作時更傾向于使用簡單常用的口語詞匯,用詞的正式性有待提高。這一結果與張亞平(2013)的結論一致,即中國學習者的寫作詞匯相對簡單,常用詞匯的使用頻率也更高,但是高級詞匯數量偏少,詞匯復雜性明顯低于本族語者;而本族語者的書面語除常用詞匯外,還更多使用高級詞匯。對于這一結果,筆者認為除中國英語學習者的學習習慣外,還有可能是因為部分學生在寫作時為了少丟分而“故意”使用熟悉的詞匯,甚至老師也引導他們盡量少用拿不準的詞匯,這些因素在很大程度上降低了詞匯復雜性。
在本研究中本族語者的平均詞長大于學習者。前者的平均詞長為4.91個字母。后者為4.75個字母。一般認為,正式語體往往使用長詞,非正式語體的詞匯較短。換言之,詞長可以衡量用詞正式性(李寶成,2004)。因此,學習者的用詞正式性不及本族語者。
本文通過對比英語學習者和本族語者的寫作文本,發現前者的詞匯相對單一,高級詞匯較少,其詞匯變化性遠低于本族語者;同時,學習者和本族語者的詞匯密度相差不大。在詞匯復雜性方面,中國英語學習者低于本族語者,覆蓋率不及本族語者。詞長方面,本族語者平均詞長高于中國英語學習者。簡而言之,在詞匯豐富性的四個維度中,詞匯變化性、詞匯復雜性、詞長能夠表現出英語寫作水平的差異,而詞匯密度不能表現出這種差異。
基于這些發現,筆者認為學習者在詞匯豐富性方面與本族語者仍有較大差距。這可能與他們的學習習慣或教師的授課方式有關。作為英語學習的基礎,詞匯具有舉足輕重的作用,它在一定程度上限制寫作能力。筆者建議學生要高度注重詞匯,主動增加自身詞匯量,積累高級詞匯,從根本上提高詞匯豐富性,縮小與本族語者的差距。而教師除講授語法知識和寫作策略外,還要引導學生主動學習詞匯,鼓勵學生使用高階詞匯,避免功利性地只為取得高分、少犯錯使用高頻詞。
①類符(type)指不重復計算的形符數。
②形符(token)相當于“詞”。
③計算每個文本每1000詞的類符/形符比,再將得到的若干個比值進行均值處理。
④根據頻率與范圍兩個標準建立的一款詞頻列表,融入了美式英語和英式英語,由Nation和Davies等人于2012年創建。(British National Corpus,簡稱BNC;Corpus of Contemporary American English,簡稱COCA)
⑤一款由魁北克大學開發的大型語料庫在線檢索系統(https://www.lextutor.ca),包括語料庫檢索、詞匯測試、詞匯學習、詞匯分析等功能。
⑥一款由蘭卡斯特大學開發的在線詞性標注器(http://ucrel-api.lancaster.ac.uk/claws/free.html)。