
【摘要】詞匯豐富性能夠有效評價二語產出的質量。詞匯豐富性基于二語寫作提出,而當前對口語的詞匯豐富性研究相對較少。為此,本研究從詞匯多樣性、詞匯復雜性、詞匯密度和詞匯偏誤率四個維度定量分析高水平大學英語學習者英語演講比賽即興演講語篇的詞匯豐富性。研究結果顯示:首先,對于高水平大學英語學習者的英語即興演講來說,詞匯豐富性對演講質量的提升有積極的作用,但演講質量難以通過某一個詞匯豐富性指標進行評定;其次,詞匯復雜性與詞匯偏誤率二者關聯緊密,且相比詞匯復雜性,詞匯偏誤率對選手即興演講質量有較大影響;再次,詞匯密度不適合區分高水平二語者口語產出質量。本研究對二語英語學習者口語的詞匯豐富性分析進行了嘗試,也為英語學習者提升口語能力提供了參考。
【關鍵詞】大學生英語演講比賽;即興演講;高水平二語口語;詞匯豐富性
【作者簡介】汪義忻(1998.08-),男,漢族,浙江衢州人,浙江大學外國語言文化與國際交流學院碩士研究生,研究方向:二語習得、計量語言學。
一、引言
詞匯豐富性又稱詞匯多樣性或詞匯復雜性。在二語寫作中,詞匯豐富性反映了詞匯得到有效使用的程度,是評價寫作質量的一種方式 (Read, 2000)。為全面評價二語產出的質量,從不同角度出發,詞匯豐富性包含不同的測量指標。在Read (2000)的研究中,詞匯豐富性包括詞匯多樣性、詞匯復雜性、詞匯密度及詞匯偏誤率。近年,詞匯豐富性在國內有關二語寫作的研究中得到廣泛應用。現有研究可分為三類:詞匯豐富性與二語寫作質量關系研究、二語寫作中的詞匯發展研究以及二語寫作詞匯豐富性對比研究(張曉東、任嬌嬌,2018)。在詞匯豐富性與二語寫作質量關系方面,汪順玉(2011)分析了大學英語四級寫作樣卷的分數高低與詞匯復雜度之間的關系,并探究了以不同的詞匯復雜度指標分析不同質量英語作文的有效性。在二語寫作詞匯豐富性發展特征的歷時研究方面,王海華、周祥(2012)和朱慧敏、王俊菊(2013)探究了大學生英語寫作的詞匯豐富性發展特征,探討了整體詞匯復雜度及具體詞匯復雜度指標的歷時變化;張會平(2020)則將中國英語初學者作為研究對象,對其二語寫作詞匯豐富性發展特征進行探究。而在二語寫作詞匯豐富性的對比研究方面,陳建林(2011)基于CEW語料庫,發現了英語專業大學生在記敘文與說明文兩種體裁的作文之間的詞匯豐富性存在差異。雖然詞匯豐富性這一概念基于寫作提出,但同樣存在對口語文本的詞匯豐富性研究,如曹賢文、田鑫(2020)探究了任務構思條件對漢語二語口語產出中詞匯豐富性的影響,縱向比較了兩種任務構思條件下學習者的口語詞匯復雜度的變化。相較于國外,國內對二語口語的詞匯豐富性研究尚有較大發展潛力。而二語演講作為二語口語的重要組成部分,其在詞匯豐富性視角下存在的問題仍有待解答。基于此,本研究以Read (2000)對詞匯豐富性的定義為理論框架,從詞匯多樣性、詞匯復雜性、詞匯密度和詞匯偏誤率四個角度研究高水平大學英語學習者英語演講比賽中即興演講的詞匯豐富性,探究高水平大學生在不同能力組之間演講語篇的詞匯復雜性是否存在差異,并借助量化數據嘗試分析出現當前現象的動因。
二、研究設計
本研究使用的語料取自21世紀杯英語演講比賽官方網站大學組演講視頻的即興部分,將選手依照最終獲獎級別從高到低分為三個組:頂尖組、次頂尖組和半決賽組。頂尖組包含全國總決賽的冠軍、亞軍和季軍;次頂尖組包含獲得全國總決賽一等獎和二等獎的選手;半決賽組包含入圍全國半決賽,但沒有晉級全國總決賽的選手。演講語篇由人工轉寫,出現的語病不進行人為修正。得到頂尖組語料10725詞,次頂尖組語料8637詞,半決賽組語料9859詞。在轉寫之后,本研究利用MATTR軟件分析詞匯多樣性,利用Range軟件分析詞匯復雜性,利用Go Tagger進行詞性標注,并手動檢查詞匯錯誤。實驗數據由Excel進行匯總,使用SPSS進行數據分析。
三、數據分析與結果
1. 詞匯多樣性。常用的詞匯多樣性測量方法是TTR,但該方法對文本篇幅的變化適應性不佳,其結果會隨篇幅增大而減小。基于此,MATTR這一方法能夠彌補篇幅增大導致詞匯多樣性降低這一缺點。該方法選取特定長度的窗口,在文本中不斷移動。窗口中獲得的型例比經過平均之后得到移動平均型例比MATTR。本研究便使用MATTR作為衡量指標。不同于一般推薦使用的500詞窗口大小,考慮到即興演講語篇的篇幅較短,500詞窗口常超出篇章長度,本研究采用100詞窗口測量詞匯多樣性。
2. 詞匯復雜性。計算詞匯復雜性的Range工具包含三個詞表。第一個詞表包含英語中最常用的前1000詞,第二個詞表包含英語中最常用的第二個1000詞,緊隨第一個詞表之后。前兩個詞表中沒有出現,但在高中和大學使用的文本中常用的詞匯組成第三個詞表。本研究使用該工具計算即興演講語篇中超過2000詞詞表外的詞匯占總文本總長度的比例,將其作為詞匯復雜性,根據 Read (2000)的觀點,該指標能夠反映二語使用者是否能精確而地道地使用二語進行表達。
3. 詞匯密度。詞匯密度指文中的實意詞在全文中的比例,它能對文章的語義豐富性進行預測。實意詞這一概念與功能詞相對,包括動詞(除系動詞、情態動詞外)、名詞、形容詞和副詞(Ure, 1971)。詞匯密度可以衡量語言使用者是否有效傳達信息。
4. 詞匯偏誤率。詞匯偏誤率指出現錯誤的詞匯占全文的比重。而在本研究中,演講稿經過人為轉寫,因此不考慮詞匯的拼寫錯誤。
按照研究設計,我們得出的詞匯豐富性描述性統計結果如下:
在第一個指標詞匯多樣性方面,通過SPSS計算得到每組文本的MATTR均服從正態分布,且方差具有齊性。進行單因素方差分析后,得到F(2, 68) = 4.599,p =0 .013, η2 =0 .119,可見存在顯著的組間差異。事后檢驗顯示,對于不同級別的選手,頂尖組與半決賽組之間的MATTR存在顯著差異 (p =0 .045),次頂尖組與半決賽組之間的MATTR存在顯著差異 (p =0 .033),但頂尖組與次頂尖組之間的MATTR不存在顯著差異 (p = 1.000) 。
在第二個指標詞匯復雜性方面,總計結果顯示每一組文本超過2000詞的詞匯出現頻數所占全文總詞數的百分比符合正態分布。但通過方差齊性檢驗發現三組樣本的方差不具備齊性。在進行不假定等方差的單因素方差分析后,得到結果顯示,頂尖組與次頂尖組之間存在顯著的組間差異 (p =0 .004),頂尖組與半決賽組之間不存在顯著差異 (p =0 .608),次頂尖組與半決賽組之間不存在顯著差異 (p = 0.162)。
在第三個指標:詞匯密度方面,由于半決賽組內的樣本不符合正態分布,因此使用K-W檢驗,結果顯示三組之間在詞匯密度上不呈現顯著差異 (p =0 .466)。
在第四個指標:詞匯偏誤率上,由于半決賽組內的樣本同樣不符合正態分布,使用K-W檢驗后,結果顯示三組之間在詞匯偏誤率上存在顯著差異 (p =0 .010)。對于不同級別的選手,成對比較顯示頂尖組與次頂尖組之間不存在顯著差異 (p =0 .359),次頂尖組與半決賽組之間不存在顯著差異 (p = 0.068),而頂尖組與半決賽組之間存在顯著差異 (p =0 .003)。
四、討論
本次對詞匯豐富性的研究選用詞匯多樣性、詞匯復雜性、詞匯密度和詞匯偏誤率四個指標,對大學高水平英語演講比賽即興演講語篇進行分析,數據顯示:在詞匯多樣性上,頂尖組選手和次頂尖組選手之間難分勝負。但相比于進入決賽的兩組選手,半決賽組選手則稍遜一籌。詞匯多樣性的差異反映了晉級決賽的選手在詞匯的靈活使用上有著更高的水準,進一步說明了詞匯多樣性對高水平選手的重要性。
對于詞匯復雜性,本研究認為應將其結合詞匯偏誤率進行解讀,因為選手在使用相對更高級的詞匯時,也承擔著更高的出錯風險。在超2000詞范圍的詞匯所占全文的比例上,頂尖組和次頂尖組區別顯著。在兩組詞匯偏誤率近似的同時,在調用更高的超2000詞高級詞匯比重上,頂尖組的選手比次頂尖組的選手更加自如。但是,頂尖組和半決賽組、次頂尖組和半決賽組之間的超2000詞詞匯占全文比重未見明顯差異。次頂尖組的高級詞匯使用率顯著低于頂尖組,而詞匯偏誤率顯著高于半決賽組,說明次頂尖組在詞匯的選擇上相對保守,但也更為穩健。而半決賽組雖然在超2000詞比重上有更高的平均值,但詞匯復雜性分布與次頂尖組之間并無顯著差異,不能就此斷言半決賽組比次頂尖組有更廣泛的詞匯運用。對比詞匯偏誤率,可以推測半決賽組在超2000詞外單詞的高比重是由于采取較為激進的詞匯選擇策略造成的。半決賽組選手廣泛選用詞匯的意識值得肯定,但他們更高的出錯率說明其整體把握能力尚不及其他兩組,顯示出次頂尖組到半決賽組的區別之一在于更低的詞匯偏誤率,也提醒著選手在選用高級詞匯的同時也應對它的使用進行考慮,挑選有把握的詞進行發揮。
而在詞匯密度方面,三組未見明顯差異。Ure (1971)將文本詞匯密度達到40%作為區分口語和書面語的通常標準。基于此,三組選手均超過50%,因而有較高的詞匯密度,達到了“出口成章”的水平,都能夠有效傳達信息,因此,詞匯密度不是一個在高水平比賽中區分選手能力的指標。
五、結語
本研究結果顯示,高水平大學英語學習者英語演講比賽即興演講的詞匯豐富性水平在整體上雖然沒有出現明顯的梯度差異,但在部分指標上仍可見顯著區別。據此,本研究推測,高水平二語演講的總體詞匯豐富性差異,不是某一個詞匯豐富性指標的單獨效果,也非各指標彼此獨立、相對均衡發展產生的結果,而是存在相互交叉關系的詞匯豐富性指標共同作用的結果。一些關鍵性指標,如詞匯偏誤率,相比詞匯復雜性,對比賽結果有更大的影響。但可以肯定的是,詞匯豐富性對演講質量的提升有著積極的作用。
本研究運用詞匯豐富性,嘗試分析了二語演講語篇,為二語口語的詞匯豐富性分析提供了新的思路。不過,同時存在一些不足:首先,對于晉級全國比賽的三個等級的選手,雖有入圍半決賽和總決賽,決賽一等獎、二等獎和總決賽冠亞季前三名之分,絕對而言,在所有高水平英語學習者中,這些選手仍屬于頂尖行列。在后續研究中有待增加真正意義上的相對低水平文本以提高選手口語能力的區分度及研究結果的普遍適應性。其次,演講比賽即興演講是多種能力的綜合,語言詞匯豐富性僅為其中一個方面,涵蓋多方面的文體學分析或能得到更完善的結果。另外,一些文本之外的內容,如手勢、重音等也應當作為考慮因素,對演講比賽進行多模態分析,以期獲得更為全面的發現。未來可在更豐富的語料基礎上采用更全面的方法進行演講語篇的相關研究。
參考文獻:
[1]Read J. Assessing Vocabulary[M]. Cambridge: Cambridge University Press, 2000.
[2]張曉東,任嬌嬌.二語即時作文高低分組詞匯豐富性對比研究[J].北京第二外國語學院學報,2018(4):41-52.
[3]汪順玉.大學英語四級寫作樣卷的詞匯復雜度分析[J].重慶郵電大學學報(社會科學版),2011(6):104-110.
[4]王海華,周祥.非英語專業大學生寫作中詞匯豐富性變化的歷時研究[J].外語與外語教學,2012(2):40-44.
[5]朱慧敏,王俊菊.英語寫作的詞匯豐富性發展特征——一項基于自建語料庫的縱貫研究[J].外語界,2013(6):77-86.