陸蕓
(南京工業大學,江蘇 南京 210009)
使用不同詞表檢驗詞匯復雜度測量方法信度和效度之比較
陸蕓
(南京工業大學,江蘇 南京 210009)
本文比較了使用N ation詞表后檢驗詞匯復雜度三種測量方法信度效度的結果是否與以往使用大綱詞表檢驗結果一致,從而比較N ation詞表和大綱詞表的差異,發現N ation詞表區分度更大,更適于研究二語學習者產出性文本。
詞匯復雜度;N ation詞表;大綱詞表
詞匯復雜度是詞匯豐富程度的一個重要指標,詞匯復雜度從某種程度上可以反映詞匯量的大小。測量詞匯復雜度以Nation(1995)的詞頻分布(LFP)和Meara(2001)的泊松擬合法影響最為廣泛,國內外學者對詞匯的研究多會借助Nation等開發的Range軟件和Meara等開發的P_Lex(如Espinosa 2005,鮑貴2010);也有專門研究詞匯復雜度測量方法的如(Nation 1995,Meara 2001,鮑貴2011,陸蕓2012)。研究表明如何控制文本長度對詞匯復雜度的影響是詞匯復雜度測量的一大難題,LFP用截取等長度的方法來控制文本長度的影響,但是這容易造成因低頻詞聚集于某一段文本而使測量結果發生偏差的情況,P_Lex因計算概率較好地控制文本長度對詞匯復雜度的影響,但P_Lex沒有解決將段落內重復低頻詞視為不同低頻詞類的問題。因此陸蕓等(2013)提出隨機取樣方法即隨機截取相同長度文本n次,取平均值以減小誤差,并將傳統的類符型符比方法,隨機取樣方法和改進的P_Lex方法(解決了將段落內重復低頻詞視為不同低頻詞類的問題)集成在一起,開發了中國的詞匯復雜度測量軟件,使用根據大學英語大綱要求制定的詞表驗證其信度和效度。驗證發現隨機取樣方法和改進的P_Lex方法更有信度和效度,尤其是隨機取樣方法可以針對較短的文本和比較不同長度的文本,更適用于測量二語學習者的產出性文本。使用大綱詞表是考慮到使用的數據來源是中國二語學習者,中國詞表可能更符合中國學生的學習規律。然而Range和P_Lex使用的詞表都是Nation根據BNC語料庫開發的詞表。利用不同的詞表是否具有相同的驗證結果以及大綱詞表和Nation詞表有何差異成為本研究想要解決的問題。
2.1 研究問題
本研究將Nation的詞表按照自行開發的軟件的要求進行編輯,并將之導入軟件,計算使用Nation詞表后三種方法的詞匯復雜度值,并將其與以往使用大綱詞表所得出的對應值進行比較,主要解決以下問題。
1)使用Nation詞表檢驗信度,結果與使用大綱詞表是否具有一致性?
2)使用Nation詞表檢驗效度,結果與使用大綱詞表是否具有一致性?
3)Nation詞表和大綱詞表有何差異?
2.2 數據收集和處理
為了便于比較兩種詞表的差異,本文所使用的數據與以往使用大綱詞表檢驗詞匯復雜度測量方法信度和效度是同一批數據。檢驗信度使用新概念英語第二冊和第三冊奇數編號的文本,共78篇。檢驗效度使用的是《英語專業語料庫》(上海外語教育出版社,2008年版)2004年的英語專業八級作文,經過處理,96篇作文被用于研究。這些作文按照其分數分成高低作文水平組,經非參數檢驗,兩組作文分數存在顯著差異。
數據處理經過去標注、削尾(即將動詞的屈折變化形式還原成動詞原形)、文本清理和詞匯復雜度測量幾個階段。
研究中使用了去標注軟件(DetaggingTool)、線削尾處理軟件(CST's Lemmatiser)、自行開發的詞匯復雜度測量軟件(LexicalSophistication)和統計軟件SPSS13.0。
3.1 信度一致性問題
信度一致性問題是通過78篇新概念英語文本進行折半信度分析來探討的。78篇新概念英語的文本被依次重新編號,并根據新的編號分為奇數組和偶數組兩組。這兩組文本使用不同的詞匯復雜度測量方法測量,其平均值如下。可以發現使用Nation詞表測量后,兩組詞匯復雜度平均值沒有太大差異,這和使用大綱詞表的情況接近。但是使用Nation詞表后,詞匯復雜度值比使用大綱詞表得到的對應值都要相對更高。

表1 使用Nation詞表和大綱詞表兩組詞匯復雜度均值
使用Nation詞表后,Guttman折半系數分別為.781,.842和.655,分別大大高于使用大綱詞表的系數.614,.699和.606。說明使用Nation詞表后發現新概念英語兩組文本間信度很高,兩組文本來自同一個整體,也反映了三種測量方法是有信度的。從三種詞匯復雜度測量方法比較來看,使用隨機取樣方法時折半系數最高,說明隨機取樣方法是較為可靠的方法。這些結果都和之前使用大綱詞表得出的結果一致。
從兩種詞表比較來看,使用Nation詞表后得出的值都要比使用大綱詞表得出的相應值高。這是因為我們對低頻詞的不同操作定義造成的。使用大綱詞表時,我們將不在中學詞表中的詞定義為低頻詞,而使用Nation詞表時,將不在最常用的2000詞詞表中的詞定義為低頻詞,測量軟件就會取出不同低頻詞個數。從結果看,大綱詞表中學詞表中的一部分詞已超出Nation的最常用和次常用詞的范圍。而既然使用Nation詞表后信度更高,顯然Nation詞表中的常用詞范圍較為合理。
3.2 效度一致性問題
效度問題是通過將語料庫中96篇專八作文的詞匯復雜度值與其對應的作文分數進行相關分析來檢驗的。使用Nation詞表后,使用三種詞匯復雜度測量方法發現詞匯復雜度和作文分數呈現低相關,詞匯復雜度值可以區分高低作文水平組。這和許多研究者的發現都比較一致(如Engber1995,鮑貴2011)。而使用隨機取樣法得出的相關系數最高,使用傳統方法相關系數最低,再一次證明了隨機取樣法的優勢。這些都說明了以往使用大綱詞表對三種方法信度效度檢驗的結論是具有普遍性的。
值得注意的是,以往使用大綱詞表時,各種方法的相關系數和t值比較接近,區分度不高,而使用Nation詞表后,相關系數和t值差異較明顯,區分度較高。這說明將中學詞表以外的詞定義為低頻詞的標準對研究二語學習者產出性文本有些高了。

表2 使用不同詞表詞匯復雜度值與作文分數呈低相關

表3 使用不同詞表高低作文水平組平均詞匯復雜度值差異顯著
3.3 Nation詞表和大綱詞表比較
Range的詞表是Nation根據BNC語料庫制定的,其中第一個基礎詞表包括最常用的約1,000個英語詞簇(wordfamily),第二個基礎詞表包括次常用的約1,000個英語詞簇。Nation(1997)認為,雖然一種語言的詞匯是一個無限量,但并非所有的詞都同樣重要。衡量一個詞的重要性,目前主要依據詞在書面和口語文本中出現的頻率,即詞頻。大學英語教學大綱(修訂本)制定的詞匯表規定了各級詞表。鄧昭春(2004)認為大綱詞表規定了要求各級領會式掌握的單詞數量和具體單詞,相反,對復用式詞匯只有數量上的要求。這無形中將大綱詞表定位在對接受性詞匯的掌握,降低了對共核詞匯的復用要求。因此她建議編寫出對我國大學生最具有復用意義的分類詞族表。從這些學者的觀點看,Nation的詞表從制表原則上來講要比大綱詞表更具科學性和實際意義。
從實證研究看,使用Nation詞表詞匯復雜度值更高,區分度更大,說明Nation的分級詞表在研究中更具有可操作性,更能反映英語學習者詞匯產出的特點,英語學習者總是最容易掌握那些最重要,最高頻的詞匯。而大綱詞匯規定的中學詞匯表領會式掌握單詞的數量超過了最常用2000詞的數量,實際上對二語學習者產出性詞匯量來講要求偏高。因此使用大綱詞表,將大綱詞表中學詞表以外的詞定義為低頻詞來研究低水平英語學習者詞匯掌握情況并不適合。也許借鑒國外詞簇詞頻研究成果,結合我國英語教學實際,編寫出對我國大學生最具有復用意義的分類詞族表對我國英語教學和詞匯研究將更有意義。
本文使用Nation詞表對詞匯復雜度測量方法信度和效度進行檢驗,發現其結果與以往使用大綱詞表檢驗具有一致性。而使用Nation詞表后,區分度更大。說明Nation詞表和大綱詞表相比更適合研究二語學習者產出性文本。也許今后可以借鑒國外詞表制表原則,制定出更符合中國英語學習者學習特點的英語詞表,更好地為國內英語教學和研究服務。
[1]Laufer,B.&Nation,P.Vocabulary size and use:lexi cal richness in L2 written production.[J].Applied Linguistics,1995,16:307-322.
[2]Meara,P.&Bell.H.P_Lex:A simple and effective way of describing the lexical characteristics of short L2texts.[J].Prospect,2001,16(3):323-337.
[3]Moreno Espinosa,S.,Fernandez Fontecha,A.and A gustin Llach,M.P.Can P_Lex accurately measure lex ical richness in the written production of young learners of EFL?[J]Porta Linguarum:Revista Internacional de Didactica de las Lenguas Extranjeras,2005,4:7-21.
[4]鮑貴.英語學習者語言復雜性變化對比研究[J].現代外語,2010,(2):166-176.
[5]鮑貴.英語學習者詞匯復雜度的最新測量及驗證[J],山東外語教學,2011,(6):44-52.
[6]陸蕓.詞匯豐富性測量方法及計算機程序開發:回顧與展望[J].南京工業大學學報,2012,(2):104-108.
[7]Engber,C.A.The relationship of lexical proficiency to the quality of L2 compositions[J].Journal of Second Language Writing,1995,4:139-155.
[8]鄧昭春.《大綱》詞表的局限性與分類詞族表的教學意義[J].中國大學教學,2004,(9):45-48.
[9]Nation,P.&R.Waring.1997.Vocabulary size,textcoverage and word lists[A].Vocabulary:Description, Acquisition and Pedagogy[C].Schmitt,N.&M.McCarthy (Eds.),NewYork:Cambridge University Press.http: //www.132.208.224.131/ResearchWeb.
責任編輯:周哲良
H 313
A
1672-2094(2013)06-0066-03
2013-10-18
陸蕓(1978-),女,江蘇太倉人,南京工業大學講師,碩士。研究方向:應用語言學。