摘要: 作為測試英語學(xué)習(xí)者綜合水平的有效手段,完型填空測試正受到越來越多的關(guān)注,已有眾多學(xué)者從理論與方法角度對此題型做了深入研究。本文通過研究學(xué)優(yōu)生和學(xué)困生完成的三份測試,結(jié)果顯示文章層次(text-level)信息是學(xué)生們用得最多的信息,并證明了有理完型填空(Rational Cloze)可以用來測試較高層次的語言閱讀技能。
關(guān)鍵詞: 有理完型填空 文章層次信息 整句層次信息
1.引論
完型填空測試(以下簡稱完型)最初由Taylor于1953年提出,被用于閱讀文章難度的評估,測試對象主要是本族語言者,后來其作為有效的測試手段已受到越來越多的關(guān)注。在我國,絕大多數(shù)重要的考試都涉及此題型,如CET-4/6、TEM-4、高考、研究生入學(xué)考試、職稱考試等。完型作為測試英語學(xué)習(xí)者綜合水平的有效手段,已有眾多學(xué)者從理論與方法角度對此做了深入研究。
2.研究背景
2.1.1題型是否有信度和效度?
Fotos(1991)在回顧了以往研究后,認(rèn)為完型不但可以產(chǎn)生平行并有信度的題型,而且同時還具有充分的內(nèi)容效度。Bachman(1982,1985)提出有理去除形式有更好的內(nèi)容效度。許多學(xué)者如Bachman(1982,1985),Brown(1983,1988,1989),F(xiàn)otos(1991)深入研究了完型的標(biāo)準(zhǔn)相關(guān)效度(criterion-related validity)和它的兩個次效度,合作效度(concurrent validity)和(predictive validity)。Storey(1997)提出如果完型的文章按照某種理論模式,那它就有很好的結(jié)構(gòu)信度。
2.1.2完型測試的是什么?
Fotos(1991)總結(jié)出三種觀點,每種觀點都有相應(yīng)的支持者。Farhady(1982)認(rèn)為完型是分離點測試(discrete-point test),因為它們之間沒有任何區(qū)別。Tobin(1982),Kibby(1980),Klein-Braley(1983),Mardham(1985)等認(rèn)為完型只能評估基本的能力,因為它更多測試的是語法點而非文章。第三類學(xué)者象Oller(1975),Bachman(1982,1985),Brown(1989),Hale et al(1985),Chavey-Olleretal(1985,1994),Jonz(1990),F(xiàn)arhandyKeramati(1996),Yamashita(2003)認(rèn)為完型測試的是高級能力以及綜合的語言熟練程度。
2.1.3其在英語評估中的作用為何?
許多研究證明了完型是測量學(xué)生語言學(xué)習(xí)的一個有效手段。Heilenman(1983)將完型用于測試法語水平,并將結(jié)果與法語現(xiàn)代協(xié)會合作外語考試作比較,得出了.90的相關(guān)性。Fotos(1991)發(fā)現(xiàn)固定比率完型(Fixed-Ratio Cloze)可以作為一個整體的方法去測試外語學(xué)習(xí)水平,并可作為短文寫作考試的替代形式。Bachman(1985)根據(jù)上下文的層次為完型形式提出了一個四層分類法,認(rèn)為這些是完成完型的必須信息。
a分句中信息(within clause);
b高于分句,整句中信息(across clause,within sentences);
c高于整句,上下文中信息(across sentence,within text);
d文章外的信息(extra-textual)。
Bachman(1985),Jonz(1991)證明了這個分類法有效地揭示了不同完型項的差別。近來,Sasaki(2000)研究了文化圖解(cultural schemata)對測試者在完成題目過程中的作用,并且使用了測試者的即時回顧作為研究材料來源之一。Bachman(1985)將固定比率與有理去除完型做比較,發(fā)現(xiàn)前者包含了更多的1,4類型,2,3類型則相對較少。
3.研究設(shè)計
3.1研究目的:本實驗?zāi)康氖峭ㄟ^研究學(xué)生用來完成有理完型的信息,從而發(fā)現(xiàn)此類型測試是否可以測量文章層次處理能力,實驗主要圍繞以下兩個研究問題。
a . 測試者用何種信息完成有理完型?高低能力學(xué)生有何區(qū)別?
b.測試者用何種信息完成每項題目?高低能力學(xué)生有何區(qū)別?
3.2研究對象:參加本次測試的共有20位學(xué)生,分別是浙江大學(xué)非英語專業(yè)一年級學(xué)生10名,浙江財經(jīng)學(xué)院東方學(xué)院非英語專業(yè)一年級學(xué)生10名。根據(jù)兩次大學(xué)英語四級模擬測試,將其分為成績高(10人),成績低(10人)。結(jié)果顯示,來自一本的浙江大學(xué)學(xué)生的英語測試成績大多高于來自三本的東方學(xué)院學(xué)生,成績高的10人中只有一名東方學(xué)院學(xué)生。
3.3材料:來自三篇文章,一份選自Yamashita(2003),16題336字,其余選自練習(xí)材料,各有20題和191,259單詞。第一篇文章為有目的的修改,所以被刪除文字都為一些連接性手段和重要實詞,其余兩篇都包含不同類型虛詞、修飾詞等,并非都為文章層次信息。
3.4問卷:每篇文章附問卷一份,要求學(xué)生針對每項題目寫出答案的原因,中英文均可。見附錄二。
3.5過程:測試時間為學(xué)期末一周的一次課,學(xué)生獨(dú)立完成,沒有時間限制,但大多數(shù)學(xué)生都在一個小時左右完成。
3.6分析:所有數(shù)據(jù)用SPSS11.0系統(tǒng)計算。
4.結(jié)果
表一是每份完型平均分以及時間和標(biāo)準(zhǔn)差。

問卷要求學(xué)生寫出其根據(jù)什么信息得出答案的,從學(xué)生寫出的答案,主要可以歸為6類,其中四類是由Bachman(1985)提出,即分句層,整句層,文章層或上下文層,和文章外信息。許多較差學(xué)生填了“猜測”,所以我們把這歸為一類,另有學(xué)生沒有寫任何原因,當(dāng)被問到時,他們說不知道,這只是一種感覺。有些則直接寫上“語感”,所以我們將這些歸為“無法解釋原因”。
表二顯示三篇測試中六種信息的平均使用分比,以及正確與錯誤答案的比率。
可以看出上下文層次信息是兩組學(xué)生用得最頻繁的。分句層次信息,成績好者使用較多,許多成績好的學(xué)生(16.9%)無法解釋原因,比成績較差學(xué)生(9.46%)多近一半。對于整句信息與文章外信息,兩組的使用率較為相等。猜測則大多為成績較低者使用,(僅有一名成績較好者使用),而絕大多數(shù)無法得到正確答案。表三是按照使用頻率列出的排名。
以上結(jié)果是三篇測試的平均值,如果我們僅觀察一篇,結(jié)果是否會不同?考慮到第一篇文章中的去除單詞類型不同于其余兩篇,它們較多要求的是文章層或上下文信息,所以我們再單獨(dú)分析第一篇文章。表四是第一篇文章中六類信息的使用率。結(jié)果與先前稍有不同。
結(jié)果顯示與前次不變的是上下文信息,仍是兩組學(xué)生用得最多的,但與前次不同的是,整句信息也多為學(xué)生使用。由于本篇文章刪去詞要求利用上下文信息,與表二相比,較少學(xué)生用了分句層信息。與表二相似,更多的成績較低學(xué)生使用猜測,對于第六類無法解釋原因,有趣的是成績較低者都沒有選擇這類信息,而有一部分成績較好者選擇了并且正確率也不低。許多學(xué)生說有時答案是非常自動地出現(xiàn)的,沒有任何原因。表五是第一篇文章使用率的排名。
總之,上下文信息是學(xué)生用的最多的信息,而成績較好者使用率更高。
5.討論
關(guān)于本次實驗的第一個問題,我們發(fā)現(xiàn)兩組學(xué)生都非常偏好借助上下文信息得出信息,其使用率遠(yuǎn)高于其他幾類信息。不同的是成績較好的學(xué)生使用比率更高。猜測更多地為成績較低者使用。分句和整句信息更多為成績好者使用,他們有更多無法解釋的原因。
對于文章一,所刪去的要求填寫的詞都需要上下文理解,對于這篇文章,上下文和整句信息較多為學(xué)生使用,其余與三篇文章平均使用情況相似。由于它更強(qiáng)調(diào)上下文信息,所以本篇的分?jǐn)?shù)可以從一定程度上反映學(xué)生對于上下文信息的運(yùn)用能力。
第二個問題,我們僅分析了文章一,對于每項填空,整句和上下文信息都是學(xué)生使用最多的。一些項目中兩組學(xué)生傾向使用相同的信息,成績較低學(xué)生一些信息類型與成績較高者有著同樣的敏感度。不同的是,好學(xué)生能借用更多類型的信息,正確完成題目。
然而本次實驗中同樣存在不少局限性。雖然實驗選擇了三篇文章,但篇幅均較短,而且選項也有限。篇幅加長,填空項增多,信度也更高。測試者數(shù)目也較有限,由于都來自一個大學(xué),所以沒有廣泛的代表性。由于實驗條件的限制,無法采用自言自語方法(think-aloud),而這一手段能更深層地發(fā)現(xiàn)學(xué)生的內(nèi)省過程(introspective process)。
許多問題尚待解決。如果將有理完型變?yōu)槎囗椷x擇完型,由于學(xué)生得到更多的信息,那實驗結(jié)果是否有變化?如果測試者為成人,測試結(jié)果是否會有不同?
6.結(jié)語
本次實驗研究了成績高低學(xué)生如何完成三份有理完型,結(jié)果顯示上下文信息是學(xué)生使用最多的。相對與成績較好的浙江大學(xué)學(xué)生,獨(dú)立學(xué)院的學(xué)生在這方面的技能欠缺現(xiàn)象較為明顯。本實驗也證明了有理完型可以評估各層次的語言水平。同樣證明了Alderson(2000)的觀點,有理完型是測試閱讀綜合水平的有效方式。在完型填空已經(jīng)成為學(xué)生非常容易丟失的題型的情況下,如何幫助學(xué)生改變這一狀況,在大學(xué)英語四級考試中獲得更高成績,已成為大學(xué)英語教學(xué)急需解決的問題。而本次實驗的結(jié)果給了我們重要的啟示。如何引導(dǎo)更多的學(xué)生更好地利用上下文信息去解題,成了能否提高此項得分的關(guān)鍵。所以在平時的對獨(dú)立學(xué)院學(xué)生的教學(xué)中,應(yīng)該增加更多的有理完型填空題型的練習(xí)機(jī)會,即以填空的形式讓學(xué)生憑借對語言的理解、對語境的理解去完成填空,從而提高學(xué)生對上下文信息的利用效率,從信息利用方面提高學(xué)生做完型填空的準(zhǔn)確性。
參考文獻(xiàn):
[1]Alderson,J.The cloze procedure and proficiency in English as a foreign language.TESOL Quarterly,1979,13,219-227.
[2]Alderson,J.Clapham,C. Wall,D.Language test construction and evaluation.Cambridge:Cambridge University Press,1995.
[3]Alderson,J.Assessing reading.Cambridge:Cambridge University Press,2000.
[4]Bachman,L.F.The trait structure of cloze test scores.TESOL Quarterly,1982,16,61-70.
[5]Bachman,L.Performance on cloze tests with fixed-ratio and rational deletions.TESOL Quarterly,1985.19,535-556,
[6]Brown,J.A closer look at cloze:Validity and reliability.In J.Oller,JR.(Ed.)Issues in language testing research(277-250).Rowlye,Massachusetts:Newbury House Publishers,1983.
[7]Brown,J.Tailored cloze:Improved with classical item analysis techniques.Language Testing,1988,5,19-31.
[8]Brown,J.Cloze item difficulty.JALT Journal,1989,10,46-67.
[9]Chavez-Oller,M.Chihara,T.Weaver,K.Oller,J.When are cloze items sensitive to constraints across sentences?Language Learning,1985,35,181-203.
[10]Chavez-Oller,M.Chihara,T.Weaver,K.Oller,J.When are cloze items sensitive to constraints across sentence?In Oller,J.and Jonz,J.editors.Cloze and Coherence.London:Associated University Press,1994,229-45.
[11]Farhady,H.The disjunctive fallacy between discrete-point and integrative tests.TESOL Quarterly,1979,13,347-357.
[12]Fotos,S.S.The cloze test as an integrative measure of EFL proficiency:a substitute for essays on college entrance examinations?Language Learning,1991,41,313-36.
[13]Hale,G.A.Stansfield,C.W.Rock,D.A.Hicks,M.M.Butler,F(xiàn).A.Jr,J.W.O:The relation of multiple-choice cloze items to the Test of English as a Foreign Language.Language Testing,1989,6,47-76.
[14]Jonz,J.Another turn in the conversation:what does cloze measure?TESOL Quarterly,1990,24,61-83.
[15]Cloze item types and second language comprehension.Language Testing,1991,8,1-22.
[16]Klein-Braley,C.A cloze is a cloze is a question.In J.Oller,JR.(Ed.)Issues in language testing research(277-250).Rowlye,Massachusetts:Newbury House Publishers,1983.
[17]Kibby,M.W.Intersentential processes in reading comprehension.Journal of Reading Behavior,1980,12,299-312.
[18]Sasaki,M:Effects of cultural schemata on students’test-taking processes for cloze tests:a multiple data source approach.Language Testing,2000,17,85-114.
[19]Stroey,P:Examining the test-taking process:a cognitive perspective on the discourse cloze test. Language Testing,1997,14,214-31.
[20]Yamashita,J:Processes of taking a gap-filling test:comparison of skilled and less skilled EFL readers.Language Testing,2003,20,267-93.