徐 晶
(新華學院 外國語學院,安徽 合肥 230088)
閱讀作為聽說讀寫四項基本技能,在語言學習中占有十分重要的地位。從某種程度上講,提高閱讀能力,是提高聽、說、讀、寫、譯的關鍵(陶加輝、鄔小琴,2009:134)。作為大規模標準化考試的英語專業四級考試(Test for English Majors-Band 4,簡稱TEM-4),是我國最具影響力的考試之一,引發了外語教學研究領域的專家學者從各個角度對其進行深入研究。閱讀理解作為TEM-4的重要題型之一,其命題質量也備受關注。為了適應我國高等教育新的發展形勢,深化教學改革,提高教學質量,考試委員會以《高等學校英語專業英語教學大綱》(以下簡稱《教學大綱》)為指導,于2004年修改了《高校英語專業四級考試大綱》(以下簡稱《考試大綱》),其中“閱讀理解”部分不再分快速閱讀和一般閱讀,“閱讀理解”部分考試時間由30分鐘縮短為25分鐘(2004:1)。這反映了《考試大綱》對“閱讀理解”的重視。那么,改革后的英語專業四級考試,其“閱讀理解”部分的考試內容效度究竟如何?這就是本文亟待分析和解決的問題。
測試效度是衡量語言測試最重要的指標,或者說是語言測試的基本出發點?!案鶕u價方法的不同,效度是指測試是否靠了考試大綱規定要考的,或者說考試的題目在多大程度上能代表它所要測量的內容。 ”(Heaton,2000:159)Alderson 等人將效度分為三種類型:(1)內部效度(internal validity),包括內容效度(content validity)和構卷效度(construct validity);(2)外部效度(external validity),又稱標準效度(criterion validity);(3)使用效度(use validity)(Alderson,1995:164)。 由于篇幅的限制,本文僅從內容效度的角度來分析TEM-4“閱讀理解”測試的有效性,總結其成功與不足,并在此基礎上提出一些建議,旨在提高命題的科學性和有效性,促進其對教學的積極反撥作用。
本研究選取了《考試大綱》修訂后的2006~2010年五年的TEM-4試題“閱讀理解”部分為樣本,共計5套試卷,20篇文章,100道題目。
內容效度指測試內容包含了它意欲測試的語言技能、語言結構等方面有代表性的因素(Hughes,1989:132)?!耙豁棞y試的內容效度越大,它就越可能達到它意欲測試的目的?!保℉ughes,1989:132)本研究分析采用的是根據 Bechman和Palmer提出的考試任務特點框架,并結合閱讀考試的實際情況進行綜合評析。Bechman和Palmer認為,任務特征包括情景特征、測試指令特征、語篇輸入特征和預期回答特征,其中涉及語篇內容分析的是后兩個特征,即語篇輸入(包括體裁、題材、文章長度、文章閱讀速度和篇章難度)和預期回答(閱讀能力的考查、題項的設計)(辜向東,2008:106)。結合《教學大綱》和《考試大綱》在閱讀方面的要求,對TEM-4閱讀理解部分的內容效度進行了分析。
1.體裁
《考試大綱》明確規定了閱讀理解部分的選材原則:體裁多樣,包括記敘文、描寫文、說明文、議論文、廣告、說明書、圖表等。筆者在統計時將其歸納為敘述文、說明文、議論文、應用文。部分文章夾敘夾議,在此統計為議論文。統計結果見表1。
表1反映了2006~2010年TEM-4試卷閱讀理解部分體裁的分布情況。從整體上來看,閱讀材料的體裁主要以議論文為主,敘述文和說明文較少,未出現應用文。從單卷來看,體裁的分布存在不平衡的狀況。在同一試卷中各體裁篇數比例不一,呈現單一的特點,甚至某一種體裁比例達到75%,如2007年卷、2008年卷及2010年卷。這與《考試大綱》體裁多樣的原則不太相符。建議在今后的命題中,應考慮選擇應用文體裁,并注意各體裁在同一試卷中的比例分配,做到體裁的多樣性和分布的合理性。
2.題材
《考試大綱》規定,閱讀材料的選擇應題材廣泛,包括社會、科技、文化、經濟、日常知識、人物傳記等。綜觀2006~2010年TEM-4的閱讀理解材料,其題材涉及科普知識、社會、文化、教育及個人經歷的小故事等。在此,為了便于統計,將教育歸入文化中,將日常生活中的個人經歷和小故事納入日常知識中。統計結果如表2所示。
表2 :2006~2010年TEM-4試卷閱讀理解題材統計表
從表2可以看出,TEM-4試卷的閱讀理解部分的題材涉獵廣泛,基本涵蓋了社會、科技、文化等方面,符合《考試大綱》的規定。同時,由于題材廣泛,涉及領域較多,在考查考生閱讀能力的同時,又體現了《教學大綱》的要求:“向學生提供廣泛的語言和文化素材,擴大學生的知識面,增強學生的英語語感,培養學生的閱讀興趣?!保?000:10)其中,文化類的題材最多,如2006年卷TEXT A論述了手機對文化的影響;2008年卷TEXT A介紹了阿姆斯特丹的文化、TEXT B介紹了幾個來源于神話傳說的詞語的詞源故事;2009年卷TEXT D的“節日小費”的故事等。社會、科普和個人經歷的小故事等在整個選材中的比例差別不大。從單卷來看,每一套試卷的閱讀材料選材基本涵蓋了幾個不同的方面(除了2010年只涉及了科技和文化)。但是,經濟題材,這五年的試卷中都未涉及,因此,在今后的選材中,可以適當融入經濟類的閱讀材料,并注意平衡各題材在同一份試卷中的比例。
3.篇章長度及閱讀速度
根據《考試大綱》對測試形式的要求,TEM-4閱讀理解部分應采用多項選擇題,由數篇閱讀材料構成,閱讀材料共長1800個單詞左右。而由表3的統計數據可知,2007~2010年的篇章長度超出標準單詞量的比例基本控制在-10%~10%之間,符合《考試大綱》(1800詞)的要求。且2007年和2009年的超出標準單詞量比例分別為-0.5%和0.5%,詞數控制非常準確。但是2006年的單詞量是五年中最少的,超出標準單詞量的比例達-17.6%,這表明,2006年卷的閱讀理解部分在單詞量上沒有嚴格遵照《考試大綱》的規定。
表3 :2006~2010年TEM-4試卷閱讀理解篇章長度及閱讀速度分析表
閱讀速度方面,從表3我們可以看出,2007年、2008年、2009年三年的閱讀速度差不多持平,分別為102詞/分鐘、103詞/分鐘、104詞/分鐘,這三年的閱讀速度控制得較為穩定,但是這與《考試大綱》規定的“閱讀速度為每分鐘120個單詞”還有一定的差距。特別是2006年和2010年平均閱讀速度為86詞/分鐘、92詞/分鐘,與大綱規定相差甚遠。由此可知,這五年的閱讀理解在閱讀速度的設計上偏低,沒有達到《考試大綱》的要求。在今后的命題中,應注意提高試卷整體的閱讀速度。
4.篇章難度
在閱讀材料的難度方面,《考試大綱》規定,“閱讀材料的語言難度中等”。閱讀材料的難度是抽象的概念,受多種因素的影響,目前沒有直接的辦法來測量。語言研究者一般使用SMOG指數,Fry易讀度估算和Flesch易讀度公式等來計算。本文采取Flesch易讀度來衡量閱讀材料的難度。在Flesch易讀度的測量上,筆者借助Microsoft Office Word 2003對文章進行“完成拼寫和語法檢查”,然后選擇顯示有關文檔的可讀性級別信息的方法獲取Flesch易讀度數據。統計結果見表4。
表4 :2006~2010年TEM-4試卷閱讀理解篇章易讀度統計表
表5為易讀度參考量表。
表5 :易讀度參考量表
參照表5,分析表4的統計結果可知,易讀度30~50、50~60、60~70、70~80 即屬于“Difficult”、“Fairly difficult”、“Standard”、“Fairly Easy”的篇章各占 25%、25%、20%、25%,2007年的 TEXT C的易讀度竟為82.2,屬于“Easy”的范圍。整體來說,低于《考試大綱》“難度中等”的要求,但易讀度的平均值比較接近,如此可見TEM-4命題的科學性和嚴謹性。同時,我們也可以看出各單卷的易讀度相差較大,2006年的四篇文章易讀度波動幅度達到了38.9之高。根據理想模式,每一篇閱讀材料都應該符合一定的易讀度,差距過大會影響測試的真實性,從而降低測試的效度。因此,在控制易讀度方面,還需要進一步努力。根據《考試大綱》的要求,對照表5,建議易讀度在50~70之間,即“Fairly Difficult”和“Standard”之間比較合適,屬于難度適中的文章。
預期回答主要指閱讀技能方面。閱讀理解測試旨在測試學生的閱讀能力。李筱菊認為:“閱讀理解測試考核的應該是受試對材料傳達的多層次、多范疇信息的理解能力?!保ɡ铙憔?,1999:86)《考試大綱》要求:“能掌握所讀材料的主旨大意,了解說明主旨大意的事實和細節;既理解字面意思,又能根據所讀材料進行判斷和推理;既能理解個別句子的意義,也理解上下文的邏輯關系”。據此,筆者將TEM-4考查的閱讀技能分為細節辨認、判斷推理、主旨分析、語義理解,并以此對2006~2010年TEM-4試卷閱讀理解材料后的題目進行分類統計,結果見表6。
表6 :2006~2010年TEM-4試卷閱讀理解材料考查能力統計表
從表6我們可以看出,TEM-4的閱讀理解部分對閱讀能力的考查是全面且符合大綱要求的,具有較高的內容效度。綜合這五年的試卷,細節辨認題和判斷推理題共有86題,占整個閱讀理解考查部分的86%。從整體來看,細節辨認和判斷推理是TEM-4閱讀理解部分對閱讀能力考查的主要內容。而主旨分析題和語義理解題則每卷只占1或2題??傮w來說,各種能力的考查在試卷中所構成的比例是合理的。但是,個別年份的單卷其考查的能力有缺失,如2009年卷并未出現明確考查主旨分析的題目。
本文通過對2006~2010年TEM-4試題中閱讀理解部分的統計與分析發現,其閱讀材料的體裁以議論文為主,敘述文和說明文較少,未出現應用文;題材涉獵廣泛,基本涵蓋了社會、科技、文化等方面,但經濟題材并未涉及,部分單卷題材選擇較為集中;篇章長度超出標準單詞量的比例基本控制在-10%~10%之間,但2006年卷單詞量偏低程度較大;在閱讀速度和易讀度的控制上有待加強;閱讀能力的考查較為全面,結構合理,但部分單卷能力考查有缺失??傮w來說,這五套閱讀理解試題基本符合《教學大綱》和《考試大綱》的要求,其測試具有一定的內容效度,對英語專業教學具有很好的導向作用,其命題是比較成功的。
針對命題中存在的一些不足之處,為了更好地提高TEM-4考試的內容效度,筆者提出以下建議:(1)材料選擇上應注意題材和體裁的多樣性和分布的合理性,適當考慮經濟類閱讀材料和應用文體裁的選擇,并注意平衡各題材體裁在同一份試卷中的比例;(2)注意個別單卷的單詞量控制,提高試卷整體的閱讀速度;(3)在閱讀難度的控制方面也需要進一步努力,將易讀度的波動幅度控制在較小范圍內,盡量使每篇閱讀材料的易讀度在50~70之間;(4)閱讀能力考查上要平衡考查技能,使閱讀測試能考查受試者全面的閱讀能力。
[1]陶加輝,鄔小琴.大學英語新四級閱讀理解內容效度研究[J].重慶交通大學學報(社科版),2009,(12):136-140.
[2][8][10][12]高校英語專業四級考試大綱修訂小組.高校英語專業四級考試大綱(2004年新版)[M].上海外語教育出版社,2004.
[3]Heaton,J.B.Writing English Language Tests[M].Beijing:Foreign Language Teaching and Research Press,2000.
[4]Alderson,J.C.,Clapham,Caroline,Wall,Dianne.Language Test Construction and Evaluation[M].Cambridge University Press,1995.
[5][6]Hughes,A.Testing for Language Teachers[M].Cambridge University Press,1989.
[7]辜向東.高考英語全國卷與各省市自主命題卷共時與歷時研究[M].成都:四川大學出版社,2008.
[9]高等學校外語專業教學指導委員會英語組.高等學校英語專業英語教學大綱[M].上海外語教育出版社,2000.
[11]李筱菊.語言測試科學與藝術[M].長沙:湖南教育出版社,1999.