英語專業四級考試閱讀理解內容效度研究

2013-08-20 06:04:52徐晶

湖北經濟學院學報·人文社科版 2013年1期

徐晶

（新華學院外國語學院，安徽合肥 230088）

一、引言

閱讀作為聽說讀寫四項基本技能，在語言學習中占有十分重要的地位。從某種程度上講，提高閱讀能力，是提高聽、說、讀、寫、譯的關鍵（陶加輝、鄔小琴，2009：134）。作為大規模標準化考試的英語專業四級考試（Test for English Majors－Band 4，簡稱TEM-4），是我國最具影響力的考試之一，引發了外語教學研究領域的專家學者從各個角度對其進行深入研究。閱讀理解作為TEM-4的重要題型之一，其命題質量也備受關注。為了適應我國高等教育新的發展形勢，深化教學改革，提高教學質量，考試委員會以《高等學校英語專業英語教學大綱》（以下簡稱《教學大綱》）為指導，于2004年修改了《高校英語專業四級考試大綱》（以下簡稱《考試大綱》），其中“閱讀理解”部分不再分快速閱讀和一般閱讀，“閱讀理解”部分考試時間由30分鐘縮短為25分鐘（2004：1）。這反映了《考試大綱》對“閱讀理解”的重視。那么，改革后的英語專業四級考試，其“閱讀理解”部分的考試內容效度究竟如何？這就是本文亟待分析和解決的問題。

二、研究設計

（一）研究目的

測試效度是衡量語言測試最重要的指標，或者說是語言測試的基本出發點?！案鶕u價方法的不同，效度是指測試是否靠了考試大綱規定要考的，或者說考試的題目在多大程度上能代表它所要測量的內容。 ”（Heaton，2000：159）Alderson 等人將效度分為三種類型：（1）內部效度（internal validity），包括內容效度（content validity）和構卷效度（construct validity）；（2）外部效度（external validity），又稱標準效度（criterion validity）；（3）使用效度（use validity）（Alderson，1995：164）。由于篇幅的限制，本文僅從內容效度的角度來分析TEM-4“閱讀理解”測試的有效性，總結其成功與不足，并在此基礎上提出一些建議，旨在提高命題的科學性和有效性，促進其對教學的積極反撥作用。

（二）研究樣本

本研究選取了《考試大綱》修訂后的2006～2010年五年的TEM-4試題“閱讀理解”部分為樣本，共計5套試卷，20篇文章，100道題目。

（三）研究方法

內容效度指測試內容包含了它意欲測試的語言技能、語言結構等方面有代表性的因素（Hughes，1989：132）?！耙豁棞y試的內容效度越大，它就越可能達到它意欲測試的目的?！保℉ughes，1989：132）本研究分析采用的是根據 Bechman和Palmer提出的考試任務特點框架，并結合閱讀考試的實際情況進行綜合評析。Bechman和Palmer認為，任務特征包括情景特征、測試指令特征、語篇輸入特征和預期回答特征，其中涉及語篇內容分析的是后兩個特征，即語篇輸入（包括體裁、題材、文章長度、文章閱讀速度和篇章難度）和預期回答（閱讀能力的考查、題項的設計）（辜向東，2008:106）。結合《教學大綱》和《考試大綱》在閱讀方面的要求，對TEM-4閱讀理解部分的內容效度進行了分析。

三、分析與討論

（一）語篇輸入

1.體裁

《考試大綱》明確規定了閱讀理解部分的選材原則：體裁多樣，包括記敘文、描寫文、說明文、議論文、廣告、說明書、圖表等。筆者在統計時將其歸納為敘述文、說明文、議論文、應用文。部分文章夾敘夾議，在此統計為議論文。統計結果見表1。

表1反映了2006～2010年TEM-4試卷閱讀理解部分體裁的分布情況。從整體上來看，閱讀材料的體裁主要以議論文為主，敘述文和說明文較少，未出現應用文。從單卷來看，體裁的分布存在不平衡的狀況。在同一試卷中各體裁篇數比例不一，呈現單一的特點，甚至某一種體裁比例達到75%，如2007年卷、2008年卷及2010年卷。這與《考試大綱》體裁多樣的原則不太相符。建議在今后的命題中，應考慮選擇應用文體裁，并注意各體裁在同一試卷中的比例分配，做到體裁的多樣性和分布的合理性。

2.題材

《考試大綱》規定，閱讀材料的選擇應題材廣泛，包括社會、科技、文化、經濟、日常知識、人物傳記等。綜觀2006～2010年TEM-4的閱讀理解材料，其題材涉及科普知識、社會、文化、教育及個人經歷的小故事等。在此，為了便于統計，將教育歸入文化中，將日常生活中的個人經歷和小故事納入日常知識中。統計結果如表2所示。

表2 ：2006～2010年TEM-4試卷閱讀理解題材統計表

從表2可以看出，TEM-4試卷的閱讀理解部分的題材涉獵廣泛，基本涵蓋了社會、科技、文化等方面，符合《考試大綱》的規定。同時，由于題材廣泛，涉及領域較多，在考查考生閱讀能力的同時，又體現了《教學大綱》的要求：“向學生提供廣泛的語言和文化素材，擴大學生的知識面，增強學生的英語語感，培養學生的閱讀興趣?！保?000：10）其中，文化類的題材最多，如2006年卷TEXT A論述了手機對文化的影響；2008年卷TEXT A介紹了阿姆斯特丹的文化、TEXT B介紹了幾個來源于神話傳說的詞語的詞源故事；2009年卷TEXT D的“節日小費”的故事等。社會、科普和個人經歷的小故事等在整個選材中的比例差別不大。從單卷來看，每一套試卷的閱讀材料選材基本涵蓋了幾個不同的方面（除了2010年只涉及了科技和文化）。但是，經濟題材，這五年的試卷中都未涉及，因此，在今后的選材中，可以適當融入經濟類的閱讀材料，并注意平衡各題材在同一份試卷中的比例。

3.篇章長度及閱讀速度

根據《考試大綱》對測試形式的要求，TEM-4閱讀理解部分應采用多項選擇題，由數篇閱讀材料構成，閱讀材料共長1800個單詞左右。而由表3的統計數據可知，2007～2010年的篇章長度超出標準單詞量的比例基本控制在－10%～10%之間，符合《考試大綱》（1800詞）的要求。且2007年和2009年的超出標準單詞量比例分別為－0.5%和0.5%，詞數控制非常準確。但是2006年的單詞量是五年中最少的，超出標準單詞量的比例達－17.6%，這表明，2006年卷的閱讀理解部分在單詞量上沒有嚴格遵照《考試大綱》的規定。

表3 ：2006～2010年TEM-4試卷閱讀理解篇章長度及閱讀速度分析表

閱讀速度方面，從表3我們可以看出，2007年、2008年、2009年三年的閱讀速度差不多持平，分別為102詞/分鐘、103詞/分鐘、104詞/分鐘，這三年的閱讀速度控制得較為穩定，但是這與《考試大綱》規定的“閱讀速度為每分鐘120個單詞”還有一定的差距。特別是2006年和2010年平均閱讀速度為86詞/分鐘、92詞/分鐘，與大綱規定相差甚遠。由此可知，這五年的閱讀理解在閱讀速度的設計上偏低，沒有達到《考試大綱》的要求。在今后的命題中，應注意提高試卷整體的閱讀速度。

4.篇章難度

在閱讀材料的難度方面，《考試大綱》規定，“閱讀材料的語言難度中等”。閱讀材料的難度是抽象的概念，受多種因素的影響，目前沒有直接的辦法來測量。語言研究者一般使用SMOG指數，Fry易讀度估算和Flesch易讀度公式等來計算。本文采取Flesch易讀度來衡量閱讀材料的難度。在Flesch易讀度的測量上，筆者借助Microsoft Office Word 2003對文章進行“完成拼寫和語法檢查”，然后選擇顯示有關文檔的可讀性級別信息的方法獲取Flesch易讀度數據。統計結果見表4。

表4 ：2006～2010年TEM-4試卷閱讀理解篇章易讀度統計表

表5為易讀度參考量表。

表5 ：易讀度參考量表

參照表5，分析表4的統計結果可知，易讀度30～50、50～60、60～70、70～80 即屬于“Difficult”、“Fairly difficult”、“Standard”、“Fairly Easy”的篇章各占 25%、25%、20%、25%，2007年的 TEXT C的易讀度竟為82.2，屬于“Easy”的范圍。整體來說，低于《考試大綱》“難度中等”的要求，但易讀度的平均值比較接近，如此可見TEM-4命題的科學性和嚴謹性。同時，我們也可以看出各單卷的易讀度相差較大，2006年的四篇文章易讀度波動幅度達到了38.9之高。根據理想模式，每一篇閱讀材料都應該符合一定的易讀度，差距過大會影響測試的真實性，從而降低測試的效度。因此，在控制易讀度方面，還需要進一步努力。根據《考試大綱》的要求，對照表5，建議易讀度在50～70之間，即“Fairly Difficult”和“Standard”之間比較合適，屬于難度適中的文章。

（二）預期回答

預期回答主要指閱讀技能方面。閱讀理解測試旨在測試學生的閱讀能力。李筱菊認為：“閱讀理解測試考核的應該是受試對材料傳達的多層次、多范疇信息的理解能力?！保ɡ铙憔?，1999：86）《考試大綱》要求：“能掌握所讀材料的主旨大意，了解說明主旨大意的事實和細節；既理解字面意思，又能根據所讀材料進行判斷和推理；既能理解個別句子的意義，也理解上下文的邏輯關系”。據此，筆者將TEM-4考查的閱讀技能分為細節辨認、判斷推理、主旨分析、語義理解，并以此對2006～2010年TEM-4試卷閱讀理解材料后的題目進行分類統計，結果見表6。

表6 ：2006～2010年TEM-4試卷閱讀理解材料考查能力統計表

從表6我們可以看出，TEM-4的閱讀理解部分對閱讀能力的考查是全面且符合大綱要求的，具有較高的內容效度。綜合這五年的試卷，細節辨認題和判斷推理題共有86題，占整個閱讀理解考查部分的86%。從整體來看，細節辨認和判斷推理是TEM-4閱讀理解部分對閱讀能力考查的主要內容。而主旨分析題和語義理解題則每卷只占1或2題?？傮w來說，各種能力的考查在試卷中所構成的比例是合理的。但是，個別年份的單卷其考查的能力有缺失，如2009年卷并未出現明確考查主旨分析的題目。

四、結論與建議

本文通過對2006～2010年TEM-4試題中閱讀理解部分的統計與分析發現，其閱讀材料的體裁以議論文為主，敘述文和說明文較少，未出現應用文；題材涉獵廣泛，基本涵蓋了社會、科技、文化等方面，但經濟題材并未涉及，部分單卷題材選擇較為集中；篇章長度超出標準單詞量的比例基本控制在－10%～10%之間，但2006年卷單詞量偏低程度較大；在閱讀速度和易讀度的控制上有待加強；閱讀能力的考查較為全面，結構合理，但部分單卷能力考查有缺失?？傮w來說，這五套閱讀理解試題基本符合《教學大綱》和《考試大綱》的要求，其測試具有一定的內容效度，對英語專業教學具有很好的導向作用，其命題是比較成功的。

針對命題中存在的一些不足之處，為了更好地提高TEM-4考試的內容效度，筆者提出以下建議：（1）材料選擇上應注意題材和體裁的多樣性和分布的合理性，適當考慮經濟類閱讀材料和應用文體裁的選擇，并注意平衡各題材體裁在同一份試卷中的比例；（2）注意個別單卷的單詞量控制，提高試卷整體的閱讀速度；（3）在閱讀難度的控制方面也需要進一步努力，將易讀度的波動幅度控制在較小范圍內，盡量使每篇閱讀材料的易讀度在50～70之間；（4）閱讀能力考查上要平衡考查技能，使閱讀測試能考查受試者全面的閱讀能力。

[1]陶加輝，鄔小琴.大學英語新四級閱讀理解內容效度研究[J].重慶交通大學學報（社科版），2009，（12）：136-140.

[2][8][10][12]高校英語專業四級考試大綱修訂小組.高校英語專業四級考試大綱（2004年新版）[M].上海外語教育出版社，2004.

[3]Heaton，J.B.Writing English Language Tests[M].Beijing：Foreign Language Teaching and Research Press，2000.

[4]Alderson，J.C.，Clapham，Caroline，Wall，Dianne.Language Test Construction and Evaluation[M].Cambridge University Press，1995.

[5][6]Hughes，A.Testing for Language Teachers[M].Cambridge University Press，1989.

[7]辜向東.高考英語全國卷與各省市自主命題卷共時與歷時研究[M].成都：四川大學出版社，2008.

[9]高等學校外語專業教學指導委員會英語組.高等學校英語專業英語教學大綱[M].上海外語教育出版社，2000.

[11]李筱菊.語言測試科學與藝術[M].長沙：湖南教育出版社，1999.

湖北經濟學院學報·人文社科版2013年1期

湖北經濟學院學報·人文社科版的其它文章: 關于湖北省大學生現實壓力的狀況研究——以武漢地區六所高校為例; 陜西省“新農保”制度的現狀調查研究——以西安市某行政村為例; 論我國保障性住房政策——基于土地財政視角; 印度居民收入差距的演變及其影響因素：1951～2004; 貨物運輸保險除外責任及其形成依據; 銅鋁期貨跨商品套利分析與研究