摘要: 信度與效度是語言測試永恒的主題,本文指出效度應重于信度。語言測試應從傳統的信度取向轉變為效度取向,并結合全國大學英語四、六級考試,具體說明這一取向的轉變對語言測試及教學質量所產生的深刻影響。
關鍵詞: 測試 信度 效度 反撥作用
語言測試是一門跨學科的綜合性科學,從語言學、語言教學法和學習理論取得科學內容,從心理測量學獲得科學手段,從長期的教學實踐和學習需要發展而來。(盧桂榮,2002)語言測試是外語教學的重要組成部分,主要用于評估外語教學質量,通過對學生語言能力進行科學、準確、客觀、公正的評價,了解學生語言能力的真實情況,找出教學過程中存在的問題,以便對后一階段的外語教學改革提供信息和借鑒。大學英語四、六級考試對教學大綱所要求的我國大學生的英語能力進行客觀的、公正的、正確的評價,反映我國改革開放以來日益擴大的國際交流對我國大學生英語能力的要求,為推動我國大學英語教學服務,為我國各級用人部門選拔人才、合理使用人才的目的服務。(楊惠中,2003)
一、語言測試的目的和用途
語言測試的主要目的是反饋、評估、選擇和研究測試提供的信息反饋使教師了解教與學的情況,評估教學效果,選擇適當的教材和方法,確定教學進度,并據此來指導教學與大綱;它也是開展科研活動,研究語言教學的有力工具。
考試是一種教育測量與評估方法。語言測試是對語言學習者的語言能力和水平的測量與評價。語言測試的第一個用途就是用于語言教學。外語教師通過進行各種教學考試,可以了解教學的情況,發現教學中存在的各種問題,從而改進教學方法,提高外語教學水平。語言測試的第二個用途是用以語言學習者的自我評價和激勵。語言測試的第三個用途就是用來選拔人才。
二、測試設計中的關鍵問題是效度與信度的統一
一提起測試,人們首先想到的是測試的信度和效度問題。語言測試的信度是指測試結果的可靠程度,即一套題的測試結果是不是比較穩定,如果一套題今天測試與幾天后測試結果比較一致的話,就說明這套試題的信度較高。語言測試信度的高低主要說明的是測試結果在多大程度上反映了受試者真實的語言行為。
效度是一種相關性,表明測試與測試目標的關聯程度。一般說來,如果一套測試題測量了試題設計者想要測量的或考查的內容或能力,那么這就是一次效度高的測試。根據結構主義測試學家的傳統解釋,語言測試的效度是指測試是否考了它所要考的。一般認為效度有五種:表面效度、結構效度、內容效度、共時效度和預示效度。
世界各國的教育部門與測試機構一直在努力開發理想的外語水平測試方法,使信度、效度兩方面同時達到高水準,即測試的穩定性強,測試中能做到范圍與難度一致,條件與方法一致,評分標準一致;能全面覆蓋教學大綱或考試大綱,試題真實有效,難易比例恰當。
三、語言測試的取向對全國四、六級考試的影響
全國四、六級考試屬水平考試,應用范圍廣,參考人數多,需全面測量并區分考生外語知識掌握的程度與綜合運用的能力。理想的外語水平測試應具有高度的可靠性和有效性,即力求高信度與高效度,并處理好這兩者之間的關系。然而,信度和效度是矛盾的兩個方面,往往顧此失彼。
1.傳統意義上的全國四、六級考試的取向。
信度重于效度、信度和效度的統一與對立的性質決定了同時具有高信度和高效度的語言測試是不存在的。任何語言測試都必須在二者之間進行平衡和折中。然而這種平衡和折中在現代語言測試中并沒有得到很好的體現。過去四、六級考試測試的一個重要偏向是過于注重信度,忽視效度。主要表現是測試內容和形式脫離語言運用實際,重知識輕能力,注重領會式技能的考查,忽視復用式技能的考察。這種偏向在測試題型上的表現是測試以客觀題為主,從而導致多項選擇題的泛濫使用,以致于它在相當長的一個時期內似乎成為了語言測試的唯一方式(Hughes,1989)。現代語言測試的這種偏向在應試教學的作用下給外語教學帶來了嚴重的負面影響,阻礙了外語教學培養交際能力這一目標的實現。外語學習者往往經過多年的學習盡管可能以較好的成績通過考試,但其語言實用能力卻很低下。語言測試的這種偏向在應試教學的作用下給外語教學帶來了嚴重的負面影響,阻礙了外語教學培養交際能力這一目標的實現。
2.四、六級考試從信度向效度的轉軌。
為了改變四、六級考試客觀題比重較大的問題,考試委員會于1995年和1996年兩次公布了可能采用的新題型,即英譯漢、簡短回答題、聽寫填空和復合式聽寫,適當增加了主觀題的比例。1999年5月,四、六級考試委員會開始實施口語考試。這些措施的實施都將有利于維護正常的教學活動,并能促使語言測試更客觀地反映學生的語言應用能力。委員會盡量增加主觀試題,即增加對考生語言知識的綜合運用、語言技能的實際掌握以及口語、筆頭的組織、表達等活用能力的綜合測試,如造句、完形填空、翻譯、短文回答、復合式聽寫、作文、會話等,并盡量避免各種形式的選擇題以減少考生猜測造成的無效差異。更重要的舉措是,在教育部于2004年頒布了新的大學英語教學大綱(修訂版)后,四、六級考試在題型、分值、計分方式等方面進行了重大的改革。客觀題減少而主觀題大幅增加,很明顯,四、六級考試正從對信度的倚重轉變為對效度的重視。
1996年以前的主觀題只有作文,占總時間的25%;而從1996年起,盡管總題量沒變,但體現效度的主觀題增加了。1996年采用的新型題是英漢翻譯,加上作文,主觀題內容約占時間的38%。而在2004年后的新題型中,整個試卷中作文,簡短回答問題,復合式聽寫及翻譯等主觀試題占總分的40%。一般來說,如果一份試卷的客觀題內容占三分之二,主觀題內容占三分之一,從卷面上看,該試卷就具有了一定的信度和效度。因此可以說,改革后的大學英國四、六級考試對我國大學英語教學的發展起了非常大的作用。
語言測試還應該盡可能地以語篇為基礎,超出語句層次,即多采用總體綜合法。綜合法主張通過一次測試全面地評價學生的總體語言水平,學生必須綜合地運用所有的語言知識和技能才能較好地完成此類試題。全國四、六級考試常用的題型有綜合改錯、完形填空、聽寫、口語、作文等。
四、通過測試改革,推進教學改革
語言測試給外語教學帶來的影響即人們常說的反撥效應,是衡量語言測試的重要標準之一,因此也被許多測試學家稱為反撥效度。大學英語四、六級以效度為主導無疑將給外語教學帶來積極的影響,給外語教學帶來顯著影響并推動外語教學向培養學生實用語言能力的方向發展。Hughes(1989)曾指出教學與考試是一種合作關系。考試是課堂教學工作的自然延伸,給教師和學生們提供有用的信息,是雙方提高與進步的基礎。一旦考試的形式與內容被固定下來,教師們就會自然地選擇那些與考試內容、形式一致的材料進行授課。好的測試也有助于發現課堂上或某些學生們會遇到的難點,還有助于找到教學大綱中沒有被給予足夠重視的甚至被忽略的區域。因此,我們相信四、六級考試的改革將會對教學實踐起到一種正面的積極反撥作用。從一些學校的情況看,凡是教學改革較好的學校,學生的語言素質和技能都較好。
五、總結
信度與效度是語言測試兩大基本要求,信度與效度的關系問題是語言測試的根本問題。從信度與效度等測試標準出發來評價或取舍一種測試模式或測試題型是必要的但卻遠遠不夠,更重要的是要考慮它對教學的影響,看它是否有利于教學目標的實現;是否符合學習過程,對學生是否有一種有利的引導作用和督促作用。
大學英語四、六級從信度向效度的轉變是為主導符合學習過程,對學生有引導作用和督促作用。并無疑將給外語教學帶來積極的影響,有利于教學目標的實現。給外語教學帶來顯著影響并推動外語教學向培養學生實用語言能力的方向發展。總之,語言測試為語言教學服務。語言測試手段只有經過不斷的探索和嘗試,才能不斷完善,才能真正做到能對受試者的語言綜合能力進行客觀、準確和公正的評價,為提高教學質量服務,這才是語言測試的本意之所在。
參考文獻:
[1]Hughes A.Testing for Language TeachersCambridge.Cambridge University Press,1989.
[2]Lyle F.Bachman Fundamental Considerations in Language Testing.上海外語教育出版社,1999.
[3]J.B.Heaton Writing English Language Tests.外語教學與研究出版社,2000.
[4]韓寶成.語言測試:理論、實踐與發展.外語教學與研究,2000.
[5]朱正才,楊惠中.關于機助自適應大學四、六級考試.外語教學與研究,2001.
[6]楊惠中.大學英語四、六級考試十五年回顧.外國語,2003.
[7]唐雄英.論大學英語四、六級測試改革趨向.江西教育學院學報,2003.
[8]盧桂榮.語言測試與語言教學.克山師專學報,2002.