摘要: 和語言教學一樣,語言測試的發展也是一個不斷探索、不斷完善、不斷走向科學化的過程。從現行大型語言測試來看,語言測試將呈現出這樣一個繼續發展的趨勢:重視對語言運用能力的測量、重視測試材料的真實性、測試基于任務、探索大規模錄音口試的可行性、重視被試的個性發揮、不斷開發新的機助測試和電子評分系統等。
關鍵詞: 英語語言測試 發展趨勢 語言能力 真實性 機助測試
一、前言
語言測試的主要目的是對被試的語言能力作出準確、公正的測量。受語言學、語言教學和心理測量學的影響,語言測試大致經歷了以教什么就測什么為特征的前科學語言測試階段;強調標準化和客觀化的心理測量學——結構主義階段;強調單一語言能力和提倡綜合測試法的社會語言學階段;以及二十世紀八十年代以后流行的以測試語言運用能力為目標的交際語言測試階段(Carroll,1980;Bachman,1990;Bachman Palmer,1996)。至今,隨著科學技術的不斷發展、計算機的日漸普及、語言教學的不斷改革和語言的實際運用能力越來越受到重視,語言測試呈現出前所未有的發展態勢,在測試的設計上體現出注重測試材料的真實性、重視考生的個性發揮、對大規模錄音口試的嘗試、機助測試、電子評分系統被開發利用等發展趨勢。
二、測試將更加重視材料的“真實性”
語言測試的真實性是測試界一直關注的問題,Spolsky早就指出:“語言測試的真實性標準給測試領域提出了語用和倫理的問題。測試材料缺乏真實性對我們根據測試成績所得出的結論也提出了疑問。”
所謂真實性,就是指測試方法特征與將來某一特定目的語使用的情景特征相關的程度。也就是說,我們在命制考題時,考試任務的特征必須與將來目的語使用的情景特征相一致。做到了這一點,考試任務才算有了真實性。舉例來說,參加商務英語(BEC)考試的考生在其工作中應當具有與客戶用英語就商務活動面對面交談的能力,該項考試的口試中就安排了考生之間面對面交談的交際活動(interaction)。
真實性對考試的重要性在于:首先是對考生的正面影響。考試的任務、話題,內容和形式都與現實生活中的情況相一致,給考生以認同感和親切感,有助于他們發揮最佳水平。其次,由于考試任務與現實生活中的任務相對應,根據考生完成考試任務時的表現能直接推斷考生今后在完成現實生活中的任務時的表現,從考生的分數能直接推斷考生的語言使用能力。最后,考試的真實性會對教學產生良好的反撥作用。
三、大規模計算機輔助口試的實施
計算機輔助英語口試是現代教育技術革新的必然產物,目前尚處于探索階段,只在較小的范圍內實施、大規模推廣后,在考試信度、效度方面可能出現一些問題,如測試的真實性問題、人機互動問題等;實施過程中也會遇到許多困難,諸如設備資金的投入、學校對學生計算機能力的自主訓練的重視程度等(司耀龍,2008)。所以如何更大程度地利用計算機技術實現接近于真實語言環境的測試,解決COPT考試缺乏真實口語交際中的交互性的缺陷,如何充分利用網絡的優勢更好地組織反饋,是目前需要大力研究的問題。當我們在這幾個方面的研究取得進展,獲得進一步的數據后,COPT可望在沒有條件實施面試型口試的地區,或在需要擴大口語考試規模時,為廣大考生提供一個更具現實可操作性的口語能力測量手段,為進一步完善我國的大學英語教學和測試開辟新的天地。
四、個性化答題類評估方法的使用
1.個別檢查
個別檢查在學校已經是一種常見的教學輔助手段。在這里我們指的是與學生語言能力評估有機地結為一體的個別檢查。它的優點是有助于教師因人而異地掌握或了解學生的語言水平(如語言點、語言技能、某一方面的語言運用能力等)。對于學生來說,這種形式可以使學生在較為輕松的環境中展示自己的語言水準,有利于提高學習自信心。
2.自評與互評
自評與互評和傳統的考試評估方式之間存在天壤之別。在傳統的考試評估方式中,教師處于主動地位,是評估者;而學生(考試對象)則處于被動地位,是被評估對象。學生自評與互評可以改變這種被動狀況,使他們參與評估過程,這有利于提高學生的學習積極性和參與意識。當然,這種方式的不利面是學生不一定知道如何進行評估,評估的結果可能缺乏信度。
3.學期作品評估
學期作品評估屬于延續性評估,時間跨度可短至幾個星期或長至數月或一個學期。可以說,學期作品評估是一種新穎的測試評估方式,評估重點不同于傳統考試。它并不要求學生答題,而是注重學生的語言實際運用能力。學期作品可以包括按照某一主題由學生所寫的文章、收集和整理的資料、制作的電腦軟件、光盤、幻燈片或其它作品等。
上述三種方式有一個共同點,即擺脫了依賴考試來評估學生語言水平的傳統模式。盡管它們還存在這樣或那樣的問題,但在拓寬語言能力評估層次與評估面上向我們展示了頗具吸引力的種種可能性。與傳統考試方式的結合使用應更被看好,因為它不僅可以幫助教師更深入地了解學生語言表現的各個層面,而且更重要的是可以減少過于依賴考試所帶來的負面效應。
五、電子評分系統的推廣
由于行為測試越來越受到重視,語言測試中會出現較多主觀性題目。主觀題的批改既費時又費力,且標準不易掌握。我國著名語言學教授韓寶成曾在《外語教學與研究》上發表文章,介紹了其嘗試用計算機對被試主觀題的答題情況進行評分的情況。韓教授等經過五年的努力,采用先進的計算語言學技術成功地開發出了一套電子作文打分系統(Electronic Essay Rater,簡稱e-rater)。與人工閱卷相比,其準確率已達87%至94%。e-rater的開發和利用,大大降低了閱卷的成本,將會引起測試評分的革命。
六、結語
語言測試測什么、怎么測,是語言測試研究永恒的主題。從上述討論可以看出,語言測試總的發展趨勢是:從只測量假設的、不自然的語言項目到注重自然的、真實的語言運用;從只看單一的語言能力到重視被試的全面的語言運用能力;從測試以設計者為中心到以學習者為中心并關注被試的個性發揮;從只看答題結果到注意被試的答題過程;逐漸向機助測試過渡并結合最新電子技術開發智能型電子評分及測試系統。總之,語言測試的形式和方法將日趨多樣化、科學化。語言測試將從整體上不斷走向完善,更好地為語言教學服務。
參考文獻:
[1]Carroll,B.J.Testing communicative competence[J].Annual Review of Applied Linguistics 1980.8.
[2]Long,M.H. Norris,J.M.Task-based Language Teaching and Assessment[A].In M.Byram(eds.).Encyclopedia of Language Teaching[C].London:Routledge,2000.
[3]Skehan,P.A framework for the implementation of task-based instruction[J].Applied Linguistics,1996:17.
[4]Spolsky,B.The limits of authenticity in language testing[J].Language Testing,1985.2.
[5]Willis,J.A Framework for Tasked-based Learning[M].London:Longman,2006.
[6]李清華.論交際測試中的“真實性”[J].外語界,2001,(6).
[7]韓寶成.語言測試:理論、實踐與發展[J].外語教學與研究, 2001,(1).
[8]黃素華.科學公正地測試學生的口語能力[A].載鄒申編.英語語言測試[C].上海:上海外語教育出版社,1998.