摘 要: 本文分析了大學英語口語測試理論基礎,介紹了大學英語口語測試的組織形式及其相關研究,探討了大學英語口語測試的發展趨勢。
關鍵詞: 大學英語口語測試 理論基礎 組織形式 發展趨勢
為了進一步推動我國大學英語教學,適應國家改革開放的需要,經教育部主管部門批準,全國大學英語四、六級考試委員會自1999年5月起,開始在部分重點院校實施大學英語口語考試。教育部頒布的《大學英語課程教學要求》也把培養學生的口頭交際能力列為大學英語教學的重要目標[1]。2005年2月,大學英語四、六級考試委員會頒布的《全國大學英語四、六級考試改革方案》也指出:“將積極開發計算機化口語考試,以進一步擴大口語考試規模。[2]”因此,在這一背景下探討大學英語口語測試的理論及方法,對推動大學英語口語教學具有十分重要的意義。
一、大學英語口語測試的理論基礎
根據李曉菊的劃分,語言測試經歷了科學前測試體系、結構主義測試體系和交際測試體系[3]。科學前語言測試體系把語言看成一個完整的語法體系規則,苛求語言形式的準確,認為學習語言就是學習語法規則、閱讀原著和雙語互譯,因此,科學前的語言測試不包含口試。結構主義測試體系的理論基礎是結構主義語言學和行為主義心理學。該體系強調測試體系的科學性、準確性和可靠性,重視口頭語言的句型結構,主張聽說領先、讀寫跟上。為了提高評分的信度,結構主義測試體系提倡客觀題。交際語言測試體系以交際語言能力為基礎。該理論認為,語言學習不僅要學習語言知識、語言技能,而且要學習交際能力。
結構主義測試體系和交際口試體系各有自己的優缺點,例如,從測試的目的和內容來看,交際口試的面要比結構主義覆蓋廣。從考試的題型和交際模式來看,交際口試更能體現交際的真實性和交互性。從評分方法來看,交際口試更能反映考生的真實水平和交際能力。但從實施的角度來看,交際口試的命題和評分要求高、難度大,而結構主義測試的最大優點是命題容易,評分信度相對較高,對考官的要求也不高。因此,為了提高大學英語口語測試的信度和效度,在實踐中往往將兩者結合起來使用。
二、大學英語口語測試的組織形式
從測試的組織形式來看,目前主要有三種形式:直接型口試、半直接型口試和間接型口試[4]。直接型口試就是通過讓學生開口說話對其口語能力作出評估,考官當場評定考生的成績。直接型口試有面試、會話、討論等多種形式,其中面試用得最多。半直接口試通過人機對話的方式進行,考前把事先準備好的試題進行錄音,測試時考生根據錄音要求進行口語活動,如朗讀、獨白、對話或討論,考官不當場評分,而是待考試全部結束后根據考生的錄音評定成績,如磁帶錄音口試和計算機輔助口試。間接型測試是通過筆試的方法來測量考生的口語水平,如通過辨音、完成對話等來檢查考生的口頭表達能力。由于通過筆試的方法無法真正地測量考生的口語水平,而半直接型口試的實施難度又比較大,因此,直接型口試成為大學英語口語測試最常見的方法。
三、大學英語口語測試的相關研究
1.測試形式
在實施不同形式的口試的過程中,人們發現三種考試各有利弊。鄒申認為,面試比較貼近現實生活,在內涵上也體現了語言的交際功能,因此具有比較高的表面效度,但其評分過程卻存在缺陷[5]。熊敦禮等對大規模的錄音口試進行研究后認為,錄音口試的優勢是節省人力、物力,考生的口語水平不受考官的語言水平和情緒的影響,而且相同的考題可使測試信度得到保證,不足之處在于語音資料的不足和錄音磁帶的不清晰可能引起評分的困難[6]。金燕、郭杰克通過面試和錄音口試的對比,認為錄音口試較面試更為經濟合理,具有可操作性,能采集到更多的語言樣本,但缺乏真實口語交際中的交互性[7]。邱東林等通過三次大規模的口語機考實驗后認為,計算機口試的優勢首先是省時省力和簡便;其次是客觀公正和考試的各種數據、資料、考題易于保管。不足之處是設備跟不上、效度不高和形式受局限[8]。蔡基剛在分析計算機口試的信度、效度及可操作性后指出,計算機口試的特點是:有利于開展大規模考試;題量和考試時間有所減少;組織實施效率高;評分人員隊伍可大可小;考試成本明顯降低[9]。
與此同時,人們還對非面試型口試與面試型口試的可替代性進行了研究。金燕、郭杰克通過錄音口試與面試的對比研究,發現兩者的相關系數達到了0.70[10]。蔡基剛通過計算機口試和面試的對比研究,發現兩者的相關系數達到了0.7085[11]。這說明半直接型口試可以替代直接型口試。韓寶成認為,考生的測試行為不僅受其語言能力的影響,而且受到測試方法的影響,因此,學生能否接受不同形式的口試也是可替代性研究的一個重要方面[12]。高丙梁通過計算機口試與面試的比較,發現盡管語言基礎不同的學生對不同測試形式表現出各不相同的適應程度,但大多數學生認同計算機口試[13]。
2.測試任務
測試任務的選擇是決定測試信度和效度的一個重要方面。高丙梁通過對我國12種外語期刊的檢索分析,歸納了我國大學英語口語測試的任務(見表1)[14]。呂長竑等對不同任務之間的效度進行了研究[15]。該研究把測試任務分為A、B、C三類。A類任務包括短文朗讀、看圖說話,B類任務包括基于短片的任務(如配音、觀點陳述等)、即席講話(給定題目),C類任務包括對話、小組討論等。A類任務主要測試學生的語音、語調,B類任務重點測試學生的連貫表達能力,C類任務測試學生根據根據對方的講話內容和情景恰當作出反應的能力。研究結果表明,A、B、C三類任務之間呈高度相關,反映的大致是同一能力,故其之間可以相互代替。
3.評分方法
如前所述,直接型口試是當場評定學習的成績,半直接型口試采用考評分離的方式,即在考試結束后根據錄音評分。評分時主要采用兩種方法:分析法和綜合法。分析法是把口語分解成若干要素,如語法、內容、語音語調、流利程度、準確度、詞匯等,評分人員根據一定的標準對不同的要素分別評分,各要素得分總和即為總分。綜合法是評分人員根據一定的標準,憑總體印象給考生打分。分析法的優點是信度較高,綜合法的優點是效度較高。為了提高評分的信度和效度,也可以將兩者結合起來,進行分析性的綜合評分。實踐證明這種評分方法科學、客觀,而且有很強的可操作性[16]。在分析現有評分方法不足的基礎上,張文中、郭晶晶和易千紅、曾路建議在口語測試中引入模糊數學的基本原理,通過建立模糊子集的方式進行評分,為大學英語口語測試的評分提供了新思路[17][18]。
4.信度和效度
信度與效度是語言測試中兩個互補的因素。信度說明考試結果與語言行為之間的關系,效度反映語言行為與語言能力之間的關系。鄒申對直接口試和間接口試的信度和效度進行分析,認為直接口試具有較高的表面效度,而在內容效度上兩者似乎都存在一些問題[19]。金燕、郭杰克對大學英語口試和錄音口試進行了對比測試,兩者在評分信度和內容效度等方面均取得令人滿意的結果[20]。蔡基剛進行的面試和計算機口試對比測試發現,計算機口試無論在效度和信度方面都將超過目前四、六級面試型口試,在考試成本上也有較大的降低[21]。這些研究表明,口語測試形式的發展是在不摒棄信度的前提下尋求效度的不斷提高。
5.反撥作用
反撥作用是反映語言測試社會效果質量標準的一個重要方面[22]。根據高丙梁的總結分析,測試的反撥作用主要體現在三個方面。首先是反映在對教學的指導上,如大學英語口語教學應重視文化的導入,重視對學生語篇意識的培養;在加強口語能力培養的同時,不放松語言基礎學習;口語測試和口語教學要相互聯系,保證測試對教學產生有益的作用。第二個反撥作用體現在學生學習態度的轉變上,例如,學生學習英語口語的主動性和積極性大大提高,課堂氣氛明顯比以前活躍,學生的口語能力有了很大提高。第三個反撥作用體現在對教學管理層和教師教學理念上,例如,大學英語四、六級的成功開展,不僅觸動了學校管理層,而且使許多英語教師認識到提高學生口語能力的重要性[23]。
四、大學英語口語測試的發展趨勢
本文討論了大學英語口語測試的基本理論、測試形式和相關研究,從中我們可以看出,大學英語英語口語測試呈多元化的發展趨勢,這種趨勢主要體現在:第一,對口語的特點有了更深刻的認識,口語測試從過去重視語音、語調、詞匯和語法轉向重視口頭交際能力。第二,口語測試形式更加豐富,從過去單一的面試發展到面試、錄音口試和計算機輔助口語測試等多種形式并存的局面。第三,測試任務的選擇更加靈活寬泛,從過去的朗讀、復述、看圖說話發展到今天的交談、討論和辯論。第四,大規模口語測試受到重視,無論是專家學者還是一線教師,都積極參與大規模口語測試研究,特別是計算機輔助口語測試的研究。隨著測試理論和測試技術的發展,大學英語口語測試將不斷地發展和完善。
參考文獻:
[1]教育部高等教育司.大學英語課程教學要求[M].北京:清華大學出版社,2004.
[2]大學英語四、六級考試委員會.全國大學英語四、六級考試改革方案(試行)[Z].大學外語教學通訊,2005,(1).
[3]李筱菊.語言測試:科學與藝術[M].長沙:湖南教育出版社,1997.
[4]劉潤清,韓寶成.語言測試和它的方法[M].北京:外語教學與研究出版社,2000.
[5][19]鄒申.試論口語測試的真實性[J].外語界,2001,(3):74-78.
[6]熊敦禮等.大學英語大規模錄音口語測試研究[J].外語教學與研究,2002,(4):283-287.
[7][10][20]金艷,郭杰克.大學英語四、六級考試非面試型口語考試效度研究[J].外語界,2002,(5):72-79.
[8]邱東林等.大學英語聽說機考嘗試[J].外語界,2005,(4):76-79.
[9][11][21]蔡基剛.大學英語四、六級計算機口語測試效度、信度和可操作性研究[J].外語界,2005,(4):66-75.
[12]韓寶成.Lyle F.Bachman的語言測試理論模式[J].外語教學與研究,1995,(1):55-60.
[13]高丙梁.計算機口試與面試的比較研究[J].外語電化教學,2007,(4):73-76.
[13][23]高丙梁.大學英語口語測試研究熱點評述[J].外語教學理論與實踐,2008,(1):92-96.
[15]呂長竑等.大學英語口語側試任務的效度研究[J].外語界,2006,(3):72-80.
[16]楊惠中.大學英語口語考試設計原則[J].外語界,1999,(3):48-56.
[17]張文忠,郭晶晶.模糊評分:外語口語測試評分新思路[J].現代外語,2002,(1):99-103.
[18]易千紅,曾路.口語測試評分模板的設置與應用[J].現代外語,2004,(1):77-82.
[22]Bachman,L.Palmer,A.Language Testing in Practice,Oxford:Oxford University Press,1996.
基金項目:該文為湖北省高等學校省級教學研究項目《計算機輔助大學英語口語測試研究》的成果之一(項目編號:2008272)。