金 力
(內蒙古師范大學 公共外語教育學院,內蒙古 呼和浩特 010022)
自1985年的《大學英語教學大綱》明確提出大學英語的教學目標之一,是培養學生具有初步的說的能力以來,大學英語教學在培養學生口語交際能力的道路上探索了整整25年。其間,隨著時代發展對人才素質結構需求的調整,《大學英語教學大綱》亦幾經修訂,不斷重新定位大學英語教學目標。1999年的《大學英語教學大綱》將“培養學生具有初步的說的能力”轉變為“培養學生具有一定的說的能力”,2004年教育部頒布的《大學英語課程教學要求(試行)》(以下簡稱《課程要求》)與1999年的《大學英語教學大綱》比較,有許多新的突破,尤其在教學目標方面,從培養學生的閱讀能力為主轉變為培養學生的綜合應用能力,尤其是聽說能力為主。因此,英語口語交際能力的重要性從大學英語教學目標的變化中得到了充分體現。
《課程要求》中明確規定:“大學英語的教學目標是培養學生的英語綜合應用能力,特別是聽說能力,使他們在今后的學習、工作和社會交往中能用英語有效地進行交際……”《課程要求》從三個層次上對說的能力提出了要求。一般要求:能在學習過程中用英語交流,并能就某一主題進行討論,能就日常話題用英語進行交談,能經準備后就所熟悉的話題作簡短發言,表達比較清楚,語音、語調基本正確。能在交談中使用基本的會話策略。較高要求:能用英語就一般性話題進行比較流利的會話,能基本表達個人意見、情感、觀點等,能基本陳述事實、理由和描述事件,表達清楚,語音、語調基本正確。更高要求:能較為流利、準確地就一般或專業性話題進行對話或討論,能用簡練的語言概括篇幅較長、有一定語言難度的文本或講話,能在國際會議和專業交流中宣讀論文并參加討論。
根據《課程要求》,大學英語教學的重點為培養學生的英語綜合英語能力,尤其聽說能力,而聽說能力的培養首先要以相應的教學材料為依托。為此,各大出版社相繼推出了立體化教材:如《新視野大學英語》、《新時代交互英語》、《大學體驗英語》等和與之相匹配的基于網絡的英語教學平臺和綜合視聽說課程系統。學生不僅可以利用網絡進行自主學習,傳統的精讀課現在也演變成兩種課型:讀寫譯和視聽說,并且各自配有完全獨立的教材。
在口語教學日益得到重視的同時,對口語教學效果進行價值判斷,測量學生的口語交際能力也成為大學英語教學關注的熱點問題之一。
隨著大學英語口語教學重要性的日益凸顯,對口語測試的研究也呈上升趨勢。根據口語測試的形式,大致可分為兩個研究階段:20世紀90年代至本世紀初對面試型口語測試的研究和2004年以來對計算機輔助口語測試的研究。取得了大量有價值的研究成果。
20世紀90年代至本世紀初對面試型口語測試的研究已經比較成熟,既有理論研究,又有實證研究。蔣秋霞、趙春霞(1999)介紹了由語言學家Chomsky和 Thorndike提出的口語測試的理論基礎;徐海銘、謝忠明(2006)針對英語專業四、八級考試口試分析的效度檢測方法提出,制定口語能力特質因素分析性等級評分表,從語言能力和策略能力兩大方面對考生的口語水平作出評定。
根據鐘長艷(2009)對外語教育類核心刊物所發表的文章的統計,實證研究的范圍涉及口語測試特點(郭麗,1999;文渤燕,2000)、大學英語口語測試模式的探索(李紅,1999;熊敦禮、邱東林、季佩英,2004;王建勛、張磊,2007;鄒瓊,2007)、國外英語口語測試模式的介紹及其在我國口語測試中的應用前景的探討(薛常明,2000;陶丹玉,2006)、對全國英語專業四級口語水平的評估(文秋芳、吳彩霞、LydiaSo,1998)、英語口語測試信度、效度的研究(鄒申,2001;呂長斌、宋冰、王焰、劉文麗、黎斌,2006;黃永紅,2006;覃朝憲、符存,2007)、口語測試的統計學方法研究(易千紅,2003)等。
2004年以來對計算機輔助口語測試的研究主要有:對大學英語大規模錄音口語測試的半直接型口試進行的理論探索(熊敦禮、陳玉紅、劉澤華、黃更新,2002);對大學英語四、六級計算機口語測試效度、信度和可操作性的研究(蔡基剛,2005);對大學英語基礎階段機器錄音口語測試模式的探討(劉艷萍、唐曉、陳英、李劫全,2007);對數字化口語考試的流程及其特點進行的探索(劉善德,2007)。
上述研究統計結果顯示,英語口語測試研究的主要對象有英語專業學生、商務英語專業學生和非英語專業學生,其中以非英語專業學生為對象的研究很少,對計算機輔助大學英語口語測試的研究更少,代表性研究有:蔡基剛(2005)對四、六級計算機口語測試的效度、信度和可操作性的研究。但是,將計算機輔助口語測試作為大學英語課程成就測試的一個部分,探討大規模口語測試的可行性和試題形式及內容對學生的影響的研究屈指可數。
依據《課程要求》,大學英語教學應貫徹分類指導,因材施教的原則,以適應個性化教學的實際需要。我國高等學校應根據實際情況確定學生應該達到的要求(一般要求、較高要求和更高要求)。我校(內蒙古師范大學)是內蒙古自治區最早成立的高等院校之一,蒙古族及其他少數民族學生占相當比例,生源地域差異較大,其入學時的英語水平差距也很大(130-30分之間),并且平均分在90分以下的學生約占60%。因此,我校的大學英語教學要求定位在“一般要求”的層次,即高等學校非英語專業本科畢業生應達到的基本要求。為了切實達到提高學生口語交際能力的目標,我校建立了由課堂教學和網絡自主學習兩大部分構成的教學模式,其中課堂教學分為讀寫譯和聽說課兩種獨立的課型。此外,學生還需要進行每周2學時的人機對話聽說訓練。大學英語課程設置上充分體現了對學生聽說能力培養的重視,而且對口語能力的評價也成為評價學生英語學習成就得一個重要指標。
口語測試是我校大學英語課程成就測試的一個重要組成部分(占各學期總評成績的10%)。我校從2005年起實行大學英語機上口語考試,用于測量和評價學生運用英語進行口語交際的能力。學校還建立了包括五個語言實驗室,共410臺電腦的大學英語自主學習中心,為實施計算機輔助口語測試提供了必要的硬件設施。
本研究從目前我校大學英語正在實施的機上口語測試研究入手,了解學生對口語機考這種測試形式和不同機考題型的態度,探討適合我校大學英語口語考試的試題設計和內容,包括:內容、題型、數量、測試時間等,進而建立效度,信度較高的口語試題庫。主要研究問題有以下三個方面:
(1)口語機考是否能反映學生的真實口語水平?能否得到學生的認可?
(2)學生對口語測試中的各種題型的主觀反應即態度如何?
(3)學生在口語測試中的各題答題表現如何?
本研究的研究對象為大學二年級學生,共378名。他們已經完成了大學英語基礎階段的學習(1-4級),參加過1-3級的期末機上口語測試,接受過不同題型的測試,對機上口語測試有較強的主觀感受和客觀認識。所用口語教材為北京外語教學與研究出版社出版的《新視野聽說教程》。研究對象除了隔周上兩課時的聽說課以外,還進行兩小時的計算機輔助大學英語聽說自主學習,學習軟件為“大學體驗英語學習系統”。因此,這些研究對象對計算機輔助英語口語和聽力測試已經非常熟悉和了解。
本研究使用的主要研究工具有:四級英語口語測試題和學生調查問卷。首先通過問卷調查方式了解和分析學生對口語測試的態度;然后結合分析學生在口語測試中的表現,了解口語機考對學生真實口語水平反應的程度;最后通過分析學生對各種題型的作答情況,診斷問題所在。
問卷共有九個問題,分別調查學生對口語機考的態度(5個題)(見表5);學生對各種題型的主觀反應(4個題)(見表6)。
四級口語測試卷由短文朗讀(2分)、回答問題(3分)和視聽理解(5分)組成。短文朗讀要求學生大聲朗讀出現在測試軟件屏幕上的文字,約250詞,朗讀內容均從本學期所學課文中節選。錄音前,給學生1分鐘時間準備,然后開始錄音,時間為1.5分鐘。回答問題包括難易搭配的兩個問題,均是學生所熟悉的話題。經1分鐘準備后,就所給話題1進行連續半分鐘的表述,話題2進行連續1分鐘的表述,錄音時間為2分鐘。視聽理解要求學生首先觀看一段視頻材料,然后根據材料內容回答問題,時間約為3.5分鐘。
本研究采用定性和定量研究相結合的方法,包括測試成績分析法和問卷調查法。先用事先準備好的試題對學生進行測試,對測試成績進行分析。考試結束后對學生進行問卷調查。
3.6.1 口語考試環境
口語考試使用的軟件為藍鴿口語考試系統。考試在大學英語自主學習中心進行,考生每
人一臺電腦,一付帶有話筒的耳機。考場內有兩名監考教師和一名技術人員。每場考試時間為20分鐘,其中答題時間為10分鐘。考試結束后,由服務器自動分配一定數量的測試者錄音文件接受評卷教師的打分。教師用藍鴿閱卷系統進行評分,每位學生成績由兩位教師評定,考生的最終成績為兩個分數的平均分。根據題型,評分從語言表達內容、準確性、靈活性和適切性及語音語調五個方面分析評價考生的英語口語水平。
計算機口試受限制于技術條件,能夠采用的題型數量無法同面試型口試相比。文獻研究顯示,蔡基剛(2005)在大學英語四、六級計算機口試研究中采用了四種題型,司耀龍(2008)在基于計算機的大規模商務英語口語診斷測試實踐研究中也涉及了五種題型,本研究所采用的題型略有不同,如下表所示:

表2 口語測試題型
根據這些題型的特點,可以歸納為三類:非交際類口試,半交際類口試和交際類口試。非交際類口試的特點是單向交流,主要考察語音語調,朗讀是典型的例子。半交際類口試有一定的交流因子在內,受試者需通過思維活動組織語言,但主要是受試者單方面的語言思維活動,計算機只需提供圖片、聲音或文字等信息材料,而不參與或構建互動,如看圖描述、回答問題、視聽理解和復述。在交際類口試中,出現人與計算機的交流或人與人的交流,更接近于真實的交際環境(司耀龍2008)。表2顯示,本研究所采用的題型主要為半交際類和非交際類題型。
3.6.3 座位安排及試題發放
每一個口語考試機房的容量為70人,每場考試人數為35人,以減少考試時的相互干擾。試題由事先準備好的題庫中隨機發放,共有六套試題,每場試題有所不同。試卷分A、B卷,相鄰座位考生的試題形式相同,但內容不同。每場考試時間約為20分鐘,答題時間約10分鐘。考試結束后,提交試卷,計算機將把錄音文件上傳到服務器,等待進行成績處理。
3.7.1 總成績分析及單項成績分析
考試結束后,我們對學生的總成績和各單項成績分別進行了統計分析。考試總成績為10分,各單項成績分別為:朗讀2分,回答問題3分,視聽理解5分。單項成績中平均分最高的是朗讀(1.75分)最低的是回答問題(1.25分),詳見下表。

表3 學生口語考試成績(10分制)統計表

表4 分數段百分比統計
表3統計結果顯示,學生的整體口語能力不理想,而且各單項成績的高低分差異也說明,學生個體之間的差距較大。表明,學生的口語能力參差不齊。各單項成績分析結果顯示,成績由高至低依次為:朗讀1.75分(滿分2分),回答問題1.25分(滿分3分),視聽理解3.00分(滿分5分)。根據朗讀的標準差,學生成績分散度較小(0.23),表明學生的朗讀水平比較接近。朗讀是學生最早用英語表達的主要形式,早在英語學習初期學生就開始朗讀單詞、句子和課文,而且朗讀是進一步用英語交流的基礎,學生比較重視朗讀。跟進的調查問卷分析顯示,學生最喜歡的口語試題是朗讀,但同時又認為,朗讀最無法反映真正的口語交際能力。
回答問題得分最低,學生需要在短時間內組織語言,在沒有任何提示的情況下,就所給的兩個問題發表個人觀點。結合調查問卷結果,學生認為,這是最難的題型。因此,學生在該部分測試的表現最差(均分1.25 分)。
通過對兩個體系的風險因素打分后,分別進行因子分析并提取公共因子,再以每個因子的方差貢獻率作為權數與該因子的得分乘數之和構造得分函數:
視聽理解測試結果表明,學生的個體差異較大(標準差為0.67)。視覺化試題信息對考生水平的發揮有積極的影響。除語言信息外,視頻短片從多角度給考生提供信息,對他們的語言表達起到了引導和刺激作用,學生的語言輸出量較大,這與李玉平(2009)的研究結果一致。學生在調查問卷中也反映,相對于其他兩種題型,視聽理解最能夠體現其真實口語交際能力。但是,學生的語言水平差異較大,語言輸出的質量差異也較大。
為了進一步了解學生的整體口語水平,我們將10分制考試分數劃分為四個分數段:優秀(8.5分以上)、良好(大于等于7分小于8分)、一般(大于等于6分小于7分)和較差(低于6分)。百分比統計結果顯示(見表4),30.90%的學生口語成績一般,位于這一分數段學生的總體表現為:朗讀較流利,但是一些語音語調不太正確,偶爾會影響理解;能表達一些個人觀點,有時會有較長時間的停頓,而且有一些語言錯誤,影響理解。
綜合成績分析結果,在完成兩年的大學英語聽說口語訓練后,70%以上的學生基本能夠達到《課程要求》中所描述的口語表達能力的“一般要求”(見表1)。
3.7.2 問卷調查和分析學生對口語測試的態度
每場口語考試結束后,考生立即在另一間教室接受問卷調查。共發放問卷378份,收回有效問卷369份。首先對問卷的第一部分,即考生對機上口語測試的主觀認識和態度進行了分析(見表5),發現考生對機上口試的看法趨于一致,大部分考生持認同態度(72.21%),認為可以接受這種考試方式。53.30%的考生認為,機考評分更公正。但對于機考是否有助于發揮真實水平,尚存在著較大分歧,這與(司耀龍2008)的研究結果一致,超過三分之一的學生不置可否。我們認為,產生分歧的原因主要在于,機考缺乏互動性(52.34%),試題類型缺乏雙向交流性。機考缺乏互動在很大程度上是由于技術條件所限,而這一點可以通過技術研發得以改善。對“機考更能緩解緊張和焦慮情緒”持贊同和否定態度的學生人數相當。
孫元春(2007)對機助與面試英語口語測試中學生焦慮度進行過對比分析與研究,結果與本研究相似。究其原因在于,首先,在交流暢通程度方面機助測試環境帶來的焦慮程度要遠高于面試中的焦慮。這說明對人機之間構成的交流渠道的陌生感加劇了學生的焦慮,不利于其真實水平的發揮。其次,機助測試與面試相比缺乏人文關懷,真實感差。特別是屏幕上顯示的回答問題的時間給學生一種緊迫感;而面對面口語測試除了語言交流,還有情感交流,教師鼓勵的眼神和微笑對于緩解學生的考試焦慮有很大的作用。

表5 學生對機上口語測試的態度

表6 學生對口語測試試卷題型的認識
對口語測試試卷調查分析結果顯示,受試者最喜歡的題型是朗讀(81.32%),但同時也普遍認為,該題型無法反映真實的口語交流能力(11.79%),因為缺乏交流的互動性(0.79%)。相比較而言,視聽理解可以較好地反映真實的口語水平。心理學研究表明,人們對于所看到的東西,能記住20%;對于所聽到的東西,能記住40%;而對于那些既能看到、又能聽到、還能直接動手做的事情,則可以記住75%或更多。視覺和聽覺是我們接受信息最主要的途徑,而多種感覺器官并用,更有利于信息接受(李玉平,2009)。本研究中,學生在視聽理解部分的語言輸出的質量也體現了這一規律。因為有視覺和聽覺的雙重刺激,更接近真實的口語交際情景,為學生的語言輸出提供了一定的輸入性刺激,使他們能更好地發揮自己的真實水平。
回答問題被認為是最難的題型。由于除問題外,沒有給考生提供更多的啟發、提示類信息和情景,學生感覺,在短時間內較流利、清晰地表達個人觀點,有較大難度。據此,在以后的回答問題部分,題目的設計不應只是簡單的提問,可以提供情景假設或提示(prompt),使其更具有交際的特點,更能反映真實的交際水平。
作為大學英語教學的一個重要組成部分,口語教學與測試日益受到重視。在大學英語口語測試中引入計算機輔助口語測試,是解決考生基數大、教師資源不足、測試信度等問題的有效途徑之一。為了最大限度地利用現有計算機技術測試學生的真實英語口語水平,使口語機考能夠大規模地施行并日臻完善,對口語機考題型和受試者的研究必不可少。
本研究證明,學生對目前我校正在實施的大規模大學英語口語測試持肯定態度,學生對不同機考題型的態度和答題表現,不僅為口語教學提供了有價值的信息,也為今后測試題的研究提供了方向。為了減輕學生的緊張和焦慮感,更好地體現他們真實的口語交際水平,在設計機考試題時,可利用計算機技術具有綜合處理文本、圖形、聲音、音頻、視頻等多種媒體的功能,創設形象、逼真、富有感情色彩的情境,以激發學生的語言表達動機和潛在智能,引發考生的情感體驗,幫助考生迅速而正確地理解考試內容,促進其語言綜合運用能力的釋放和發揮。
此外,本研究中所未涉及的交際類口語測試題型也將是今后研究的重點,尤其是技術支持層面。因為,對于能更好地測試交際能力的機考題型,如小組討論等,往往受到技術支持層面的限制。但是,隨著計算機技術持續快速的發展,計算機輔助口語測試的前景仍然十分廣闊。
[1]蔡基剛.大學英語四、六級計算機口語測試效度、信度和可操作性研究[J].外語界,2005(4):66-75.
[2]《大學英語教學大綱》修訂組.大學英語教學大綱[Z].上海外語教育出版社,高等教育出版社,1999.
[3]高等教育出版社.大學英語課程教學要求[Z].高等教育出版社,2007.
[4]李琳.計算機輔助英語口語測試的實證性研究[J].湖北船舶職業技術學院學報,2007(4):91-94.
[5]劉善德.如何在數字化英語口語測試中實現自動化[J].英語評估與測試,2007(11):38-40.
[6]劉艷萍、唐曉、陳英、李劫全.大學英語基礎階段口語測試模式探索[J].英語評估與測試,2007(4):60-70.
[7]司耀龍.基于計算機的大規模商務英語口語診斷測試實踐研究[J].外語電化教學,2008(1):67-71.
[8]孫元春.機助與面試英語口語測試中學生焦慮度對比分析與研究[J].長春師范學院學報,2007(4):140-143.
[9]熊敦禮、陳玉紅、劉澤華、黃更新.大學英語大規模錄音口語測試研究[J].外語教學與研究,2002(4):283-287.
[10]徐海銘、謝忠明.我國英語專業口語測試現狀的理論分析[J].南京師范大學大學報,2006(2):94-100.
[11]鐘長艷.近10年我國英語口語測試研究綜述[J].科技信息,2009(1):147-149.