胡茶娟 邸平



【摘要】計算機輔助口語測試技術為大規模口語測試的實現提供了可能。文章基于暢言互動英語口語測試平臺開展了大學英語口語測試實踐,探討大規模在線口語測試的可行性,并就具體實施中存在的問題提出解決思路。研究表明,暢言互動英語口語測試系統具有良好的可操作性,其技術設計可以達到預設目的,但是在測試效度、測試信度以及技術整合上還需要進一步完善。
【關鍵詞】口語測試:計算機輔助;大學英語:反思
【中圖分類號】G420 【文獻標識碼】A 【論文編號】1009—8097(2013)06—0076—05
引言
隨著大學英語教學改革的深入和大力推進,口語教學及測試己普遍受到國內各高校的重視。但是,在以教師為主導的傳統口語測試環境下,由于學生人數眾多、考試時間和教師精力有限,使得大規模的英語口語測試難以實現。以計算機技術為主的現代信息技術為促進大學英語教學改革提供了強大的技術支持,也為大規模英語口語測試提供了實現手段。一大學英語口語測試現狀
口語考試是大學英語教學評估的重要手段。自2006年全面實施大學英語教學改革以來,全國各高校不同程度地實行了對大學英語教學理念、教學模式等方面的改革,但是,口語教學及其測試卻未能實現與時俱進的突破。廖亦斌通過短信調查發現,受試對象中大部分高校(不少為211院校)口語測試不到位,在期末考試中并無口語考試的部分。而筆者同參加外教社暑期教學研討班的其他高校教師交流得知,許多實施口語考試的高校出現了進退兩難的尷尬局面。一方面,為了督促學生的口語學習,提高口語能力,口語考試勢在必行;另一方面,由于采用的是以教師為主導的傳統口語測試,為了保證考試的真實性和公正性,通常會以小組討論形式讓學生就某個話題進行交流,并安排至少兩名教師評分,但是這種傳統口語測試用到大規模的大學英語口語考試中,不僅需要耗費掉大量的時間和精力,而且對學生口語能力提高的促進作用也相當有限。
出現以上現象的原因主要有:(1)擴招后的師生比列嚴峻,無論是采取1:1、1:2還是1:3的師生比例考試組合,都需要耗費巨大的時間和精力,口語考試實施困難。(2)沒有規范化的培訓,教師口語測試評判能力和水平參差不齊,無法保證口語考試的信度和效度,并且為了保證公正每個考試小組配備兩名以上教師的要求也會讓大規模的口語測試難以實現。(3)缺乏相關部門的介入和指導,口語考試沒有正式納入學生評估體系或所占比例甚小,也未納入教師的工作量,費時費力,教學雙方收效不明顯。可見,傳統口語測試已經不能滿足目前大學英語教學的需求,大規模英語口語測試迫切需要的是一種省時省力、高效的測試方式。隨著計算機和網絡技術的發展,計算機輔助口語測試技術已經成熟,“將多媒體軟件應用于口語教學是對傳統口語教學的突破,也是當前大力加強口語教學的社會現實需要”。
二 暢言互動口語測試平臺簡介
暢言互動英語學習平臺是由科大訊飛信息科技公司研發的可部署在校內網、校外網和計算機教室的自主學習系統。該系統融合了智能語音技術,可以幫助實現智能化、自動化的英語口語測試、英語聽力測試、英語口語對話學習、英語朗讀訓練和英語單詞速記,并且有利于教師快捷方便地掌握學生的英語水平和學習進度。口語測試功能提供一個開放性的考試環境,教師可以設定試題,通過系統的實時評測功能,進行自動化考試、判分和生成測試報告。其關鍵語音技術包括:(1)語音合成技術(TextTo Speech,TTS),該技術能夠自動將任意文字實時轉換為連續的自然語音,提供高效便捷的語音信息服務;(2)語音識別技術(Auto SpeechRecognize,ASR),讓計算機辨別人類的語音,并將語音中包含的文字信息提取出來,實現有效人機交互。(3)語音評測技術,即通過計算機自動對發音進行評分、檢錯并給出矯正指導。以上關鍵語音技術服務通過Web Service的方式實現。
三 大規模在線口語測試設計和實踐
1 實踐對象
研究對象為我校2012級普通班學生。目前我校大學英語教學實行分級教學,分為長望實驗班(三級起點班)、實驗班(二級起點班)和普通班(一級起點班)。其中,普通班學生共2569人,占年級總人數的76%,其學期總評成績由平時成績(10%)、口語成績(10%)、期中成績(20%)和期末成績(60%)四部分組成,其中口語成績指學期末的在線口語測試成績。
2 實施方案
口語考試地點為我校大學多維語言綜合訓練中心的兩個大學英語自主學習教室,共200個學生機位。
(1)時間安排
期末口語考試集中安排在兩天進行,考試時間為8:00-12:00和13:00-17:00,學生根據各自事先安排好的時間段進入自主學習中心考試,每一輪考試流程(包括組織過程等)控制在30分鐘以內。進行口語考試的時間為10分鐘,非設備等客觀原因學生不允許重考。任課教師不用到場,考試地點有一名實驗技術人員和兩名學生助理負責維護考場秩序和進行考試指令說明。
(2)題型設計
本次口語考試內容由任課老師結合所學課文主題設計,共九套不同主題的口語試題(題型設計見表1),學生隨機選取進行口語考試。
3 學生終端
學生登錄暢言互動英語學習平臺,輸入學號和密碼,確認個人信息后進入口語考試界面。該界面為學生提供了九套口語測試題,學生隨機選擇一套后,口語考試正式開始。
第一部分為短文朗讀。朗讀片段的內容和體裁選自全新版大學英語綜合教程的課文。系統在宣讀題目指令以后,提供示范朗讀(圖2),為學生提供朗讀技巧參考和準備時間。學生可以選擇跳過直接進入朗讀考試,錄音時間為2分鐘。
第二部分為主題說話,情景主題參考新視野視聽說教程的單元主題設計,提供思路提綱(圖3),學生要求就提綱進行語言組織和口語表達。該部分準備時間為3分鐘,錄音時間為2分鐘。
學生在其電腦終端完成整個口語考試所需時間僅為10分鐘。總的來說,該平臺提供的學生端口語測試功能良好。據學生口語考試結束后的訪談記錄,學生普遍認為:(1)該平臺提供的界面友好,操作簡單,省時高效。(2)大部分學生對自己的口語成績表示滿意,認為在線口語測試客觀公正。
4 教師終端
口語考試結束后,任課教師可以在任何一臺聯網的計算機終端上登錄學習平臺管理系統(圖4),查看學生的測試成績和測評報告,導出學生測評成績和考試錄音。如果對學生成績不確定,可以查看詳細口語測試報告(圖5)。該報告將提供學生的口語考試各部分的錄音和原文參考,教師可以播放學生錄音進行重新評估,確保無誤。
根據任課教師的考試總結和會談記錄,暢言互動在線口語測試平臺具有以下優勢:(1)考試組織管理得以簡化,節省了人力物力。口語考試時任課教師不需要到場,整個考試過程由系統自動生成口語成績和評估報告,教師需要完成的是整體管理學生成績和把握學生口語水平。(2)系統自動生成的評估報告,能夠比較真實地反映學生的口語現狀,為任課教師的口語教學提供參考,緩解口語教學中師生1:1交流機會少的局面,增進教師對學生的了解。(3)系統的錄音保存功能和導出功能,創建了一個豐富的口語語料庫,教師不僅可以通過錄音重播追蹤學生的口語學習進展,而且也為教師進行口語教學研究提供了數據資源。(4)為學生提供個人原始錄音和示范音頻,還原口語考試現場,有助于學生自我分析和發現口語表達中存在的問題。
四 存在的問題與反思
1 對在線口語測試平臺的反思
(1)測試效度
效度是測試的可解釋性和可推廣性。大學英語口語測試是針對基礎階段大學英語學生進行的口語能力評估。《大學英語課程教學要求》對基礎階段口語能力提出了要求,即“能就教材內容和一般的聽力材料進行問答,復述和討論;能用英語進行一般的日常會話;能就一般的社會生活話題進行簡單的交談、討論和發言,表達思想清楚,語言、語調基本正確”。暢言互動口語測試平臺擁有的語音識別技術(ASR)實現了數字化模擬口語考試機制,減輕了口語測試對考官的需求和考試效度的壓力,能夠通過諸如朗讀、看圖說話、復述等結構主義口試題型對學生錄音進行機評自動生成成績。這樣的人機對話有比較固定的參考答案,具備命題容易、評分相對客觀可靠的優點,但是該平臺支持的人機對話考試模式只局限在某些測試題型上,無法實現如談話、討論、辯論等交際法口語測試題型的機考,因而很難做到真實的溝通,體現出交際的真實性和交互性,不能完全準確的反映學生的真實交際能力。蔡基剛認為“只有試卷內容能測試到各種相關的交際功能,而且這些功能具有足夠的代表性,才具有較高的效度”。理想的口語測試考查形式應該是對話、討論、辯論等具有交際真實性和互動性的題型。而此類題型所要求的真實性和互動性卻是目前較難攻關的技術難題,今后的研究和開發應該專注這一方面,讓在線口語測試更加真實化,進一步提高在線口語測試的效度。
(2)測試信度
信度主要指測試的穩定性和可重復性。大規模口語考試實現準確、公正地測量學生的實際口語能力需要考慮評分模式的可行性和可靠性。我國大學英語口語測試的對象為水平相對較低的在校學生,因此在制訂具體的評分標準上要依據學生的實際情況來決定。綜合式和分項式是目前大規模考試常用的評分模式。為了確保口語考試的信度,提高口語測試對學生口語學習的反撥作用,評分標準和原則應該保持一致性,為學生和教師提供多角度、多層面的測評分析,為今后的學習和教學提供參考。蔡基剛指出,可以利用計算機把口語評分內容分解,將打分專業化、流水化,實現計算機口試的準確性和高效率性。在線口語測試系統的評分一致性需要通過專業、細化的評分系統來實現。這樣的評分系統能夠提供:1)能力分項評分(AbilityAnalytical Scoring),從語音、詞匯、流利性等各方面對學生的口語表達能力進行評分,然后根據各個方面的得分算出總分;2)題型分項評分(ItemAnalytical Scoring),就考生對各題的內容表達及語言表現程度給分;3)總體綜合評分(Holistic Scoring),把學生的口語能力分為五個等級,按每一級規定的標準給分。暢言互動英語學習系統提供的口語測試平臺并未細化評分標準,系統自動生成口語成績評估報告構成比較簡單,只是將單項得分列舉出來,對口語表現的得分點或是扣分點沒有明確說明,特別是對學生口語表現的能力分項未作出單項評分。這樣形成的測評報告只能為學生和教師提供一個總體判斷,無法幫助學生深入了解自己口語學習的優勢和存在的問題,跟進自己的學習。
(3)測試技術
暢言互動英語學習平臺的服務端使用VS2008開發工具C#語言進行開發,以.NET Framework 2.0作為實行環境,產品為B/S架構,并使用AJAX技術來進一步提升系統頁面的表現力。服務端的配置要求為:Intel Penfium 3.2 GHz(2 Core)的CPU、2G內存、200G以上的硬盤剩余空間和100M網卡,其對應的服務端并發性能支持1千人同時在線和50路關鍵業務,而口語測試每題評測時間不大于評測引擎客戶端所需時間的120%。客戶端采用Delphj開發外殼程序與部分允許離線使用的客戶端功能,其他的部分采用嵌入瀏覽器控件打開服務端頁面的方式實現,使得客服端具備較好的響應效果。系統采用的關鍵語音技術服務通過Web Service的方式實現,便于靈活部署。
但是作為口語測試系統的重要功能之一,該系統的數據庫管理和維護功能稍顯薄弱,在提供學生考試錄音及傳送給客戶端的表現上比較吃力。為了保證傳輸可靠性和可行性,便于考試過程中大量文件的傳輸,今后在線口語測試系統的研發除了需要高性能網卡提高服務器的網絡并發能力,更有效的方式在于對系統服務器進行有效劃分,建立應用服務器和數據庫服務器,采用如Microsoft SQL Server 2008等大型關系型數據庫作為后臺管理數據庫,延伸數據管理的有效性,建立“以數據的綜合處理、流程匯總、試題數據庫管理和信息檢索技術為核心”的大型網絡數據整合應用平臺。
2 對在線口語測試方案和實施的反思
(1)優化測試方案
本次口語測試僅有短文朗讀和主題說話兩種題型,容易操作和實施,在機考口語測試中易于實現,但考查形式稍顯單薄。人類語言具有強大的交際性,交流互動是學習一門語言最大的目的。短文朗讀側重語音基礎和意群停頓,主題說話注重描述事物或敘述事件的能力,兩種考查形式都缺乏交際功能,只能局限在描述、敘述等語言功能上,無法測試較高級的語言能力,存在引出的話語功能和話語范圍比直接口試狹窄的問題。
另外,本次口語考試測試時長為10分鐘,除去考試指令、準備的時間,真正用于口語表達的時間僅四分鐘,這其中只有兩分鐘的時間用于主題說話。后期學生訪談結果也證明了這一點,有學生反映“考試剛開始,我還沒找到感覺就已經結束了”。測試時間長度的制定需要考慮學生人數、設備數量、教學計劃、實驗人員工作時間等諸多客觀因素。合理有效的考試長度不僅能讓大規模口語測試高效有序的完成,而且能夠為學生提供足以展現其口語能力的時間長度。可見,今后開展口語測試時間需要作出調整,調整依據可以參考大學英語四六級口語測試等大型考試的時間設置標準。
(2)完善評價體系
目前,我校學生的口語成績占期末總評成績的10%,而教師對學生的口語成績評定主要取決于期末在線口語測試成績,這使得學生平時在線口語訓練的參與性不高,大部分學生反映平時很少在自主學習中心進行在線口語練習,部分學生甚至從未去過自主學習中心。只有建立多層次、多維度的評價體系和口語學習激勵機制,加大口試在學期成績中的權重,把在線口語考試納入形成性考察之中,從平時、期中和期末口語考評三個方面對學生做出要求,注重平時成績的積累,促進學生參與在線口語訓練的積極性,樹立學生口語學習的主體意識,從而減少偶然因素的影響,使評價更加客觀。
(3)促進教師多維角色轉變
教師的指導、監督和管理角色在口語測試中具有重要作用。作為在線口語測試的管理者,教師應該及時查看學生的口語練習記錄,對學生的在線練習數據給予反饋和幫助,引導學生參與更多的口語練習任務,實現在線口語練習的良性循環,保證教學相長的雙向互動性。教師管理的不到位在本次實踐中凸顯出來,大部分教師反映還未從傳統口語測試的角色中轉變過來,在線口語訓練僅僅停留在對學生的口頭要求上,并且多數教師對在線測試平臺沒有深入了解,更談不上對學生的監控和指導。因此,為了讓教師熟悉在線口語測試系統,對教師的系統培訓顯得尤為迫切,除此之外,同樣需要建立相應的機制規范教師行為,避免出現由于在線口語測試系統的自評功能使得教師完全依賴于機評的被動現象。
五 結束語
口語測試是語言能力測試中不可缺少的一部分。現代教育技術的發展為大學英語口語測試尋求新的突破提供了契機,計算機輔助大規模英語口語測試還處于嘗試階段,如何使大規模的口語測試易于操作并具備顯著的效度和信度,還需要大量的實踐和探索。