李輝+岳禎



摘 要:以江蘇省某高校兩個文理不同的二級學院學生英語四級總成績和單項成績為研究對象,運用SPSS11.0對數據進行描述性分析和T檢驗,觀察文科類(經管組)和理工類(交通組)學生四級總成績和單項成績的差異性。結果表明,交通組學生四級總分明顯高于經管組并具有顯著差異,但兩組在合格率上普遍偏低;單項成績中聽力、寫作與翻譯分數無顯著差異,且分數極度偏低;交通組在閱讀理解中表現突出,高分數段人群中分數同比偏高,并具有顯著差異。寄希望于兩組成績的反撥效應給分類教學以科學的依據。
關鍵詞:語言測試;反撥;差異;分類教學
中圖分類號:G640 文獻標識碼:A
1 引言
大學英語四、六級考試是教育部主管的一項全國性的大規模英語考試,其目的是“對大學生的實際英語能力進行客觀、準確的測量,為大學英語教學提供測評服務”,自上世紀80年代實施以來,曾經客觀上助推了我國大學英語教學,提高了大學生英語水平。然而其規模之大、影響之深、參加人數之多一直飽受爭議,從未停息。究其原因有二:一是當前的四、六級考試不能全面的考查英語學習者的語言能力;二是考試通過率帶來的功利化現象促使了應試教育死灰復燃。也就是說四、六級考試不能滿足英語全面能力的測量和大學英語ESP改革的需要。同時教育管理者把四、六級作為衡量大學生畢業資格的標準之一,社會職場則把它看成是就業的敲門磚。
面對著這樣的尷尬局面,教育部也力推四、六級考試改革方案,以消除其不良影響。如2006年全面改革計分體制和成績報導方式,采用滿分為710分的計分體制,不設立及格線;由考試合格證書改為成績報告單,報導內容包括:總分、單項分等。測試題型也偏重聽力和閱讀,取消了詞匯測試。2013年12月又將試題結構進行了局部調整,客觀題減少,主觀題增加,同一考場多題多卷等。可見大學英語四、六級改革從未停止。這樣做就是為了減少測試帶來的功利化影響,使學校正確理解考試分數的含義,合理使用考試測量的結果,減少應試帶來的作弊現象,使考試更加科學、合理、有效。改革既有科學依據,又緊跟時代發展。比如說增加主觀試題是因為它帶來的積極反撥效應更利于課堂中交際教學手段的實施。段落翻譯的設置更能滿足交際需求,符合中國文化走出去的國家戰略。雖然大學英語四、六級考試體系日臻完善,并也有自己的口語測試機制,但其龐大的規模和人力物力的局限決定了改革的路還很長。
然四、六級考試作為一門語言測試,并不是教學改革的助推器。語言測試伴隨著語言教學產生的,沒有語言教學就沒有語言測試。這并不是“雞生蛋、蛋生雞”的問題。而正像楊惠中老先生說的那樣,語言教學是第一性的,語言測試為語言教學服務。簡單的說測試就是測量人的知識和能力的方法。正是因為教學實施者和教學管理者沒有弄清楚語言教學和語言測試之間的關系,才導致語言教學服務于語言測試的怪像。因此我們不能為了測試而教學,而應把測試作為一種教學工具。利用測試對課堂教學產生的反撥效應,改進教學方法、提高學生能力。大學英語四、六級之所以一直在改革的道路上前行,并不是為了滿足社會的呼聲,而是要更好的實現其反撥效應。從新的題型設置上來看,我們就能知道它在一定程度上對學習者的聽、讀、寫、譯等單項技能進行了評估。這說明我們可以從學生的單項成績中得到有效的反撥,進而付諸于教學實施中。
四、六級考試提供的大量數據幫助我們對我國大學英語教學現狀進行實證性分析和描述。本研究就著眼于文理不同類學習者四級考試的總分和單項技能,利用數據分析他們在綜合能力和單項能力中的情況和差異,我們也希望研究成果能有效反撥教學,為大學英語分類教學提供可靠的科學依據。
2 研究設計
2.1 研究對象
筆者采用江蘇省某高校兩個二級學院總共451名本科生的2014年6月大學英語四級成績及單項成績為研究對象,其中交通工程學院174人,經濟管理學院277人。在研究中,我們把交通工程學院定義為交通組,經濟管理學院定義為經管組。根據教師平時的教學反饋,普遍認為經濟管理學院等文科學院對學生的英語要求較高,學生學習風氣好且英語水平高于其它學院學生。為此筆者選取某一理工科學院的學生與之進行比較,希望能有新的發現。
2.2 研究問題及研究方法
1)經管組學生四級總分與交通組學生四級總分是否存在差異,如果有,其差異是否顯著;
2)經管組四級單項成績(聽力、閱讀、寫作與翻譯)與交通組四級單項成績之間是否存在差異,如果有,其差異是否顯著?
本研究采用SPSS11.0對四級成績與單項成績做描述性統計分析、頻數分布和T檢驗。
3 數據分析與討論
3.1 四級總分對比分析
從表1中,我們看到兩組學生四級總分的平均成績、標準差、標準誤差。交通組的平均成績為401.7,高于經管組391.7的平均分,相差大約10分。標準差相差不大,說明兩個樣本與其平均數的離散程度相當,兩組英語成績數據波動相當。從標準誤差來看2.7<3.6說明經管組的正太分布曲線更加陡峭,整體來講兩個值都不算大,對總體數據的可靠性相差無幾。
為了進一步了解兩組總分的分布情況,我們運用SPSS生成描述統計數據表(見表2)。表2除了顯示了平均分之外,還顯示最大值、最小值、中數、眾數等重要信息。交通組最高分570分,最低分290分,高低分差距280分;而經管組最高分518分,最低分231分,高低分差距287分。兩組組內高低分波動范圍相當,但兩組之間的高分差距和低分差距卻很大。從眾數來看,交通組出現370、394、417等多個眾數,而經管出現391分的最多。從百分位值來看,交通組75%的學生分數在434以下,經管組則在423以下,雖然交通組的成績好于經管組,但兩組達到的合格率都不高。
那么兩組之間的差異是否具有顯著性呢?我們把兩組總分通過獨立樣本t檢驗來看他們之間差異的顯著性。t檢驗是對兩樣本均數(mean)區別的顯著性進行檢驗。t檢驗須知道兩個總體的方差(Variances)是否相等;t檢驗值也會有所不同。也就是說,t檢驗須視乎方差是否同質。所以,SPSS在進行t檢驗(t-test for Equality of Means)的同時,也要做萊文方差同質性檢驗(Levenes Test for Equality of Variances)。如果萊文方差同質檢驗的F值的顯著值大于0.05,就說明方差同質(Equal variances assumed),那么我們就參照第一欄的t值,反之,小于0.05,則參照第二欄的t值。
表3 中的萊文方差同質性檢驗欄顯示,顯著值(sig.)0.19>0.05,說明兩個樣本總體方差同質。那么我們就參照第一欄的t值t=2.208,自由度df=449, 雙側顯著值Sig=0.028,Mean Difference=9.9245。因為顯著值0.028小于0.05,否定原假設,這說明在95%的置信區間內,差異具有顯著性。也就是說兩組平均成績具有顯著差異,交通組好于經管組。
3.2 四級單項成績對比分析
兩組學生的總成績存在顯著差異,是否能夠說明他們在各個單項成績中也存在顯著差異呢?沒有數據的支持我們不能貿然斷言。表4是兩組學生單項成績的均分分組統計數據,可以看出兩組學生在聽力、寫作與翻譯兩個單項方面均分差異不大,分別為128和126,而在閱讀單項中交通組的146分明顯高于經管組140分的均分。
表5更加詳細地展示兩組學生各個單項成績的頻數分布情況,可以看到兩組學生的聽力成績、寫作與翻譯成績在中數、眾數、最大值、最小值都極為相似,如果查閱頻數分布表(略)我們就會注意到,兩組學生的聽力成績大多集中在107-147分之間。而寫作和翻譯成績多集中在114-137分之間。而在閱讀方面,雖然經管組的眾數要高于交通組,也只能說經管組個別同學的閱讀能力較強,但從整個平均數和最高分來講,交通組還是優于經管組。
通過觀察表6的四級單項成績獨立樣本T檢驗的F值,我們可以確定三組單項成績均方差同質,因此我們都參照每組第一欄的T檢驗。結果發現聽力、寫作和翻譯顯著值0.284和0.171均大于0.05,說明兩組在聽力、寫作與翻譯單項中無顯著差異。不過閱讀單項的顯著值0.016小于0.05,具有統計學意義的顯著差異??梢缘弥煌ńM的閱讀能力較強。
綜上所述,交通組英語總體水平高于經管組,并且兩組分數在430分以上的約55名學生中,交通組的成績都略高于經管組。在單項成績方面,聽力、寫作和翻譯能力旗鼓相當,成績在各分數段的分布相似,沒有明顯差異。交通組的閱讀能力要好于經管組并且突出表現在140-200的高分段。不過兩組學生也有一些共性問題,如達到425分以上的比例并不大,交通為32.2%,經管為23.5%。這說明兩組學生英語基本技能包括聽、讀、寫、譯均有待提高。單項成績中聽力成績、寫作與翻譯的合格率不到10%,閱讀的合格率維持在40%左右。相比之下,學生的閱讀能力較強,可以運用自己所學的詞匯和語法知識分析篇章,快速攫取有效信息,而學生在聽力、寫作、翻譯等基本技能都需要加強。
4 結語
本研究結果顛覆了教學工作者對文理不同學院學生英語水平的感性認知。我們不能主觀臆斷而是要依靠大量的數據證實學習者的學習現狀。四、六級測試為我們提供了分析學習者學習能力的具體數據,對這些數據進行有效的分析,有助于測試帶來的積極反撥效應。把握住四、六級成績的標尺,對于一線教學工作者來說意義重大。在此,筆者提出幾點建議:1)教學工作者和教學管理者應該以科學的考試數據為依據對學生的英語實際能力做出實事求是的判斷,以對教學方法、教學內容、教學管理做出合理的調整。不能籠統地以四級總分來衡量學生的英語水平,單項成績更能為分類教學和選課提供可靠依據;2)正確處理好語言測試與語言教學的關系。大學英語教學不能被大學英語四、六級所“綁架”。讓測試合理地服務于教學,衡量學習者在輸入和內化過程中存在的不足和缺陷,扎扎實實地提高他們的語言基本技能;3)放開四、六級口語測試的資格門檻。以聽、讀、寫、譯等技能總分作為口語測試的資格線是不可取的,也是荒謬的。能讓更多學生參與到口語測試之中必將增強提高口語的熱情,為口語教學提供可靠證據。雖然本次研究樣本教小,也不能否認此研究的意義,正像Edwards所說的那樣“即使小的樣本研究也是美麗的”。
參考文獻:
[1] 蔡基剛.CET的重新定位研究[J].外語電化教學,2011(139).
[2] McNamara, T. Language Testing[M]. Oxford: Oxford University Press, 2000.
[3] 陸仲飛.大學英語需要從“教學翻譯”向“翻譯教學”過渡——評析“大學英語四、六級考試新題型”中的段落翻譯[J].上海翻譯,2012(2).
[4] 屠麗華,蔡慧萍.從CET4看性別差異對外語學習者單項技能的影響[J].外語研究,2014(2).
[5] 楊惠中.大學英語四、六級考試十五年回顧[J].外國語,2003(3).
[6] Brown, H.D. Principles of Language Learning and Teaching [M]. Beijing: Foreign Language Teaching and Research Press,2002.
[7] 辜向東,張正川,劉曉華.改革后的CET對學生課外英語學習過程的反撥效應實證研究——基于學生的學習日志[J].解放軍外國語學院學報,2014(5).
[8] 肖巍,辜向東,倪傳斌.CET的反撥效應機制:基于多群組結構方程建模的歷時研究[J].外語教學理論與實踐,2014(3).
[9] 王守仁.關于高校大學英語教學的幾點思考[J].外語教學理論與實踐,2011(1).
[10] Edwards, C. & Willis, J. Teachers Exploring Tasks in English Language Teaching[M].Beijing: Higher Education Press, 2009.