999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

從閱讀理解題看英語專業四級考試的穩定性

2008-12-31 00:00:00婁喜祥鄒湘湘聶明方
考試周刊 2008年19期

摘 要:本研究采用隨機抽樣的方法抽取了1995年和1997年英語專業四級考試中的閱讀理解真題,分別編入期中和期末泛讀考試題中,對同一組被試進行了測試。統計結果證明英語專業四級考試題在歷時方面穩定性不夠,并建議英語專業四級考試命題在該方面要有所體現。

關鍵詞:英語專業四級 閱讀理解 歷時穩定性

1. 引言

教學中的測試是對教學效果和學生學習效果的檢驗,是教師或教學管理人員對教學采取進一步措施的重要的依據之一,因此它對教學的積極作用是毋庸置疑的。測試學則是研究如何設計考題和實施考試,以準確評價考生的能力,從而為教學管理、人才選拔、教學研究等工作提供最有力的支持。它綜合了教育學、心理學、統計測量學和相關專業的知識,是一門實踐性較強的交叉性學科。外語教學與研究中也同樣少不了測試,研究如何制作外語考題對外語教學與研究有著舉足輕重的作用。

國內有較大影響的英語測試主要有:高等教育入學英語考試(即高考MET)、大學英語系列考試(CET-4、 CET-6)、碩士生入學考試、英語專業系列考試(TEM-4、TEM-8)和公共英語等級考試(PETS)。對測試的研究主要從理論和實踐兩方面進行:理論方面的研究多從宏觀的學科理論角度分析考試的基本原理、基本特點、基本作用和基本步驟等,如:陳曉扣和李紹山(2006)對考試的結構效度進行了研究;李紹山(2005)對測試的反撥作用與試題的設計關系作了研究;楊惠中(1999)對測試與教學之間的關系進行了論述;李建達對閱讀的測試方式對不同語言能力的學生成績的影響等。實踐方面是針對某類具體的考試或某類考試中某次考試的方方面面進行研究分析,國內研究多集中于此。

國內對外語考試進行的研究分析也多集中于實踐方面,主要有兩個角度:一是從應試者的角度。主要是通過分析往年試題來把握題目各方面變化規律,以求得掌握未來試題的趨勢,從而為考生更有把握應考奠定基礎。這種研究多為一些被輔導的應試者所鐘愛。二是從出題方的角度。主要是通過分析往年考試結果來總結出題過程的得與失,從而為進一步編制更精確的考題奠定良好的基礎。如:鄒申(1995)在1994年3月至5月就英語四級、八級考試對部分高校進行了問卷調查;文秋芳和趙學熙(1995)對英語專業四級口語考試的可行性等問題作了研究;文秋芳等(2002)對英語專業八級口語考試的可行性問題作了研究;朱嫣華(1995)和祝平(2005)分別就專業四級、八級標準化、科學實驗化及大綱變化作過研究;黃永紅(2006)研究分析了英語專業四級口語測試的信度和效度;李曉等(2002)分析了英語專業四、八級考試的意義和存在的必要性;黃家祐(2000)評估了中山大學英語系幾年間參加全國英語專業四級和八級統測的表現,分析了統測的結果并認為,這種測試提供的信息有助于改進教學,因而作為一種評估手段是有效的;王海貞(2007)運用評分過程證據對英語專業四級口語考試的效度進行了研究。

當前從出題者角度分析的文章多為針對較短時期內特別是某年或某次試題的分析和研究,如某一年或兩年的考試題的分析,如:鄒申等(1996)分析了1995年四級和八級考試各題型優點與缺點,各型之間的相關等;陳小扣和李紹山(2006a)研究了英語專業四級考試填空題的結構效度;張喆和羅凱洲(2007)對專業四級考試的反撥作用進行了實證研究。但這一領域極少有通盤對多年考題的穩定性方面進行系統的分析和研究。某一種考題的多年的穩定性也應是其信度的主要表現,就像用一把尺子去量多年考生的英語水平一樣,可以使我們對各屆考生間英語水平的變化作出精確的判斷。如果某類考試這樣的特點不夠明顯或根本未進行考慮,我們就不可能縱向對各屆考生作出歷時的比較。那么無論是教學或是研究中我們對考生語言水平的發展變化都不可能有較全面準確的了解。

英語考試中閱讀測試是不可缺少的組成部分,在其編制過程中有許多可變的因素都會造成考題難度的變化,從而影響到考試題目的信度,如材料的長短、生詞量的多少、句子的平均長度和復雜程度、單詞的平均長度、閱讀材料內容與考生所處的生活環境或文化習俗等的相關程度等。這些影響因素多數是不容易進行控制的,也就是說在各年的考試中閱讀題的穩定性是比較難以控制的,它的穩定性可以作為整套題目的穩定性的標志。因此,以閱讀理解題作為代表,通過實驗做的研究和分析來展示一下某類英語考試中穩定性是可行的,會對試題編制起到不可估量的推動作用。

本研究試圖用英語專業四級考試題中的閱讀理解題真題作為代表來研究歷年英語專業四級考試題在穩定性方面的表現。

2.研究方法

本研究隨機抽取歷年來英語專業四級真題中的兩年閱讀題為代表來研究本類考試多年的穩定程度。

2.1研究問題。

(1)兩套閱讀試題中學生成績是否相當;

(2)兩套閱讀試題中學生成績是否具有較高的相關性。

2.2研究對象。

在本研究中作為被試的是本校2005級英語專業小學教育專科兩個班的77名在校學生,其中男生18人,女生59人,平均年齡為21歲。這些學生在初中畢業后均未繼續上高中,而是考取本市教育學院招的中等師范的小學教育,因而未系統學習高中英語,英語基礎較差。實驗進行時在本校上大學專科已經近兩年,英語水平接近英語專業四級水平。有多數學生考過了大學英語四級考試,也有個別學生通過了英語專業四級考試。本實驗的考試的實施是在本學期各科學習結束時各科進行結業期間進行的。

2.3工具。

(1)英語專業四級考試閱讀理解考試真題兩份。

本研究從1993至2005年的英語專業四級題中隨機抽取了1995年和1997年的完整閱讀理解部分分別作為兩套泛讀考試題中的組成部分并連續對參與被試先后進行了測試。第一次考試在2007年4月20日上午7:30到9:10進行,第二次考試在2007年4月23日上午9:30-11:10進行,一百二十分鐘的時間對大多數學生來說都足以完成所有考題。在第一次考試中(2)班有3名學生缺席,第二次考試全到,因此這三位學生的成績不計在實驗結果中。兩次考試相隔僅兩天,考生不可能在短時間內有能力上的顯著變化,因此學生的能力不會對兩次測試結果異同產生影響。1995年的考題閱讀題由四篇短文后附20個考試閱讀理解的小題,1997年的考題也由四篇短文組成,不過文后僅附15個選擇題。因此實驗將計算出各個學生在每套試題的得分率進行對比。

(2)統計工具。

本研究使用的統計工具為SPSS 15.0統計軟件。測試結果均用SPSS軟件進行分析處理,因此無人工計算產生誤差的機會。

2.4實驗數據。

實驗統計了各個學生在兩次考試的閱讀題中答對的題目的個數,并計算出他們的得分率,其描述統計結果顯示在表1中:

注:R=Range,Min=Minimum,Max=Maximum,M=Mean,S.D.=Std.Deviation,V=Variance,Skew=Skewness,Kurt=Kurtosis,Stat=Statistic,S.E.=Std.Error,TEM1995=編入期中泛讀試題選用的1995年英語專業四級真題的閱讀理解題部分,TEM1997=編入期末泛讀試題選用的1997年英語專業四級真題的閱讀理解題部分#65377;

表中顯示:學生在1995年閱讀題中的得分率平均為.5701,而在1997年的考題中的得分率平均為.4424。二者之間有一定的差異,但我們不能就此斷定二者的差異達到了統計學意義的顯著差異。為檢驗二者之間的差異是否達到了顯著水平,實驗中對二者進行了成對樣本的T檢驗,檢驗結果如表2:

表2中顯示,計算結果t=6.667,p=0.000<0.05,據此可斷定二者的差異達到了顯著水平,說明二者間的差異是由于試題本身原因造成的,而非其他偶然因素形成的。

為了進一步考查這兩年閱讀題之間的關系,本實驗又計算了學生在兩次考試閱讀題中的得分率之間的相關性,其結果如表3:

表中顯示,二者之間的相關系數r =.119,而且p = .304 > 0.05, 故二者之間為低度相關,也即如果一個考生在前一次考試中得了高分或低分,他在后一次考試中仍得高分或低分的可能性不太高,換句話說就是兩次考試相互對應的程度非常低。還可以說這兩年考試中學生考試的成績之間的可比性較差,如果兩個人在這兩考試中都得了60分,他們的能力高下之分就難于決斷。這就是每年考題難易度不一樣造成相互之間的不可比性。

3.結論

通過以上數據分析不難發現,1995和1997年的英語專業四級考試的閱讀題之間存在著顯著的差異。這種差異性體現在兩個方面:一是1997年的閱讀題目似乎難度有所增加,因為學生得分率明顯下降;二是學生在兩套題中的得分相關性較弱。這種差異性的存在就表明二者之間的連貫性或稱連續性不強,這種大型考試的較弱的連貫性或連續性就會使教育有關從業人員無法對學生們進行縱向的即歷時的比較,至少比較的結果可能信度下降。

4.啟示與建議

每一類大型考試不但涉及當年考題的方方面面,還牽涉到這類考試試題多年之間的一致性和連貫性,至少要保持在一定階段內的穩定。它的調整與改變不能有一點隨意性,必須有充分的理由。比如說:考試的目的要求有了較大的改變,考試的范圍有了較大的調整,考生整體水平有了較大的變化等。總之,要根據全局范圍內的實際情況的需要來變化,要在變化前作充分的調查研究,以做到準確無誤。還要在變化實施前做廣泛的宣傳,使所有考生和考試相關人員完全了解,以免考生感到突然。英語專業四級考試大綱到目前為止先后有兩次修訂:第一次修訂本是在1997的11月出版的,第二次修訂本是2004年3月出版的。顯然本實驗抽取的1995年和1997年的題目應屬大綱第一修訂前一段的,相互之間理應有較高的一致性,而實際上從試卷上看1997年閱讀題目在分值上與1995年已經不同了。本實驗證明其難度也有顯著的不同,其較大的不對應性也是理所當然的。

參考文獻:

[1]文秋芳,吳克明,王文宇,任裕海.全國英語專業八級口語考試可行性研究[J].外語界2002,(4):67-73.

[2]文秋芳,趙學熙.英語專業四級口試的可行性研究——總體設計與實施[J].外語界,1995,(1):30-36.

[3]王海貞.基于評分過程證據的英語專業四級口試效度研究[J].解放軍外國語學院學報,2007,(4).

[4]朱嫣華.努力實現英語專業四級、八級考試的標準化和科學化[J].外語界,1995,(1):24-29(36).

[5]李曉,廖鳳榮,羅耀光.論英語專業統考與素質教育的關系[J].廣西高教研究,2002,(2):73-75.

[6]李紹山.語言測試的反撥作用與語言測試設計[J].外語界,2005,(1):71-75.

[7]祝平.英語專業四、八級考試大綱的新變化[J].外語界,2005,(1):67-70(79).

[8]張喆,羅凱洲.英語專業四級考試反撥作用實證研究[J].考試研究,2007,(2).

[9]楊惠中.語言測試與語言教學[J].外語界,1999,(1):16-25.

[10]鄒申.部分高校英語專業四級、八級考試問卷調查報告[J].外語界,1995,(1):20-23(16).

[11]鄒申,陳漢生,黃素華.1995年高等院校英語專業四級、八級考試分析[J].外語界,1996,(1):55-61.

[12]陳曉扣,李紹山.TEM-4完型填空測試結構效度研究——答題過程分析法[J].現代外語(季刊),2006a,29(1):71-77.

[13]陳曉扣,李紹山.談語言測試的結構效度[J].解放軍外國語學院學報,2006b,29(3):45-49.

[14]黃永紅.英語專業四級口語測試的信度和效度[J].外語研究,2006,(3):36-38.

[15]黃家祐.英語專業四級、八級測試(TEM4,TEM8)為教學帶來的反饋信息[J].中山大學學報論叢,2000,20(6),61-69.

(漳州師范學院科學研究資助項目(項目編號:SS07016)

主站蜘蛛池模板: 国产成人精品一区二区免费看京| 自慰高潮喷白浆在线观看| 精品国产免费观看| 99国产精品免费观看视频| 伊人久久精品无码麻豆精品| 精品亚洲麻豆1区2区3区| 67194亚洲无码| 午夜日韩久久影院| 91久久大香线蕉| 伊在人亚洲香蕉精品播放| 亚洲福利片无码最新在线播放| 在线视频亚洲色图| 国内精品久久人妻无码大片高| 国产一级毛片网站| 热久久综合这里只有精品电影| 国产真实乱了在线播放| 国产精品女主播| 国产成人精品免费av| 喷潮白浆直流在线播放| 精久久久久无码区中文字幕| 亚洲人成影视在线观看| 国产精品专区第一页在线观看| 欧美视频在线播放观看免费福利资源| 欧美色视频日本| 欧美日韩精品在线播放| 亚洲va在线∨a天堂va欧美va| 日韩中文精品亚洲第三区| 久久黄色小视频| 99热亚洲精品6码| 亚洲精品无码高潮喷水A| 亚国产欧美在线人成| 日韩不卡高清视频| 亚洲成年人网| 九九九精品视频| 国产精品林美惠子在线播放| 精品成人一区二区三区电影| 中国成人在线视频| 久久青草精品一区二区三区| 美女一区二区在线观看| 波多野结衣一区二区三区AV| 天天做天天爱夜夜爽毛片毛片| 国产一级毛片yw| 亚洲日韩精品无码专区97| 国产黄色免费看| 婷婷六月综合网| 欧美三级自拍| 欧美日韩专区| 不卡的在线视频免费观看| 国产精女同一区二区三区久| 成人免费黄色小视频| 沈阳少妇高潮在线| www.亚洲一区二区三区| 伦伦影院精品一区| 欧美精品亚洲二区| 日本少妇又色又爽又高潮| 91无码视频在线观看| 久久精品这里只有精99品| 国产玖玖玖精品视频| 亚洲无线一二三四区男男| 人妻无码AⅤ中文字| 国产精品美女自慰喷水| 欧美午夜理伦三级在线观看| 国产高颜值露脸在线观看| 青青草a国产免费观看| 国产精品露脸视频| 久久久久国产精品熟女影院| 又污又黄又无遮挡网站| 无码福利日韩神码福利片| 香蕉视频在线观看www| 在线观看亚洲精品福利片| 二级毛片免费观看全程| 欧美午夜久久| 国产精品主播| 国产成人久久综合777777麻豆| 午夜不卡福利| 青青草一区二区免费精品| 狠狠躁天天躁夜夜躁婷婷| 超碰精品无码一区二区| 国产激情无码一区二区免费| 国产91久久久久久| 亚洲黄色网站视频| 欧洲一区二区三区无码|