999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

適應(yīng)性語言測(cè)試的理論和實(shí)踐

2012-04-29 00:00:00唐義靜
北方文學(xué)·中旬 2012年6期

摘 要:本文主要介紹適應(yīng)性測(cè)試和計(jì)算機(jī)適應(yīng)性測(cè)試的理論和實(shí)踐,為我們的語言測(cè)試, 特別是英語測(cè)試, 提供一種全新的視角。

關(guān)鍵詞:適應(yīng)性測(cè)試 計(jì)算機(jī)適應(yīng)性測(cè)試

正如McNamara所說,考試是社會(huì)生活中一種普遍特征。中國(guó)的考試制度追溯到2000多年以前,對(duì)于那時(shí)平民百姓來說,考試是唯一能進(jìn)入官宦生活的方式。語言測(cè)試在20世紀(jì)60年代初期在西方才成為一門新新學(xué)科,而中國(guó)的語言測(cè)試(主要指英語語言測(cè)試)的發(fā)展更為晚些。李莜菊(1997:4),舒云祥(1999:13)在其書中總結(jié)了一些關(guān)于目前我國(guó)語言測(cè)試的特點(diǎn):第一,英語測(cè)試仍采用心理測(cè)量加結(jié)構(gòu)主義的方法,聽、說在我國(guó)大部分地區(qū)仍被廣泛運(yùn)用,分離測(cè)試占據(jù)著重要地位。第二,人們更為關(guān)注測(cè)試而不是測(cè)試?yán)碚?。第三,人們只注意考試的評(píng)價(jià)與選拔功能,忽略測(cè)試的反撥作用。

1. 適應(yīng)性測(cè)試

1.1適應(yīng)性測(cè)試?yán)碚?/p>

適應(yīng)性測(cè)試(Adaptive Testing)指測(cè)試者所遇到的特定題目是由他對(duì)以前題目的反應(yīng)來決定的。他碰到的第一個(gè)題目是中等難度,如果這個(gè)題目被正確完成,第二個(gè)題難度將會(huì)增加,反之,第二個(gè)就會(huì)容易些,考試就按照這種方式循環(huán)直到獲得一個(gè)與他能力或成就相匹配的分?jǐn)?shù)為止。在大部分適應(yīng)性測(cè)試中,受試者并不能覺察到他們對(duì)特定題目反應(yīng)是否正確,他們可能也不知道隨后碰到的題目是由前面反應(yīng)來決定的。

適應(yīng)性測(cè)試是采用單個(gè)適應(yīng)性測(cè)試的形式,也叫做順序測(cè)試,分支測(cè)試,監(jiān)測(cè)測(cè)試,獨(dú)立測(cè)試,程序測(cè)試,靈活測(cè)試,連續(xù)反應(yīng)測(cè)試等,它來自于20世紀(jì)五六十年代的程序性教育活動(dòng)的紙筆練習(xí)。其練習(xí)包括兩種:線性和分支性練習(xí)。它們都提供了一種教學(xué)因素,即通過一系列框架所取得的進(jìn)步暗示著學(xué)習(xí)者已取得了令人滿意的效果。線性練習(xí)是在每一步框架之后就知曉分?jǐn)?shù),而分支性練習(xí)更適合快速學(xué)習(xí)者。

通過使用基于項(xiàng)目反應(yīng)理論(Item Response Theory)以及計(jì)算機(jī)監(jiān)測(cè)的分支策略使得適應(yīng)性測(cè)試變得很流行。使用項(xiàng)目難度與能力相結(jié)合的策略,學(xué)生被重復(fù)使用越來越難的題目直到獲得一個(gè)與他能力或成就相匹配的分?jǐn)?shù)。這種策略就叫做最優(yōu)化適應(yīng)性測(cè)試信息策略。當(dāng)然,適應(yīng)性測(cè)試并不新鮮,在某些方面,甚至連Stanford-Binet測(cè)量也是適應(yīng)性的。計(jì)算機(jī)很有可能使此項(xiàng)測(cè)試普及。

1.2適應(yīng)性測(cè)試的實(shí)踐

如果讓測(cè)試者一天之內(nèi)連續(xù)七小時(shí)考試顯然是不切實(shí)際的,而使用監(jiān)測(cè)性或適應(yīng)性測(cè)試就完全具備這種可能,因?yàn)檫m應(yīng)性測(cè)試是依照單個(gè)測(cè)試者對(duì)前一試題的反應(yīng)而被連續(xù)給予試題??荚嚨谋O(jiān)測(cè)是由計(jì)算機(jī)來完成的,因?yàn)樗茉诿恳徊桨匆筮x擇所需要的試題然后進(jìn)行分?jǐn)?shù)統(tǒng)計(jì)。實(shí)際上,Linn Carlson 在1968年就進(jìn)行了探索性研究,那時(shí)監(jiān)測(cè)性或分支測(cè)試正在發(fā)展。研究的結(jié)果不盡人意,他們認(rèn)為適應(yīng)性測(cè)試遠(yuǎn)不如常規(guī)性測(cè)試有效,很大程度是因?yàn)樗麄冊(cè)谘芯恐惺褂贸R?guī)性試題替代適應(yīng)性試題進(jìn)行研究。

如今,這方面的關(guān)注除了要控制試題難度以外,還必須確信受試者之間的遇到的題目的難度系數(shù)是相同的。集中難度系數(shù)僅僅是作為一種選擇題目的手段,我們也可以選擇差異很大的詞匯作為試題,這樣在效果上單個(gè)人碰到的適應(yīng)性測(cè)試等同于詞匯測(cè)試。在實(shí)踐中,選擇題目要根據(jù)區(qū)分度,當(dāng)然是越高越好。如果我們只考慮試題庫(kù)的多樣性而引進(jìn)許多新的不同的材料,這會(huì)產(chǎn)生新的問題,因?yàn)槿藗兒苌龠x用新的試題作為考題。正如Green (1998)所說,項(xiàng)目反應(yīng)理論方法比起常規(guī)方法在忽略新穎和差異方面更為有效,因此計(jì)算機(jī)監(jiān)測(cè)考試更好。解決這一問題的方法之一就是劃分考題類型并分段計(jì)量。

適應(yīng)性測(cè)試類型的原則是我們選擇試題時(shí)要預(yù)測(cè)到受試者考試情況以及所處的層次,只有這樣測(cè)試才有效。入學(xué)層次需由以前熟練水平來限定,由最初的題目,任務(wù)或預(yù)測(cè)的結(jié)果來確定,甚至是由年齡等決定。因此最后評(píng)價(jià)的準(zhǔn)確性可能會(huì)受到最初評(píng)判的影響。

1.3 適應(yīng)性測(cè)試的優(yōu)點(diǎn)

適應(yīng)性測(cè)試有其顯而易見的優(yōu)勢(shì),任何一個(gè)測(cè)試者會(huì)得到更少的試題,并且考試的時(shí)間也隨之縮短。如果需要的話,在能力范圍的兩極(即最優(yōu)秀和最差)的評(píng)估還可改進(jìn)。不同受試者回答不同的題目——這樣可以確保試題庫(kù)的安全性,是另外一個(gè)不顯眼的優(yōu)點(diǎn)。

監(jiān)測(cè)適應(yīng)性測(cè)試可以采用以下形式:單獨(dú)面試(像口語測(cè)試),紙筆模式,計(jì)算機(jī)監(jiān)測(cè)的形式。適應(yīng)性測(cè)試中最成功的使用即是計(jì)算機(jī)適應(yīng)性試(Computer Adaptive Testing, 簡(jiǎn)稱為CAT),這在語言測(cè)試中是最有潛力同時(shí)也最具有挑戰(zhàn)研究和發(fā)展領(lǐng)域,而且它以試題難易層次和受試者能力層次的最優(yōu)化匹配的方式同時(shí)監(jiān)測(cè)某幾種類型的語言測(cè)試。

2. 計(jì)算機(jī)適應(yīng)性測(cè)試

2.1計(jì)算機(jī)適應(yīng)性測(cè)試?yán)碚?/p>

CAT是以試題庫(kù)的存在為依據(jù),它的試題依照能力-難度計(jì)量為標(biāo)準(zhǔn),通過這種標(biāo)準(zhǔn),題目得以排序,受試者的名次得以排列,項(xiàng)目反應(yīng)理論提供了這樣做的工具。CAT試題提前設(shè)置題目難度系數(shù),它來自于學(xué)生以紙筆的方式對(duì)一個(gè)試驗(yàn)樣本中題目的反復(fù)考查。

CAT的目的是盡可能讓試題的難度系數(shù)與測(cè)試者的能力像匹配。在考試中,單個(gè)受試者會(huì)碰到題庫(kù)中題目的選擇,任何一個(gè)測(cè)試者遇到的題目都是由計(jì)算機(jī)程序依照這個(gè)測(cè)試者對(duì)一系列問題的反應(yīng)的結(jié)果來決定的。測(cè)試者的第一反應(yīng)用來構(gòu)成暫時(shí)的評(píng)判,容易或稍難的題目依據(jù)每一步的反應(yīng)的調(diào)整來進(jìn)行選擇,例如,如果題目A對(duì)于一個(gè)測(cè)試者太難,隨后他會(huì)遇到一個(gè)容易的題,如果題目B證明太容易,那么題目C將被作為中間難度被選中。通過這種方法,計(jì)算機(jī)程序根據(jù)相應(yīng)的題目難度范疇(直到分?jǐn)?shù)在一個(gè)公認(rèn)的精確水平)得出測(cè)試者能力的分?jǐn)?shù)。

2.2計(jì)算機(jī)適應(yīng)性測(cè)試的實(shí)踐

在CAT方法中,題目被給予的順序是測(cè)試者反應(yīng)的一種功能。如果測(cè)試者不能回答一個(gè)特定的題目,那么下一個(gè)題就會(huì)變得容易一些,相反,如果回答正確,下一個(gè)題就會(huì)難一些。在按測(cè)試題目順序的方法里,不僅測(cè)試者對(duì)所提供的題目的順序沒有直接選擇,而且不同能力層次的測(cè)試者很可能碰到不同的題目,或者遇到不同順序中的相同題目,此外,一個(gè)特定的考生在重考中可能會(huì)遇到以不同順序出現(xiàn)的不同題目。

CAT更有利于評(píng)估的精確性,因?yàn)榭忌龅降念}目都具有很大的區(qū)分度,也就是說,這些題目或多或少都在評(píng)判考生能力范圍之內(nèi),這種類型的題目比起太容易或太難的題目來說能提供更多關(guān)于受試者的信息。

CAT是適應(yīng)性測(cè)試的一種變異,這種變異依照考生在考試中經(jīng)歷的成功或失敗來給予試題順序。例如,對(duì)于一個(gè)特定的題目考生如果答對(duì)了,就會(huì)導(dǎo)致更難層次題目的呈現(xiàn),反過來,答錯(cuò)的考生將遇到較容易的題。這種過程的一些變異會(huì)以反復(fù)的形式繼續(xù)直到允許考生考試終止的信息被收集為止。

2.3計(jì)算機(jī)適應(yīng)性測(cè)試的優(yōu)點(diǎn)和缺點(diǎn)

任何事物都有正反兩面一樣,CAT也有自身的缺點(diǎn)和優(yōu)點(diǎn)。我們需要發(fā)現(xiàn)新的方法來克服或者彌補(bǔ)這些缺點(diǎn)。當(dāng)然隨著熟練操作計(jì)算機(jī)的人的增多以及學(xué)校和其它組織計(jì)算機(jī)的不斷引進(jìn), 這些反對(duì)的聲音開始逐漸變小。

1)使用計(jì)算機(jī)作為考試工具要注意:一是計(jì)算機(jī)硬件和軟件的高成本,另外就是所有考生都必須會(huì)操作其程序。

2)CAT僅只局限于客觀評(píng)判模式。

3)在一些語言測(cè)試技能中,有一些是計(jì)算機(jī)不能識(shí)別的熱身考試,如口語測(cè)試。

4)一些來自于對(duì)依照不同試題結(jié)合給不同的考生測(cè)試而獲得的分?jǐn)?shù)的反對(duì)意見也具有一定的合理性。

5)CAT方法中一個(gè)最大的缺陷是只客觀為語言測(cè)試評(píng)分,而對(duì)作文,聽寫,口語測(cè)試就沒有這樣的評(píng)分步驟。

盡管有以上缺陷,但是仍舊有一些計(jì)算機(jī)適應(yīng)性測(cè)試所具有的無可比擬的優(yōu)點(diǎn), 如:

1)CAT對(duì)測(cè)試者能力類別也能提供適應(yīng)方式,真正消除常規(guī)考試中的作弊現(xiàn)象,安排考試也有很大的靈活性,這是由于每次考試都不一樣,運(yùn)用小型題庫(kù)和測(cè)試網(wǎng)絡(luò)可極大提高考試效率(包括每次考試時(shí)間的大大縮短)。

2)試驗(yàn)發(fā)現(xiàn)CAT在信度和效度方面都優(yōu)于傳統(tǒng)的紙筆測(cè)試。

3)研究人員已發(fā)現(xiàn)把CAT和傳統(tǒng)考試相結(jié)合來測(cè)量具有顯著預(yù)測(cè)能力。

4)當(dāng)學(xué)生碰到超越他們能力極限的題目但又不得不回答時(shí),CAT可減少其挫敗感覺和疲勞。對(duì)那些遇到太容易題目的考生來說枯燥也會(huì)減少。

5)CAT能直接提供準(zhǔn)確﹑一致的考試結(jié)果,同時(shí)能為老師和考官提供診斷性的幫助,減輕出題者負(fù)擔(dān),而且計(jì)算機(jī)還能靈活自如轉(zhuǎn)到題庫(kù)。

6)CAT的實(shí)踐優(yōu)點(diǎn)在于極大提高測(cè)試的安全性,這是由于兩個(gè)考生在同樣的測(cè)試順序幾乎不可能會(huì)遇到一樣的題,單個(gè)考生在隨后測(cè)試中也不可能碰到相同的題,因此允許其試題對(duì)同一個(gè)考生重復(fù)使用。

7)和傳統(tǒng)考試相比,CAT能記錄單個(gè)考生取得進(jìn)步的全過程。

8)由于計(jì)算機(jī)可以保持每個(gè)考生答題的詳細(xì)情況,因此可以擴(kuò)展對(duì)每個(gè)考生的報(bào)告,調(diào)查和評(píng)估。

9)除了多項(xiàng)選擇題以外,考試類型也可以監(jiān)測(cè),如等級(jí)評(píng)分題,甚至后來由老師打分的作文考試題也一樣。換句話說,CAT可以消除辨認(rèn)學(xué)生作文中潦草字跡等問題。

3. 結(jié)論

隨著社會(huì)的發(fā)展和計(jì)算機(jī)的普及,要求人們掌握更多的東西,如全面的專業(yè)知識(shí),靈活操作計(jì)算機(jī),甚至擅長(zhǎng)與人溝通等等。計(jì)算機(jī)適應(yīng)性測(cè)試作為一種判斷一個(gè)人是否全面,是否能適合社會(huì)發(fā)展需要的工具將會(huì)受到越來越多的重視。通過使用計(jì)算機(jī)適應(yīng)性測(cè)試而不斷發(fā)揮其優(yōu)點(diǎn)。

主站蜘蛛池模板: 无码有码中文字幕| 国产美女无遮挡免费视频网站 | 国产成人高清在线精品| 啦啦啦网站在线观看a毛片| 久久久久亚洲Av片无码观看| 国产成人欧美| 无码不卡的中文字幕视频| 国产一级二级三级毛片| 九九久久精品免费观看| 亚洲日韩日本中文在线| 亚洲天堂成人| 丝袜国产一区| 亚洲男人天堂2020| 美女无遮挡免费视频网站| 毛片基地美国正在播放亚洲| 免费无码网站| 99热这里只有精品久久免费| 露脸真实国语乱在线观看| 色综合中文| 欧美一级在线| 久久综合伊人 六十路| 免费观看三级毛片| 制服丝袜在线视频香蕉| 美女高潮全身流白浆福利区| 亚洲免费播放| 人妻精品久久无码区| 亚洲综合中文字幕国产精品欧美 | 四虎永久免费地址| 日韩免费毛片视频| 99热国产这里只有精品无卡顿"| 99资源在线| 人妻丰满熟妇αv无码| 国产综合无码一区二区色蜜蜜| 日本爱爱精品一区二区| 亚洲成网站| 国产丰满大乳无码免费播放| 欧美全免费aaaaaa特黄在线| 色综合热无码热国产| 国产午夜无码专区喷水| 中文成人无码国产亚洲| 色偷偷一区二区三区| 国产成人福利在线| 亚洲天堂日本| 2021精品国产自在现线看| 国精品91人妻无码一区二区三区| 国产人成午夜免费看| 久久综合激情网| 婷婷亚洲天堂| 日韩黄色大片免费看| 国产精品成人观看视频国产| 一区二区三区四区在线| 五月婷婷丁香综合| 99伊人精品| 72种姿势欧美久久久久大黄蕉| 国国产a国产片免费麻豆| 91探花国产综合在线精品| 国产日韩欧美成人| 久久亚洲国产一区二区| 天堂成人av| 日韩中文无码av超清| 女人毛片a级大学毛片免费| 91精品视频播放| 91小视频在线观看免费版高清| 在线免费观看AV| 久久91精品牛牛| 色综合久久88| 一级毛片高清| 91热爆在线| 九色综合视频网| 国产三区二区| 国产一级片网址| AV片亚洲国产男人的天堂| 亚洲第一国产综合| 97国产在线观看| 久久综合结合久久狠狠狠97色| 国产精品福利导航| 亚洲bt欧美bt精品| 狠狠久久综合伊人不卡| 精品国产黑色丝袜高跟鞋 | 午夜福利免费视频| 日韩在线永久免费播放| 国产福利小视频高清在线观看|