999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關于“考試”,我們了解多少?

2015-06-16 23:25:15廖先祥莫海浪
廣西教育·D版 2015年6期
關鍵詞:標準水平學生

廖先祥 莫海浪

在前面的兩個問題中,我們知道了分析試題的兩個重要指標:區分度和難度。這兩個指標作為我們分析、評價和篩選試題的重要依據,分別承擔著區分學生不同能力水平和衡量學生得分難易程度的功能。可能你會說:“能最大限度地把不同水平的學生區分開,學生又容易做的題,必然是一道好題了。”或者說:“看看難度和區分度的關系表就知道,難度是0.5的試題是最好的,因為它的區分度最大。”真的是這樣嗎?

問題7:什么樣的試題才算是好的試題?

如前面所說,一道試題好或者不好,它的區分度和難度是必須要考察的兩個參數,哪個更應該排在第一位呢?我們先來看看下面這道初中物理單項選擇題。

下列對物理概念或規律的說法中正確的是( )

A.某種燃料完全燃燒放出的熱量,叫做這種燃料的燃燒值。

B.陽光通過棱鏡后被分解成各種顏色的光,這種現象叫光的反射。

C.電路的一部分導體在磁場中做切割磁感線運動時,導體中就產生電流。

D.一切物體在沒有受到力的作用時,總保持靜止狀態或勻速直線運動狀態。

這道題的內容涉及初中物理的四大領域——力學、熱學、電學、光學,是一些老師所鐘愛的試題,尤其是在綜合性考試中,因為對試題的數量有限制,同時又對知識的覆蓋面有要求,這道題便顯示出了它的獨特“優勢”。此時,也許你想知道這道題的難度和區分度有多大,但這不應該是我們首先要討論的話題。我們說,任何一道試題,都應該有它的考查意圖、考查目的,或者說,它應該對應一個或兩個具體的知識目標,以便通過學生的作答來診斷其知識狀態、能力水平。這一道試題的四個選項,各自對應一個知識目標,不論學生的答案是哪一項,我們都無法判斷它對另外三個知識目標的掌握情況。這道試題的最大特點是題干沒有指向明確的檢測目標,對選項的知識范圍沒有做任何限制,任何一個完整的陳述都可以與題干相匹配。這種由無目標的“通用題干”所統領的試題不是我們所提倡的,如果該試題不加以修改,我們甚至沒有必要去計算或預計它的難度和區分度。

所以,要求試題符合常規的命題規則,是我們命制一道好試題的基本前提。缺少這一前提,會導致試題參數的不確定性。當然,不同的題型有不同的命題規則。比如,命制單項選擇題就有如下要求:題干中盡量避免使用負性用語;答案選項的字數盡量不要比題干多;答案選項與題干在語法上應該結構一致,并保持內容的同質性;答案選項中應慎用“以上選項都不對”“以上選項都對”“總是”“絕對”等詞語,以免造成給學生“提示”正確或錯誤答案的嫌疑。不同題型的命題技術有不同的要求,受篇幅與話題所限,我們就不在這里展開討論了。

如果一道試題有明確的內容檢測目標,并符合一般的命題技術要求,就可以接著往下分析了。我們來看下面這道試題。

汽車在結冰的路面上比在同一條路的干爽路面上行駛更容易引發交通事故,這是由于路面結冰后( )

A.汽車與路面的摩擦力變小。

B.汽車與路面的壓力變小。

C.汽車會開得比平常快。

D.汽車輪子比平常癟。

該試題主要考查考生對物體運動狀態改變及其原因的解釋能力。經考試后抽樣分析,我們得出該試題的難度為0.97,區分度為0.27。對照上一講的難度與區分度的關系表可以看出,這道試題的兩個參數值的表現都很好。但單看難度系數,說明該試題很容易;單看區分度,0.27的數值似乎又顯示了該試題的區分度不甚理想。那么,這兩個參數哪一個更重要呢?這取決于你想用這道題來考查什么。假如你想借此題來區分學生對“物體運動狀態發生改變的原因”的解釋能力的不同水平,這道題是不合格的;假如你想檢查是不是多數學生對該題的解釋能力都達到了較低層次的理解水平,這就是符合需要的試題了。

那么,難度和區分度都符合要求的試題就是好試題嗎?我們還是以上面這道題為例,簡單分析一下學生的答題情況,表1是78名學生在回答這道題時,對4個選項的答題選項統計表。

此題的正確選項是A。從表1可以看出,選擇錯誤選項的學生較少,其中的C選項甚至是零選擇,說明這一選項對學生完全不具備干擾性,它的存在似乎只是為了湊夠4個選項,因而可以說它是一個廢項。當然,這個結果也可能是抽樣偏少導致,但這道題依然是值得我們斟酌的,至少它提示我們,可能需要增加抽樣量來進一步分析,作出是否修改試題的決定。

我們再來看這樣一道試題的數據分析。表2為柳州市某城區模擬考試卷中的一道主觀題(題目略)的區分度與難度情況分析表,表3為學生的得分情況分析表。該題賦分為5分,命題符合一般技術要求,數據來源為參加考試的該城區的學生樣本。

從總體情況看,該題的難度與區分度相當理想,說明題目本身是恰當的。進一步分析學生的得分情況,我們卻發現了一個小問題:得到4分的學生人數在總人數中所占比例非常小,連1%都不到,這說明該題的計分點設置不夠合理,修訂辦法是把4分和5分兩個計分點合并,或者重新設置計分點。

這樣看來,什么樣的試題才算是好試題,還真不是一個簡單的問題。我們認為,要想知道一道試題算不算好試題,既要單獨考察這道試題有沒有遵守命題規則,是否達到了一般的技術要求;又要分析這道試題的具體參數,看它是不是符合測試的目的,同時還要考察學生的答題情況。當然,在后面的問題中,我們還會運用項目反應理論來分析學生的答題反應,分析試題與學生能力期望值的擬合度,以保證試題的高質量。

我們知道,一份試卷由一道道試題組成,如果我們把若干道好試題組合起來,就一定能得到一份好試卷嗎?

問題8:什么樣的試卷才算是好試卷?

通常一份好試卷需要滿足一些必要的條件,比如:從試卷雙向細目表去檢查試題內容是不是符合考試要求,編排的難度梯度有沒有給考生造成不必要的答題障礙,試題難度與區分度的分布是不是合理,文字閱讀量是否恰當,考試的信度、效度是否足夠好,等等。在以上各個項目中,有些分析還要在考試結束后才能進行。那么,在考試之前分析一份試卷是不是好試卷,最關鍵、最重要的因素是什么呢?

假設你已經較好地掌握了命題的技術要領,現在要命制一份試卷,你首先該考慮什么呢?沒錯,我們首先應考慮這份試卷將用于什么類型的考試,它的主要功能是什么,即明確它的測試目的是什么。

這里先借用心理測量學的一些專業說法:根據對測驗進行解釋時所采用的標準,我們把測驗分成兩類,即標準參照測驗與常模參照測驗。也就是說,我們所說的考試即測驗(為方便讀者同時閱讀其他相關資料,本話題下文暫且將“考試”稱為“測驗”),依據評價所參照的標準來劃分的話,基本上可以分為標準參照測驗與常模參照測驗兩類。標準參照測驗又叫目標參照測驗,它的目的是將考生的測驗成績與絕對標準相比較,以評價考生是否達標或達標程度如何;它不拿考生之間的分數作比較,側重了解考生在所規定的測量內容上的行為水平,其出發點是個體本身的絕對水平,而不是個體間的差異。常模參照測驗則是將考生的測驗成績與常模相比較,評價考生在團體中的相對位置,即側重于考查考生的個體差異,一般用于大規模測驗中衡量考生的相對水平,以選拔為目的。值得一提的是,常模這個概念比較專業,它是對樣本的測驗分數用統計手段進行處理后得到的一種用作比較的標準量數,不過這不是我們這里要討論的重點,對它一時的不理解并不影響大家參與后面的討論,如果你對常模分數的確定有興趣,可以另外查閱相關的資料。

具體地說,我們平常的章節測驗、單元檢測、期末測試等,是老師為了了解學生是否已經掌握相關的教學內容及掌握的程度如何。學生的畢業考試,目的在于評價學生是否達到相應學段課程標準規定的要求。從測驗的性質看,以上測驗都屬于標準參照測驗。由于標準參照測驗用于檢驗學生是否達到某一標準,因而在編制試卷時不論題目難易,也不論區分度大小,只要屬于考查的知識范圍,難度與標準水平要求相一致就應該編進試卷。比如:交規考試就是非常具有代表性的標準參照測驗,它考查考生對交規的理解水平是否達到允許申領駕照的門檻,不考慮通過率是多少,不考慮考生的差異有多大。考試依照我國機動車道路駕駛相關規定的標準設置100道題,能答對90道題以上(含90道)就是合格的。假如考生水平都很高,合格率可以是100%;假如考生水平都比較低,合格率可能不到50%。

當你的命題任務是為了給學生編組、編班,或者為高一級學校選拔學生,需要將學生分類排隊,區分個體差異時,你所編制的試卷將要應用于一個常模參照測驗。為使試卷盡量對學生有較強的鑒別力,我們需要充分考慮試題的難度分布(別忘了好試題的難度與區分度之間是有一定關系的),尤其要在學生群體中的某個能力水平或若干個能力水平處投放有足夠的、對應區分度的試題。大部分智力測驗、升學招生考試等都是常模參照測驗,高考是非常典型的常模參照測驗。好的高考試卷通常都會在一本、二本、三本等能力水平處設置足夠數量的試題,這時對一個考生的高考成績單獨解釋毫無意義,它必須放到全體考生這個團體中去才能體現出它的意義。比如:廣西高考物理卷賦分是108分,如果一個考生的高考物理成績是60分,單看這個分數是很不理想的,但如果我告訴你廣西高考物理的常模分數大約是40分(注:這并非一本線),60分在廣西考生群體中的排名已經很不錯了,已經超出了物理單科一本線的能力水平,是不是很值得慶賀呢?考生的成績還可以和全國的常模比較呢。

下面我們給出一個具體的例子,圖1是2013年柳州市中考物理學科命題難度預計分布圖。

在圖1中,我們看到該卷在難度為0.7—0.9和0.4—0.6兩個區間預設了較多的試題(占全卷試題的近70%)。從前面的討論中我們知道,難度在0.5左右的試題具有最大的潛在區分度。

圖2則是用IRT軟件對測試所反映出來的考生能力分布的一種分析結果。

圖2中,左列數值為考生能力值,右邊的數字為區分對應左列能力值的計分點,從能力分布圖可以看出,學生的能力基本呈正態分布。該圖能很清楚地顯示出,有大量的試題側重在能力水平1以下,熟悉初中物理課程標準的人都知道,這部分試題檢驗學生是否達到課程標準的要求,同時也有足夠試題較集中地區分能力水平為-2、1和2的考生,這正是柳州市中考單科成績等級劃分的三條重要界限。到這里你可能會產生疑問了:中考到底是標準參照測驗,還是常模參照測驗?

“中考”全稱是“初中畢業升學考試”,兼有畢業生檢驗與選拔的雙重功能。在實際考試中,我們可能會面對類似的特殊需求,要求測驗兼有標準參照測驗與常模參照測驗兩種性質,這就要求我們在編制試卷時必須在它們之間找到一個恰當的平衡點,如同例子中的這份物理卷。兩種類型的測驗并非水火不相容,雖然它們的側重點不同,但它們在一定程度上仍能顯示出對方的痕跡。在我國,這種情況并不罕見,像研究生考試就有常模參照測驗和標準參照測驗的雙重屬性。說它是常模參照測驗,因為考生需要排序、選拔;說它是標準參照測驗,是因為有“單科分數線”存在。比如一個考生總分可能很高,但他英語沒上單科分數線,同樣不能錄取,他會被認為“英語水平沒有達標”……聊了這么多,好試卷都要具備哪些條件好像還是沒說全。是的,我們只談了最為關鍵的東西:試卷必須為測驗目的服務!明確了測試目的這一根本問題,剩下怎樣選擇好的試題,怎樣命制試題,怎樣組卷等等,大都是純技術性的問題了。就如同兩軍開戰,明確了自己將要面臨一場巷戰,一個優秀的指戰員就會知道應該選擇輕武器而不是坦克大炮,也當然知道什么戰術最合適,難道不是嗎?(責編 白聰敏)

猜你喜歡
標準水平學生
2022 年3 月實施的工程建設標準
張水平作品
加強上下聯動 提升人大履職水平
人大建設(2019年12期)2019-05-21 02:55:32
忠誠的標準
當代陜西(2019年8期)2019-05-09 02:22:48
美還是丑?
趕不走的學生
學生寫話
學生寫的話
一家之言:新標準將解決快遞業“成長中的煩惱”
專用汽車(2016年4期)2016-03-01 04:13:43
做到三到位 提升新水平
中國火炬(2010年8期)2010-07-25 11:34:30
主站蜘蛛池模板: www精品久久| 亚洲开心婷婷中文字幕| 特级做a爰片毛片免费69| 欧美日本视频在线观看| 国产凹凸视频在线观看| 99久久免费精品特色大片| 九色91在线视频| 天堂在线视频精品| 亚洲一区第一页| 国产三区二区| 在线国产你懂的| 亚洲成综合人影院在院播放| 欧美色图久久| 毛片久久网站小视频| 日韩精品免费在线视频| 波多野结衣中文字幕久久| www.91中文字幕| 日韩精品毛片人妻AV不卡| 一本色道久久88亚洲综合| 91伊人国产| 一本大道在线一本久道| 色偷偷一区二区三区| 粉嫩国产白浆在线观看| 玖玖免费视频在线观看| 亚洲色图欧美| 成年人福利视频| 国产毛片久久国产| 呦视频在线一区二区三区| 2022国产无码在线| 97se亚洲综合在线天天| 亚洲成人黄色网址| 大陆精大陆国产国语精品1024| 91九色视频网| 亚洲天堂在线免费| 日韩第八页| 91口爆吞精国产对白第三集 | 国产乱子精品一区二区在线观看| 国产在线观看一区精品| 欧美在线天堂| 国产69精品久久| 久久夜夜视频| 波多野结衣中文字幕久久| 毛片大全免费观看| 亚洲最黄视频| 思思99热精品在线| 一本大道东京热无码av| 国产亚洲欧美日韩在线观看一区二区| 少妇露出福利视频| 婷婷亚洲最大| 久久香蕉国产线看精品| 国产精品美女免费视频大全 | 中文字幕永久在线看| 午夜视频www| 自偷自拍三级全三级视频| 国内精品久久久久久久久久影视| a毛片免费在线观看| 日韩 欧美 国产 精品 综合| 色综合综合网| 无遮挡国产高潮视频免费观看 | 欧美人与性动交a欧美精品| 国产成人a毛片在线| 伦精品一区二区三区视频| 欧美97色| 国产微拍一区二区三区四区| 新SSS无码手机在线观看| 一级毛片在线播放| 精品视频第一页| 国产日韩AV高潮在线| 精品自窥自偷在线看| 青青青亚洲精品国产| 亚洲人成网7777777国产| 婷婷综合色| 国产欧美在线观看一区| 国产无码制服丝袜| 性欧美久久| 99青青青精品视频在线| 欧洲亚洲一区| 国产成人h在线观看网站站| 99热最新在线| 免费在线成人网| 好吊妞欧美视频免费| 999精品色在线观看|