摘 要:隨著教育信息化的不斷發(fā)展,網(wǎng)絡(luò)教學(xué)考試系統(tǒng)得到了廣泛應(yīng)用與發(fā)展。文章對(duì)網(wǎng)絡(luò)教學(xué)考試系統(tǒng)中兩種不同測(cè)量理論進(jìn)行分析比較,并闡述了各自的特點(diǎn),通過對(duì)比掌握這兩種理論將對(duì)解決網(wǎng)絡(luò)教學(xué)考試系統(tǒng)建立使用過程中存在的問題起到積極的推動(dòng)作用。
關(guān)鍵詞:網(wǎng)絡(luò)教學(xué);考試系統(tǒng);經(jīng)典測(cè)量理論
網(wǎng)絡(luò)教學(xué)考試系統(tǒng)是一個(gè)綜合性網(wǎng)絡(luò)教學(xué)應(yīng)用平臺(tái),利用該系統(tǒng)可以進(jìn)行課堂教學(xué)、學(xué)員自學(xué)、遠(yuǎn)程實(shí)時(shí)教學(xué)、在線答疑、討論交流,完成作業(yè)、自測(cè)、考試、教學(xué)效果分析等教學(xué)全過程。考試是一種知識(shí)測(cè)量行為,網(wǎng)絡(luò)教學(xué)考試是對(duì)網(wǎng)絡(luò)教學(xué)效果的一種測(cè)量。網(wǎng)絡(luò)教學(xué)考試系統(tǒng)是基于教育測(cè)量理論建立并發(fā)展起來的,比較常用的有經(jīng)典測(cè)量理論和項(xiàng)目反應(yīng)理論兩種模型。當(dāng)前,隨著信息化教育的不斷發(fā)展,網(wǎng)絡(luò)教學(xué)考試系統(tǒng)得到了廣泛應(yīng)用。對(duì)網(wǎng)絡(luò)教學(xué)考試系統(tǒng)中兩種不同測(cè)量理論進(jìn)行比較并掌握其特點(diǎn),將對(duì)解決網(wǎng)絡(luò)教學(xué)考試系統(tǒng)使用過程中存在的問題起到積極的推動(dòng)作用。
1 經(jīng)典測(cè)量理論
經(jīng)典測(cè)量理論建立在三個(gè)假設(shè)的基礎(chǔ)上:真分?jǐn)?shù)的值是固定的常數(shù);測(cè)量誤差是完全隨機(jī)的;誤差分?jǐn)?shù)與真分?jǐn)?shù)相加得到觀察分?jǐn)?shù)。
經(jīng)典測(cè)量理論的主要計(jì)量指標(biāo)包括試題的難度、區(qū)分度、測(cè)量信度、測(cè)量效度四項(xiàng)。
1.1 試題難度
試題難度是評(píng)測(cè)質(zhì)量的重要量化指標(biāo),用來表達(dá)評(píng)測(cè)的難易程度。一道試題的難度既能反映試題本身的復(fù)雜程度,又可反映教員與學(xué)員間的教與學(xué)的狀況。同一試題,在不同對(duì)象、不同環(huán)境中使用,所得的難度值不一定相同。
1.2 區(qū)分度
區(qū)分度指試題對(duì)于被試者的區(qū)分程度和鑒別能力。區(qū)分度高,意味著題目的分選性好,可以有效拉開不同水平被試者的分?jǐn)?shù)差距,而低區(qū)分度則反映不出不同被試者的水平差異。區(qū)分度是評(píng)價(jià)試題質(zhì)量和篩選試題的主要指標(biāo)和依據(jù)。
1.3 測(cè)量信度
測(cè)量信度就是同一或相當(dāng)?shù)亩鄠€(gè)測(cè)驗(yàn)對(duì)同一組被試者施測(cè)兩次以上,所得結(jié)果的一致性和穩(wěn)定程度,亦即可靠性程度。信度是衡量試卷質(zhì)量的重要指標(biāo),只有信度高的試卷,才能對(duì)學(xué)員做出公平合理的評(píng)價(jià),才能為改進(jìn)教學(xué)提供可靠依據(jù)。影響考試信度的因素很多,其中可以控制的重要因素有試卷的難度、題型、題量、考試的內(nèi)容。
1.4 測(cè)量效度
測(cè)量效度是指測(cè)量結(jié)果的準(zhǔn)度和有效度,也稱為正確性。效度是一個(gè)相對(duì)的概念,它沒有絕對(duì)性,只有高低之分。內(nèi)容效度、實(shí)證效度與結(jié)構(gòu)效度是常見的三大類考試效度。
以試題的難度、區(qū)分度、測(cè)量信度、測(cè)量效度為主要計(jì)量指標(biāo),經(jīng)典測(cè)量理論為網(wǎng)絡(luò)教學(xué)考試系統(tǒng)的題庫建設(shè)、試卷的編制以及考試分析評(píng)價(jià)奠定了堅(jiān)實(shí)的理論基礎(chǔ),在實(shí)際的教學(xué)與研究中大量應(yīng)用了此理論。
2.2 項(xiàng)目反應(yīng)理論的三種假設(shè)
項(xiàng)目反應(yīng)理論的三種基本假設(shè)包括:潛在特質(zhì)空間的單維性假設(shè)、局部獨(dú)立性假設(shè)和項(xiàng)目特征曲線假設(shè)。
單維性假設(shè)指被試者對(duì)測(cè)驗(yàn)項(xiàng)目的反應(yīng)過程中受能力支配的惟一性,不可能重復(fù)性。雖然影響被試者對(duì)測(cè)驗(yàn)項(xiàng)目反應(yīng)的因素是多方面的,如知識(shí)、個(gè)性、動(dòng)機(jī)等,但只要所有影響因素中僅有一個(gè)起主導(dǎo)作用,且此因素與測(cè)量的潛在特質(zhì)相匹配,則此測(cè)驗(yàn)屬于單維性測(cè)驗(yàn)的范疇。
局部獨(dú)立性假設(shè)包括兩個(gè)方面:一方面,被試者對(duì)不同測(cè)驗(yàn)項(xiàng)目的反應(yīng)在統(tǒng)計(jì)上是獨(dú)立的。另一方面,被試者不會(huì)交叉影響彼此的成績,作答過程彼此獨(dú)立,結(jié)果僅受限于被測(cè)人的潛在特質(zhì)水平。
特征曲線假設(shè)是指正確反映被試項(xiàng)目的概率與其能力之間的函數(shù)關(guān)系,采用項(xiàng)目特性曲線來表述的模型。
3 兩種測(cè)量理論的有效性
經(jīng)典測(cè)量理論和項(xiàng)目反應(yīng)理論這兩種測(cè)量理論都是20世紀(jì)創(chuàng)立,經(jīng)過不斷發(fā)展完善并沿用至今的。作為網(wǎng)絡(luò)教學(xué)考試系統(tǒng)的基礎(chǔ)模型,它們都有各自的優(yōu)越性,也同時(shí)有難以克服的局限性,兩者并沒有一定的高下之分。下面僅對(duì)兩種測(cè)量理論進(jìn)行一個(gè)客觀的對(duì)比分析。
經(jīng)典測(cè)量理論的局限性:第一、統(tǒng)計(jì)量(項(xiàng)目難度,區(qū)分度,信度和效度)對(duì)樣本的依賴性。第二,信度估計(jì)難以精確。信度是根據(jù)平行測(cè)驗(yàn)進(jìn)行概念定義的,而即使對(duì)相同的對(duì)象進(jìn)行相同的測(cè)試,也難以實(shí)現(xiàn)完全平行化,因此信度估計(jì)往往不夠精確。第三,被試水平和項(xiàng)目難度定義在彼此無關(guān)的兩個(gè)量表上,能力量表來自于卷面的總分,而項(xiàng)目難度則來自于被測(cè)試者的得分率,項(xiàng)目難度與能力不能呈正比匹配,p值為0.6的難度不能代表60分的能力。
比較而言,項(xiàng)目反應(yīng)理論較經(jīng)典測(cè)量理論具有一定的優(yōu)勢(shì):首先,項(xiàng)目反應(yīng)理論的所測(cè)項(xiàng)目與被試能力估計(jì)值之間不具相關(guān)性。其次,項(xiàng)目反應(yīng)理論的難度與考生能力在同一量表上被定義。第三,它定義了試題信息函數(shù)這一更為科學(xué)的綜合質(zhì)量標(biāo)準(zhǔn)。應(yīng)用測(cè)驗(yàn)信息函數(shù),可以對(duì)不同考生在某測(cè)驗(yàn)上的測(cè)量精度值進(jìn)行具體化確定。第四,項(xiàng)目反應(yīng)理論的發(fā)展為自適應(yīng)測(cè)驗(yàn)提供了重要的基礎(chǔ)條件。
然而,項(xiàng)目反應(yīng)理論也無法避免其局限性:因其假設(shè)條件嚴(yán)格,一般學(xué)科題庫難以完全滿足。另外,該理論對(duì)于連續(xù)和等級(jí)資料的過程處理比較困難,其最成熟的單維三參數(shù)模型,雖然對(duì)“1,0”計(jì)分的考試資料非常適用,但對(duì)于非“1,0”計(jì)分的考試資料卻一直沒有比較好的解決模型。再者,“維度”與“特質(zhì)”實(shí)際并非直接的心理學(xué)概念,而是兩個(gè)統(tǒng)計(jì)學(xué)概念,因此無法對(duì)特定測(cè)量的內(nèi)容、結(jié)構(gòu)效度提供保證,基于項(xiàng)目反應(yīng)理論的測(cè)驗(yàn)樣本,仍需沿用經(jīng)典測(cè)量理論的檢驗(yàn)方法進(jìn)行效度檢驗(yàn)。
綜上所述,經(jīng)典測(cè)量理論在目前應(yīng)用環(huán)境中更為有效,難以被后續(xù)發(fā)展起來的項(xiàng)目反應(yīng)理論完全取代。經(jīng)典測(cè)量理論在概念的直觀性、計(jì)算方法的簡易性、結(jié)果指標(biāo)值的精確程度等方面更有優(yōu)勢(shì),能夠滿足實(shí)際需求。它的適用性更廣,不僅能夠處理“1,0”計(jì)分,還可以解決連續(xù)與等級(jí)計(jì)分的測(cè)量問題,可以對(duì)既包含選擇性、又包含非選擇性題型的復(fù)雜試卷進(jìn)行全面的題目分析與客觀的卷面質(zhì)量分析。因此,在實(shí)際的網(wǎng)絡(luò)教學(xué)考試系統(tǒng)建立使用過程中,經(jīng)典測(cè)量理論更適用于作為其基礎(chǔ)模型。
參考文獻(xiàn)
[1]萬明高.現(xiàn)代教育技術(shù)理論與方法[M].北京:北京大學(xué)出版社,2007.
[2]漆書青,戴海崎,丁樹良.現(xiàn)代教育與心理測(cè)量學(xué)原理[M].高等教育出版社,2002.
[3]余勝泉,何克抗.網(wǎng)絡(luò)題庫系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].中國遠(yuǎn)程教育,2000.
[4]郁建政.網(wǎng)絡(luò)題庫系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù),2008.