網(wǎng)絡(luò)教學(xué)考試系統(tǒng)中兩種教育測(cè)量理論的比較

2013-12-31 00:00:00葉昊亮郭泉成

科技創(chuàng)新與應(yīng)用 2013年12期

摘要：隨著教育信息化的不斷發(fā)展，網(wǎng)絡(luò)教學(xué)考試系統(tǒng)得到了廣泛應(yīng)用與發(fā)展。文章對(duì)網(wǎng)絡(luò)教學(xué)考試系統(tǒng)中兩種不同測(cè)量理論進(jìn)行分析比較，并闡述了各自的特點(diǎn)，通過對(duì)比掌握這兩種理論將對(duì)解決網(wǎng)絡(luò)教學(xué)考試系統(tǒng)建立使用過程中存在的問題起到積極的推動(dòng)作用。

關(guān)鍵詞：網(wǎng)絡(luò)教學(xué)；考試系統(tǒng)；經(jīng)典測(cè)量理論

網(wǎng)絡(luò)教學(xué)考試系統(tǒng)是一個(gè)綜合性網(wǎng)絡(luò)教學(xué)應(yīng)用平臺(tái)，利用該系統(tǒng)可以進(jìn)行課堂教學(xué)、學(xué)員自學(xué)、遠(yuǎn)程實(shí)時(shí)教學(xué)、在線答疑、討論交流，完成作業(yè)、自測(cè)、考試、教學(xué)效果分析等教學(xué)全過程。考試是一種知識(shí)測(cè)量行為，網(wǎng)絡(luò)教學(xué)考試是對(duì)網(wǎng)絡(luò)教學(xué)效果的一種測(cè)量。網(wǎng)絡(luò)教學(xué)考試系統(tǒng)是基于教育測(cè)量理論建立并發(fā)展起來的，比較常用的有經(jīng)典測(cè)量理論和項(xiàng)目反應(yīng)理論兩種模型。當(dāng)前，隨著信息化教育的不斷發(fā)展，網(wǎng)絡(luò)教學(xué)考試系統(tǒng)得到了廣泛應(yīng)用。對(duì)網(wǎng)絡(luò)教學(xué)考試系統(tǒng)中兩種不同測(cè)量理論進(jìn)行比較并掌握其特點(diǎn)，將對(duì)解決網(wǎng)絡(luò)教學(xué)考試系統(tǒng)使用過程中存在的問題起到積極的推動(dòng)作用。

1 經(jīng)典測(cè)量理論

經(jīng)典測(cè)量理論建立在三個(gè)假設(shè)的基礎(chǔ)上：真分?jǐn)?shù)的值是固定的常數(shù)；測(cè)量誤差是完全隨機(jī)的；誤差分?jǐn)?shù)與真分?jǐn)?shù)相加得到觀察分?jǐn)?shù)。

經(jīng)典測(cè)量理論的主要計(jì)量指標(biāo)包括試題的難度、區(qū)分度、測(cè)量信度、測(cè)量效度四項(xiàng)。

1.1 試題難度

試題難度是評(píng)測(cè)質(zhì)量的重要量化指標(biāo)，用來表達(dá)評(píng)測(cè)的難易程度。一道試題的難度既能反映試題本身的復(fù)雜程度，又可反映教員與學(xué)員間的教與學(xué)的狀況。同一試題，在不同對(duì)象、不同環(huán)境中使用，所得的難度值不一定相同。

1.2 區(qū)分度

區(qū)分度指試題對(duì)于被試者的區(qū)分程度和鑒別能力。區(qū)分度高，意味著題目的分選性好，可以有效拉開不同水平被試者的分?jǐn)?shù)差距，而低區(qū)分度則反映不出不同被試者的水平差異。區(qū)分度是評(píng)價(jià)試題質(zhì)量和篩選試題的主要指標(biāo)和依據(jù)。

1.3 測(cè)量信度

測(cè)量信度就是同一或相當(dāng)?shù)亩鄠€(gè)測(cè)驗(yàn)對(duì)同一組被試者施測(cè)兩次以上，所得結(jié)果的一致性和穩(wěn)定程度，亦即可靠性程度。信度是衡量試卷質(zhì)量的重要指標(biāo)，只有信度高的試卷，才能對(duì)學(xué)員做出公平合理的評(píng)價(jià)，才能為改進(jìn)教學(xué)提供可靠依據(jù)。影響考試信度的因素很多，其中可以控制的重要因素有試卷的難度、題型、題量、考試的內(nèi)容。

1.4 測(cè)量效度

測(cè)量效度是指測(cè)量結(jié)果的準(zhǔn)度和有效度，也稱為正確性。效度是一個(gè)相對(duì)的概念，它沒有絕對(duì)性，只有高低之分。內(nèi)容效度、實(shí)證效度與結(jié)構(gòu)效度是常見的三大類考試效度。

以試題的難度、區(qū)分度、測(cè)量信度、測(cè)量效度為主要計(jì)量指標(biāo)，經(jīng)典測(cè)量理論為網(wǎng)絡(luò)教學(xué)考試系統(tǒng)的題庫建設(shè)、試卷的編制以及考試分析評(píng)價(jià)奠定了堅(jiān)實(shí)的理論基礎(chǔ)，在實(shí)際的教學(xué)與研究中大量應(yīng)用了此理論。

2.2 項(xiàng)目反應(yīng)理論的三種假設(shè)

項(xiàng)目反應(yīng)理論的三種基本假設(shè)包括：潛在特質(zhì)空間的單維性假設(shè)、局部獨(dú)立性假設(shè)和項(xiàng)目特征曲線假設(shè)。

單維性假設(shè)指被試者對(duì)測(cè)驗(yàn)項(xiàng)目的反應(yīng)過程中受能力支配的惟一性，不可能重復(fù)性。雖然影響被試者對(duì)測(cè)驗(yàn)項(xiàng)目反應(yīng)的因素是多方面的，如知識(shí)、個(gè)性、動(dòng)機(jī)等，但只要所有影響因素中僅有一個(gè)起主導(dǎo)作用，且此因素與測(cè)量的潛在特質(zhì)相匹配，則此測(cè)驗(yàn)屬于單維性測(cè)驗(yàn)的范疇。

局部獨(dú)立性假設(shè)包括兩個(gè)方面：一方面，被試者對(duì)不同測(cè)驗(yàn)項(xiàng)目的反應(yīng)在統(tǒng)計(jì)上是獨(dú)立的。另一方面，被試者不會(huì)交叉影響彼此的成績，作答過程彼此獨(dú)立，結(jié)果僅受限于被測(cè)人的潛在特質(zhì)水平。

特征曲線假設(shè)是指正確反映被試項(xiàng)目的概率與其能力之間的函數(shù)關(guān)系，采用項(xiàng)目特性曲線來表述的模型。

3 兩種測(cè)量理論的有效性

經(jīng)典測(cè)量理論和項(xiàng)目反應(yīng)理論這兩種測(cè)量理論都是20世紀(jì)創(chuàng)立，經(jīng)過不斷發(fā)展完善并沿用至今的。作為網(wǎng)絡(luò)教學(xué)考試系統(tǒng)的基礎(chǔ)模型，它們都有各自的優(yōu)越性，也同時(shí)有難以克服的局限性，兩者并沒有一定的高下之分。下面僅對(duì)兩種測(cè)量理論進(jìn)行一個(gè)客觀的對(duì)比分析。

經(jīng)典測(cè)量理論的局限性：第一、統(tǒng)計(jì)量（項(xiàng)目難度，區(qū)分度，信度和效度）對(duì)樣本的依賴性。第二，信度估計(jì)難以精確。信度是根據(jù)平行測(cè)驗(yàn)進(jìn)行概念定義的，而即使對(duì)相同的對(duì)象進(jìn)行相同的測(cè)試，也難以實(shí)現(xiàn)完全平行化，因此信度估計(jì)往往不夠精確。第三，被試水平和項(xiàng)目難度定義在彼此無關(guān)的兩個(gè)量表上，能力量表來自于卷面的總分，而項(xiàng)目難度則來自于被測(cè)試者的得分率，項(xiàng)目難度與能力不能呈正比匹配，p值為0.6的難度不能代表60分的能力。

比較而言，項(xiàng)目反應(yīng)理論較經(jīng)典測(cè)量理論具有一定的優(yōu)勢(shì)：首先，項(xiàng)目反應(yīng)理論的所測(cè)項(xiàng)目與被試能力估計(jì)值之間不具相關(guān)性。其次，項(xiàng)目反應(yīng)理論的難度與考生能力在同一量表上被定義。第三，它定義了試題信息函數(shù)這一更為科學(xué)的綜合質(zhì)量標(biāo)準(zhǔn)。應(yīng)用測(cè)驗(yàn)信息函數(shù)，可以對(duì)不同考生在某測(cè)驗(yàn)上的測(cè)量精度值進(jìn)行具體化確定。第四，項(xiàng)目反應(yīng)理論的發(fā)展為自適應(yīng)測(cè)驗(yàn)提供了重要的基礎(chǔ)條件。

然而，項(xiàng)目反應(yīng)理論也無法避免其局限性：因其假設(shè)條件嚴(yán)格，一般學(xué)科題庫難以完全滿足。另外，該理論對(duì)于連續(xù)和等級(jí)資料的過程處理比較困難，其最成熟的單維三參數(shù)模型，雖然對(duì)“1，0”計(jì)分的考試資料非常適用，但對(duì)于非“1，0”計(jì)分的考試資料卻一直沒有比較好的解決模型。再者，“維度”與“特質(zhì)”實(shí)際并非直接的心理學(xué)概念，而是兩個(gè)統(tǒng)計(jì)學(xué)概念，因此無法對(duì)特定測(cè)量的內(nèi)容、結(jié)構(gòu)效度提供保證，基于項(xiàng)目反應(yīng)理論的測(cè)驗(yàn)樣本，仍需沿用經(jīng)典測(cè)量理論的檢驗(yàn)方法進(jìn)行效度檢驗(yàn)。

綜上所述，經(jīng)典測(cè)量理論在目前應(yīng)用環(huán)境中更為有效，難以被后續(xù)發(fā)展起來的項(xiàng)目反應(yīng)理論完全取代。經(jīng)典測(cè)量理論在概念的直觀性、計(jì)算方法的簡易性、結(jié)果指標(biāo)值的精確程度等方面更有優(yōu)勢(shì)，能夠滿足實(shí)際需求。它的適用性更廣，不僅能夠處理“1，0”計(jì)分，還可以解決連續(xù)與等級(jí)計(jì)分的測(cè)量問題，可以對(duì)既包含選擇性、又包含非選擇性題型的復(fù)雜試卷進(jìn)行全面的題目分析與客觀的卷面質(zhì)量分析。因此，在實(shí)際的網(wǎng)絡(luò)教學(xué)考試系統(tǒng)建立使用過程中，經(jīng)典測(cè)量理論更適用于作為其基礎(chǔ)模型。

參考文獻(xiàn)

[1]萬明高.現(xiàn)代教育技術(shù)理論與方法[M].北京：北京大學(xué)出版社，2007.

[2]漆書青，戴海崎，丁樹良.現(xiàn)代教育與心理測(cè)量學(xué)原理[M].高等教育出版社，2002.

[3]余勝泉，何克抗.網(wǎng)絡(luò)題庫系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].中國遠(yuǎn)程教育，2000.

[4]郁建政.網(wǎng)絡(luò)題庫系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù)，2008.

科技創(chuàng)新與應(yīng)用2013年12期

科技創(chuàng)新與應(yīng)用的其它文章: 關(guān)于食品安全報(bào)道方面的現(xiàn)狀和策略; 試論新形勢(shì)下醫(yī)院檔案管理現(xiàn)狀與優(yōu)化策略; 加強(qiáng)科技信息宣傳工作; 淺論足球運(yùn)動(dòng)員體能訓(xùn)練方法; 長沙市駕培行業(yè)發(fā)展對(duì)策研究; 利用社區(qū)化學(xué)習(xí)打造班組學(xué)習(xí)社區(qū)