摘要:本文對傳統試題屬性指標進行了分析,提出了一種優化改進的指標體系,根據試卷的各項約束條件,確定了計算機自動組卷的目標函數和數學模型。
關鍵詞:組卷策略;試卷模式;目標函數;組卷數學模型
1 緒論
目前教育教學中,考試是評價學生學習情況的重要手段。要想真實準確地反映出學生的學習情況和個體差異,一份客觀和標準化的試卷是基礎條件。所以組建“客觀和標準化”的試卷是考試的核心環節,提高考試質量,試題質量是關鍵。試題質量又依賴于組卷工作的科學性。組卷工作的科學性主要體現在代表性和針對性。代表性是指試題取樣能足夠反映考試內容。針對性是指試題本身編制要合理,對不同的考試對象能有不同的體現。因此,建立計算機管理的標準化試題庫,研究高效組卷策略,對提高考試的科學性,提高考試質量具有極為重要的作用。
2 組卷的基本原則
計算機自動組卷是按照教師和教學的要求,由計算機自動從試題庫中選擇試題,組成一份多項條件分布要求的試卷。組卷的基本原則主要體現在:
(1)確定考試的知識點覆蓋面。考試知識點可以由用戶決定,既可以按章節,也可以按題型。試卷的各章節所占的分數比例一般應該與教學所用的時間成正比,但是用戶也可根據需要改變分數的比例。
(2)試題值的難度值的問題。試卷中試題的難度比例、考查深度要符合考試大綱的要求,試題的難度應適中,并且能根據不同的時間、不同的考試對象動態的改變。
(3)組成的試卷應該能夠區分出不同水平的學生的能力。即全卷的區分度不應該太低,不然不同考生的分數都趨近于一致,達不到考試的目的。每道試題的區分度事先由有經驗的教師確定,并根據考生的考試成績不斷調整。
(4)試卷的編排要合理。試卷的題類比例、題型比例應當根據考試的目的、類型不同而不同。
組卷工作是一項復雜的智力勞動,組卷者首先要研究考試大綱和命題計劃,明確考試的目的、對象、性質;試題的形式、數目;試題數量和分數在各部分中的分配比例,考查的重點和其它要求。其次,根據命題計劃編制試題,給出答案。并對組出的試卷進行審查、修改和篩選等。
3 試題的指標體系結構
試題都是存放在試題庫中,而試題本身含有固定的屬性,試題各項屬性指標的確定直接影響到組卷系統的準確性和工作效率。試題庫中的內容將直接用于試卷之中,所以試題庫結構的設計是組卷問題的重要內容。試題的屬性指標定量地描述了每一道試題的內在屬性、外部特征以及它在考試測試中的功能,是計算機進行抽題組卷的基礎。
傳統的組卷策略中,試題屬性指標主要有有六項:題號、題型、章節(知識點)、難度、區分度、時間、分數。組卷的指標體系是指試題的各種參數,是建立試題庫管理系統,實現計算機自動組卷的關鍵。試題本身含有一些固有的特性參數,這些固有的特性參數都需要用相應的指標來刻畫并用以指導組卷的選題。
抽題組卷時,常常需要進行試題分析。試題分析包括定性分析與定量分析。定性分析是指對試題的科學性的分析,如試題是否是預定的教學內容,試題測量的是否是預定的教學目標等。定量分析是指對試題的難度與區分度的分析。試題的難度、區分度都是試題的重要質量指標,但它們不是試題自身的性質,而是試題針對參加統計的這組學生反映出的特性,因此,它們的數值總是和某批學生有關,難度和區分度的確定也比較困難。所以實際建立題庫的時候,常常讓有經驗的老師給試題的難度和區分度確定一個初始值,然后根據每年考試的結果,依據一定的算法進行修正。
試題的難度值是指全體被試對該題的失分率,針對不同的考試目的、不同階段的考試,試題的命題難度應該相應地不同,用符號D表示。其計算公式為:
其中,D是題目的難度值, 為全體被試在該題上得分的平均數,W為該題的滿分值。
從公式可知, 越大,D越小,當=W,D=0; 越小,D值越大,當=0時,D=1。D的取值范圍O≤P≤1。
也就是說,被試得分越多,試題的難度值越小,試題越容易;被試得分越少,試題的難度值越大,試題越難。當所有被試都答對了時,試題的難度值為0,試題最容易;當所有被試都不會答時,試題的難度值為1,試題最難;當難度值為0.5時,試題為中等難度。
當測驗用于最大程度地區分考生時,難度恒定在0.50左右最為合適。例如全國高等學校入學考試其難度規定為3:5:2,即較容易的題目占30%,中等難度的題目占50%,較難的題目占20%,整個試卷的平均難度大約為0.50。
試題的區分度也叫題目的鑒別力,也是區分不同層次的學生水平能力的指標,它是由被試在該題上的得分與被試的實際能力水平之間的關系來確定的,可衡量題目對不同水平被試的心理特質的區分程度。嚴格來說,區分度應該通過測試后才得到,但對每題進行實測存在技術困難,而且實測的信度難以保證,因此,筆者認為,在實際使用時,若已經利用難度值作為學生水平能力的指標,通常也可以忽略區分度。
綜上所述,另外根據筆者的實踐測試,對試題屬性指標體系進行優化,組卷的參數范圍可參考如下表:
4 試卷模式
組卷就從試題庫中抽取試題,實現根據用戶組卷要求生成的組卷模式。組卷模式是一些分數分布,組卷的過程就是從試題庫中選擇合適的試題去實現這些分數的分布。每一個分布可以看作是一個需要實現的約束,這多個分布則可以看作是多個約束,所以組卷的過程就是一個實現多個約束的過程。組卷的約束條件基本上有以下幾個方面:
4.1章節(知識點)-分數約束
包括各章節在總試卷中所占的分值比例,如果更加細化地來分,還可以對試題在章節的基礎上進行知識點的確定,通過對章節的約束來實現,這樣,此處約束就能夠更好地實現試卷對學生的評判效果。
根據考試科目不同章節分數也不同,用C表示章節,對于一套試卷X=(X1,X2,…,Xm),m為試卷X總題數,Xj為第j道試題,m(j)為試題Xj的分數,c(j)為試題Xj所在章節。設ci為試卷的第i章節的分數,n為章節數,則章節-分數約束為:
4.2題型-分數約束
題型約束是指試卷中包含的試題類型,即以何種類型的試題組卷測試。用TP表示試題類型,設題型-分數約束為:
計算方法與上述章節(知識點)-分數約束類似。
4.3難度-分數約束
對于一套試卷X=(X1,X2,…,Xm),m為試卷X總題數,Xj為第j道試題,m(j)為試題Xj 的分數,d(j)為試題Xj的難度級別。用D表示難度,設di為試卷的第i個難度級別的分數,n為難度級別的個數,則難度-分數約束為:
本系統中難度級別劃分為三個等級,D={易,中,難},n=3。
4.4總時間
設考試總時間為T0,完成試卷X所需預計時間為T(X),預留檢查時間為a*T(X),則完成試卷X所需實際時間為:
其中,m為試卷X的總題數,tj(X)為試卷X的第j道題的預估計時間。
4.5 總分數
設試卷期望總分數為M0,實際組成試卷X的總分數為M0(X)。則
其中,m為試卷X的總題數,mj(X) 為試卷X的第j道題的分值。
5 組卷目標的確定
5.1偏差的計算
設難度、章節(知識點)、題型、總時間、總分數的期望值分別為D、C、TP、T、M,對試卷X的預估計值分別為D(X)、C(X)、TP(X)、T(X)、M(X),偏差分別表示為error(D,X)、error(C,X)、error(TP,X)、error(T,X)、error(M,X),則偏差越小X越接近期望值,所以:
5.2 目標函數
組卷的目標就是從一個試題庫I={x1,x2,…xn}中,尋找一個子集X={x1,x2,…xm },使得這個子集X滿足上面所描述的成卷模式中的各個約束分布。其中,n是試題庫的總題量,m為一套試卷中的總題量。使試卷中每一道試題,都包含有題號、題型-分數、難度-分數、章節(知識點)-分數的四維向量(a1,a2,a3,a4),則一份有m道試題的試卷,就決定了一個n×4的矩陣S,數學模型如下:
而目標函數就是要使實際得到的試卷中的各指標分布與理論要求分布的分值偏差最小。這里采用對各分布的所有偏差加權求和,取該和的最小的方法來定義組卷問題的目標函數。在一般考試試卷中,每種類型的題目數量和分值是固定值,所以就不存在總時間和總分數的偏差時,因此,總偏差——也就是目標函數值就被簡化成:
其中,wl,w2,w3分別為難度、章節(知識點)、題型指標的權重,且
考慮到測試的保密性,防止猜題,就要保證試題選中率,使得每道試題在連續的n份試卷中不能重復出現。因此,增加一個約束來控制選中率。設試卷X中任意試題x上一次在試卷B1(x)中出現,本次組卷中試卷的選中編號為B2(x)。則對選中率的要求可以表示為:
B2(x)-B1(x)>n
上面的約束條件和目標函數就是建立的實現成卷算法的數學模型。
6 結束語
傳統的試卷編制,一般是需要教師收集資料,制作題庫,然后再選擇適合的題目,這項工作需要花花費教師大量的時間和精力,效率低下,而且難以做到出題客觀。如果用計算機對試題庫進行分析篩選,自動選題,不但提高了工作效率,而且若采用了優秀高效的選題策略,加上一種快速的組卷算法(筆者開發的組卷系統中采用了改進的遺傳算法),可以使選題更加客觀,從而可以使考試更加標準化,才能更有效地評價學生的學習成績、促進學生的學習,同時也是教學完善教學方法、提高教學質量的重要手段。
參考文獻
[1]宋兆鴻,劉世表,張才美.現代教育測量[M].北京:教育科學出版社,1986.
[2]楊青.基于遺傳算法的試題庫自動組卷問題的研究[J].濟南大學學報(自然科學版),2004,18(3):228-231.
[3]王力發,楊麗敏.教育統計與測量[M].哈爾濱:哈爾濱工程大學出版社,1994.
[4]余勝泉.通用試題庫組卷策略算法[J].GCCC99論文集,108-116.
[5]吳美娟,黃煙波,劉中宇.基于改進遺傳算法的智能組卷系統研究[J].計算機應用與軟件,2007,24(12):191-193.
[6]王小平,曹立明.遺傳算法——理論、應用與軟件實現[M].西安:西安交通大學出版社,2002.