摘 要:本文簡要概括了自動組卷算法的現(xiàn)狀,全面分析題庫試題應包含的主要屬性,給出了基于隨機搜索逐步優(yōu)化的自動組卷算法的基本思想,設計出了配合此算法執(zhí)行的試題庫。實踐證明,這種結構下的試題庫能很好地配合基于隨機搜索逐步優(yōu)化的自動組卷算法的執(zhí)行,組卷成功率較高,系統(tǒng)性能穩(wěn)定,冗余度小。
關鍵詞:自動組卷 試題庫結構
引言
試題庫這一概念,近年來在教育機構、學校都引起了極大的興趣。事實上,國內(nèi)外許多教育機構和大學在花大力氣研究試題庫,因為,試題庫對考試機構變得越來越重要,其明顯潛在的優(yōu)點是試題庫使教育測量的質(zhì)量不斷提高而測驗編制者所花費的時間不斷減少。所謂試題庫,是由許多適用于不同目的、技能和任務需求,且具有必要參數(shù)的大量優(yōu)質(zhì)題目組成的試題集合[1]。試題庫中的題目是供測驗編制者能根據(jù)需要按預定的要求組卷,當試題庫中的題目在內(nèi)容恰當和技巧完備時則測驗編制者的工作就會變得簡單且卓有成效,組卷的質(zhì)量就變得更高,就能使測驗更加高效地達到既定的測量目標,從而在試卷質(zhì)量方面保證教育測量的信度和效度。
在當今數(shù)字化教育時代下自動組卷系統(tǒng)是智能教學系統(tǒng)(CAI)的重要組成部分,自動組卷卷算法的成功與否以及能否達到既定的測量目標很大程度上取決于相對于算法的試題庫的庫結構,試題庫的結構設計成為建立智能組卷系統(tǒng)的重要內(nèi)容?,F(xiàn)存的自動組卷系統(tǒng)針對各自的組卷算法提出的試題庫結構大致可分為四類:(1)主要依托于隨機函數(shù)或隨機量的算法所確定的試題庫結構;(2)針對深度及廣度搜索算法所確定的試題庫結構;(3)依托于智能搜索算法所確定的試題庫結構;(4)基于遺傳算法所確定的試題庫結構。這些數(shù)據(jù)庫結構中,都沒有全面地考慮到為達到既定測量目標所需的試題的全部屬性。前三類只適合于對組卷質(zhì)量要求不高的場合,后一類雖然組卷質(zhì)量較高,但是,當考慮的題目參數(shù)增加時,其算法會變得非常復雜,會帶來性能上的問題。
基于此,本文提出一種與基于隨機搜索逐步優(yōu)化的組卷算法相適應的,使組卷效率更高、速度更快、試題庫冗余更小的試題庫結構。
1 算法基本思想
該算法的基本思想是設計一隨機函數(shù)random( ),對題庫隨機抽取試題,然后匹配用戶錄入的組卷要求,若匹配,則記錄試題編號,否則,放棄該試題,反復此過程直到符合組卷要求的題量為試卷要求的題量,即組卷完畢。
①接收用戶輸入的組卷要求(如題型、題量、滿分值分值、答題時間、曝光度、難度分布、知識點分布、能力層次分布和重要程度分布等)。
②根據(jù)美國著名的網(wǎng)絡公司cisco公司的在線測試系統(tǒng)的試卷滿分及學生成績計算方法,本文用百分制計算學生的考試成績,但試卷滿分不一定為100分,有可能出現(xiàn)試卷滿分大于100分或小于100分的情況。換算公式為:
其中s 為用百分制計算的成績,s 為原始成績,t為試卷滿分。由于分數(shù)屬于順序量表,經(jīng)過這種變換后不會影響既定的測量目標[2]。故可以認為試卷滿分為100分,而且學生成績也是百分制的,這解決了題庫分值屬性與用戶要求題量掛鉤的難題。
③設計隨機函數(shù)random(sum)(sum為題庫中的記錄總數(shù))抽取n個試題使其滿足用戶要求的題型、題量、知識點分布及重要程度。
用test[n]來記錄n個試題的編號,設試卷包含qu_cl個試題類型,每個試題類型的題量為qi(i=1,2,…,c),則有:
用二維數(shù)組qu_cl_sum[c][1]來記錄各類題型的當前題量,當qu_cl_sum[i][1]=qi(i=1,2,…,c)時,題型及題量滿足用戶要求;
用集合kn_point{}來記錄當前已抽到的題目所屬的知識點集合,利用一個集合中的元素不能重復的性質(zhì)來保證知識點的覆蓋面;
用二維數(shù)組qu_im[le_sum][1]來記錄le_sum個不同重要程度的試題的當前累積分值,設lj(j=1,2,…,le_sum)為試卷要求的不同重要程度的試題的在試題中所占的分值,當qu_im[j][1]=lj(j=1,2,…,le_sum)時,不同重要程度的試題的在試題中所占的分值滿足用戶要求。
通過這一步的處理試題在題型、題量、知識點分布及不同重要程度的試題的在試題中所占的分值滿足了用戶要求。接下來局部調(diào)整試卷在難度和能力層次上的分布以及每題在出題次數(shù)上的合理化,以實現(xiàn)試卷的逐步優(yōu)化。
④評估當前試卷中不同難度的試題所占比重qu_de[de](de表示不同難度級別的數(shù)量)是否符合用戶要求的比重dk(k=1,2,…,de)(一般不符合),則有:
sub[k]=qu_de[de]-dk
其中sub[k](k=1,2,…,de)為當前各個不同難度等級的試題在試卷中實際所占比重與組卷要求的比重的偏差大小。若sub[k]=0,則轉到⑤;否則,若sub[k]>0,則實際所占比重偏大,若sub[k]<0,則偏小。需要進行的優(yōu)化操作是用sub[k]<0且與sub[k]>0的題目具有相同題型、題量、知識點和重要程度的題目來替換sub[k]>0的題目(根據(jù)sub[k]大小,決定需更換題目的類型及數(shù)目)重復這一步,直到滿足要求。
通過這一步的處理試題在題型、題量、知識點分布、不同重要程度的試題的在試卷中所占的分值及難度方面滿足了用戶要求。試卷得到了進一步的優(yōu)化。
⑤用類時的方法調(diào)整試卷中不同能力層次的試題所占的比重qu_ca[ca](ca表示不同能力層次的等級數(shù)量)以滿足用戶的要求。
經(jīng)過以上處理得到的試卷就是一份質(zhì)量較高的試卷,能較好地保證達到既定的教育測量目標。
2 試題庫結構設計[3]
試題庫中的試題有兩類屬性:性能屬性和內(nèi)容屬性。試題屬性提供了試題的內(nèi)容及答案等信息,這些信息不作為組卷算法的參數(shù)。性能屬性則要參加組卷過程,這里主要對影響組卷算法的性能屬性進行討論研究。通過上述對組卷算法的分析,要得到一份高質(zhì)量的試卷需要包含下屬這些性能屬性:題型、分值、難度、知識點、能力層次、重要程度和出題次數(shù)。
①題型。試題類型有多種劃分形式,將其劃分為填空題、判斷題、單選題、多選題、簡答題、論述題、作圖題和綜合題等,參與運算時可用編碼值代替。試卷所包含的試題類型及相應得試題量一般由用戶輸入。
②分值。同一道試題在不同的試卷中可能會有不同的分值,但是,當試題入庫的時候必須給定分值,因為在自動組卷的過程中,不同能力層次或難度的試題在試卷中所占的比重是根據(jù)分值這個參數(shù)計算的。這使得同一道試題在何的試卷中都具有相同的分值,這是不合適的,但目前還沒有更好的解決方法。
③難度。難度是衡量試題難易程度的指標,不同的教育測量類型,對試卷的難度要求及不同難度的試題分布比重不同。難度系數(shù)通常用通過率來表示,即答對或通過試題人數(shù)的比例來表示[1]。
當題目以二分法計分時,計算公式為:
④知識點??梢杂檬M制的字符類型字段表示章節(jié),如用4位十進制字符表示時可以用前兩位表示章,后兩位表示節(jié),類似的可以用知識點屬性表示到更精確的知識點(如某一章節(jié)的某個知識點)。在自動組卷時,可以根據(jù)這一參數(shù)所表示知識點的精度,利用知識點不重復確保試卷中所考查知識點的不重復。
⑤能力層次。美國心理學家布盧姆教育目標的認知領域劃分為六個主要類型,即知識、理解、應用、分析、綜合和評價。這些類別由簡到繁順序排列,而且前一種類別是后一種類別的基礎,后一種類別有涵蓋了前一種類別。按照命題雙向細目表的要求,根據(jù)不同的教育測量目標,不同目標層次的試題在試卷中所占的比重不同。
⑥重要程度。重要程度是某知識點對教學的要求程度,這種相對重要性可以由該內(nèi)容項目的教學課時的多少來體現(xiàn)。這樣應將知識內(nèi)容按重要程度劃分等級,使試卷中每一內(nèi)容的比例與其相對重要程度相符合。
⑦出題次數(shù)。用于指示試題庫中某試題在實際試卷中出現(xiàn)過的次數(shù)。通過該參數(shù)可以控制題目在試卷中出現(xiàn)的概率。
結束語
本文在分析了現(xiàn)存的組卷系統(tǒng)的組卷算法及相應的試題庫結構的基礎上,給出了基于隨機搜索逐步優(yōu)化的智能組卷算法的基本思想和數(shù)據(jù)庫結構的設計方法,經(jīng)過實驗比較,試題庫設計比較合理,可以較好地配合這種組卷算法,所得到的試卷基本符合用戶的輸入要求,試卷質(zhì)量較高。不足之處是速度較慢,另外需要進一步對測驗的信度和效度進行分析評估,考慮到這項工作難于實施,這里不作討論,將在課題研究的下一階段進行。
參考文獻:
[1]張敏強.教育測量學.北京:人民教育出版社,2001.
[2]許建鉞.教育測量與評價.北京:教育科學出版社,1999.
[3]于莉.題庫系統(tǒng)的智能組卷算法研究.計算機應用研究,2004.
[4]金漢均,鄭世鈺,吳民武.分段隨機抽取算法在智能組卷中的研究與應用.計算機應用與研究,2003.
基金項目:全國教育科學“十一五”規(guī)劃教育考試學研究重點課題項目(2006JKS3017);山西省教育科學“十一五”規(guī)劃課題(GH-06106)。
注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文?!?/p>