溫長吉,王生生,趙 昕,李 健,周翠娟
(1.吉林農業大學信息技術學院,長春 130118;2.吉林大學符號計算與知識工程教育部重點實驗室,長春 130012)
基于改進蜂群算法的項目反應理論混合模型參數估計
溫長吉1,2,王生生2,趙 昕1,李 健1,周翠娟1
(1.吉林農業大學信息技術學院,長春 130118;2.吉林大學符號計算與知識工程教育部重點實驗室,長春 130012)
基于混合項目反應理論模型,實現了對客觀題組和主觀測試組成項目結構的模型構建,并給出一種改進人工蜂群算法實現該混合模型的參數估計.在模擬數據上通過與Winbug的對比結果驗證了利用改進人工蜂群算法估計混合模型參數的有效性.
項目反應理論;混合模型;參數估計;人工蜂群算法
項目反應理論也稱為潛在特質理論或潛在特質模型,是一種現代心理測量理論,可指導項目篩選和測驗編制.當前國內計算機考試測評體系及其認知診斷平臺普遍存在對考生能力測查不足,且在知識考查過程中所測查知識以考生死記硬背為主,缺乏知識間的聯系與組合.針對上述問題,項目反應理論從認知診斷心理學出發,能客觀準確地反映學生能力,對學生的知識缺陷作出合理診斷.現代教育測試命題形式多樣,一般以主客觀兩部分命題方式常見,因此建立混合模型對測試屬性和被試能力進行科學準確的評價尤為必要.但目前混合模型的構建及其參數估計研究基礎較薄弱,文獻報道較少.文獻[1]首次提出了混合模型的思想,并指出模型構建的可行性;文獻[2]在項目參數已知的條件下,通過固定混合模型的權重參數提出一種被試能力估計策略;文獻[3]利用加權最大后驗估計在混合模型權重自適應變化的基礎上實現了被試能力的估計;文獻[4]提出了混合3PLM和GRM的項目反應理論模型,并利用EM/MMLE方法實現了混合模型的參數估計.上述研究結果推動了項目反應理論中混合模型的研究,但也存在一定的局限性:一方面混合模型中的參數設定相對固定,不適應多樣化的測試命題形式;另一方面采用傳統項目理論參數估計方法,由于涉及非線性方程組迭代求解問題,迭代收斂速度慢、參數估計偏差較大、理論性較強等因素,因此在一定程度上限制了項目反應理論在相關領域的推廣和應用[5-6].參數估計問題由于可轉化為非線性方程組迭代求解問題,因此利用群智能算法進行參數估計成為可能[7-9].人工蜂群算法[10]因其參數設置少、收斂速度快、收斂精度高,且每次迭代過程中同時進行全局和局部雙向搜索,因此成為群智能算法研究的熱點[11-12].
本文構建了由三參數題組反應理論模型和分步評分模型組成的混合模型用于主客觀測試項目的描述,并通過在全局搜索中引入啟發式規則,在局部搜索中自適應調整搜索半徑,提出一種改進人工蜂群算法用于混合模型的參數估計.與項目反應理論分析軟件Minbug對比,模擬數據實驗結果驗證了本文提出的改進人工蜂群算法用于混合參數估計的有效性.
三參數Logistic題組理論模型(three-parameter logistic testlet response model,3PLTRM)[13]用于解決題組內部題目關聯性的問題.三參數Logistic題組理論模型表達式為

其中:ai表示試題i的試題區分度系數;bi表示難度系數;ci表示猜測系數;θj表示被試能力系數;γjd(i)表示題組隨機效應參數,用以表征被試j與題目i所在題組d(i)間的相互作用參數.
分步評分模型(partial credit model,PCM)[14-15]可對主觀性試題逐步作答進行描述.分步評分模型表達式為

其中:f j表示試題i的滿分值;t表示被試在此題上的分值;bjx表示被試在已經作答x-1步后預完成第x步的難易度;θj表示被試能力系數.
人工蜂群算法的思想是根據生態環境一致性原則[16-17],最優或較優蜜源附近可能分布大量優質蜜源.首先將當前獲取的最佳蜜源與若干輪前獲取的最佳蜜源位置信息建立指引路徑,從而為引領蜂搜索提供啟發式規則,降低搜索隨機性,加快算法的收斂速度;其次,自適應調整搜索半徑,局部蜜源搜索時,半徑增大從而適度擴大跟隨蜂和偵查蜂的搜索范圍,然后適度減小搜索半徑實現局部區域聚焦加速最優蜜源搜索.算法改進策略如下.
1)啟發式規則為將當前獲取的最佳蜜源與若干輪前獲取的最佳蜜源位置信息建立指引路徑,作為引領蜂全局搜索的啟發式規則:

其中:θi(k)表示第k代引領蜂位置信息;genfix和Maxcycle用以給定向前溯源輪數域值,本文中L=5.
2)半徑自適應調整策略為


其中:rand[-1,+1]取值為+1或-1;rand(-1,+1)隨機取[-1,+1]間的值;f k,f j,flim依次表示鄰域搜索范圍內第k,j和鄰域迭代最大代數對應最優目標函數值.隨機步長φij可保證鄰域搜索初期步長較大搜索范圍相應較大,算法迭代后期伴隨目標函數值趨近鄰域內最優值,搜索步長逐漸縮小聚焦局部最優區域,加快算法局部搜索尋優的速度.
利用改進人工蜂群算法實現混合模型參數估計,基于文獻[5]利用混合模型的似然函數構建收益度函數,混合模型似然函數表達式為

則改進人工蜂群算法的收益度評價函數為

設定蜂群個體數為N=40,局部區域搜索迭代代數限定lim=10,全局最大搜索迭代次數為Maxcycle=2 000.混合模型參數設定依據分步形式選取合適區間,以加速算法收斂.改進人工蜂群算法參數設定列于表1.

表1 混合模型參數取值設定Table 1 Setting of mixture model parameters
對于項目參數和能力參數均未知的參數估計問題,依據Birnbaum參數估計思想把問題分解為兩階段進行:
1)假設被試能力參數已知,對項目參數進行估計,初始能力參數估計采用被試回答正確得分數和總分比值作為被試初始能力值;
2)將初始估測出的被試能力值作為真值,對項目參數進行估計.
上述兩階段循環進行,直至參數值趨于穩定.
模擬數據產生原則依據文獻[3],實驗過程中分別對500和200個被試者各自進行總測試項目數為40和30的模擬實驗.測試項目模擬設計如下.
1)測試項目數為40的混合模擬數據,4組帶有題組結構的二級反應數據:組1有10個題目,組2有10個題目,組3有5個題目,組4有5個題目;10個多級記分題目.
2)測試項目數為30的混合模擬數據,3組帶有題組結構的二級反應數據:3組題組類數據,每組各有5個題目;10個多級記分題目.
本文提出的改進蜂群算法,算法中參數及目標函數設定依據上節中的設定原則.為了有效驗證算法的有效性,將本文方法與使用MCMC方法的Winbug軟件包計算結果進行對比,Winbug軟件是一個采用Bayes方法利用MCMC解決復雜統計模型的軟件,其使用算法具有普適性,因此本文使用該軟件對模型中參數的估測作為對比驗證標準.實驗重復10次取計算平均值作為最終的實驗結果,對比實驗結果列于表2.實驗過程中參數的反真性指標采用均方根誤差(root mean square error,RMSE)進行度量,用以表示參數估計值與真值間的偏差程度,RMSE計算表達式為

其中n和m分別表示題組數目和被試者數目.

表2 差異化項目結構和被試者數目下兩種方法的對比實驗結果Table 2 Comparative experiment results of the two methods for variable items and tests
由表2可見,本文基于改進人工蜂群算法實現混合模型參數估計方法的估測值與Winbug軟件估計結果基本一致,其中(30,200)題組數和被試者數模擬設定實驗中,項目參數估計值整體優于Winbug軟件估計值;在(30,500)設定中,部分參數估計值也明顯優于軟件估計值,因此可猜測在小樣本量測試實驗中本文方法的有效性;此外,在上述模擬實驗中本文方法在題組難度系數估測中整體估測結果也優于軟件估計結果.
綜上所述,以均方根誤差作為反真性指標,將本文方法與Winbug軟件包在模擬數據上進行比較,實驗結果表明,利用改進人工蜂群算法估計混合模型參數具有較高的精度,同時多次重復實驗結果不依賴于參數的初始值選取,算法具有較高的穩定性.因此,本文提出的利用改進人工蜂群算法估計項目理論模型參數高效可行.
[1] Ercikan K,Schwarz R D,Julian M W,et al.Calibration and Scoring of Tests with Multiple Choice and Constructed Response Item Types[J].Journal of Educational Measurement,1998,35(2):137-154.
[2] TAO Jian,SHI Ningzhong,CHANG Huahua.Item-Weighted Likelihood Method for Ability Estimation in Tests Composed of Both Dichotomous and Polytomous Items[J].Journal of Educational and Behavioral Statistics,2012,37:298-315.
[3] SUN Shanshan,TAO Jian,CHANG Huahua,et al.Weighted Maximum-a-Posteriori Estimation in Tests Composed of Both Dichotomous and Polytomous Items[J].Applied Psychological Measurement,2012,36(4):271-290.
[4] 涂冬波,蔡艷,戴海琦,等.項目反應理論新進展:基于3PLM和GRM的混合模型[J].心理科學,2011,34(5):1189-1194.(TU Dongbo,CAI Yan,DAI Haiqi,et al.New Progress on IRT:The Mixture Model Based on 3PLM and GRM[J].Journal of Psychological Science,2011,34(5):1189-1194.)
[5] 施三支,王德輝,宋立新,等.隨時間變化系數參數AR模型的Bayes估計[J].吉林大學學報:理學版,2011,49(5):857-860.(SHI Sanzhi,WANG Dehui,SONG Lixin,et al.Bayesian Estimation of Time Vary Parameter Autoregression Model[J].Journal of Jilin University:Science Edition,2011,49(5):857-860.)
[6] 朱復康,李琦.INGARCH(1,1)模型參數的矩估計和Bayes估計[J].吉林大學學報:理學版,2009,47(5):899-902.(ZHU Fukang,LI Qi.Moment and Bayesian Estimation of Parameters in the INGARCH(1,1)Model[J].Journal of Jilin University:Science Edition,2009,47(5):899-902.)
[7] 熊紅云,曹新社.運用粒子群優化算法估計IRT參數[J].福建電腦,2006(10):175-176.(XIONG Hongyun,CAO Xinshe.Using Particle Swarm Optimization to Estimate IRT Parameter[J].Fujian Computer,2006(10):175-176.)
[8] 杜鵬東.GA在IRT中2PLM參數估計中的應用研究[D].呼和浩特:內蒙古師范大學,2007.(DU Pengdong.The Applied Study on Genetic Algorithm in Parameter Estimation of Two Parameters Logistic Model on Item Response Theory[D].Hohhot:Inner Mongolia Normal University,2007.)
[9] 袁洲.基于改進粒子群算法的項目反應理論3PLM參數估計方法研究 [D].長春:吉林大學,2011.(YUAN Zhou.The Research of Item Response Theory 3PLM Parameter Estimation Based on Improved Particle Swarm Optimization[D].Changchun:Jilin Unversity,2011.)
[10] Karaboga D,Basturk B.On the Performance of Artificial Bee Colony(ABC)Algorithm[J].Applied Soft Computing,2008,8(1):687-697.
[11] 溫長吉,王生生,于合龍,等.基于改進蜂群算法優化神經網絡的玉米病害圖像分割[J].農業工程學報,2013,29(13):142-149.(WEN Changji,WANG Shengsheng,YU Helong,et al.Image Segmentation Method for Maize Diseases Based on Pulse Coupled Neural Network with Modified Artificial Bee Algorithm[J].Transactions of the Chinese Society of Agricultural Engineering,2013,29(13):142-149.)
[12] 畢曉君,王艷嬌.約束多目標人工蜂群算法[J].吉林大學學報:工學版,2013,43(2):397-403.(BI Xiaojun,WANG Yanjiao.Constrained Multi-objective Evolutionary Algorithm Based on Artificial Bee Colony Algorithm[J].Journal of Jilin University:Engineering and Technology Edition,2013,43(2):397-403.)
[13] Bradlow E T,Wainer H,Wang X.A Bayesian Random Effects Model for Testlets[J].Psychometrika,1999,64(2):153-168.
[14] 杜文久,肖涵敏.多維項目反應理論等級反應模型[J].心理學報,2012,44(10):1402-1407.(DU Wenjiu,XIAO Hanmin.Multidimensional Grade Response Model[J].Acta Psychologica Sinica,2012,44(10):1402-1407.)
[15] 吳銳,丁樹良,甘登文.含題組的測驗等值[J].心理學報,2010,42(3):434-442.(WU Rui,DING Shuliang,GAN Dengwen.Test Equating with Testlets[J].Acta Psychologica Sinica,2010,42(3):434-442.)
[16] Banharnsakun A,Achalakul T,Sirinaovakul B.The Best-So-Far Selection in Artificial Bee Colony Algorithm[J].Applied Soft Computing,2011,11(2):2888-2901.
[17] Karaboga D,Gorkemli B,Ozturk C,et al.A Comprehensive Survey:Artificial Bee Colony(ABC)Algorithm and Application[J].Artificial Intelligence Review,2014,42(1):21-57.
Modified ABC Based Parameter Estimation of the Mixture IRT Model
WEN Changji1,2,WANG Shengsheng2,ZHAO Xin1,LI Jian1,ZHOU Cuijuan1
(1.CollegeofInformationandTechnology,JilinAgriculturalUniversity,Changchun130118,China;2.KeyLaboratoryofSymbolicComputingandKnowledgeEngineeringofMinistryofEducation,JilinUniversity,Changchun130012,China)
A mixture IRT model was proposed which is composed of the testlet response model and the partial credit model for representing the subject and object tests.Meanwhile a modified artificial bee colony algorithm was proposed to estimate the parameters in the mixture model.The comparative experiment results based on the simulate data show that the novel method in this work is feasible and effective.
item response theory;mixture model;parameter estimation;artificial bee colony algorithm
TP301.6
A
1671-5489(2014)04-0758-05
10.13413/j.cnki.jdxblxb.2014.04.24
2013-12-09.
溫長吉(1979—),男,漢族,博士研究生,講師,從事數據挖掘和模式識別的研究,E-mail:chagou2006@163.com.通信作者:王生生(1974—),男,漢族,博士,教授,博士生導師,從事模式識別和時空推理的研究,E-mail:wss@jlu.edu.cn.
國家自然科學基金(批準號:61133011;61303132;61103091)、吉林省科技發展計劃項目(批準號:20120665;20100181;20140101201JC;201201131)和吉林農業大學科研啟動基金(批準號:2012037).
韓 嘯)