劉侍剛 辛曉萌 彭亞麗 宋小云
摘 要: 為了有效地對學生成績數據進行恢復,提出一種迭代奇異值分解的學生成績恢復方法。該方法采用矩陣表示學生成績,利用該矩陣具有低秩的特性,在給定缺失元素的初始值后,利用奇異值分解得到缺失元素的近似值,而該近似值比初始值更加接近真實值。再將求到的近似值代替初始值,經過多次迭代,最終可求到成績表中缺失元素的真實值。該方法的優點是在缺失元素恢復過程中,利用了所有已知元素信息,并將所有已知元素平等地對待。模擬實驗和真實實驗結果表明該方法能夠快速、精確地恢復出學生的真實成績。
關鍵詞: 學生成績; 缺失元素; 低秩矩陣; 奇異值分解
中圖分類號: TN911?34 文獻標識碼: A 文章編號: 1004?373X(2014)10?0001?04
Abstract: To recover the missing student scores, an iterative singular value decomposition (SVD) method is presented in this paper. The student scores are depicted by a matrix with low rank. Given initial values of missing data, the approximate values which are nearer the real values than the initial values can be obtained by SVD method. After several iterations, the real values can be recovered. The innovations of the method are that all the known elements are utilized in process ofmissing data recover and all the known elements are treated uniformly. Therefore, the method can precisely recover the missing data. The experimental results with both simulate and real data show that the presented method has the ability to recover the students scores rapidly and accurately.
Keywords: student score; missing data; low rank matrix; singular value decomposition
0 引 言
學生成績是學籍管理中的重要內容之一,它是學校評價學生的最主要的指標之一[1?3]。學生成績恢復是指學生成績由于漏輸或者學生沒有選修該課程等原因導致學生成績數據不完整,通過一定的技術將該成績恢復出來。目前,學校鼓勵開設任選課以提高學生的綜合素質,學生具有較大的選擇課程的自主權。由于學生選擇的課程不同,任課教師也就不可能一樣,那么教師在給學生評分時尺度也就不一樣。同時,所選修的課程也難度不一樣,所以導致學生最終的分數也存在差別。但學生的得分卻是學生評比中最主要的因素。為了克服這些原因導致學生得分不一致,許多學校在對學生成績評比中,不考慮任選課,而僅考慮全班所有同學都學了的課程。這樣導致學生不重視選修課的學生。同時,對于那些選修課學得好的同學,也是不公平的。為了克服這些缺點,本文利用學生成績表可以表示為一個矩陣,并利用該矩陣具有低秩的特點,將沒有選修該課程的成績恢復出來。
基于低秩矩陣缺失元素的恢復在計算機視覺、醫學圖像分析等領域中具有廣泛的用途[4?6]。Tomasi等人利用子矩陣法對矩陣缺失元素進行恢復[7],但是該方法恢復結果依賴于所選取的子矩陣。為了克服該缺點,Ma等人通過矩陣的行列變換,將所有的已知元素變換到矩陣的左上角,再利用這些已知的元素,一個一個地將缺失元素恢復[8]。但是該方法在恢復缺失元素時,利用了已恢復元素的信息,這樣必然會導致誤差的積累。有些學者采用進化的方法對缺失元素進行恢復[9],但該方法運算量大,而且易出現早熟現象。有些學者采用非線性規劃的方法進行求解[10],但是這些方法收斂速度比較慢,尤其是到了算法的后期。
為了克服上述缺點,本文采用迭代奇異值分解的方法對缺失元素進行恢復,該方法對矩陣進行SVD分解,得到一個低秩矩陣,將低秩矩陣中的元素代替未知元素,再循環進行SVD分解。
該方法的優點是在矩陣恢復過程中,利用了所有已知元素信息,而且將所有已知元素平等地對待,這樣必然恢復精度高。
1 迭代矩陣奇異值分解的缺失數據恢復方法
3 結 語
本文為了有效地對學生成績數據進行恢復,提出 了一種迭代奇異值分解的學生成績恢復方法。該方法將學生成績表示為一個矩陣,利用該矩陣具有低秩的特性,在給定缺失元素的初始值后,采用迭代奇異值分解的方法,最終求取成績表中缺失元素的真實值。模擬實驗和真實實驗結果表明該方法能夠快速、正確地恢復出學生的真實成績。
參考文獻
[1] ROBERTS M, GIERL M. Developing score reports for cognitive diagnostic assessments [J]. Educational Measurement: Issues and Practice, 2010, 29(3): 25?38.
[2] KOEDEL C, BETTS J. Does student sorting invalidate value?added models of teacher effectiveness [J]. Education Finance and Policy, 2011, 6(1): 18?42.
[3] CANDES E, TAO T. The power of convex relaxation: near?optimal matrix completion [J]. IEEE Transactions on Information Theory, 2009, 56(5): 2053?2080.
[4] 彭亞麗,劉芳,焦李成,等.基于秩4約束的遮擋點恢復方法[J]. 機器人,2008,30(2):138?141.
[5] 彭亞麗,劉芳,焦李成,等.正投影模型下基于1維子空間的遮擋點恢復方法[J].儀器儀表學報,2011,32(9):2029?2033.
[6] 彭亞麗,劉侍剛,劉芳.基于秩1約束的三維重建方法[J].信號處理,2010,26(1):28?31.
[7] TOMASI C, KANADE T. Shape and motion from image streams under orthography: a factorization method [J]. International Journal of Computer Vision [J]. 2010, 65(2): 137?154.
[8] MA Y, HUANG K, VIDAL R. Rank conditions on the multiple?view matrix [J]. International Journal of Computer Vision, 2011, 66(2): 115?137.
[9] 彭亞麗,劉芳.一種組織進化的遮擋點恢復算法[J].西安電子科技大學學報,2013,40(4):1466?1469.
[10] 劉侍剛,吳清亮,彭亞麗,等.一種準線性集束調整方法[J].光電工程,2011,38(5):103?107.
[11] 劉侍剛,彭亞麗,徐秋平,等.基于秩3約束的遮擋點恢復方法[J]. 儀器儀表學報,2008,29(12):2622?2625.
[12] 劉侍剛,彭亞麗,韓崇昭,等.3維子空間約束的遮擋點恢復方法[J].西安交通大學學報,2009,43(4):10?13.
[13] CAI J, CANDES E, SHEN Z. A singular value thresholding algorithm for matrix completion [J]. Society for Industrial and Applied Mathematics Journal on Optimization, 2010, 20(4): 1956?1982.
[14] 周俊秀,裘國永,劉侍剛,等.迭代張量高階奇異值分解的圖像恢復方法[J].計算機應用研究,2013,30(11):3488?3492.
[3] CANDES E, TAO T. The power of convex relaxation: near?optimal matrix completion [J]. IEEE Transactions on Information Theory, 2009, 56(5): 2053?2080.
[4] 彭亞麗,劉芳,焦李成,等.基于秩4約束的遮擋點恢復方法[J]. 機器人,2008,30(2):138?141.
[5] 彭亞麗,劉芳,焦李成,等.正投影模型下基于1維子空間的遮擋點恢復方法[J].儀器儀表學報,2011,32(9):2029?2033.
[6] 彭亞麗,劉侍剛,劉芳.基于秩1約束的三維重建方法[J].信號處理,2010,26(1):28?31.
[7] TOMASI C, KANADE T. Shape and motion from image streams under orthography: a factorization method [J]. International Journal of Computer Vision [J]. 2010, 65(2): 137?154.
[8] MA Y, HUANG K, VIDAL R. Rank conditions on the multiple?view matrix [J]. International Journal of Computer Vision, 2011, 66(2): 115?137.
[9] 彭亞麗,劉芳.一種組織進化的遮擋點恢復算法[J].西安電子科技大學學報,2013,40(4):1466?1469.
[10] 劉侍剛,吳清亮,彭亞麗,等.一種準線性集束調整方法[J].光電工程,2011,38(5):103?107.
[11] 劉侍剛,彭亞麗,徐秋平,等.基于秩3約束的遮擋點恢復方法[J]. 儀器儀表學報,2008,29(12):2622?2625.
[12] 劉侍剛,彭亞麗,韓崇昭,等.3維子空間約束的遮擋點恢復方法[J].西安交通大學學報,2009,43(4):10?13.
[13] CAI J, CANDES E, SHEN Z. A singular value thresholding algorithm for matrix completion [J]. Society for Industrial and Applied Mathematics Journal on Optimization, 2010, 20(4): 1956?1982.
[14] 周俊秀,裘國永,劉侍剛,等.迭代張量高階奇異值分解的圖像恢復方法[J].計算機應用研究,2013,30(11):3488?3492.
[3] CANDES E, TAO T. The power of convex relaxation: near?optimal matrix completion [J]. IEEE Transactions on Information Theory, 2009, 56(5): 2053?2080.
[4] 彭亞麗,劉芳,焦李成,等.基于秩4約束的遮擋點恢復方法[J]. 機器人,2008,30(2):138?141.
[5] 彭亞麗,劉芳,焦李成,等.正投影模型下基于1維子空間的遮擋點恢復方法[J].儀器儀表學報,2011,32(9):2029?2033.
[6] 彭亞麗,劉侍剛,劉芳.基于秩1約束的三維重建方法[J].信號處理,2010,26(1):28?31.
[7] TOMASI C, KANADE T. Shape and motion from image streams under orthography: a factorization method [J]. International Journal of Computer Vision [J]. 2010, 65(2): 137?154.
[8] MA Y, HUANG K, VIDAL R. Rank conditions on the multiple?view matrix [J]. International Journal of Computer Vision, 2011, 66(2): 115?137.
[9] 彭亞麗,劉芳.一種組織進化的遮擋點恢復算法[J].西安電子科技大學學報,2013,40(4):1466?1469.
[10] 劉侍剛,吳清亮,彭亞麗,等.一種準線性集束調整方法[J].光電工程,2011,38(5):103?107.
[11] 劉侍剛,彭亞麗,徐秋平,等.基于秩3約束的遮擋點恢復方法[J]. 儀器儀表學報,2008,29(12):2622?2625.
[12] 劉侍剛,彭亞麗,韓崇昭,等.3維子空間約束的遮擋點恢復方法[J].西安交通大學學報,2009,43(4):10?13.
[13] CAI J, CANDES E, SHEN Z. A singular value thresholding algorithm for matrix completion [J]. Society for Industrial and Applied Mathematics Journal on Optimization, 2010, 20(4): 1956?1982.
[14] 周俊秀,裘國永,劉侍剛,等.迭代張量高階奇異值分解的圖像恢復方法[J].計算機應用研究,2013,30(11):3488?3492.