史雪靜,吳 飛,荊曉遠(yuǎn),3
(1.南京郵電大學(xué) 計(jì)算機(jī)學(xué)院,江蘇 南京 210003;2.南京郵電大學(xué) 自動(dòng)化學(xué)院,江蘇 南京 210003;3.武漢大學(xué) 計(jì)算機(jī)學(xué)院 軟件工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430072)
基于改進(jìn)MDS的軟件缺陷預(yù)測(cè)
史雪靜1,吳 飛2,荊曉遠(yuǎn)1,3
(1.南京郵電大學(xué) 計(jì)算機(jī)學(xué)院,江蘇 南京 210003;2.南京郵電大學(xué) 自動(dòng)化學(xué)院,江蘇 南京 210003;3.武漢大學(xué) 計(jì)算機(jī)學(xué)院 軟件工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430072)
隨著計(jì)算機(jī)技術(shù)的發(fā)展,計(jì)算機(jī)軟件產(chǎn)品給個(gè)人和企業(yè)都帶來(lái)了很多方便,但很多軟件也會(huì)存在各種缺陷。為了找到并解決軟件中存在的缺陷,研究者將機(jī)器學(xué)習(xí)等方法應(yīng)用到軟件缺陷預(yù)測(cè)之中,但這些方法在數(shù)據(jù)預(yù)處理方面還存在很多需要改善的地方。在之前的研究中,有研究者使用多維尺度分析(MDS)對(duì)數(shù)據(jù)樣本進(jìn)行降維,但關(guān)于如何使用和改善MDS的方法卻很少。文中提出了基于閾值相關(guān)性的多維尺度分析(TC_MDS)方法,在使用MDS方法的基礎(chǔ)上,使用對(duì)稱不確定性(SU)方法提取具有高鑒別的特征,并使用閾值相關(guān)性去除冗余特征。該方法學(xué)習(xí)得到的數(shù)據(jù)具有高鑒別性,去除了冗余特征,從而提高了預(yù)測(cè)效率。在軟件工程N(yùn)ASA數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)結(jié)果表明,提出的方法具有較好的缺陷預(yù)測(cè)效果。
多維尺度分析;對(duì)稱不確定性;閾值相關(guān)性;軟件缺陷預(yù)測(cè)
軟件缺陷預(yù)測(cè)可以預(yù)測(cè)軟件出現(xiàn)的錯(cuò)誤[1]。從整體上,軟件缺陷預(yù)測(cè)可以分為動(dòng)態(tài)缺陷預(yù)測(cè)和靜態(tài)缺陷預(yù)測(cè)[2]。文中使用的是靜態(tài)缺陷預(yù)測(cè)。
至今已有很多文獻(xiàn)提出了靜態(tài)軟件缺陷預(yù)測(cè)算法,算法的核心有兩點(diǎn),一是挖掘軟件度量,二是構(gòu)建軟件缺陷預(yù)測(cè)模型。……