999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

軟件缺陷傾向性預(yù)測投票方法

2021-06-23 07:53:42劉亞娜吳彩華
科學(xué)技術(shù)創(chuàng)新 2021年18期
關(guān)鍵詞:方法模型

劉亞娜 吳彩華 陳 浩 石 晶

(空軍預(yù)警學(xué)院雷達(dá)士官學(xué)校,湖北 武漢430345)

1 概述

軟件內(nèi)部隱藏的缺陷可能導(dǎo)致其在實(shí)際運(yùn)行時(shí)產(chǎn)生不可預(yù)料的后果,嚴(yán)重影響軟件質(zhì)量甚至有時(shí)會(huì)危及到人們的生命安全。而軟件缺陷預(yù)測可以為軟件開發(fā)過程提供決策支持,即:在項(xiàng)目的開發(fā)初期,通過預(yù)先識(shí)別出所有可能含有缺陷的軟件模塊,可以針對性地對這些程序模塊設(shè)計(jì)測試用例,以確保充分測試,從而提高軟件質(zhì)量。程序模塊根據(jù)實(shí)際測試需求可設(shè)置為包、文件、類或函數(shù)等。目前,缺陷預(yù)測模型在構(gòu)建時(shí)常采用支持向量機(jī)[1]、Logistic 回歸、樸素貝葉斯[2]、決策樹[3]、集成學(xué)習(xí)[4]等常見的機(jī)器學(xué)習(xí)方法。

早期的關(guān)于缺陷預(yù)測的大部分研究都是集中于單分類器的研究,它們是根據(jù)交叉驗(yàn)證所得數(shù)據(jù)進(jìn)行實(shí)驗(yàn)得到的性能的平均值來作為最終性能,并以此性能來度量模型的,但是平均后的性能并沒有得到很大改善,只是在方差上有一定的改進(jìn),同時(shí)并不能給出樣本最終的預(yù)測結(jié)果。而且軟件缺陷預(yù)測一般都更加關(guān)注少數(shù)類的預(yù)測效果,但受數(shù)據(jù)不平衡的影響交叉驗(yàn)證平均后的性能偏向于多類。比如Kaur 等人[5]使用的隨機(jī)森林分類器,Elish 等人[6]等人使用的支持向量機(jī)(SVM),Khoshgoftaar[7]等人使用的神經(jīng)網(wǎng)絡(luò),它們的結(jié)果都偏向于多類而忽略了少類,導(dǎo)致結(jié)果出現(xiàn)較高的假負(fù)率。而本文提出了一種基于軟件缺陷傾向性預(yù)測投票方法,該方法是使用單分類器的投票機(jī)制,即使用一種分類器對分層交叉驗(yàn)證的數(shù)據(jù)進(jìn)行下采樣構(gòu)建模型,對其得到的多個(gè)預(yù)測結(jié)果進(jìn)行投票得到最終的預(yù)測結(jié)果,并基于該結(jié)果計(jì)算模型的性能。

2 軟件缺陷傾向性預(yù)測投票方法

以下將軟件缺陷傾向性預(yù)測投票方法簡稱投票法,將軟件缺陷傾向性預(yù)測平均法簡稱平均法。

2.1 PCA 及主成分個(gè)數(shù)的確定

本文采用一組3×2 交叉驗(yàn)證來選擇主成分個(gè)數(shù)k,采用缺陷預(yù)測的性能指標(biāo)(本文用F1 值)在測試集上最大來選。對數(shù)據(jù)KC1,PC3,PC4 分別構(gòu)造一組3×2 交叉驗(yàn)證,對k=1,2,…p(p 為數(shù)據(jù)集中屬性的個(gè)數(shù))分別構(gòu)建基于PCA 的缺陷預(yù)測模型,選取在6 份上的F1 指標(biāo)平均值最大的k 作為模型的主成分個(gè)數(shù),KC1 數(shù)據(jù)集上挑選的k=3,PC3,PC4 數(shù)據(jù)集上挑選的k=14。

2.2 投票法

給定一個(gè)數(shù)據(jù)集為D= {(xi,xy)|i=1,2,…n},yi的取值為{0,1},0 表示沒有缺陷,1 表示有缺陷;給定二折交叉驗(yàn)證的重復(fù)次數(shù)m;給定一個(gè)機(jī)器學(xué)習(xí)算法L;給定一個(gè)m×n 的矩陣A,向量Pred,m×4 的矩陣Perf。

投票法首先對數(shù)據(jù)進(jìn)行了m×2 的分層交叉驗(yàn)證,交叉驗(yàn)證結(jié)束后可以得到一個(gè)m×n 的矩陣A,其中元素A[i,j]表示第次二折交叉驗(yàn)證后對樣本j 的預(yù)測結(jié)果(以0,1 的形式表示),二折交叉驗(yàn)證共重復(fù)m 次,所以可得到m 行n 列的預(yù)測結(jié)果A,得到矩陣A 后,對A 中的預(yù)測結(jié)果進(jìn)行投票,其中A 矩陣中第j(j=1,2,…n)列存儲(chǔ)的是第j 個(gè)樣本的m 個(gè)預(yù)測結(jié)果,對這m 個(gè)預(yù)測結(jié)果進(jìn)行投票,使用m/2 作為閾值,如果第j 列中m 個(gè)結(jié)果中1 的個(gè)數(shù)大于或等于它的閾值,則最終判斷第j 個(gè)樣本為有缺陷(1),否則為沒有缺陷(0),重復(fù)n 次,將數(shù)據(jù)集D 中n個(gè)樣本的最終預(yù)測結(jié)果存儲(chǔ)到Pred 向量中,最后按照此最終預(yù)測結(jié)果計(jì)算出precision,recall,F(xiàn)1,accuracy 的值,其算法如圖1所示。

圖1 投票法算法偽代碼

3 數(shù)據(jù)集及性能指標(biāo)

3.1 數(shù)據(jù)集

本文實(shí)驗(yàn)數(shù)據(jù)來源于PROMISE 平臺(tái)上的KC1、PC3 和PC4數(shù)據(jù)集。KC1 數(shù)據(jù)集包含2109 個(gè)樣本,21 個(gè)變量;PC3 數(shù)據(jù)集包含1125 個(gè)樣本,37 個(gè)變量;PC4 數(shù)據(jù)集包含1399 個(gè)樣本,37個(gè)變量。

3.2 性能度量

本文使用的性能度量為precision、recall、F1 值、accuracy,其計(jì)算公式如下:

其中,TP 為實(shí)際有缺陷被預(yù)測為有缺陷的樣本數(shù);FP 為實(shí)際沒有缺陷被預(yù)測為有缺陷的樣本數(shù);TN 為實(shí)際沒有缺陷被預(yù)測為沒有缺陷的樣本數(shù);FN 為實(shí)際有缺陷被預(yù)測為沒有缺陷的樣本數(shù)。

4 實(shí)驗(yàn)結(jié)果及分析

在KC1、PC3 和PC4 數(shù)據(jù)集上使用logistic 回歸模型的實(shí)驗(yàn)結(jié)果如圖2 所示,對于KC1、PC3 和PC4 數(shù)據(jù)集使用logistic 回歸建模來說其對應(yīng)的投票結(jié)果的precision、recall、F1 值、accuracy 值都高于平均結(jié)果。所以綜合而言,在KC1、PC3 和PC4數(shù)據(jù)集上投票方法的性能優(yōu)于平均結(jié)果的性能。

圖2 數(shù)據(jù)集使用logistic 模型的投票實(shí)驗(yàn)結(jié)果

在KC1、PC3 和PC4 數(shù)據(jù)集上使用決策樹模型的實(shí)驗(yàn)結(jié)果如圖3 所示,對于KC1、PC3 和PC4 數(shù)據(jù)集使用決策樹建模來說,其對應(yīng)的投票法的precision、recall、F1 值、accuracy 值都高于平均法得到的性能結(jié)果。所以綜合而言,在KC1、PC3 和PC4 數(shù)據(jù)集上投票方法的性能優(yōu)于平均結(jié)果的性能。

圖3 數(shù)據(jù)集使用決策樹模型的投票實(shí)驗(yàn)結(jié)果

5 總結(jié)與展望

針對傳統(tǒng)的計(jì)算軟件缺陷預(yù)測模型的性能是按照交叉驗(yàn)證后性能的平均值進(jìn)行度量的,而本文則是按照交叉驗(yàn)證后投票得到的最終預(yù)測結(jié)果計(jì)算得到的性能值度量模型的。該方法在NASA 的KC1、PC3 和PC4 數(shù)據(jù)集上分別構(gòu)建了logistics 回歸模型和決策樹模型,從實(shí)驗(yàn)結(jié)果可以得出,該方法可以得到待測樣本的最終預(yù)測結(jié)果;其性能基本優(yōu)于平均法計(jì)算得到的性能值。所以綜合來說,該方法具有一定優(yōu)勢。

該方法仍有一些后續(xù)工作有待擴(kuò)展:

(1)該方法只在NASA 數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),之后將在其他跨項(xiàng)目數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),驗(yàn)證該方法的有效性;

(2)嘗試以特定的比例對數(shù)據(jù)進(jìn)行下采樣,以進(jìn)一步緩解類不平衡問題;

(3)在該方法中進(jìn)一步考慮特征選擇方法,通過移除數(shù)據(jù)集中的冗余特征和無關(guān)特征來進(jìn)一步提升軟件缺陷預(yù)測模型的性能。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
學(xué)習(xí)方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 91精品人妻互换| 五月天久久婷婷| 国产人碰人摸人爱免费视频 | 99久久精品免费观看国产| 亚洲妓女综合网995久久| 亚洲精品男人天堂| 99在线观看精品视频| 国产成人综合亚洲欧美在| 亚洲va欧美va国产综合下载| 伊人久久大香线蕉影院| 亚洲伊人久久精品影院| AⅤ色综合久久天堂AV色综合 | 久久久久人妻一区精品| 97免费在线观看视频| 国产精品久久久久婷婷五月| 国产av剧情无码精品色午夜| 国产精品女在线观看| 国产一区二区三区免费观看| 国内熟女少妇一线天| 色妞永久免费视频| 色婷婷在线影院| 中文字幕中文字字幕码一二区| 日本不卡在线播放| 亚洲免费播放| 亚洲欧美一区二区三区图片| 97久久超碰极品视觉盛宴| 色偷偷av男人的天堂不卡| 国产成人综合亚洲欧美在| 国产一区亚洲一区| 最新日韩AV网址在线观看| 丝袜国产一区| 综合网天天| 亚洲中文字幕手机在线第一页| 中国精品自拍| 亚洲国产精品不卡在线| 成人夜夜嗨| 国产精品原创不卡在线| 国产玖玖玖精品视频| a毛片基地免费大全| 国产高清在线精品一区二区三区 | 91无码视频在线观看| 国产美女自慰在线观看| 宅男噜噜噜66国产在线观看| 免费观看无遮挡www的小视频| 黄色网在线免费观看| 男女性色大片免费网站| 亚洲欧美自拍一区| 欧美一级高清免费a| 免费在线色| 综合人妻久久一区二区精品| 老司机精品一区在线视频| 99久久精品免费视频| 综合久久五月天| 亚洲一级毛片在线观播放| 91精品国产麻豆国产自产在线| 亚洲丝袜中文字幕| 毛片手机在线看| 日本午夜三级| 国禁国产you女视频网站| 呦女精品网站| 成人夜夜嗨| 国产二级毛片| 在线色国产| 午夜精品福利影院| 国产午夜一级淫片| 精品第一国产综合精品Aⅴ| 91久久精品日日躁夜夜躁欧美| 色婷婷视频在线| 国产视频一二三区| 亚洲欧美在线看片AI| 九九线精品视频在线观看| 欧美影院久久| 精品视频91| 亚洲人成网18禁| 丁香六月综合网| 一本大道无码日韩精品影视| 青青青伊人色综合久久| 蝴蝶伊人久久中文娱乐网| 97国产成人无码精品久久久| 无码中文AⅤ在线观看| 国产福利2021最新在线观看| 亚洲精选无码久久久|