999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

軟件工程數(shù)據(jù)挖掘研究進(jìn)展

2015-12-31 00:00:00姜鑫
文化產(chǎn)業(yè) 2015年7期

摘 要:所謂的數(shù)據(jù)挖掘指的是通過(guò)搜索海量的數(shù)據(jù)信息,將有用的知識(shí)和信息挖掘出來(lái)。在數(shù)據(jù)挖掘技術(shù)中,軟件工程數(shù)據(jù)挖掘技術(shù)是一項(xiàng)重要的內(nèi)容。通過(guò)表示、分析和提取等方法,將對(duì)軟件開發(fā)有用的知識(shí)和信息挖掘出來(lái)。本文簡(jiǎn)要介紹了軟件工程數(shù)據(jù)挖掘,并對(duì)軟件開發(fā)階段需要應(yīng)對(duì)的問(wèn)題和解決方案進(jìn)行了簡(jiǎn)要的分析。

關(guān)鍵詞:軟件工程;數(shù)據(jù)挖掘;軟件開發(fā);

文章編號(hào):1674-3520(2015)-07-00-01

在數(shù)據(jù)挖掘技術(shù)中,軟件工程數(shù)據(jù)挖掘是一個(gè)重要的領(lǐng)域,對(duì)軟件工程的發(fā)展有著極大的影響。所謂的軟件工程數(shù)據(jù)挖掘指的是在海量的數(shù)據(jù)中將有用的知識(shí)和信息提取出來(lái),為軟件開發(fā)服務(wù)。

一、軟件工程數(shù)據(jù)挖掘

所謂的軟件工程數(shù)據(jù)挖掘的主要特點(diǎn)有以下幾個(gè)方面。首先,其能夠解決軟件開發(fā)者的數(shù)據(jù)選擇問(wèn)題;其次,能夠解決挖掘算法的選擇問(wèn)題;最后,能夠解決軟件工程的數(shù)據(jù)處理和提取問(wèn)題[1]。

軟件工程數(shù)據(jù)挖掘,可以分為三個(gè)階段:結(jié)果評(píng)估、數(shù)據(jù)挖掘、數(shù)據(jù)預(yù)處理。其主要任務(wù)在于提取復(fù)雜混合的信息、異常檢測(cè)、估計(jì)預(yù)測(cè)、分類等等。與傳統(tǒng)的數(shù)據(jù)挖掘相比,軟件工程數(shù)據(jù)挖掘具有一定的特殊性。

(一)軟件工程數(shù)據(jù)挖掘具有更加復(fù)雜的數(shù)據(jù),包括版本信息、軟件報(bào)告等結(jié)構(gòu)化數(shù)據(jù),以及注釋、代碼等非結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)具有緊密的聯(lián)系,但是卻不能使用同一種算法進(jìn)行計(jì)算。這也造成了軟件工程數(shù)據(jù)挖掘的數(shù)據(jù)更為復(fù)雜。

(二)結(jié)果呈現(xiàn)的方式比較特殊。文字、報(bào)表等形式是傳統(tǒng)數(shù)據(jù)挖掘結(jié)果的主要表現(xiàn)形式。然而軟件工程數(shù)據(jù)的挖掘要將具體的實(shí)例提供給軟件開發(fā)者,例如設(shè)計(jì)結(jié)構(gòu)、缺陷定位等等,因此,必須開發(fā)新型的結(jié)果提交方法和手段。

(三)難以對(duì)挖掘結(jié)果進(jìn)行統(tǒng)一評(píng)價(jià)。盡管在傳統(tǒng)數(shù)據(jù)挖掘技術(shù)領(lǐng)域已經(jīng)形成了相對(duì)完善的評(píng)價(jià)標(biāo)準(zhǔn),然而由于軟件工程數(shù)據(jù)挖掘的前兩個(gè)特殊性,難以對(duì)挖掘結(jié)果進(jìn)行統(tǒng)一的評(píng)價(jià)。

因此,挖掘結(jié)果的表述和對(duì)數(shù)據(jù)的預(yù)處理是軟件工程挖掘的重點(diǎn)和難點(diǎn)。

二、軟件工程數(shù)據(jù)挖掘在軟件開發(fā)階段的問(wèn)題和解決對(duì)策

編寫程序是軟件開發(fā)階段的主要目的。在結(jié)果提交和代碼編寫方面容易出現(xiàn)一些問(wèn)題,需要采取有效的方式對(duì)其進(jìn)行解決。

軟件開發(fā)者在進(jìn)行代碼編寫時(shí),首先要對(duì)代碼的功能和結(jié)構(gòu)進(jìn)行全面的了解,然后加以自己的理解為基礎(chǔ),通過(guò)軟件工程數(shù)據(jù)挖掘,在海量數(shù)據(jù)中尋找可復(fù)用的信息[2]。一般情況下,可以將編程所需的信息劃分為三個(gè)方面。第一,在已有的代碼中,開發(fā)者要將可以重用的代碼找出來(lái)。第二,開發(fā)者要將可以重用的靜態(tài)規(guī)則找出來(lái),例如繼承關(guān)系和類的方法等等。第三,開發(fā)者要講可以重用的動(dòng)態(tài)規(guī)則找出來(lái),例如應(yīng)用程序接口的調(diào)用順序等等。

一般情況下通過(guò)求助他人、查看代碼、通過(guò)軟件的幫助文檔等方法在軟件開發(fā)的代碼編寫中比較常用,但是這些方法也會(huì)出現(xiàn)一些問(wèn)題,例如重用信息量過(guò)少、代碼量大、難以保障幫助文檔的完整性和準(zhǔn)確性等等[3]。

(一)重用代碼

開發(fā)者要了解所需的方法或者類,然后才能進(jìn)行代碼的重用,對(duì)相關(guān)代碼進(jìn)行瀏覽。這需要耗費(fèi)過(guò)多的時(shí)間,可以在代碼庫(kù)中通過(guò)關(guān)鍵字來(lái)尋找可以重用的代碼,這是由于可以重用的代碼必然存在相似的模式,通過(guò)上下文結(jié)構(gòu)可以呈現(xiàn)最終的結(jié)果,例如類與類的關(guān)系。首先要將具有上下文架構(gòu)和例程的代碼庫(kù)構(gòu)建出來(lái)。其次,開發(fā)者將類的信息提交到代碼庫(kù),并對(duì)反饋結(jié)果打分,將代碼庫(kù)組建出來(lái)。第三,按照高低分來(lái)排序查詢時(shí)的例程,開發(fā)者可以自行選用查詢結(jié)果。

(二)重用靜態(tài)規(guī)則

利用軟件工程數(shù)據(jù)挖掘來(lái)重用靜態(tài)規(guī)則,開發(fā)者可以重復(fù)利用靜態(tài)規(guī)則,在代碼庫(kù)中用類與類的關(guān)系的形式將其保存下來(lái),可以用關(guān)聯(lián)規(guī)則來(lái)發(fā)泄這種規(guī)則。首先,搜索代碼庫(kù)中內(nèi)力的關(guān)系,在代碼庫(kù)中保存其與其余類的關(guān)系。其次,挖掘關(guān)聯(lián)規(guī)則。可以使用Apriori算法來(lái)發(fā)現(xiàn)出現(xiàn)頻率高的規(guī)則。第三,裁剪挖掘出的結(jié)果。也就是在篩選結(jié)中將無(wú)用的關(guān)聯(lián)去掉,使開發(fā)者能夠得到更為精煉的信息。第四,根據(jù)關(guān)聯(lián)關(guān)系在代碼庫(kù)中出現(xiàn)的頻率,用列表的形式呈現(xiàn)頻率的排序。

(三)重用動(dòng)態(tài)規(guī)則

首先,開發(fā)者要制定動(dòng)態(tài)規(guī)則的順序。其次,將結(jié)果利用隊(duì)列等簡(jiǎn)單的數(shù)據(jù)結(jié)構(gòu)保存起來(lái),開發(fā)者可以在編譯器擴(kuò)展中檢查結(jié)果的順序。第三,反饋違反規(guī)則的代碼。

在動(dòng)態(tài)規(guī)則的具體重用過(guò)程中,由于開發(fā)者往往不能預(yù)先設(shè)定動(dòng)態(tài)規(guī)則,因此,有研究提出了自動(dòng)發(fā)現(xiàn)這種規(guī)則。自動(dòng)發(fā)現(xiàn)規(guī)則主要是根據(jù)軟件開發(fā)者的習(xí)慣性,以及違反規(guī)則可能出現(xiàn)的問(wèn)題,發(fā)現(xiàn)兩個(gè)事件發(fā)生的順序。例如B事件必然發(fā)生在A事件之前,發(fā)現(xiàn)此類規(guī)則之后就可以規(guī)則設(shè)定為先后調(diào)用的相同函數(shù),然后驗(yàn)證每一個(gè)規(guī)則,得出每個(gè)規(guī)則成立與否。由于可能會(huì)得到數(shù)量非常多的函數(shù),為了降低函數(shù)的數(shù)目,可以使用一些函數(shù)命名規(guī)則,將不可能的函數(shù)對(duì)去除掉,然后再匹配剩下的函數(shù)對(duì)。

三、結(jié)語(yǔ)

當(dāng)前我國(guó)的軟件工程數(shù)據(jù)挖掘仍然處于發(fā)展的初級(jí)階段,還有非常漫長(zhǎng)的研究路程要走。當(dāng)前我國(guó)已經(jīng)有公司開始發(fā)布軟件工程數(shù)據(jù)挖掘系統(tǒng)的框架,但是遠(yuǎn)沒(méi)有達(dá)到商業(yè)化應(yīng)用的程度。本文以軟件開發(fā)階段為例,對(duì)軟件工程數(shù)據(jù)挖掘研究中所面臨的問(wèn)題和解決對(duì)策進(jìn)行簡(jiǎn)要的分析,在軟件工程數(shù)據(jù)的修改和維護(hù)階段還會(huì)出現(xiàn)更多的問(wèn)題,例如無(wú)法對(duì)搜索的結(jié)果到表示進(jìn)行統(tǒng)一,這也一定程度上的軟件工程數(shù)據(jù)挖掘技術(shù)的發(fā)展造成了阻礙。隨著軟件工程數(shù)據(jù)挖掘研究的不斷深入,將會(huì)開發(fā)出更為友好化和實(shí)用化的軟件工程數(shù)據(jù)挖掘工具,推動(dòng)軟件數(shù)據(jù)挖掘技術(shù)的發(fā)展和成熟。

參考文獻(xiàn):

[1]艾迪明,齊劍鋒,涂序彥. 關(guān)于分布式、異構(gòu)、歷史遺留數(shù)據(jù)的數(shù)據(jù)挖掘研究[J]. 計(jì)算機(jī)工程與應(yīng)用. 2013(01)

[2]金光,錢家麒,黃蔚民. 公安業(yè)務(wù)信息數(shù)據(jù)挖掘研究[J]. 警察技術(shù). 2013(04)

[3]章成志.數(shù)據(jù)挖掘研究現(xiàn)狀及最新進(jìn)展[J]. 南京工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào). 2013(02)

主站蜘蛛池模板: 992tv国产人成在线观看| 欧美综合区自拍亚洲综合绿色| 日韩美毛片| 国产亚洲欧美日韩在线观看一区二区 | 女人av社区男人的天堂| 亚洲91在线精品| 亚洲人成网站日本片| 久久婷婷人人澡人人爱91| 一级看片免费视频| 国产玖玖视频| 国产一区二区色淫影院| 国产高清色视频免费看的网址| 欧美一级高清片久久99| 国产免费一级精品视频 | 国产免费福利网站| 欧美在线视频不卡第一页| 国产SUV精品一区二区| 国产一级视频在线观看网站| 婷五月综合| 国产欧美日韩另类| 一级毛片高清| 亚洲中文制服丝袜欧美精品| 青青青国产视频手机| 香蕉久人久人青草青草| 免费jizz在线播放| 2048国产精品原创综合在线| 亚洲视频在线青青| 中文字幕色站| 九九久久精品免费观看| 国产精品99一区不卡| a级毛片在线免费观看| 男人天堂亚洲天堂| 欧美成人精品在线| 无码中字出轨中文人妻中文中| 午夜日b视频| 国产精品夜夜嗨视频免费视频| 国产精品人成在线播放| 国产精品美女自慰喷水| www精品久久| 亚洲第一福利视频导航| 久久精品欧美一区二区| 日本免费精品| 午夜无码一区二区三区在线app| 欧美一区精品| 国产又粗又爽视频| 四虎免费视频网站| 国产成人狂喷潮在线观看2345| 激情综合五月网| 日韩精品成人在线| 亚洲中字无码AV电影在线观看| 国产成人a毛片在线| 综合亚洲网| 无码'专区第一页| 国产精品人人做人人爽人人添| 国产精品视频导航| 国产传媒一区二区三区四区五区| 久久夜夜视频| 色网站在线免费观看| 婷婷五月在线| 国产福利一区在线| 国禁国产you女视频网站| 国产亚洲精品97在线观看| 国产精品七七在线播放| 在线观看无码a∨| av无码一区二区三区在线| 亚洲女人在线| 最新国产精品第1页| 国产制服丝袜91在线| 香蕉视频国产精品人| 欧美国产在线看| 在线观看91香蕉国产免费| 91丝袜在线观看| 天天躁夜夜躁狠狠躁图片| 99爱视频精品免视看| 在线国产三级| 男女男免费视频网站国产| 国产精品爽爽va在线无码观看| 成人精品在线观看| 色婷婷在线播放| 人妻无码中文字幕一区二区三区| 青草午夜精品视频在线观看| 国产95在线 |