張宇塵
隨著互聯網技術的普及,電子技術發展速度不斷加快,軟件技術的也得到前所未有的發展,但傳統的計算機軟件維修維護變得更加困難。通過數據挖掘技術將軟件中的數據提取出來,將有助后續軟件技術的發展。所以軟件數據挖掘技術的發展與探究有十分重大的現實意義。本文通過介紹軟件數據挖掘技術,分析未來軟件工程數據挖掘的發展方向,為后續的研究人員提供參考和借鑒。
【關鍵詞】工程數據 挖掘 發展方向
1 引言
軟件數據挖掘技術是在軟件儲存的大量數據中尋找所需信息的技術。軟件數據挖掘技術是軟件工程研發中數據搜索領域中一項重要研究方向。數據挖掘技術不僅可以有效縮短開發的周期,同時也能夠增加軟件的延伸性和穩定性。隨著電子行業的快速發展,軟件開發領域不斷受到重視,其數據搜索技術將得到更加廣闊的發展和重要應用。因此軟件數據挖掘技術的發展不僅具有重要的學術研究價值,同時也具有十分重要的應用價值。本文主要介紹軟件數據挖掘技術的研究現狀、所遇到的發展問題及未來的發展方向。
2 軟件數據挖掘技術
2.1 軟件數據挖掘技術的發展背景
軟件數據主要是在軟件研發過程中,研究人員對軟件的開發進行模擬,分析,對軟件開發,升級進行操作性分析,其重要編碼、代碼等相關數據。這些重要的信息數據是研究人員獲取軟件開發信息的唯一來源。隨著軟件技術的發展和軟件的升級更新,軟件中其重要的研發編碼和工程信息將出現指數性增長。例如:Kumia軟件研發數據中,其編碼超過600萬行。隨著軟件的升級更新,這對研究者對軟件價值數據開發的有很高要求。因此利用軟件數據挖掘技術獲取軟件工程數據對研發人員開發和軟件升級是十分重要的。
2.2 軟件數據挖掘技術的過程
通常情況下,軟件研發中工程數據的獲取主要尋找未升級更新的原始數據,這些工程數據便于研究人員發現。這些數據信息來自不同形式的云數據中,來源途徑不同,數據格式有差異,但較為容易轉為同一格式。通過對軟件挖掘數據過程中數據噪音、無序數據的篩選,可以對工程數據進行挖掘。近些年,主要的數據搜索處理技術包括LDA、LSA。
工程數據挖掘這一技術是從軟件數據信息中的海量數據中尋找出能夠代表軟件重要信息和基本規律的原始數據。導入的數據是規律有序的代碼或文本,將相關、分支信息的形式表現出來,這些信息的表現形式與挖掘技術有重要聯系。
評估論證信息。通過對搜索結果的評估確認出對開發者和使用者有價值的數據。其中包括將軟件和工程信息等轉化為使用者能夠理解和方便使用的形式,并將評估結果提供給研發人員。
3 軟件數據挖掘技術面臨的問題
3.1 軟件數據復雜化
目前軟件工程所涉及的數據主要包括兩類:結構化和非結構化。結構化數據中包含很多信息涉及軟件類型和錯誤報告。而非結構化數據主要包含軟件工程的編碼、代碼等。兩類工程數據采用不同的算法和編撰程序,但是兩者之間還有很多密切的聯系。因此在軟件工程數據挖掘過程中要深入了解兩個工程數據的聯系和結構不同,這對數據提取造成很多困難。
3.2 分析方法難道高
軟件工程數據挖掘后期的主要工作是將獲取的數據轉換成用戶能夠接受的形式。在傳統的數據提取技術過程中,如電子商務等需要將其轉換成數字或圖表等,但是這對軟件開發者并不是件輕松的工作,其包含很多分析編程方法、錯誤報告的選取。這對軟件數據挖掘技術發展存在一定挑戰。
3.3 軟件數據挖掘結果標準多樣化
很多行業對軟件工程數據挖掘都有一定應用。但是在表達和評估結構上,軟件工程數據存在較多標準,且標準不唯一。這對軟件開發者獲取數據后處理將是極為復雜,同時不同標準需要數據表達的方式也不盡相同,若想獲取準確的數據信息結果存在一定困難。
4 軟件數據挖掘技術的解決方法
4.1 軟件信息復雜化解決辦法
數據復雜化解決辦法主要有三種:
4.1.1 數據結構類型復雜化
目前研究人員通過對軟件信息的結構圖和結構網中獲取信息。
4.1.2 數據間聯系復雜化
這種類型數據可以通過軟件數據升級,強化數據間的聯系程度,進一步提高獲取有用信息數據的準確性。
4.1.3 數據中存在大量錯誤報告和缺失數據
對于這種類型的報告可以采用半管理式分析方法降低錯誤或缺失數據帶來的影響。
4.2 非傳統數據的分析方法
對于文本或數據等軟件數據,軟件研發人員采用使用范例的形式進行分析,很多研究結果涉及軟件使用案例和編程規則。同時將程序可視化,極大的滿足了研究人員對非傳統數據挖掘的要求。
4.3 挖掘數據評估結果解放辦法
傳統的數據評估方法很難使用不斷變化的軟件工程挖掘技術,研究人員通過利用缺陷檢測的評估方法對提取數據進行評估,但是這種方便也存在一定問題,還不成熟,評估結果的客觀性不充分,由于服務對象用戶的需求不同,因此需要軟件工程數據挖掘技術采用更多管理學上的方法。
5 軟件工程數據挖掘的發展趨勢
對于軟件工程數據的需求,開發出更高效的挖掘分析方法。從精準的關鍵數據向模糊數據發展;分析檢測錯誤或缺陷更加適應其復雜化;探索更為高效預處理數據方法;引入新的軟件工程技術,利用互聯網技術智能化的特征開發數據挖掘工作;這些利用數據挖掘技術整合技術信息、工程數據或利用數據挖掘工具設計軟件,輔助軟件模塊的開發等。
6 結論
隨著互聯網時代的不斷發展,電子技術日新月異,同時軟件開發技術也得到前所未有的發展,人們利用軟件技術開發解決生活、工作中的問題更加普遍,這對軟件工程數據挖掘技術提出了更多要求,難道也越來越大。本文通過對軟件工程數據挖掘技術的介紹和相關概念的分析,對目前所面臨的一些技術問題進行概述,同時對未來遇到的挑戰和應對措施進行探究,最后提出一些解決辦法。希望能夠為軟件工程數據挖掘技術的研究人員提供一些有意義的建議和參考。
參考文獻
[1]毛澄映,盧炎生,胡小華.數據挖掘技術在軟件工程中的應用綜述[J].計算機科學,2009(05):1-6.
[2]李新,張曉靜,米燕濤.軟件開發過程中的數據挖掘[J].石家莊職業技術學院學報,2007(02):31-33.
[3]趙志升,羅德林,李海英.數據挖掘技術與應用[J].河北北方學院學報(自然科學版),2006(06):63-66.
作者單位
大連市第十二中學 遼寧省大連市 116023