閆緒鵬
摘 要:該文通過對軟件工程行業中數據挖掘的重要性進行了分析,詳細地闡述了數據挖掘在該領域的具體應用。希望通過此文,能促進該技術在軟件行業中的應用,提升行業數據處理水平,保障軟件平穩、可靠運行。
關鍵詞:軟件工程 數據挖掘 數據處理
中圖分類號:TP311.5 文獻標識碼:A 文章編號:1672-3791(2019)01(b)-00-02
當今社會,隨著“數據”的不斷增加,相關數據處理技術也在不斷優化升級。在軟件工程中,也應采用先進技術,提升數據處理水平,保證軟件開發的合理性和科學性,為用戶提供更好的使用體驗?!皵祿诰颉痹趯祿奶幚砩嫌兄艽蟮膬瀯?,在軟件領域應用此技術勢在必行。
1 軟件工程行業中數據挖掘的重要性
近年來,隨著信息技術的發展,互聯網中的信息及數據不斷增加,人類已經進入信息爆炸的“大數據時代”,要對“爆炸的”信息進行有效的處理,傳統的數據處理方法已經不能滿足大多數軟件公司的需要,其迫切需要一種能夠高速處理數據的技術,“數據挖掘”應運而出[1]。
數據挖掘技術能結合軟件操作目的,通過分類、排序及關聯等步驟,從大量的數據中發現并摘取“有用的”信息,為相關工作人員提供了便利;其在應用中可以按照一定算法將數據細分為各個類別,通過對數據的分析找到規律、建立模型,對后續運行進行預測;還可以通過對某些特定的數據進行針對性的分析,利用相似性找到不同數據間的聯系,找出該數據的意義及價值。數據挖掘不是單純的對數據進行靜態分析,其在本質上是“動態的”,一般分為3個部分:第一,數據挖掘離不開預處理。在數據挖掘的整體工作中,最基礎的步驟就是預處理,此部分在整體中也發揮著關鍵性的作用,通過獲取、辨別、調取及交換數據,能夠梳理出數據信息的整體脈絡,掌握其中的邏輯關系,為數據創造更高層次的使用價值。第二,數據挖掘。在對數據進行預處理之后,需要對數據進行進一步的挖掘,明確挖掘目標及算法,對數據進行分類和總結,提高數據挖掘的效果。第三,深入分析。在分類之后需要對數據進行評估和分析,確定及呈現出數據的最終價值,為相關工作人員提供直觀的數據意義及價值。將這些技術應用到軟件工程行業,能有效提升軟件中數據處理的能力,從而提升整體軟件的運行效果,使用戶體驗更高水平的使用感受。
伴隨著科技水平的不斷提升,軟件工程行業的技術也會不斷優化升級,數據挖掘的作用會越來越大,其在該行業中的地位也會越來越突出,對于行業的長期發展具有重要意義。
2 軟件工程行業中數據挖掘的具體應用
隨著科學技術尤其是互聯網的發展,數據挖掘技術在軟件工程中發揮著越來越大的作用。一般情況下,數據的處理都要經過預處理、挖掘和深入分析這幾個步驟,預處理的對象相關數據信息如代碼、注釋及缺陷等;在預處理的基礎上,數據挖掘可以對相關信息進行細分,分門別類的對數據進行挖掘,找出有用的信息;最后結合數據挖掘的結果與軟件的實際運作,對軟件中的信息進行分析,找出漏洞,發送錯誤報告。無論是在軟件的維護階段還是完善階段,都能通過應用數據挖掘技術,采用適當的算法實現對數據信息的統一管理,進而提高軟件運行的效率與質量[2]。
2.1 對克隆代碼的數據挖掘
對克隆代碼進行檢測是軟件工程中最基礎、最原始的操作,該檢測是指通過比對系統中的文本及標識符等,對代碼語言進行判斷。在此方面可以應用數據挖掘技術,能通過相關函數對字符串進行匹配,對檢測對象進行深入挖掘,從而起到優化比對,提升匹配效率的作用。除此之外,通過檢測軟件系統中的代碼源能及時有效地發現并解決系統問題,為后續系統的維護與完善奠定良好的基礎。
2.2 對開源軟件的數據挖掘
開源軟件從本質上與其他軟件不同,其具有開放性、全面性和動態性,其全面性體現在對軟件應用記錄全面,既含有錯誤報告,也包含其他開發者活動。其動態性體現在相關人員的變化上。由于軟件具有開放性,人員的變動特別大,人員的動態性在很大程度上影響著軟件管理的效果。應用數據挖掘技術,軟件公司能夠有效把握數據的動態變化,實現高效、優質的管理。
2.3 對版本信息的數據挖掘
在軟件工程中,應用數據挖掘的技術能夠對工程版本信息進行控制。在實際的工程開發中,要對數據和信息進行統一的管理離不開對數據信息的充分掌握。數據挖掘技術的應用能夠使相關工作人員詳細了解當前系統的版本信息,在對數據進行分析及處理時能夠借助不同模塊間的差異及聯系,更加準確、全面地掌握信息;除此之外,通過對數據的準確掌握,工作人員也能及時發現系統中存在的問題,能夠采用適當解決辦法進行處理,從而不斷提升軟件的全面性及穩定性,進而可以有效提升軟件工程的質量。
2.4 對軟件漏洞的數據挖掘
在軟件的設計及應用中,對于漏洞的檢測是重要環節,對漏洞進行及時的檢測與維修能有效保證整個軟件工程的可靠性及安全性。由于軟件漏洞檢測工作目標的明確性,數據挖掘可以針對具體的數據及信息進行比對,能規范檢索范圍,這樣數據挖掘的準確度能更高,從而提升漏洞檢測的效率。數據挖掘技術能夠對相關信息進行深入挖掘,并對信息進行適當的轉換,過濾掉無用信息,提煉有用信息,增加檢測的針對性;還能對信息進行科學的選擇和補充,對漏洞進行詳細描述,用數值表示出來,準確定位漏洞,提升驗證和處理效果。某軟件公司還將此技術應用于軟件運行前的系統測試,借此檢驗系統整體運行效果,增強其使用的穩定性及可靠性。
2.5 對執行記錄的數據挖掘
在軟件的設計與開發中,應用數據挖掘技術還能對執行記錄進行挖掘,再根據所收集到的信息進行分析,發現并利用不同軟件或不同模塊間的聯系和差異,跟蹤數據信息執行路線,逆向建立模型,增強使用效果。具體流程是“初步插裝—記錄—過濾—建?!?,通過對被檢測的軟件進行記錄,能有效掌握軟件的編程接口及相關變量變化,在此基礎上對所獲取的信息進行過濾和分類,用模型表達系統的具體特征,掌握系統運行規律。所以,在對執行記錄進行挖掘時可以應用數據挖掘技術,這樣不僅能夠有效維護系統代碼,對信息進行準確的過濾,還能增強軟件的穩定性。
2.6 在人力管理中的數據挖掘
在軟件開發工程中,除了對數據進行挖掘外,還應對相關工作人員進行有效的管理,數據挖掘也可以在這方面發揮作用。在員工的日常工作中,不可避免地要進行溝通交流,除了面對面交流,還會有網絡上的交流。在使用網絡進行交流時,可以利用該技術對這中間產生的電子信息及數據進行挖掘,從而了解人員間的大致關系,企業可以利用這一點將人員進行合理的調配,開展有效的管理工作,從而保證工程進度,提升工作效率。
3 結語
綜上所述,數據挖掘技術在軟件的設計及運行中能發揮相當大的作用,其能夠對克隆代碼、開源軟件、版本信息、執行記錄中的數據及信息進行挖掘,通過比對、分類和處理,呈現出數據的最終價值,其在人力資源管理中也有很好的應用效果。隨著該技術的不斷發展,其應用效果也會不斷提升。
參考文獻
[1] 李俊標,何佩.軟件工程數據挖掘研究進展[J].電子技術與軟件工程,2018(24):163-167.
[2] 楊繼武.基于計算機數據挖掘技術的開發及其應用研究[J].信息與電腦:理論版,2018(24):29-31.