梁雯
摘要:隨著科學技術的高速發展,人們的生活行為、個人喜好、出行軌跡甚至個人社交都能通過一連串復雜的數據來顯示。強大的數據網絡對人們的工作生活及科技發展產生了重要影響。因此,如何在龐大的數據網絡中找到有價值的、有需要的數據,成為了數據信息技術的一個研究方向。數據挖掘技術在一定程度上解決了這個問題。文章結合數據挖掘的內涵,分析數據挖掘技術在軟件工程中的作用,提出一些應用方法,旨在對我國軟件工程和科技發展提供參考。
關鍵詞:軟件工程;數據挖掘技術;應用
中圖分類號:TP311? 文獻標識碼:A
1 引言
數據挖掘是大數據分析領域中的一個新的數據處理理念,它的核心思想是通過對數量巨大、但價值密度低的數據進行分析處理,從而提取出一些對所研究的問題有價值的信息。隨著軟件工程的發展,在軟件開發和項目管理過程中也逐漸出現了海量數據分析的難題,例如源代碼管理、版本管理、漏洞分析、系統操作記錄。軟件長期運行所積累下來的數據,由于數據量過大,傳統的數據處理技術顯然是不可能完成的。為此,研究數據挖掘技術在軟件工程中的應用具有重要意義。
2 數據挖掘技術的概述
數據挖掘是在大量的數據中探測有意義的行為和規律,它不僅可以應用于研究領域,使研究人員快速獲取大量目標數據,還能夠應用于商業中等多個領域。該技術可以了解數據中潛在的規律,還能夠用歷史數據對未來進行預測。它能夠檢測海量數據中的異常數據,發現數據中顯著不同于其他數據的對象。數據挖掘系統也在不斷的發展,初代系統是作為一個獨立的應用,可以支持一個算法,也可支持多個算法,而現在的系統能夠和各種移動數據相連,并且大多都存在計算模型,可以應用于多種移動設備。在進行數據挖掘的過程中,首先要對數據進行預處理,能夠對不一致或不完整的數據進行清除,還能夠進行數據的抽樣,能夠保證數據的正確性以及統一性。隨后需進行數據的挖掘,挖掘過程中有多種算法可對數據進行分類與預測,分類過程中可以構建模型對現有的數據和新數據進行分類,建立函數值模型能夠對數據進行預測,此外還有聚類、關聯等算法。最后需要根據挖掘過程中所選擇的算法和最終產生的結果對整個過程進行評價,還要將結果傳遞給客戶,需要將信息模式進行轉換,使用戶可以理解。
3 數據挖掘技術的應用流程
數據挖掘技術在軟件工程中的應用主要包括數據預處理、數據挖掘、模型表現等三個不同的階段。在數據預處理階段,主要任務與目標是,對獲取的原始數據進行處理,厘清目標對象,實現有效數據的分離,并且在數據預處理的過程中,對軟件工程中涉及到的原始數據進行了清理,將冗余信息進行清除,同時對部分缺失數據進行補充,形成完整的數據鏈條,從而為后續軟件開發、軟件管理以及軟件評測工作的開展提供了參考。在數據挖掘的過程中,為保證挖掘效果,需要明確挖掘人物,認真做好數據的分類、歸納、評估以及總結工作,在此基礎上,對挖掘方法進行針對性選擇,選擇過程中,要結合數據自身的特點以及軟件工程相關工作的具體要求,對數據挖掘方法做出必要的調整,確保挖掘的有效性。為實現挖掘結果的完整表達,可以使用模型評價或者知識表示的方式,將數據挖掘的結果以更加完整、系統的方式呈現出來,使得相關工作人員能夠在相關數據挖掘結果的指導下,有針對性地開展軟件開發、管理以及測評工作,大大增強了軟件工程的時效性,為后續相關工作的開展奠定了堅實基礎。
4 數據挖掘技術在軟件工程中的應用
4.1 軟件管理中的應用
軟件管理中的應用可以分為兩個方面即可進行開源軟件的管理,又可進行軟件項目的管理。開源軟件較為特殊,因此它的使用不需收費。由于開源軟件較多,并且所有人都可以隨意使用,因此管理過程有較大難度,開源軟件的質量也難以保證。利用數據挖掘技術,能夠提高開源軟件的質量。利用該技術進行項目管理時,利用數據挖掘技術能夠整理組織關系,有利于信息的交互。軟件開發過程中需要不斷進行版本的更新和漏洞的修復,開發者可以利用數據挖掘技術查看歷史版本和以往出現的漏洞,避免這些問題在開發過程中重復出現,有利于軟件的開發和后期的維修與管理。
4.2 項目管理
在具體的數據挖掘技術應用中,軟件工程企業可以針對組織關系和版本控制數據進行數據挖掘。組織關系數據雖然相對繁瑣,但有利于軟件工程企業進行企業和項目的管理,梳理組織系統和組織管理,保障資源調配和應用的系統性和有效性。而版本控制數據是指數據挖掘技術中對數據進行控制和調整變化的數據部分。通過對這方面數據的應用,能更好的控制企業信息,出現混亂的流程和問題時能及時調整,提高軟件運行的穩定性。根據這一特點,企業還能將數據挖掘應用到對問題進行提前預警和及時解決的過程中去,全面提高項目管理質量。
4.3 軟件漏洞掃描
漏洞檢測是軟件工程的重要內容,是發現安全隱患、提高軟件質量、保障系統安全的有效措施。在傳統的漏洞檢測技術中,由于需要掃描的數據量過大,如果逐條依次分析,將導致長時間的等待,可操作性不強。在漏洞掃描中引入數據挖掘技術,可以有效提高掃描效率。典型的基于數據挖掘的軟件漏洞掃描應用步驟如下:第一,創建測試項目。根據用戶的具體需求制定軟件測試方案,明確需要掃描哪些類型的漏洞,采用什么方案進行掃描。第二,收集漏洞信息。掃描漏洞的前提是要認識漏洞,也就是對漏洞進行定義。需要收集有關軟件缺陷的大量信息,并對一些屬性進行定量化處理。第三,選擇理論模型。根據掃描要求,選取適當的數據挖掘模型,根據前期收集的數據資料,對模型進行充分的訓練,得到有效的訓練集與測試集,取得最佳掃描策略。第四,開展漏洞掃描。采用前一步得到的模型,將其應用于軟件掃描測試過程,經過數據的分類和特征分析,提取漏洞信息。第五,根據掃描結果,修復漏洞,并重新掃描以確認漏洞的成功修復。
4.4 著力提升故障檢測能力
軟件工程涉及技術類型較為多樣,軟件工程中一旦出現故障,勢必影響整個軟件開發的進度,造成額外的成本支出。同時由于技術的復雜性,使得軟件工程故障的排除難度較高。數據挖掘技術的應用,可以根據軟件編寫中API等規則,對運行過程中產生的各類信息進行分析,在分析過程中,如果發現錯誤信息,及時向工作人員發出提示,進行警報。工作人員在獲取警報后,根據相關信息,對軟件的故障區域進行針對性的維護、處理,從而大大增強故障檢測以及應對能力,實現了軟件工程體系的優化升級。
5 結束語
數據挖掘技術在現代科技發展中發揮了重要作用。不僅能保障軟件工程企業的設備運行的安全性和準確性,還能促進軟件產品的優化進程,幫助更好的為客戶服務。因此,企業可以在實際工作中用數據挖掘技術代替傳統的信息處理技術,憑借其優異的數據處理能力和數據分析能力,降低企業科技研發成本和維護成本,保障企業的發展。
參考文獻:
[1] 吳金玲.數據挖掘技術在軟件工程中的應用[J].產業創新研究,2019(03):115-116.
[2] 龍艷.分析數據挖掘技術在軟件工程中的應用[J].科技風,2019(02):83.
[3] 梅擁軍.軟件工程中數據挖掘技術的應用[J].電子技術與軟件工程,2019(01):141.
[4] 程志平,徐涢基.數據挖掘技術在軟件工程中的應用探究[J].信息技術與信息化,2018(12):210-212.
[5] 蔡斌.數據挖掘技術在軟件工程中的應用[J].電子技術與軟件工程,2018(21):148.