陳忠菊
摘 要:隨著社會的迅速發展,軟件工程運用數據挖掘技術也十分關鍵。其不僅能夠讓信息數據得到更為準確的傳播,而且還能讓數據挖掘的效率得到全面的提升。該文主要針對軟件工程運用數據挖掘技術進行分析,并提出了相應的優化措施。
關鍵詞:軟件工程 數據挖掘 技術 分析
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2016)06(b)-0080-02
當今時代是信息時代,隨著互聯網技術的發展,人們步入了大數據時代。毫不夸張地說,在這個大社會環境中,每個人都有自己的數據庫,而眾多人的數據結合在一起,形成了一個巨大的數據庫,應用這些數據可以獲取許多信息,而這些信息可以在一定程度上給商家帶來所需的信息,因此,大數據在當今時代的地位越來越突出,賣家可以根據這些信息了解買家的偏好以及需求。在這樣一種時代背景之下,為了滿足人們對信息的需求,數據挖掘技術逐漸發展起來。
1 軟件工程運用數據挖掘技術的概況分析
1.1 數據挖掘技術發展現狀
所謂的數據挖掘技術指的是在眾多繁雜的信息中收集以及提取出自己所需要的、對自己有價值的信息,它作為一門技術是為了軟件工程開發而服務的。數據挖掘技術的最終目的是找到并提取對自己有用的信息,而信息提取的過程就是數據挖掘的過程。隨著數據挖掘技術的進步,越來越多的行業開始將其應用到自己的領域中,軟件工程也不例外。早期中國,信息量不是很大,傳統軟件工程開發在數據采集方面比較落后,它在驗證驅動的過程中需要先假定信息的存在,在此基礎上對信息進行采集和挖掘,最后再對假設進行驗證,判斷是否成立。但是現如今社會已經步入了信息時代,信息數量迅速增多,各種信息交匯在一起,錯綜復雜,因此信息呈現出又多又亂的特點,如果按照傳統軟件工程開發的方式對數據進行收集,那么就會使工作量變得很大,很難得以實施。數據挖掘技術基于這樣一種現狀對驗證驅動的方法進行了調整和改進,可以在雜亂的信息中識別有用的信息并提取出來。
1.2 數據挖掘的相關內容
就目前來講,關聯發現技術、人工神經網絡、分類樹技術、最優集合規約技術以及聚類技術和可視數據挖掘技術等是最常使用的數據挖掘技術。在工程開發過程中,對數據的度量同樣具有復雜性和難實施性,因此,在采用數據挖掘技術的同時要配合使用一些特殊的處理技術,例如:分類樹處理技術、統計分析處理技術、回歸建模處理技術等。不管應用哪種處理技術以及哪種數據挖掘技術,我們應該時刻注意開發商所要達到的目標,以此為指導,我們便能對多種技術進行合理的選擇。
2 軟件工程運用數據挖掘技術的方法
隨著計算機的發展以及網絡的普及,人們逐漸步入了信息的時代,在這樣一種時代背景之下,人們對數據產生了更多的需求,而數據在很大程度上表現出多而雜亂的特點,這無疑給信息的查找以及提取帶來了困難。為了滿足人們的需求,數據挖掘技術逐漸發展起來,隨著數據挖掘技術的逐漸完善,網絡科學技術也得到了長足的發展;另一方面,網絡科學技術隨著時代的進步也在不斷地發展,網絡科學技術的發展使得信息數量逐漸增多,這也為數據挖掘技術的產生以及發展提供了基礎。
2.1 挖掘執行記錄
挖掘執行記錄在軟件工程中屬于數據挖掘的領域,具體指的是根據分析程序的執行路徑找到其與程序代碼之間的關系,用逆向的方式找到軟件程序與各個模塊代碼之間的關系,以此達到維護整體程序的目的。就目前來看,挖掘執行記錄在長久以來雖然取得了一定的成效,但是,對其評價標準卻缺少明確的規定,大家對它的評價不夠完整并且不成體系。另外,現階段信息數量多而雜亂,在對信息的表述上也不夠統一,軟件開發商很難做到對各種表達方法進行對比,因此也難以用定量的方法對數據進行分析。
2.2 檢測軟件漏洞
軟件漏洞的問題一直以來是大家都比較關注的問題。一旦軟件出現漏洞,將給企業帶來不可估量的損失,數據挖掘技術在軟件工程中應用時,要注意對軟件漏洞的檢測以及及時修補,這也是提高軟件工程可靠性以及安全性的重要措施。在進行軟件漏洞的檢測過程中還要對其安全性能進行相應的評估,對于一些軟件威脅病毒要及時地發現,并做好相應的清理工作。同時,還要做好相應的安全防護工作,采用多種模態進行軟件運行狀態的監控,避免重要信息和參數被侵犯。
2.3 挖掘版本控制信息
挖掘版本控制信息在軟件開發中也有不可小覷的作用,就目前來講,開發商在對軟件進行開發時,一般會采用版本控制系統對開發過程進行系統管理以及系統保護。挖掘版本控制信息在軟件工程中屬于數據挖掘領域。它主要的目的是保證軟件的安全性和可靠性,對系統全局性的更新奠定基礎。同時,在進行信息的控制過程中需要對其信息進行相應的維護。要采用多種方式保證信息的安全和信息的正確。從而實現版本信息的有效控制。
2.4 挖掘開源軟件
挖掘開源軟件在軟件工程的開發中具有明顯的優勢,它與前三者不同,具有其自身獨特的優勢,其特征包括開放性、全局性和動態性。由于其自身所具有的特點,在對該類軟件進行開發時要注意同傳統的軟件區分開來,根據該軟件自身的特點對其進行開發,采取適當而又有效的策略和方法。在進行軟件的挖掘以及開發的過程中需要結合軟件工程的主題進行相應地開發,避免開發出來的軟件不具備一定的實用性。與此同時,在進行軟件開發的過程中還要挖掘開源軟件,其要順應時代發展的特點,與市場發展趨勢相互結合,讓開發的軟件的應用效率得到完滿的提升。
3 軟件工程中程序代碼的挖掘
3.1 克隆代碼的檢測
在進行程序代碼的挖掘過程中,其原創的可能性較低。通常會采用克隆代碼的檢測,獲取相應的核心數據,然后對代碼進行粘貼以及拷貝。之后需要結合企業的實際需要,對數據代碼進行小幅度的調動,從而達到相應的檢測效果。其檢測是為了避免故障的拷貝傳播這樣的不利情況發生,而且對其檢測還能對軟件進行演化這個過程里起到不錯的維護作用,基本上可以說克隆代碼檢測這樣的存在已經是軟件工程這個大領域中最先的數據挖掘需求,目前大概可以整理出四種比較常用的方式,分別為基于文本對比、標識符對比、度量、程序結構的方法。其也可以利用Hash函數這樣的一項技術對字符進行相應的變化,從而達到相應的代碼檢測效果。
3.2 Aspect挖掘
在進行挖掘的過程中,其通常也需要對其Aspect數據進行挖掘。其主要是對程序的一種構造模式。在進行數據的挖掘過程中,其通常需要對各個關注點之間的數據進行相應的分析。同時,對不同的代碼進行相應的分類,構造出較為合適的代碼數據,讓信息節點之間能夠得到有效地傳遞。比如基于度量分析或者是形式概念分析等這類相對而言具有很強針對性的方法。這種方法能夠讓數據更加具有應用性實質效果。因此,Aspect挖掘在軟件工程中的應用十分廣泛。
4 結語
軟件工程運用數據挖掘技術具有十分深遠的意義。在進行挖掘技術的應用過程中,首先需要對挖掘的內容進行有條理的分析。同時還要應用數據挖掘的方法,對其各種執行記錄、軟件防護、信息控制以及開源軟件進行全面的探討。最后需要對軟件的程序代碼進行檢測和Aspect挖掘,從而實現軟件工程中挖掘技術的應用價值。
參考文獻
[1] 欒家明.數據挖掘技術在網上銀行促銷活動中的運用[J].電子世界,2016(11):15-23.
[2] 李家兵.數據挖掘技術在工業上的應用[J].湖南城市學院學報:自然科學版,2016(3):69-72.
[3] 曾倩倩.數據挖掘技術在計算機犯罪取證中的應用[J].通訊世界,2016(12):55-58.
[4] 杜立斐.數據挖掘技術在電力營銷系統中的應用[J].中國高新技術企業,2016(21):49-56.