摘要:隨著科技的進步,信息時代的發展,數據庫在各行各業得到了廣泛的應用。數據庫中存儲著大量的信息,提供給人們查閱、編輯、保存等功能。如何能使數據庫信息的利用率達到最大化,對其進行快速充分的利用,逐漸成為人們研究的重點。目前數據挖掘技術在大數據分析中有著舉足輕重的地位,基于此,本文主要分析數據挖掘技術在軟件工程中的應用,以其能夠產生借鑒作用。
關鍵詞:數據挖掘技術 數據庫 軟件工程 應用
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2016)10-0072-01
數據挖掘技術是保證數據可靠性和安全性的重要基礎,是提升軟件工程應用效用的重要基底,需要引起人們的重視和關注。因此,探究當前數據挖掘技術在軟件工程中的應用策略,提升數據挖掘技術的應用效能,對于軟件工程的優化和管理來說具有深遠意義。
1 數據挖掘所涵蓋的內容
數據挖掘的研究所涵蓋的內容多種多樣,但是究其根本主要包括以下幾個方面:首先,開發專用數據挖掘系統。針對不同的處理信息任務開發出不同的數據挖掘系統,一個完善的數據挖掘系統可以在不同數據庫下工作,所以開發出一個完善的數據挖掘系統顯得尤為重要。其次,挖掘系統運行算法能夠高效率運行。數據挖掘的功能是為了能夠節省時間,提高工作效率,其最主要功能的實現都需要建立在極快運行速度之上,這就要求數據挖掘系統所使用的算法必須高效率,從而使得工作時間可以被接受。第三,確保數據挖掘結果準確性、有效性。數據挖掘的結果必須達到用戶所需要的目的,相關數據按規則現實,不相關數據抑制顯示,相近數據提示顯示。第四,可視化的挖掘結果。所得到的數據必須清晰易懂,不需要在用任何解碼方式對其進行處理,數據挖掘的結果通過可視化的過程予以展現。第五,多層次數據挖掘。在數據庫中許多數據都屬于動態變化,或者是以交互的形式存在的,這就要求數據挖掘系統具有多層次性,動態搜索的特點才能對數據庫進行不同角度的挖掘。第六,多數據庫挖掘。許多數據庫通過Internet技術相連接起來,開發出通過Internet技術的數據挖掘方法可以在不同數據庫中挖掘出所需數據。第七,數據挖掘的安全性。網絡和黑客的存在,讓數據挖掘面臨著極大的風險,所以要提高數據挖掘過程中的安全性,防止泄露個人信息,保證數據的可靠有效。
2 數據挖掘在軟件工程中的應用
2.1 建立數據信息軟件
2.1.1 數據倉庫系統
數據倉庫是面向主體的、集成的、穩定的數據集合,通過“倉庫構建”來支持經營管理中的決策制定過程。這一過程主要包括以下幾個階段:一是源數據階段:此階段主要是對歷史數據、當前數據和綜合數據進行收集。二是源數據預處理階段:其主要包括關系數據庫、軟件數據文檔和其他。三是進入倉庫管理階段:主要包括數據倉庫管理工具、抽取、轉換、裝載、元數據庫和數據建模工具。四是知識基DM分析工具:分類分析工具、聚類分析工具、關聯分析工具和序列分析工具。五是可視化的軟件領域知識:揭示影響軟件質量的必然因素。五個方面構成整個數據倉庫管理系統。
2.1.2 數據倉庫建模
數據倉庫建模主要將已有的數據歸納一起,建立一個合理的數據資源庫。這些信息包括客戶需求信息、客戶評估信息、軟件系統信息、可行性研究報告。首先,需要將客戶所需要的信息進行匯總整理,從而做好系統功能、界面、數據等方面的確定。其次,客戶評估信息主要是應用軟件測試,(其中包括動態測試,也包括靜態測試,形式化測試)獲得相應的評估信息,將其與客戶所需要的信息進行匯總,權衡軟件在應用中的質量,從中尋找可能存在的錯誤,并對其進行修改。第三,軟件系統信息是軟件應用的基礎,其主要包括系統的規模、范圍、總體要求,以及所需要的支撐環境。第四,可行性報告主要指的是其是否具有運行的可行性,技術、經濟、法律、使用是否能夠達到需要的目的。
2.2 對集成軟件信息數據倉庫進行信息挖掘
2.2.1 聚類分析發現
通過某些相似的需求將某一些客戶分成一組成為聚類,使客戶的信息更容易被開發人員了解,以便于提供更高服務水平,和滿意的服務。將某些客戶聚類為一組,可以專門為其要求開發出具有特別功能的軟件,通過聚類分析,可以對客戶的軟件應用情況進行有甄別性的觀察,從而讓軟件達到一種很好的使用效果。
2.2.2 分類分析的發現
與聚類完全不同,分類分析是通過已經標記的特點進行數據分類。分類就是為了通過記錄表現來方便的描述這一類數據所具有的特點。分類分析主要應用于決策樹、神經網絡和徑向基礎函數等軟件中。分類分析的結果可讓我們在數據庫的設計過程中更有針對性,可以通過軟件對所應對的客戶進行屬性劃分,針對不同的客戶提供不同的服務或者保護。
2.2.3 序列分析的發現
序列分析是完全獨立的一種分析算法,其區別于以上兩種算法。這類算法主要是根據數據的序列或者事件進行檢測。由于不同的客戶要求同一軟件為其提供的功能一般不同,因此,軟件分析人員就可將客戶按其所傾向需求的功能模式進行分類。例如當客戶使用到某一軟件的特定功能時,檢索功能就會根據計算機用戶的需求進行提示,詢問是否按照計算機算法分析出的需求來進行下一步的搜索操作。
3 結語
數據挖掘技術在軟件開發過程中有著廣泛的應用前景,但是國內對此技術的研究僅僅在理論研究階段,需要通過對其深化讓其發揮更大的價值。只有不斷探索研究,才能夠讓數據挖掘技術在軟件工程中的應用變得更加成熟可靠,并在更加廣泛的其他領域中得到更加優異的表現。
參考文獻
[1]馬保平.關于對軟件工程中的數據挖掘技術的探討[J].電子技術與軟件工程,2015,19:196-197.
[2]徐賜發.數據挖掘在軟件工程領域中的應用淺析[J].電子技術與軟件工程,2014,19:206.
收稿日期:2016-08-12
作者簡介:孫曉迎(1987—),女,漢,山東龍口人,大學本科,中級,研究方向:工程類。