摘? 要:在信息化時代背景下,傳統(tǒng)的信息系統(tǒng)已經無法滿足軟件工程對信息數據傳輸與存儲的高要求,人們應用數據挖掘技術能夠解決這一問題,并保證信息數據的準確性。基于此,本文以數據挖掘技術作為研究對象,結合技術概述分析其應用在軟件工程的重要性,從系統(tǒng)結構、軟件開發(fā)與管理等方面闡述數據挖掘技術的實踐應用。
關鍵詞:數據挖掘技術;軟件工程;數據預處理
中圖分類號:TP311.13? ? ? ?文獻標識碼:A 文章編號:2096-4706(2019)15-0017-02
Application Analysis of Data Mining Technology in Software Engineering
ZHANG Wei
(Guizhou Light Industry Technical College,Guiyang? 550025,China)
Abstract:Under the background of information age,traditional information systems can no longer meet the high requirements of software engineering for information data transmission and storage. People applying data mining technology can solve this problem and ensure the accuracy of information data. Based on this,this paper takes data mining technology as the research object,and analyzes the importance of its application in software engineering with the technical overview,and expounds the practical application of data mining technology from the aspects of system structure,software development and management.
Keywords:data mining technology;software engineering;data preprocessing
0? 引? 言
隨著我國信息技術的進步,數據挖掘技術得到廣泛應用,在軟件工程中需要對數據信息進行搜集、分類與整理,通過數據挖掘技術的應用可以有效提高工作效率,推動軟件工程的有序發(fā)展。我國對數據挖掘技術的應用與研究雖然處于初級階段,但通過不斷的經驗積累也能夠發(fā)揮技術的更多價值。
1? 數據挖掘技術概述
數據挖掘技術指的是在信息技術發(fā)展背景下,對信息數據展開處理的技術。與過去的信息處理技術相比,數據挖掘技術功能更加強大,可以應用在各個領域,無論是數據處理、數據轉換還是數據分析,都能夠完成相互之間的聯(lián)系,并對數據進行最終評估。將數據挖掘技術應用在軟件工程中,能夠提高企業(yè)處理信息數據的效率,避免操作失誤,保護企業(yè)數據準確[1]。
2? 數據挖掘技術在軟件工程中的重要性分析
2.1? 高效整合多樣化信息數據
由于數據挖掘技術的功能比較多,其中包含了傳統(tǒng)處理技術的功能,實現多樣化信息的收集與分類,并將數據按照類別存儲與整理。數據挖掘技術可以在多樣化數據中實現數據的系統(tǒng)化管理,為人們進行數據查閱工作帶來方便。在軟件工程中應用該技術,方便信息數據的高效整合,幫助企業(yè)全方位了解信息與數據[2]。
2.2? 保證信息數據的準確率
數據挖掘技術擁有強大數據運算功能,以往的數據信息系統(tǒng)運算數據時需要耗費大量時間與成本。如果信息數據體系龐大,系統(tǒng)運算時會面臨癱瘓問題。在軟件工程中,一旦系統(tǒng)發(fā)生癱瘓,系統(tǒng)將無法正常使用,數據也會受到破壞。應用數據挖掘技術之后可以有效解決以上問題,實現系統(tǒng)的優(yōu)化,使系統(tǒng)可以在最短時間內處理數據,防止信息數據發(fā)生丟失現象,提高數據處理的時效性。面對大量的信息數據,有的數據得不到利用,但長期處于系統(tǒng)中會影響系統(tǒng)運行效率,應用數據挖掘技術可以將無價值的數據剔除,留下有用的信息數據,保證系統(tǒng)的運行效率和數據質量。
2.3? 縮短信息數據處理時間
在軟件工程中應用數據挖掘技術可以分類處理雜亂無章的數據,實現數據的轉換與調用。對數據進行深入挖掘處理時也可以應用數據挖掘技術進行數據的分類,并對模糊數據及時清理,提高系統(tǒng)內現存數據的實用價值。人們獲取到的信息數據需要進行反復核對,以此保證數據真實性,通過數據挖掘技術的應用減少時間浪費,提高數據核對效率。
3? 數據挖掘技術在軟件工程中的應用分析
3.1? 系統(tǒng)結構
數據挖掘技術應用流程主要分為三個階段:數據預處理、數據挖掘、模式評估與知識表示。在數據預處理階段中,高效得到原始數據的根本原因在于確定任務處理對象,得到符合軟件工程需求的數據。通過數據清洗彌補原始數據存在的缺陷,確保數據的完整性。數據抽取需要從數據庫中選擇與軟件工程任務相符合的信息。數據轉換需要將數據格式加以轉化,實現數據的適用性。在數據挖掘中需要制定一定的挖掘任務,通過對數據的分類與評價總結,合理應用運算方法進行數據推敲。在模式評估與知識表示中,其實際用途在于挖掘成功的表達,將興趣度作為衡量標準,提高數據表達的識別能力。
針對軟件工程中數據挖掘技術的優(yōu)化應用,可以從系統(tǒng)結構方面入手,具體如下:(1)檢測軟件工程中的克隆代碼。以軟件工程為標準,將一部分代碼復制,結合實際情況更改一部分代碼,并對這些代碼進行檢測,代碼檢測與更改可以同時進行,能有效提高檢測效率,實現系統(tǒng)的維護工作。當前應用數據挖掘技術進行克隆代碼檢測的方式一共有四種,具體為比較標識符、對比文本、檢測系統(tǒng)程序結構與度量圈。在實際操作中,要求人們結合實際情況選擇相應的克隆代碼檢測方法。(2)數據信息挖掘法。這是以橫切關注點為主的挖掘方法,在軟件工程中應用該方法可以改造系統(tǒng),對數據信息達到良好的處理效果[3]。
3.2? 軟件管理
為了讓數據挖掘技術更好地應用在軟件工程中,需要從軟件管理角度入手,采用以下兩方面舉措。一方面,深入挖掘數據的組織關系,另一方面,挖掘版本控制信息。軟件工程系統(tǒng)比較繁瑣,挖掘組織關系時較為困難,人們需要合理調配各項信息,以此作為挖掘的依據。如果以軟件工程管理流程作為主題,對電子郵件與共享文件展開組織關系挖掘,可以有效避免系統(tǒng)流程發(fā)生混亂,保護軟件管理的秩序。當信息數據發(fā)生變化時,應用數據挖掘技術進行軟件管理,將版本控制作為重要依據,將數據挖掘技術與版本控制相聯(lián)系,降低系統(tǒng)運行成本,并達到警示的效果,提高軟件工程的管理水平。
3.3? 軟件開發(fā)
在軟件工程初期階段,人們將數據挖掘技術看成數據庫,隨著技術的發(fā)展,軟件工程發(fā)展到現實應用,系統(tǒng)和現實共同發(fā)展。軟件工程將各項指標與要求緊密結合,研發(fā)出最新產品,以往的軟件工程中軟件開發(fā)十分困難,而如今應用數據挖掘技術,可以將其與數據庫相融合,發(fā)揮數據庫內信息的最大價值,有效推動軟件開發(fā)的進步。不僅如此,軟件工程可以對信息進行更深層次的挖掘,充分發(fā)揮軟件工程的價值,利用數據挖掘技術實現數據的更新,保證軟件開發(fā)質量,優(yōu)化軟件操作流程。在技術的支持下,人們可以合理劃分軟件內部,方便及時發(fā)現問題,并展開積極有效的問題處理。利用數據挖掘技術可以進行網站設計,對網站內容進行挖掘,特別是對文本內容的挖掘,隨后整合網站信息,通過自動歸類技術實現信息的層次性組織。在軟件或網站管理中,應用數據挖掘技術可以根據用戶對網站的訪問記錄,進行記錄信息挖掘,從中了解用戶對該網站內容的興趣,進而對用戶提供信息推送服務和定制服務,以此吸引更多用戶訪問該網站。
在軟件開發(fā)階段,可以使用Data Analytics輕量級業(yè)務數據可視化分析平臺,這是數據挖掘技術的一項成果。該平臺能夠實現異構數據源的高效整合,可以兼容各種數據源類型,支持海量數據。可接入Excel/CSV等數據文件、企業(yè)各種業(yè)務系統(tǒng)、第三方互聯(lián)網數據、公共數據服務平臺等來源,輕松整合所有相關業(yè)務數據,幫助企業(yè)消滅數據孤島。企業(yè)利用該平臺可以完成數據的深度交互分析,Data Analytics基于探索式分析,支持智能推薦圖形與圖表,二者可以協(xié)同過濾,幫助用戶快速定位,通過數據挖掘找出問題,以拖拽式操作方法解決問題。
3.4? 聚類
在數據挖掘技術中聚類指的是對各個環(huán)節(jié)數據加以分析,結合軟件工程的具體要求實現數據細化,以類型細化作為基礎,為原始數據類型做出保障。通過聚類可以讓同種類型數據具有相似性特點,在存在相似性的同時,也存在一定的差異,突出各自的特點。應用數據挖掘技術實現聚類劃分時,面對的對象無法預測,與其他算法相比,聚類擁有更加廣泛的應用范圍,進行數據分析時更加獨特,挖掘信息數據時可以確保檢測結果的有效性與真實性。
4? 結? 論
總而言之,隨著信息技術的深入發(fā)展,人們已經步入信息時代,數據挖掘技術也成為對信息數據展開處理和存儲的有效方式。在軟件工程中應用數據挖掘技術,有利于提高軟件開發(fā)效率,提升軟件管理質量,加強數據挖掘力度,使數據挖掘技術發(fā)揮巨大效果,人們可以應用數據挖掘技術完成數據的聚類和網站設計,為人們的生活帶來便利。
參考文獻:
[1] 張立鑒.數據挖掘技術在軟件工程中的應用研究 [J].網絡安全技術與應用,2019(6):47-48.
[2] 王祥順.數據挖掘技術在軟件工程中的實踐與探索 [J].電腦編程技巧與維護,2019(4):82-83+100.
[3] 吳金玲.數據挖掘技術在軟件工程中的應用 [J].產業(yè)創(chuàng)新研究,2019(3):115-116.
作者簡介:張瑋(1981.10-),女,土家族,貴州銅仁人,本科,講師,研究方向:計算機科學與技術。