王煒
【摘要】 改革開放以來,我國的綜合國力在不斷的壯大,經濟社會也在不斷的發展,各行各業隨著經濟的積累也在不斷發展。計算機技術和信息技術的發展也突飛猛進。信息的總數在不斷的上升,為了更好的對數據進行統計,一些新的數據統計的方式應勢而生。為能更方便提取有效數據的工作起了推進的作用。本文將對遺傳算法在數據中的應用進行全面的分析和研究。希望可以對數據的統計和提取有效數據的工作在日后的工作中起到借鑒性的作用。
【關鍵詞】 遺傳算法 數據挖掘 應用 研究
引言
計算機技術的不斷發展,信息技術的不斷進步,使得數據庫中的數據越來越多,越來越細,也越來越雜亂。想要在這么多繁雜的數據中,快速有效的提取出有用的數據信息。傳統的數據的提取方式已經不能再適應科學技術的進步和發展,數據挖掘的出現,正好彌補了數據在提取過程中的這一缺點[1]。數據挖掘可以從大量繁雜的數據中,提取出一些有用的數據,大大減少了在數據提取工作中的時間消耗。提高了工作效率的同時,節約的工作時間。
一、數據挖掘的現狀研究
近幾年來對數據挖掘的研究主要集中在幾個問題上。一是研究專門用于挖掘知識方面的數據的形式化語言。二是對不同類型的數據進行處理工作,主要是對相互關聯的數據和一些較為復雜的數據進行挖掘時的研究工作。三是對此題目研究興趣的分析研究。四是對數據庫中不同類型的數據的挖掘工作的研究。五是對不同數據算法的研究,目前主要且常用的數據算法有:并行式的算法、分布式的算法和增量的挖掘研究。六是對數據挖掘結果的研究。
二、遺傳算法的現狀研究
目前在對遺傳算法的研究主要集中在四個大問題上。其一是研究有關于遺傳算法的理論,遺傳算法理論的主要內容包括:影響算法的有關設置,有關的專業數學統計解釋等。其二是遺傳算法的改進,在不斷發展的技術進步的影響下,遺傳算法的方式也需要不斷的隨之改進,能更好的在龐大數據中進行計算分析[2]。其三是研究,并行化的遺傳算法,這一問題的研究對遺傳算法的發展有具有重要意義。其四是研究遺傳算法與其他技術能否混合使用,這一研究的目的是為了提高其工作的速度,節省工作時間。
三、遺傳算法與數據研究之間的關系
數據挖掘與遺傳算法之間是相互包含的關心,數據挖掘包含遺傳算法,遺產算法是數據挖掘中眾多算法中的一種,但是是最主要的一種。由于遺傳算法的重要性和在數據挖掘中所占有的重要地位,遺傳算法適應的范圍越來越廣,有關技術部門對其的重視程度也隨之增加。遺傳算法在諸多方面得到應用,逐漸成為了數據挖掘領域中,新的具有重要意義的研究性課題。
四、數據挖掘的應用
數據挖掘已經運用到越來越多的行業當中,數據挖掘應用的工作也得到了很好的落實。但是在數據挖掘實際應用的過程中還是存在著一些問題。數據挖掘應用的領域越廣泛,受到的挑戰就越大。這些挑戰分別體現在不同領域的運用中。例如生物學領域的數據挖掘,金融領域的數據挖掘,電信領域的數據挖掘等諸多方面。由于這些領域的數據都比較繁雜,所以挖掘的工作就會不同程度的存在一些難度問題。
五、遺傳算法中存在的不足
遺傳算法雖然是數據挖掘中最主要的算法之一,但是遺傳算法本身還是存在著一定的不足方面。在遺傳算法進行工作中,如果算法的工作目標不確定,就會影響遺傳算法的工作進行,減低遺傳算法的工作效率[3]。遺傳算法由于受到一定模式的影響,在對較多相似的數據進行提取時可能會影響遺傳算法的工作速度,遺傳算法的靈活能力較低。在對參考數據的設置過程中理論依據不完善,容易造成在進行數據的運算過程中不能較快、較好的找到可以參考的數值,延誤數據運算的工作。
六、遺傳算法在數據挖掘中的應用分析
數據挖掘主要是對一些數據量大,且種類多,相似度高數據進行的提取有效數據的過程和對有效數據的計算過程,為了更好的達到這個目的。就要對數據挖掘中最主要的計算方式,遺傳算法進行完善和創新,只有不斷的完善,總結出最科學的算術系統,才能更好的完成大量數據運算的工作。
七、結語
通過上文的分析,可以看出,數據挖掘在對數據進行提起的工作中的運用越來越廣泛。數據挖掘較傳統的數據提取方式來說,具有許多優勢。數據挖掘的工作時間更短、提取數據的速度更快、工作效率更高等這些是數據挖掘的優勢之處。
為了更好的利用數據挖掘,就要求相關人員在以后的工作中能更加注重數據挖掘這方面的研究。希望本文的分析能對以后的研究工作起到借鑒作用,為以后的研究工作打下良好的數據基礎。
參 考 文 獻
[1]劉建華,王勇,洪月好.遺傳算法編碼設計及其在數據挖掘中的應用[J].上海電力學院學報,2005,(03):244-248.
[2]王淑靜,賈兆紅,王亮等.遺傳算法在決策支持系統和數據挖掘中的應用[J].計算機技術與發展,2006,(08):35-37.
[3]李智玲,張亦軍,胡彧.基于粗糙集的遺傳算法在數據挖掘中的應用[J].科技情報開發與經濟,2009,3(09):127-129