摘 要:隨著互聯(lián)網(wǎng)科技的飛速進(jìn)步,經(jīng)濟(jì)全球化的進(jìn)程也逐步加快。網(wǎng)絡(luò)技術(shù)的開(kāi)發(fā)也應(yīng)用也在逐步的完善,同時(shí)其應(yīng)用范圍也涉及到了社會(huì)、生活和工作的方方面面。現(xiàn)今的企業(yè)發(fā)展和經(jīng)濟(jì)進(jìn)步也已經(jīng)離不開(kāi)網(wǎng)絡(luò)技術(shù)的應(yīng)用。數(shù)控挖掘技術(shù)是網(wǎng)絡(luò)技術(shù)中應(yīng)用中最為普遍的一項(xiàng)。隨著信息技術(shù)的高速發(fā)展,人們積累的數(shù)據(jù)量急劇增長(zhǎng)。如何從海量的信息數(shù)據(jù)中提取有用的知識(shí)成為當(dāng)務(wù)之急。下面就網(wǎng)絡(luò)的數(shù)據(jù)處理技術(shù)進(jìn)行分析。
關(guān)鍵詞:網(wǎng)絡(luò)技術(shù) 數(shù)據(jù)挖掘技術(shù) 信息存儲(chǔ)
一、數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)中的定義
數(shù)據(jù)挖掘是在大量的、不完整的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、未知的、有用的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘技術(shù)可以通過(guò)技術(shù)處理在復(fù)雜的環(huán)境中提取出自己所需的重要信息。這樣能夠?qū)?fù)雜多樣化的儲(chǔ)備信息進(jìn)行針對(duì)性的分類(lèi)和利用,對(duì)信息方便管理和存儲(chǔ)。數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)分析,主要包括關(guān)聯(lián)分析、聚類(lèi)分析、分類(lèi)、預(yù)測(cè)、時(shí)序模式和偏差分析等等。其中關(guān)聯(lián)分析是指兩個(gè)或者兩個(gè)以上變量的取值之間存在的某種規(guī)律性,數(shù)據(jù)關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)絡(luò)參數(shù)得以充分利用。而聚類(lèi)分析和其他幾個(gè)類(lèi)型的分析通常都是通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)信息和知識(shí)進(jìn)行宏觀的分類(lèi),在每個(gè)類(lèi)型中再進(jìn)行細(xì)化的分析。這樣可以使數(shù)據(jù)更加立體化和細(xì)致化,方便管理和及時(shí)利用。
二、數(shù)據(jù)挖掘技術(shù)的應(yīng)用方法
數(shù)據(jù)挖掘技術(shù)在實(shí)踐中的應(yīng)用主要包括神經(jīng)網(wǎng)絡(luò)方法、遺傳算法、決策樹(shù)法、粗集方法、覆蓋正例排斥反例法、統(tǒng)計(jì)分析法、模糊集法等。(1)神經(jīng)網(wǎng)絡(luò)方法主要以感知機(jī)、bp反向傳播模型、函數(shù)型網(wǎng)絡(luò)為代表的應(yīng)用模型,神經(jīng)網(wǎng)絡(luò)本身就具有良好的適應(yīng)性和自主性。在處理、分布存儲(chǔ)和高度容錯(cuò)等特性上非常適合解決數(shù)據(jù)挖掘問(wèn)題。(2)遺傳算法是一種基于生物自然選擇與遺傳機(jī)理的隨機(jī)搜索算法,易于和其他模型結(jié)合應(yīng)用。例如對(duì)飛機(jī)上失事后的真實(shí)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,遺傳算法在實(shí)際應(yīng)用中比較便捷有效。并且可以與神經(jīng)網(wǎng)絡(luò)、粗集等技術(shù)進(jìn)行結(jié)合應(yīng)用。遺傳算法對(duì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化有一定的效果,可以在不增加錯(cuò)誤率的前提下刪除多余的鏈接和隱居單元。(3)決策樹(shù)法經(jīng)常被用于對(duì)某應(yīng)用或者軟件等方案實(shí)踐前的預(yù)測(cè)。它可以將大量的數(shù)據(jù)進(jìn)行有規(guī)律的分類(lèi),再?gòu)闹姓页鲇袃r(jià)值的潛在的有利信息。它的優(yōu)點(diǎn)是簡(jiǎn)單,分類(lèi)快速,更加適合較大規(guī)模的數(shù)據(jù)處理。隨著網(wǎng)絡(luò)時(shí)代的發(fā)展,網(wǎng)絡(luò)技術(shù)也促進(jìn)了人腦思維的創(chuàng)新。決策樹(shù)法也隨著時(shí)代的發(fā)展不斷改善著。(4)粗集方法是針對(duì)不確定性、不明確性的知識(shí)的教學(xué)工具。它的優(yōu)點(diǎn)在于算法相對(duì)比較簡(jiǎn)便,很容易操作。它的缺點(diǎn)在于在連續(xù)屬性上的處理不能夠直接進(jìn)行,而實(shí)踐中現(xiàn)實(shí)屬性是普遍存在的。所以,粗集方法也正在隨著日新月異的市場(chǎng)要求而改變。(5)覆蓋正例排斥反例方法是通過(guò)覆蓋所有的正例,排斥所有反例的思想尋找規(guī)則。它比較適合對(duì)確定性的實(shí)例。(6)統(tǒng)計(jì)分析方法是指,利用統(tǒng)計(jì)分析的方法對(duì)數(shù)據(jù)庫(kù)中的信息進(jìn)行分析,比如求數(shù)據(jù)庫(kù)中針對(duì)數(shù)值的最大值、最小值、總和、平均值等等。(7)模糊集方法,是利用模糊集合理論對(duì)實(shí)際問(wèn)題進(jìn)行模糊評(píng)判、模糊決策、模糊模式識(shí)別和模糊聚類(lèi)分析等。系統(tǒng)的模糊性取決于它的復(fù)雜程度。
三、數(shù)據(jù)挖掘技術(shù)的應(yīng)用流程
在網(wǎng)絡(luò)環(huán)境下,數(shù)據(jù)存儲(chǔ)的數(shù)量、類(lèi)型和范圍都是比較廣泛的。因而在數(shù)據(jù)挖掘技術(shù)應(yīng)用時(shí)就要先對(duì)數(shù)據(jù)進(jìn)行大致的定義,首先清晰的定義出業(yè)務(wù)問(wèn)題,確定數(shù)據(jù)挖掘的目的。然后進(jìn)行數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)準(zhǔn)備就是在大型的數(shù)據(jù)庫(kù)中提取數(shù)據(jù)挖掘的目標(biāo)數(shù)據(jù)庫(kù),然后進(jìn)行數(shù)據(jù)加工刪除無(wú)效的數(shù)據(jù)。其次,根據(jù)數(shù)據(jù)功能的類(lèi)型和特點(diǎn)選擇相對(duì)應(yīng)的算法,以進(jìn)行針對(duì)性的數(shù)據(jù)挖掘。最后,進(jìn)行結(jié)果分析,對(duì)挖掘出的數(shù)據(jù)進(jìn)行解釋和評(píng)價(jià),以轉(zhuǎn)變成為用戶(hù)能夠理解的信息。然后將這些信息集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中。完成數(shù)據(jù)挖掘技術(shù)的實(shí)踐應(yīng)用。
四、網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)的局限性
在網(wǎng)絡(luò)環(huán)境下,市場(chǎng)對(duì)數(shù)據(jù)有著更高的敏感度和要求,數(shù)據(jù)挖掘并不是萬(wàn)能的,它只是一個(gè)工具。在數(shù)據(jù)挖掘技術(shù)應(yīng)用的前期需要對(duì)涉及業(yè)務(wù)進(jìn)行初步了解和預(yù)測(cè)。在應(yīng)用中,它也只是在幫助我們更深入的分析數(shù)據(jù),并無(wú)法給出一個(gè)確定的目標(biāo)方案,而通過(guò)數(shù)據(jù)挖掘出的結(jié)果必須要通過(guò)驗(yàn)證才能夠進(jìn)行采納。因?yàn)閿?shù)據(jù)挖掘技術(shù)是針對(duì)于數(shù)據(jù)庫(kù)信息的應(yīng)用技術(shù)。它的準(zhǔn)確性受到數(shù)據(jù)庫(kù)信息的制約,數(shù)據(jù)庫(kù)信息的存儲(chǔ)必須確定正確無(wú)誤才能夠保證數(shù)據(jù)挖掘技術(shù)應(yīng)用后得出的結(jié)果分析是正確的。雖然大數(shù)據(jù)時(shí)代的來(lái)臨代表著網(wǎng)絡(luò)技術(shù)可以在各個(gè)領(lǐng)域施展,但單純的只利用科學(xué)技術(shù)根本不能夠解決復(fù)雜多變的數(shù)據(jù)環(huán)境。所以,在高明的科學(xué)技術(shù)也離不開(kāi)經(jīng)驗(yàn)豐富的人腦操作。在人腦和高技能技術(shù)的共同協(xié)作下才能夠信息的真實(shí)性、可靠性、正確性有所保障。
五、數(shù)據(jù)挖掘的發(fā)展趨勢(shì)
近十幾年來(lái),數(shù)據(jù)挖掘已經(jīng)得到了廣泛的研究。并在商業(yè)、金融、醫(yī)療等眾多領(lǐng)域得到了成功的應(yīng)用。但是在網(wǎng)絡(luò)時(shí)代快速發(fā)展和大數(shù)據(jù)時(shí)代全面覆蓋的情況下,現(xiàn)有的信息挖掘技術(shù)顯然不能夠經(jīng)受大數(shù)據(jù)時(shí)代的考驗(yàn)。因此,數(shù)據(jù)挖掘還有很大的提升空間。數(shù)據(jù)挖掘技術(shù)是人們長(zhǎng)期對(duì)數(shù)據(jù)庫(kù)技術(shù)進(jìn)行研究和開(kāi)發(fā)的結(jié)果。起初只是對(duì)數(shù)據(jù)庫(kù)的存儲(chǔ)和分類(lèi)進(jìn)行研究,后來(lái)逐漸升級(jí)為對(duì)數(shù)據(jù)庫(kù)的信息進(jìn)行即時(shí)性的分辯和甄選。數(shù)據(jù)挖掘使數(shù)據(jù)庫(kù)技術(shù)進(jìn)入了一個(gè)更為高級(jí)的階段。數(shù)據(jù)挖掘的核心模塊技術(shù)歷經(jīng)了數(shù)十年的發(fā)展,但隨著時(shí)代的變遷和人們思想的進(jìn)步,數(shù)據(jù)挖掘技術(shù)也在不斷的被改進(jìn),爭(zhēng)取通過(guò)數(shù)據(jù)挖掘技術(shù)的應(yīng)用省去人工操作,這樣更有利于企業(yè)和社會(huì)的高效性,進(jìn)而促進(jìn)了社會(huì)和經(jīng)濟(jì)的飛速發(fā)展。
六、結(jié)語(yǔ)
綜上所述,根據(jù)對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用范圍和應(yīng)用方法進(jìn)行了解分析,我們可以看到數(shù)據(jù)挖掘是各領(lǐng)域?qū)嵺`應(yīng)用中不可或缺的部分。它的應(yīng)用可以有效的將數(shù)據(jù)庫(kù)內(nèi)的有效信息進(jìn)行提取,減少繁瑣的人工處理步驟。在復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)下,信息的產(chǎn)生和處理有較高的要求,高效率的信息處理技術(shù)可以給運(yùn)營(yíng)軟件加速,減少不常用信息的內(nèi)存占用,也給信息挖掘做好了鋪墊。數(shù)據(jù)挖掘技術(shù)將在未來(lái)發(fā)展中不斷進(jìn)行改革,配合人腦的經(jīng)驗(yàn)值應(yīng)用,更加便捷有效的完成數(shù)據(jù)處理。為商業(yè)、金融、醫(yī)療、教育等方面的蓬勃發(fā)展提供了有利的條件。
參考文獻(xiàn):
[1]郭春. 基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)入侵檢測(cè)關(guān)鍵技術(shù)研究[D].北京郵電大學(xué),2014.
[2]胡領(lǐng). 數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)入侵檢測(cè)中的應(yīng)用研究[D].寧夏大學(xué),2014.
[3]常凱. 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘分類(lèi)算法比較和分析研究[D].安徽大學(xué),2014.
[4]尚志遠(yuǎn). 基于數(shù)據(jù)流挖掘分析的網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)研究[D].山東大學(xué),2012.
[5]程建平. 基于網(wǎng)絡(luò)化數(shù)據(jù)挖掘技術(shù)的銀行間資金流網(wǎng)絡(luò)研究[D].西南財(cái)經(jīng)大學(xué),2012.
[6]陳萍. 數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)教學(xué)中的應(yīng)用研究[D].廣東技術(shù)師范學(xué)院,2015.
[7]孔志周. 基于小波網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)及其在銷(xiāo)售預(yù)測(cè)中的應(yīng)用[D].湖南大學(xué),2004.
[8]潘鳳. 基于數(shù)據(jù)挖掘技術(shù)的安全事件分析平臺(tái)的研究與設(shè)計(jì)[D].成都理工大學(xué),2009.
[9]王金磊. 數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)入侵檢測(cè)中的應(yīng)用研究[D].鄭州大學(xué),2005.
[10]王麗影. 數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)教育平臺(tái)中的應(yīng)用研究[D].天津師范大學(xué),2008.
作者簡(jiǎn)介:呂天賜(1996—),男,籍貫:黑龍江省大興安嶺地區(qū),學(xué)歷:本科,職稱(chēng):學(xué)生,研究方向: 計(jì)算機(jī)科學(xué)與技術(shù)。