何棟
摘要:伴隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)與數(shù)據(jù)庫技術(shù)日新月異的發(fā)展,數(shù)據(jù)庫的規(guī)模總是在一直不斷的擴(kuò)大,人們積累的數(shù)據(jù)也就越來越多。當(dāng)數(shù)據(jù)在不斷增加的同時,我們?nèi)绾螐拇罅康臄?shù)據(jù)中提取出有效信息的矛盾日益突顯。而傳統(tǒng)的查詢、報(bào)表等工具已經(jīng)無法滿足收集有效信息的需求,因此,需要一種新的數(shù)據(jù)分析方法與技術(shù):它可以實(shí)現(xiàn)從大量的數(shù)據(jù)中提取出隱含但有效的信息與知識,所以數(shù)據(jù)挖掘技術(shù)由此而生。該文簡單地介紹了數(shù)據(jù)挖掘技術(shù)的產(chǎn)生,挖掘過程以及數(shù)據(jù)挖掘的應(yīng)用和發(fā)展。
關(guān)鍵詞:數(shù)據(jù)庫;數(shù)據(jù)挖掘模式
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)18-4121-01
1 數(shù)據(jù)挖掘技術(shù)的概念
數(shù)據(jù)是分析問題,掌握知識的基石。但是,擁有大量的數(shù)據(jù)與擁有許多有效的數(shù)據(jù)卻完全是兩回事。近幾年來,從數(shù)據(jù)庫中發(fā)現(xiàn)新問題掌握新知識這一領(lǐng)域發(fā)展飛速,廣闊的市場前景和研究利益促使這一領(lǐng)域不斷壯大。計(jì)算機(jī)技術(shù)發(fā)展和數(shù)據(jù)收集技術(shù)的進(jìn)步,可以讓人們從更加廣泛的范圍和以驚人的速度收集和存儲有效信息。
收集數(shù)據(jù)是為了得到有效信息,然而大量數(shù)據(jù)的存在本身卻并不意味著信息。當(dāng)今的數(shù)據(jù)庫技術(shù)使我們存儲大量的數(shù)據(jù)流已變得非常簡單,但卻還沒有一種成熟的技術(shù)能幫我們來分析、理解和讓數(shù)據(jù)以可理解的信息表示出來。所以,傳統(tǒng)的知識獲取技術(shù),在面對巨型數(shù)據(jù)倉庫無能為力時數(shù)據(jù)挖掘技術(shù)就此誕生。……