劉西清
摘要:數(shù)據(jù)管理中,由于很大數(shù)量的基數(shù)產(chǎn)生,而且數(shù)據(jù)的結(jié)構(gòu)相對復(fù)雜,很容易導(dǎo)致數(shù)據(jù)缺失的問題。采用數(shù)據(jù)挖掘技術(shù),可以對數(shù)據(jù)管理中所產(chǎn)生的數(shù)據(jù)進(jìn)行更深層次加工,以提高數(shù)據(jù)質(zhì)量。本論文針對數(shù)據(jù)挖掘技術(shù)應(yīng)用于經(jīng)濟(jì)統(tǒng)計(jì)中的研究展開研究。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù) 預(yù)處理 決策樹 經(jīng)濟(jì)統(tǒng)計(jì)
數(shù)據(jù)挖掘技術(shù)作為數(shù)據(jù)處理技術(shù),就是針對數(shù)據(jù)倉庫中的各種數(shù)據(jù)信息處理中選擇合適的分析工具,以通過篩選而獲得有用的信息。在經(jīng)濟(jì)統(tǒng)計(jì)中應(yīng)用數(shù)據(jù)挖掘技術(shù),可以對社會(huì)經(jīng)濟(jì)活動(dòng)的運(yùn)行情況進(jìn)行分析,以使得統(tǒng)計(jì)信息能夠滿足社會(huì)各個(gè)領(lǐng)域的需求。
一、數(shù)據(jù)挖掘技術(shù)
信息環(huán)境下所產(chǎn)生的數(shù)據(jù)量逐漸增大,給數(shù)據(jù)信息的使用者帶來了困難。在經(jīng)濟(jì)統(tǒng)計(jì)中,如果對這些信息進(jìn)行處理,并獲得有價(jià)值對信息成為亟待解決的問題。面對龐大的屬于局信息,采用數(shù)據(jù)挖掘技術(shù),可以通過對所獲得的數(shù)據(jù)信息進(jìn)行分析和技術(shù)處理后獲得符合使用標(biāo)準(zhǔn)的數(shù)據(jù)信息,以滿足使用者的需求。在經(jīng)濟(jì)統(tǒng)計(jì)中采用數(shù)據(jù)挖掘技術(shù),可以提高數(shù)據(jù)信息質(zhì)量,以使得數(shù)據(jù)信息能夠更好地為中的社會(huì)經(jīng)濟(jì)發(fā)展服務(wù)。隨著數(shù)據(jù)信息質(zhì)量的提高,數(shù)據(jù)信息的使用效率也會(huì)提升,而且數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián)性也會(huì)被建立起來。
二、經(jīng)濟(jì)統(tǒng)計(jì)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用
1.數(shù)據(jù)挖掘技術(shù)之預(yù)處理方法的應(yīng)用
對數(shù)據(jù)進(jìn)行預(yù)處理可以分為三個(gè)部分,即要做好數(shù)據(jù)清理工作,之后對有用的信息進(jìn)行篩選,對統(tǒng)計(jì)數(shù)據(jù)中所存在的不全面的現(xiàn)象,就要將具有噪聲的信息進(jìn)行去除?!?br>