胡凱歌
(太原學(xué)院財(cái)經(jīng)系 山西 太原 030032)
我國市場經(jīng)濟(jì)處于穩(wěn)步提升的狀況,逐年呈現(xiàn)爆炸性增長態(tài)勢,經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)庫擁有龐大規(guī)模的數(shù)據(jù),經(jīng)濟(jì)市場的繁榮景象必定會(huì)增加經(jīng)濟(jì)數(shù)據(jù)信息變得更加繁雜,經(jīng)濟(jì)市場對于經(jīng)濟(jì)統(tǒng)計(jì)工作的高效與準(zhǔn)確自然提出了更高的要求。因此,如何提升經(jīng)濟(jì)統(tǒng)計(jì)的整體水平,創(chuàng)新經(jīng)濟(jì)統(tǒng)計(jì)的方法與模式,已然成為我國經(jīng)濟(jì)統(tǒng)計(jì)相關(guān)部門不斷探索的重點(diǎn)。數(shù)據(jù)挖掘技術(shù)的出現(xiàn)為經(jīng)濟(jì)統(tǒng)計(jì)工作帶來了新的領(lǐng)航方向,可以對經(jīng)濟(jì)統(tǒng)計(jì)工作中涉及到的海量數(shù)據(jù)進(jìn)行資源整合,并且可以在最快時(shí)間內(nèi)準(zhǔn)確地挖掘、分析、選擇出對經(jīng)濟(jì)統(tǒng)計(jì)工作有價(jià)值的數(shù)據(jù)信息,從而使數(shù)據(jù)的質(zhì)量得到提高,獲取信息也更加廣泛與準(zhǔn)確[1]。由此可以看出數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中占比越來越高,值得我們給予充分的關(guān)注與重視。
數(shù)據(jù)挖掘是數(shù)據(jù)庫與人工智能領(lǐng)域的研究重點(diǎn),又被稱之為數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn),是一門多學(xué)科交叉的技術(shù)。所謂數(shù)據(jù)挖掘,即是從模糊、隨機(jī)的海量實(shí)際應(yīng)用數(shù)據(jù)中提取、挖掘出對人們具有一定價(jià)值數(shù)據(jù)的過程,主要基于人工智能、模式識(shí)別、可視化技術(shù)、統(tǒng)計(jì)學(xué)、神經(jīng)網(wǎng)絡(luò)等。數(shù)據(jù)挖掘技術(shù)簡單來說就是一種從大量繁冗的數(shù)據(jù)出提取出有價(jià)值信息的一種技術(shù)手段,可以對相關(guān)數(shù)據(jù)進(jìn)行自動(dòng)化、智能化的分析,并進(jìn)行整合、歸納與推理,可以為企業(yè)的決策者提供科學(xué)的數(shù)據(jù)依據(jù),幫助其及時(shí)調(diào)整市場經(jīng)營策略,做出正確決策[2]。
由于經(jīng)濟(jì)統(tǒng)計(jì)領(lǐng)域的數(shù)據(jù)復(fù)雜性,目前數(shù)據(jù)挖掘技術(shù)在該領(lǐng)域已經(jīng)有了較為廣泛的應(yīng)用,可以幫助從事經(jīng)濟(jì)統(tǒng)計(jì)的相關(guān)工作人員在獲取數(shù)據(jù)信息方面更加便捷,將大量數(shù)據(jù)進(jìn)行不同層次的處理,使之轉(zhuǎn)換為有價(jià)值的數(shù)據(jù)信息,可以打破原始數(shù)據(jù)隨機(jī)性、模糊性的制約。
數(shù)據(jù)挖掘技可以為經(jīng)濟(jì)統(tǒng)計(jì)帶來諸多的優(yōu)勢,經(jīng)濟(jì)統(tǒng)計(jì)與其他領(lǐng)域工作不同,涉及大量的金錢數(shù)據(jù)交易,在經(jīng)濟(jì)統(tǒng)計(jì)工作中,會(huì)涉及到一些企業(yè)商業(yè)機(jī)密,因此在經(jīng)濟(jì)統(tǒng)計(jì)工作方面進(jìn)行信息數(shù)據(jù)安全管理非常重要。數(shù)據(jù)挖掘包含數(shù)據(jù)的清理、變化、挖掘?qū)嵤⒛J皆u估等共計(jì)八個(gè)步驟,屬于一個(gè)反復(fù)循環(huán)的過程,每一個(gè)步驟達(dá)到預(yù)期目標(biāo)后系統(tǒng)才會(huì)執(zhí)行下一個(gè)步驟,在這個(gè)過程中可以保證數(shù)據(jù)信息的保密性[3]。依托于數(shù)據(jù)挖掘技術(shù)的保密性,可以有效地保證經(jīng)濟(jì)數(shù)據(jù)統(tǒng)計(jì)所有環(huán)節(jié)中的安全性,避免數(shù)據(jù)分析中的潛在隱患帶來不必要的麻煩。此外,利用數(shù)據(jù)挖掘技術(shù)作為數(shù)據(jù)庫技術(shù),還可以實(shí)現(xiàn)對經(jīng)濟(jì)信息存儲(chǔ)的持久性與長期性,便于后期經(jīng)濟(jì)統(tǒng)計(jì)工作所需數(shù)據(jù)的調(diào)動(dòng)與管理;數(shù)據(jù)挖掘技術(shù)具備較強(qiáng)的搜索與預(yù)測功能,其依托于信息技術(shù)手段對數(shù)據(jù)信息進(jìn)行相關(guān)分析,不僅可以避免傳統(tǒng)人工檢索中容易丟失信息的問題,還具有人工信息檢索無法實(shí)現(xiàn)的信息采集效率與速度,可以使工作人員快速、準(zhǔn)確地獲取到一手經(jīng)濟(jì)信息,實(shí)現(xiàn)對經(jīng)濟(jì)信息發(fā)展趨勢的預(yù)測。
數(shù)據(jù)挖掘技術(shù)可以從規(guī)模龐大的原始數(shù)據(jù)中準(zhǔn)確地挖掘出具有價(jià)值性和真實(shí)性的數(shù)據(jù),還可以對這些數(shù)據(jù)進(jìn)行分析與處理,使其具有應(yīng)用價(jià)值。隨著數(shù)據(jù)挖掘技術(shù)自身的不斷創(chuàng)新與完善,在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用也逐漸廣泛,以下針對較為典型的應(yīng)用進(jìn)行簡單分析。
數(shù)據(jù)挖掘技術(shù)應(yīng)用于經(jīng)濟(jì)統(tǒng)計(jì)中,第一步需要進(jìn)行的是對數(shù)據(jù)進(jìn)行分類、整合和處理。由于經(jīng)濟(jì)數(shù)據(jù)的復(fù)雜性,在對有用數(shù)據(jù)進(jìn)行分析和研究之前,必須剔除其中的無用數(shù)據(jù),因此,需要通過數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)信息進(jìn)行分類和預(yù)處理。數(shù)據(jù)挖掘技術(shù)只是經(jīng)濟(jì)數(shù)據(jù)統(tǒng)計(jì)處理的初級階段,而不是經(jīng)濟(jì)統(tǒng)計(jì)的全部工作,只能用計(jì)算機(jī)系統(tǒng)對經(jīng)濟(jì)數(shù)據(jù)進(jìn)行分類和管理,因此,需要采用回歸法、分箱法、聚類法等數(shù)據(jù)清理方法對數(shù)據(jù)進(jìn)行清理,并對異常數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)經(jīng)濟(jì)信息數(shù)據(jù)的整合與預(yù)處理[4]。
數(shù)據(jù)挖掘技術(shù)可以對原始數(shù)據(jù)進(jìn)行分析和輸出便于用戶使用的數(shù)據(jù)信息。輸出數(shù)據(jù)的有效形式可以用決策樹來表示。決策樹方法在數(shù)據(jù)挖掘中是非常有效的,可以實(shí)現(xiàn)數(shù)據(jù)資料直觀快速查找,因此有必要建立決策樹,實(shí)現(xiàn)決策樹方法的有效應(yīng)用。首先對輸出數(shù)據(jù)的信息進(jìn)行決策樹排序和分類,然后用樹形圖表示輸出數(shù)據(jù)的信息。決策樹可以建立一個(gè)清晰的系統(tǒng),對數(shù)據(jù)進(jìn)行分類和排序,準(zhǔn)確地提取用戶需要的信息。當(dāng)決策樹中的數(shù)據(jù)進(jìn)行多次分類時(shí),最終目標(biāo)是完成標(biāo)記決策樹的數(shù)據(jù)分布。決策樹構(gòu)建完成后,還需根據(jù)具體的統(tǒng)計(jì)需求對決策樹進(jìn)行修剪,刪除對應(yīng)急統(tǒng)計(jì)沒有幫助的數(shù)據(jù),確保所有分析數(shù)據(jù)對當(dāng)前的經(jīng)濟(jì)統(tǒng)計(jì)有所幫助。
為了更好地利用數(shù)據(jù)挖掘技術(shù)進(jìn)行經(jīng)濟(jì)統(tǒng)計(jì)工作,為經(jīng)濟(jì)統(tǒng)計(jì)工作帶來一定的優(yōu)勢,需要正確認(rèn)識(shí)到數(shù)據(jù)挖掘技術(shù)的概念與特征,強(qiáng)化對數(shù)據(jù)挖掘技術(shù)的認(rèn)知,加強(qiáng)應(yīng)用力度,這樣才能實(shí)現(xiàn)經(jīng)濟(jì)統(tǒng)計(jì)信息數(shù)據(jù)的有效提供與分析,改善經(jīng)濟(jì)統(tǒng)計(jì)的工作質(zhì)量與效率,推動(dòng)市場經(jīng)濟(jì)的穩(wěn)定發(fā)展。