劉淑英
(咸陽師范學院 計算機學院,陜西咸陽712000)
淺談數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的應用
劉淑英
(咸陽師范學院 計算機學院,陜西咸陽712000)
我國經(jīng)濟的高速發(fā)展使社會經(jīng)濟活動越來越復雜,加上各種外界與內(nèi)部的經(jīng)濟因素共同所用下,最終形成了一個經(jīng)濟復雜的關系整體。想要對如今的經(jīng)濟統(tǒng)計進行一個系統(tǒng)的分析,單單靠人腦的理解分析能力已然不夠,需要借助更加先進的現(xiàn)代統(tǒng)計與分析技術才能實現(xiàn)。近些年來,數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計領域應用的較為廣泛,已經(jīng)逐漸成為了經(jīng)濟統(tǒng)計活動中的新生代主流,受到社會各界的廣泛關注。
數(shù)據(jù)挖掘;經(jīng)濟統(tǒng)計;應用分析
我國經(jīng)濟在近幾十年來得到了空前速度的發(fā)展,并累積了大量的經(jīng)濟統(tǒng)計數(shù)據(jù)。經(jīng)濟統(tǒng)計數(shù)據(jù)由于其自身的特殊性,擁有著十分龐大且復雜的信息龐體性,統(tǒng)計數(shù)據(jù)在使用的過程中往往受限于資料難以發(fā)揮最大的作用,因此,數(shù)據(jù)挖掘技術應運而生。其特點是可以對數(shù)據(jù)進行縱向的開發(fā)與深入,同時還會對數(shù)據(jù)的橫向進行延伸與拓展,利用不斷的數(shù)據(jù)挖掘,可達到基礎數(shù)據(jù)利用率的最大提升,滿足統(tǒng)計數(shù)據(jù)使用的最大需求。
數(shù)據(jù)挖掘技術的原理并不復雜,不過是一種對數(shù)據(jù)信息進行深層次挖掘的技術。具體而言,就是將原本復雜多變的數(shù)據(jù)庫進行簡化,然后從經(jīng)過簡化的數(shù)據(jù)信息中提取出所需要的有用數(shù)據(jù),進行進一步的分析與整理,從而達到數(shù)據(jù)分析與充分利用的目的。如今我國的經(jīng)濟數(shù)據(jù)信息的基礎十分龐大,同時隨機性較強,很多數(shù)據(jù)還存在著不完整的特性,以至于往往在使用常規(guī)普通的數(shù)據(jù)統(tǒng)計方式時,無法對這些經(jīng)濟數(shù)據(jù)進行系統(tǒng)的分析,導致結論準確度不高。而數(shù)據(jù)挖掘技術則可以有效地解決這一問題,其根據(jù)相應的軟件與程序算法,對原本完整性不高、隨機性強的原始數(shù)據(jù)進行系統(tǒng)的歸納與分析統(tǒng)計,最終形成一套簡便合理的統(tǒng)計數(shù)據(jù)形態(tài),讓數(shù)據(jù)的使用者可以更加直觀地對所需的數(shù)據(jù)進行提取與使用。
數(shù)據(jù)挖掘的特點是可以自動捕捉到有意義、有價值的數(shù)據(jù),并將其進行歸納與收集,不需要人為的操控,就可以自動將所收集歸納的數(shù)據(jù)進行后續(xù)加工、處理,并與處理之前的數(shù)據(jù)進行分析比對,從而實現(xiàn)所被挖掘到的數(shù)據(jù)的實用性與準確性[1]。數(shù)據(jù)挖掘技術的自動化原理會將原本復雜混亂的原始數(shù)據(jù)進行深度的分析與總結,最終形成規(guī)范的數(shù)據(jù)形態(tài),以便使用者進行應用。數(shù)據(jù)挖掘技術會從層面上對一些基礎性數(shù)據(jù)進行挖掘,從技術層面對原始數(shù)據(jù)進行自主性的分析,從而實現(xiàn)更加高水平、高智能應用的系統(tǒng)設計,并得到更多尖端技術的有力支持,其中包括模塊識別技術、模糊概念成像技術、數(shù)據(jù)庫系統(tǒng)篩選知識技術等。
數(shù)據(jù)挖掘技術會將長時間積累下來的經(jīng)濟統(tǒng)計數(shù)據(jù)深入到數(shù)據(jù)使用者所要求的條件之中,在實踐的過程中會涉及到數(shù)據(jù)挖掘技術的多個特性,按照這些特性來保證經(jīng)濟統(tǒng)計數(shù)據(jù)能夠以最大的限度發(fā)揮作用,服務于管理者的需求。
目前,在很多領域數(shù)據(jù)挖掘技術都已經(jīng)得到了廣泛的應用與普及,在對數(shù)據(jù)的分析與歸納過程中,發(fā)揮著舉足輕重的作用。其中包括經(jīng)濟統(tǒng)計、物理分析、數(shù)學統(tǒng)計等各個方面。數(shù)據(jù)挖掘技術需要有著強大的統(tǒng)計能力、數(shù)據(jù)挖掘能力,同時還需要強大的后續(xù)數(shù)據(jù)自動分析與統(tǒng)計的功能,能夠協(xié)助數(shù)據(jù)的使用者對數(shù)據(jù)進行完整的處理[2]。數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計的應用中,起到了極大的作用,其對經(jīng)濟數(shù)據(jù)的開發(fā)、整理與分類帶來極大促進作用,會給數(shù)據(jù)的使用者提供更加方便快捷的服務。
目前,我國在數(shù)據(jù)挖掘技術方面的應用時間有限,技術層面并沒有達到很高的水平,不過就目前的數(shù)據(jù)挖掘技術而言,對我國的相關經(jīng)濟統(tǒng)計工作已經(jīng)起到了很大的效果應用,使統(tǒng)計工作的性能得到了進一步加強,并且我國在經(jīng)濟數(shù)據(jù)領域的分析、統(tǒng)計與整理的能力進行了強化,并會利用數(shù)據(jù)挖掘技術對更多有價值、有意義的信息進行挖掘,并最終表現(xiàn)為數(shù)據(jù)的高效性與準確性。
對于如今的宏觀型數(shù)據(jù)庫,數(shù)據(jù)挖掘技術也能有效應用其中,并取得很好的效果。如今我國的經(jīng)濟數(shù)據(jù)統(tǒng)計分析所使用的方法絕大多數(shù)還受限于傳統(tǒng)的經(jīng)濟統(tǒng)計方式,很多對數(shù)據(jù)信息的歸納與收集的方式還相對落后,無法與所匹配的信息形成一個完整的整體[3]。很多數(shù)據(jù)的使用者在對數(shù)據(jù)進行全方面管理與歸納時,會出現(xiàn)較多的問題,無法快速高效的達到數(shù)據(jù)分析與統(tǒng)計的目的。為此現(xiàn)象,就需要引入更加新式、高效的方法來提升對經(jīng)濟數(shù)據(jù)統(tǒng)計的效率。數(shù)據(jù)挖掘技術在經(jīng)濟數(shù)據(jù)宏觀數(shù)據(jù)庫中的適應性極強,宏觀經(jīng)濟統(tǒng)計數(shù)據(jù)庫可以為數(shù)據(jù)挖掘技術提供一個完全展示其功能的平臺,以便其發(fā)揮出自身的特性[4]。對經(jīng)濟統(tǒng)計領域而言,其數(shù)據(jù)分析的準確性必須得到保證,其速度也需要進行優(yōu)化處理,因此將數(shù)據(jù)挖掘技術引入數(shù)據(jù)宏觀經(jīng)濟統(tǒng)計,需要依靠大量可靠的數(shù)據(jù)資源,最終統(tǒng)計分析出更加有效的宏觀數(shù)據(jù)。
在使用數(shù)據(jù)挖掘技術的初始階段,需要相關領域的專家與學者對所需要挖掘的數(shù)據(jù)進行目標定義,目標定義的效果將直接決定后續(xù)數(shù)據(jù)挖掘所產(chǎn)生的結果,因而,數(shù)據(jù)挖掘的初始定義有著重要的地位,需要一邊定義一邊進行算法的演算,以確保定義效果的明確與準確[5]。另一方面,定義的要求也需要與實際的工作需求相對應。
作為整個數(shù)據(jù)挖掘技術過程中最為重要、時間消耗最長的階段,數(shù)據(jù)準備階段一共分為三個步驟:數(shù)據(jù)的挑選、處理與變化分析。數(shù)據(jù)的挑選是將整個宏觀數(shù)據(jù)庫中的所有相關數(shù)據(jù)都進行篩選與排列,按照數(shù)據(jù)定義為目標區(qū)域數(shù)據(jù);接著利用數(shù)據(jù)處理功能對所排列的所有數(shù)據(jù)進行初步的篩選處理,初步挑選出所需要的符合要求的數(shù)據(jù);最后利用數(shù)據(jù)變換的功能對所挑選的數(shù)據(jù)進行簡化處理,也屬于更深層次的數(shù)據(jù)挑選,最終得到最符合目標定義的數(shù)據(jù)信息。
數(shù)據(jù)挖掘階段的首要步驟是對算法的預定,需要設計出合適的算法來對所變換來的數(shù)據(jù)源進行合理挑選,才能進行深度挖掘[6]。算法的初步預定完成之后,就可以進行下一步的數(shù)據(jù)模塊計算。這一過程需要有專門的專家與數(shù)據(jù)挖掘分析人員進行操作,因此此步驟也是數(shù)據(jù)挖掘的關鍵點所在。
經(jīng)過上述的幾個步驟所得到的最終數(shù)據(jù)結果,數(shù)據(jù)的使用者需要對其進行一個結果的分析,利用數(shù)據(jù)挖掘技術將分析得到的數(shù)據(jù)結果進行全方面的顯示,并自動生成數(shù)據(jù)價值的評估,篩選后有用的信息進行保留,對無意義或重復的數(shù)據(jù)要及時的刪除[7]。如果經(jīng)過一系列的操作與篩選所得到的數(shù)據(jù)并不符合最終的要求,則系統(tǒng)會自動執(zhí)行回上一步,重新進行二次篩選,直到達到標準為止。
數(shù)據(jù)的使用者所需要得到的數(shù)據(jù)與目標有著很大的差異性,因此數(shù)據(jù)挖掘技術所對應的系統(tǒng)也要有多種的變化。如今數(shù)據(jù)挖掘技術尚沒有發(fā)展徹底,很多數(shù)據(jù)難題無法有相之匹配的功能型數(shù)據(jù)挖掘技術,因此如今很多的設計者所面臨的任務是設計出更多的數(shù)據(jù)挖掘系統(tǒng),以解決層出不窮的數(shù)據(jù)統(tǒng)計難題。
數(shù)據(jù)挖掘技術可以對宏觀數(shù)據(jù)庫中的數(shù)據(jù)進行篩選與歸納,具有很強的可表達性、有效性與確定性。利用一定的自動化原理對所表達出的數(shù)據(jù)進行深度的挖掘,充分的顯示出數(shù)據(jù)庫中的主要內(nèi)容,并根據(jù)相應的算法將數(shù)據(jù)應用到實際當中[8]。利用數(shù)據(jù)挖掘技術可以對一些有著明顯缺陷的數(shù)據(jù)進行補充與處理,對一些缺陷并不明顯或數(shù)據(jù)較為相似的數(shù)據(jù)可按照一定的規(guī)律展現(xiàn)出來。
被挖掘出的統(tǒng)計數(shù)據(jù)并不一定是經(jīng)過最簡化得到的結果,主要取決于數(shù)據(jù)的使用者。如果數(shù)據(jù)的使用者是專業(yè)的專家或學者,則問題的簡化程度影響效果并不大;如果數(shù)據(jù)的使用者并非專業(yè)的學者,而是一般的使用者,那么就需要對數(shù)據(jù)進行最簡化。
數(shù)據(jù)挖掘技術擁有一定的技術交互性,利用交互式的數(shù)據(jù)挖掘能夠對所需要處理、分析與整理的數(shù)據(jù)進行精確的深度挖掘,利用數(shù)據(jù)焦點的動態(tài)變化等特點,從多個角度對數(shù)據(jù)進行全方位的分析,采取抽象的層次變換屬性對所歸納的數(shù)據(jù)進行挖掘、收集與歸納,并最終實現(xiàn)數(shù)據(jù)的交互。
經(jīng)濟數(shù)據(jù)都具有一定的保密性,需要有很高的安全性保障。數(shù)據(jù)挖掘技術會隨著科技與時代的發(fā)展,在安全保密性上面取得更快的發(fā)展,對所得到的挖掘結果與數(shù)據(jù)統(tǒng)計進行強化的安全與保密,以防止數(shù)據(jù)泄露或丟失,強調對數(shù)據(jù)隱私的重視度。
在我國經(jīng)濟快速發(fā)展的大背景下,經(jīng)濟統(tǒng)計的效果高低將會直接決定經(jīng)濟長遠發(fā)展的前景好壞。而隨著挖掘技術在經(jīng)濟統(tǒng)計領域內(nèi)大范圍的應用,使得我國目前在數(shù)據(jù)統(tǒng)計分析領域有著更加優(yōu)異的表現(xiàn),可以更好實現(xiàn)數(shù)據(jù)分析的高質量化與標準化。因此,數(shù)據(jù)挖掘技術更廣泛的應用,使經(jīng)濟數(shù)據(jù)領域的統(tǒng)計工作的結果將變得更加可靠真實,從而為政府相關經(jīng)濟部門提供更加強有力的理論依據(jù),也會為一些工業(yè)企業(yè)提供更多的經(jīng)濟發(fā)展方向。數(shù)據(jù)挖掘技術在未來還會有著更廣泛的社會效益。
[1]謝湘寧.淺談數(shù)據(jù)挖掘技術在專利信息分析中的應用[J].中國發(fā)明與專利,2015,(1):59-62.
[2]王思懿.數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的應用管窺[J].商,2015,(18):216.
[3]楊楠.數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的應用探索[J].商,2015,(26):194.
[4]楊梅冰,梁思思.關于數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的應用[J].時代金融,2015,(24):179.
[5]董靜.試析數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的應用[J].商,2015,(31):227-228.
[6]陳超,王哲.淺談數(shù)據(jù)挖掘技術在信息資源規(guī)劃中的應用[J].信息通信,2015,(12):188-189.
[7]易立.數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的應用分析[J].時代金融,2016,(5):136.
[8]張永生.數(shù)據(jù)挖掘技術在經(jīng)濟統(tǒng)計中的應用[J].現(xiàn)代國企研究,2016,(14):135.
F22
A
1673-291X(2017)35-0176-02
2017-09-22
劉淑英(1982-),女,陜西咸陽人,副教授,碩士,從事軟件理論研究。
[責任編輯 杜 娟]