摘要:經(jīng)濟社會的發(fā)展離不開經(jīng)濟研究與管理工作,數(shù)據(jù)可以準確反映整個社會的經(jīng)濟運行情況,因此,經(jīng)濟數(shù)據(jù)必須具備真實性、可信性和時效性,能夠為我國的經(jīng)濟發(fā)展提供信息保障。數(shù)據(jù)挖掘技術(shù)正是為了統(tǒng)計經(jīng)濟統(tǒng)計工作更好的開展而出現(xiàn)的。本文首先從統(tǒng)計數(shù)據(jù)挖掘與經(jīng)濟研究的關(guān)系及其應(yīng)用與發(fā)展兩個方面簡要分析,接著就這一新技術(shù)在經(jīng)濟統(tǒng)計工作中的重要意義和應(yīng)用范圍進行了探討,以供相關(guān)人士參考和交流。
關(guān)鍵詞:數(shù)據(jù)挖掘;經(jīng)濟研究與管理;統(tǒng)計數(shù)據(jù)
引言:
準確的提取數(shù)據(jù)信息,提高經(jīng)濟工作效率是統(tǒng)計數(shù)據(jù)挖掘重要的研究課題,數(shù)據(jù)挖掘技術(shù)的最大優(yōu)勢就是能夠從大量的數(shù)據(jù)中發(fā)現(xiàn)有用的信息并利用多種算法和分析軟件對數(shù)據(jù)進行分析和處理,從而解決經(jīng)濟管理中的實際問題,數(shù)據(jù)挖掘和經(jīng)濟統(tǒng)計調(diào)查工作的結(jié)合對于促進經(jīng)濟研究與管理工作的發(fā)展具有非常重要的作用。
1 淺析統(tǒng)計數(shù)據(jù)挖掘在經(jīng)濟研究與管理中的作用
(一)數(shù)據(jù)的來源
詳細的數(shù)據(jù)為統(tǒng)計工作提供了便捷,推動經(jīng)濟研究與管理的發(fā)展,那么人們使用的數(shù)據(jù)來源于何處,就成為我們值得討論的話題。如果要問經(jīng)濟學(xué)家,他們給出的答案可能是:國家統(tǒng)計局專門提供詳細的數(shù)據(jù),以便為專業(yè)研究提供理論指導(dǎo)。為全面促進經(jīng)濟發(fā)展,掌控社會發(fā)展的整體局勢,我國專門成立了數(shù)據(jù)統(tǒng)計部門,有專職人員開展數(shù)據(jù)收集工作,且使用四種相對固定的統(tǒng)計方式:①定期報表;②重點檢查項目;③抽樣調(diào)查;④普查。統(tǒng)計局利用上述方法,安排內(nèi)部具有專業(yè)資質(zhì)的統(tǒng)計員,深入一線開展數(shù)據(jù)調(diào)查工作。統(tǒng)計者進入生產(chǎn)企業(yè)和管理部門,按期采集數(shù)據(jù)信息,再逐級上報數(shù)據(jù)信息,最后國家統(tǒng)計局負責(zé)歸納、整理相關(guān)材料,再面向社會大眾公布數(shù)據(jù)采集的情況,為各企業(yè)的生產(chǎn)、經(jīng)營、管理,提供切實有效的參考數(shù)據(jù)。
(二)什么是數(shù)據(jù)挖掘?
數(shù)據(jù)挖掘(Data Mining)是采用數(shù)學(xué)的、統(tǒng)計的、人工智能和神經(jīng)網(wǎng)絡(luò)等領(lǐng)域的科學(xué)方法,如記憶推理、聚類分析、關(guān)聯(lián)分析、決策樹、神經(jīng)網(wǎng)絡(luò)、基因算法等技術(shù),從大量數(shù)據(jù)中挖掘出隱含的、先前未知的、對決策有潛在價值的關(guān)系、模式和趨勢,并用這些知識和規(guī)則建立用于決策支持的模型,提供預(yù)測性決策支持的方法、工具和過程。當然除了以上所列出的還有時間序列分析等一些其他的功能,數(shù)據(jù)挖掘的各項功能不是獨立存在的,它們在數(shù)據(jù)挖掘中互相聯(lián)系,為推動經(jīng)濟管理質(zhì)量的提升而發(fā)揮作用。做好數(shù)據(jù)挖掘,為全面分析社會經(jīng)濟的發(fā)展形勢,奠定了良好的基礎(chǔ)。
(二)統(tǒng)計數(shù)據(jù)挖掘與經(jīng)濟研究和管理之間的關(guān)系
數(shù)據(jù)挖掘技術(shù)簡單來說指的就是一種可以從海量信息數(shù)據(jù)中,快速、精準鎖定所需有用信息數(shù)據(jù)的技術(shù)。在未進行數(shù)據(jù)挖掘之前,雖然信息數(shù)據(jù)量較為龐大,但其中有許多信息數(shù)據(jù)并不完整,甚至存在諸多錯誤信息數(shù)據(jù),而通過使用數(shù)據(jù)挖掘技術(shù),則可以將其中新穎的、有價值的信息數(shù)據(jù)準確提取出來,通過對此類精心篩選出的信息數(shù)據(jù)進行深度處理,從而為經(jīng)濟研究和管理工作提供真實可靠的數(shù)據(jù)支持。在經(jīng)濟研究與管理的過程中運用數(shù)據(jù)挖掘技術(shù),可以幫助統(tǒng)計人員快速從眾多未加工的經(jīng)濟數(shù)據(jù)中篩選出有價值的統(tǒng)計數(shù)據(jù),并對其進行深入處理與再加工,為相關(guān)工作人員分析經(jīng)濟形勢、判斷經(jīng)濟走向、制定經(jīng)濟決策決議等提供重要數(shù)據(jù)參考[1]。此外,由于數(shù)據(jù)挖掘技術(shù)并不只是一種簡單的數(shù)據(jù)分析工具,其可以深入結(jié)合信息使用者的實際需求,特別是在我國經(jīng)濟不斷發(fā)展下,經(jīng)濟數(shù)據(jù)信息量驟增,其對于經(jīng)濟統(tǒng)計技術(shù)的要求也越來越高,將數(shù)據(jù)挖掘技術(shù)運用在經(jīng)濟統(tǒng)計當中,能夠有效保障信息評估的可靠性,實現(xiàn)數(shù)據(jù)處理成效的進一步優(yōu)化。在運用數(shù)據(jù)挖掘技術(shù)完成對經(jīng)濟數(shù)據(jù)的深入挖掘與分析處理下,建立起相應(yīng)的數(shù)據(jù)庫,可以在更好地融合各種數(shù)據(jù)信息的基礎(chǔ)上,為經(jīng)濟管理活動需求提供高質(zhì)量服務(wù),有效減輕統(tǒng)計人員的工作負荷。
二、如何有效避免數(shù)據(jù)的失真
數(shù)據(jù)統(tǒng)計主要分成價值統(tǒng)計和實物統(tǒng)計兩個部分,出于各方面的原因,容易出現(xiàn)數(shù)據(jù)失真的情況。數(shù)據(jù)的統(tǒng)計錯誤,給經(jīng)濟管理工作造成了較大的困擾,行業(yè)中的技術(shù)人員應(yīng)如何避免此類問題,可參考以下幾種方法:
(一)以市場產(chǎn)品的價格為基礎(chǔ)
出現(xiàn)數(shù)據(jù)失真的一類原因,可歸納為市場產(chǎn)品的價格,與實際統(tǒng)計情況相背離。因此數(shù)據(jù)統(tǒng)計工作應(yīng)從市場的實際情況出發(fā),按照統(tǒng)計工作的要求,調(diào)查人員嚴格按照部門的有關(guān)規(guī)定,認真查處、統(tǒng)計市場的真實價格,再結(jié)合企業(yè)提供的各項數(shù)據(jù),盡快做出數(shù)據(jù)對比,獲取符合市場運營規(guī)律的真實數(shù)據(jù),再將數(shù)據(jù)進行收集、整理,定期上報統(tǒng)計部門入檔、備案。
(二)堅決禁止統(tǒng)計工作的弄虛作假
從統(tǒng)計工作反饋的情況來看,部分企業(yè)、個人為保證私有利益,存在上報虛假數(shù)據(jù)的情況,數(shù)據(jù)收集的失真,在一定程度上影響了經(jīng)濟發(fā)展的局勢。統(tǒng)計人員應(yīng)根據(jù)國家的指令、調(diào)度,采取切實有效的整改措施,堅決避免虛假信息的上報。召集各類企業(yè)負責(zé)人,配合抓好黨風(fēng)、政風(fēng),做好反腐倡廉的相關(guān)工作,從制度層面保證數(shù)據(jù)的統(tǒng)計質(zhì)量,確?!霸搭^清潔”,堅決避免數(shù)據(jù)統(tǒng)計的弄虛作假,才能獲取真實有效的信息,才能讓數(shù)據(jù)統(tǒng)計為推動經(jīng)濟發(fā)展做出貢獻。
三、統(tǒng)計數(shù)據(jù)挖掘在經(jīng)濟研究與管理中的應(yīng)用與發(fā)展
(一)數(shù)據(jù)挖掘在經(jīng)濟研究與管理中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在經(jīng)濟研究與管理中的應(yīng)用可以大致的分為兩個方向,分別為描述方向和預(yù)測方向。描述方向主要包括聚類和描述變量或數(shù)據(jù)間相關(guān)關(guān)系的各種算法,聚類是將相關(guān)關(guān)系較大的變量或個體聚為一類,預(yù)測方向主要包括分類和回歸,分類的主要工作是“貼標簽”,具體算法有決策樹、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、SVM、樸素貝葉斯模型等?;貧w不同于分類的是分類是對離散型數(shù)據(jù)做預(yù)測而回歸是對連續(xù)型數(shù)據(jù)做預(yù)測,回歸模型包括線性回歸、多項式回歸、Lasso回歸、嶺回歸等。聚類在經(jīng)濟研究與管理中最為常見,為了提高調(diào)查精度,在抽樣調(diào)查中可以先將調(diào)查對象聚類,再從不同類中分別抽取樣本,抽樣調(diào)查中的分層抽樣和整群抽樣都可能用到聚類方法。降維方法也廣泛的應(yīng)用于經(jīng)濟研究與管理中,由于統(tǒng)計調(diào)查進行一次需要花費大量的人力和物力,所以在統(tǒng)計調(diào)查中指標一般較多且詳細復(fù)雜,這就需要數(shù)據(jù)挖掘中的降維技術(shù)將相關(guān)性大的變量合并在一起,從而使數(shù)據(jù)分析更為簡便清晰,主要的降維方法有主成分法、因子分析法等?,F(xiàn)階段降維算法與評價算法相結(jié)合已應(yīng)用于經(jīng)濟評價中,正是由于對數(shù)據(jù)的大量收集、數(shù)據(jù)算法的產(chǎn)生、經(jīng)濟數(shù)據(jù)庫的出現(xiàn)、先進的計算機技術(shù)、對數(shù)據(jù)進行精深統(tǒng)計方法計算的能力、數(shù)據(jù)訪問速度的提升等一系列東西的出現(xiàn),使得數(shù)據(jù)挖掘技術(shù)的作用越來越廣泛[2]。由于經(jīng)濟研究與管理中中數(shù)據(jù)的實用性和準確性的需要,數(shù)據(jù)挖掘技術(shù)也開始慢慢在經(jīng)濟研究與管理中中大展身手。
1、統(tǒng)計分析法
所謂統(tǒng)計分析法其實是指,針對研究對象的規(guī)模、范圍進行全面分析,找到事物之間的關(guān)聯(lián)性,對企業(yè)內(nèi)部產(chǎn)品消耗的工時,做原始的記錄,根據(jù)現(xiàn)狀分析、整理減少消耗措施,保留企業(yè)最大利潤的方法。經(jīng)濟數(shù)據(jù)庫字段項之間存在兩種關(guān)系,相關(guān)關(guān)系和函數(shù)關(guān)系。就是對于數(shù)據(jù)庫中的信息利用統(tǒng)計學(xué)原理來進行分析。
2、決策樹
決策樹分析法主要利用概率和圖論中的樹對,分析經(jīng)濟發(fā)展現(xiàn)狀,再以此為基礎(chǔ)得到一套優(yōu)質(zhì)的風(fēng)險管理方案。這種分析法主要運用了概率論的原理,決策樹一般用于預(yù)測模型,通過對大量復(fù)雜無順序的數(shù)據(jù)有目的分類,找到有價值的信息。同時,正是因為描述簡單,分類速度快,特別適合運用于經(jīng)濟運行過程中出現(xiàn)的大規(guī)模數(shù)據(jù)的處理。
3、遺傳算法
它是一種根據(jù)生物遺傳機理和自然選擇的隨機搜索算法,其主要思路是依據(jù)特定的社會問題,然后在指定對象中去采集相關(guān)信息,最后通過對信息中隱含部分的歸整、分析,進而得到結(jié)果。經(jīng)濟問題不是固定不變的,相反它是一個不斷發(fā)展變化的問題,內(nèi)部的聯(lián)系千絲萬縷,改變其中一項其他的也會相應(yīng)改變。按照遺傳算法的步驟,從源頭開始,我們就一步步向下探索,去提取信息數(shù)據(jù),對整體進行分析[3],這樣就能把經(jīng)濟問題目標化、具體化、直接化,使得在研究問題時可以更加直觀,把隱性的表現(xiàn)出來,使得經(jīng)濟研究與管理中工作更加直白、簡單。
4、粗集理論法
這是一種探究不確定知識、不精確的數(shù)學(xué)的工具,它通過上下集比較而出來結(jié)果。它易于操作,算法簡單;簡化輸入信息的表達空間;不需要給出額外信息,特別適合分析那些不確定的經(jīng)濟因素,幫助從事經(jīng)濟管理活動的人員,盡量降低不確定因素對經(jīng)濟發(fā)展的負面影響。同時正是因為粗集理論法的這種原則,才能使得其與制定經(jīng)濟決策的需求更加接近,也為企業(yè)的發(fā)展提供了更多的可能性。
5、神經(jīng)網(wǎng)絡(luò)法
神經(jīng)網(wǎng)絡(luò)法是一種高強度模擬人腦加工信息過程的智能現(xiàn)代信息技術(shù)。它和人的神經(jīng)運動過程一樣,首先進行數(shù)據(jù)的輸入,然后進行精準的分析,最后輸出。在經(jīng)濟研究與管理中過程中得到了實際的應(yīng)用。神經(jīng)網(wǎng)絡(luò)法為我們提供了一種準確的、完整的處理經(jīng)濟研究與管理中的過程,使得經(jīng)濟運行模式和人在處理信息的過程很相像,一樣實用化、形象化、具體化。使經(jīng)濟過程中各個部分之間能取得更好的聯(lián)系,從而獲得對經(jīng)濟研究與管理中問題的處理辦法。
(二)數(shù)據(jù)挖掘在經(jīng)濟研究與管理中的發(fā)展
1、能為經(jīng)濟研究與管理中提供有效的服務(wù)
數(shù)據(jù)挖掘技術(shù)雖然經(jīng)歷的時間不是很長,然而,它的研究與應(yīng)用水平已達到了一種相對穩(wěn)定的狀態(tài)。隨著科學(xué)技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)在各國也普遍受到關(guān)注,特別是在經(jīng)濟研究與管理中領(lǐng)域。數(shù)據(jù)挖掘技術(shù)能夠這樣的的迅速發(fā)展,在很大程度上也是依賴于它對經(jīng)濟研究與管理中的有效服務(wù)。
2、能夠為經(jīng)濟研究與管理中的不同需要提供不同的服務(wù)
目前,最常見的數(shù)據(jù)挖掘工具主要有綜合工具、通用型工具、和面向特定應(yīng)用的工具。綜合工具,不僅能夠為處于商業(yè)中的經(jīng)濟體提供有效的管理報告,并且還能夠?qū)ζ胀ń?jīng)濟結(jié)構(gòu)中的數(shù)據(jù)信息經(jīng)行深入挖掘。通用型工具在市場上占最大比例,其也是在應(yīng)用方面最為成熟的挖掘工具。面向特定應(yīng)用工具,從字面來理解,這種工具就是針對特定領(lǐng)域來提供服務(wù)的,具有很強的特定性和針對性,它能夠有針對性的對經(jīng)濟管理中需要的數(shù)據(jù)進行挖掘和分析。
3、建立宏觀經(jīng)濟數(shù)據(jù)庫,為數(shù)據(jù)挖掘的應(yīng)用提供了良好的電子平臺
在目前,全國范圍內(nèi)的大部分經(jīng)濟研究與管理部門主要使用的還是應(yīng)用統(tǒng)計系統(tǒng)。大部分經(jīng)濟研究與管理中的數(shù)據(jù)信息都處于一種不相聚分散的狀態(tài),并沒有形成一套有效的管理系統(tǒng)。經(jīng)濟研究與管理過程中一旦出現(xiàn)問題,容易導(dǎo)致經(jīng)濟數(shù)據(jù)的有效性與準確性受到影響[4]。經(jīng)濟研究與管理部門可以利用數(shù)據(jù)挖掘基礎(chǔ)建立其相關(guān)的經(jīng)濟數(shù)據(jù)庫,當建立了宏觀經(jīng)濟數(shù)據(jù)庫以后,以上問題就可以尋找到有效的解決辦法。宏觀經(jīng)濟數(shù)據(jù)庫與數(shù)據(jù)挖掘技術(shù)的合理運用,保證經(jīng)濟研究與管理部門挖掘到的信息的準確性和真實,這不僅滿足了現(xiàn)實中經(jīng)濟發(fā)展的需要,同時也為經(jīng)濟決策的制定提供了準確、重要的依據(jù)。
三、結(jié)束語
數(shù)據(jù)挖掘技術(shù)在現(xiàn)代經(jīng)濟研究與管理中占有重要的地位,它是未來統(tǒng)計工作的一種重要技術(shù),精心鉆研數(shù)據(jù)挖掘技術(shù),能推動社會經(jīng)濟的發(fā)展,切實做好經(jīng)濟管理的相關(guān)工作,更可以實現(xiàn)對數(shù)據(jù)進行更深層次的分析和處理,且能有效的提升數(shù)據(jù)分析的質(zhì)量,以幫助決策者做出更好、更正確的決策。及時更新傳統(tǒng)的經(jīng)濟統(tǒng)計方法,擴大數(shù)據(jù)挖掘技術(shù)的使用范圍,對提高統(tǒng)計的效率,減少統(tǒng)計時的成本支出具有重要意義。當下應(yīng)加強對專業(yè)人才的培養(yǎng),利用數(shù)據(jù)的統(tǒng)計與分析,促使國內(nèi)的經(jīng)濟發(fā)展形勢,產(chǎn)生重大的、積極的變革。
參考文獻
[1]楊留華. 數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計調(diào)查中的應(yīng)用[J]. 全國商情·理論研究, 2019, 000(026):55-57.
[2]趙慧. 數(shù)據(jù)挖掘在統(tǒng)計工作中的應(yīng)用前景分析[J]. ?2021(2017-14):7-7.
[3]劉佩, 常青, 楊卿. 數(shù)據(jù)挖掘技術(shù)在PHM平臺構(gòu)建中的應(yīng)用[J]. ?2020(2014-2):11-13.
[4]徐婧婧. 基于數(shù)據(jù)挖掘技術(shù)的經(jīng)濟統(tǒng)計研究[J]. 中國鄉(xiāng)鎮(zhèn)企業(yè)會計, 2019(03):298-299.
[5]王志勇, 王建宇. 數(shù)據(jù)挖掘在知識管理系統(tǒng)中的研究與應(yīng)用[J]. 航天工業(yè)管理, 2019.
作者簡介;楊軍平、性別;男、1987.02、學(xué)歷;本科,職稱;中級,研究方向;健康電子,單位;青島中科康諾電子信息科技有限公司