劉姣
[摘 要]隨著經濟的快速發展,“互聯網+”時代的到來,各行各業的發展產生海量的數據信息,統計工作面臨新的機遇與挑戰。如何提高統計數據質量、如何充分發揮數據挖掘技術在統計工作中的優勢,是統計工作者們共同思考的話題。本文重點闡述數據挖掘技術在統計工作中的創新應用。
[關鍵詞]數據挖掘技術;統計工作;創新;研究
doi:10.3969/j.issn.1673 - 0194.2018.06.066
[中圖分類號]TP311.13 [文獻標識碼]A [文章編號]1673-0194(2018)06-0-02
隨著信息技術的快速發展,大數據、云計算、物聯網等先進的科技在人們日常生產生活中得到了更為廣泛的應用,先進的信息科技大大加快了數據的傳播速度,提高了傳播質量。在統計工作過程,利用信息技術能有效提高數據信息的及時性、完整性與有效性,大大提高了一國的綜合國力與國際競爭力。
在政府日常運營中,統計部門發揮至關重要的作用,統計工作質量的高低直接影響政府決策的有效性與科學性。在新形勢下,信息技術體系的不斷完善,有效提高了統計工作的質量,例如:數據挖掘技術,在統計工作的信息化進程中發揮不可替代的作用,為政府的科學決策提供強有力的支撐。筆者根據自身多年的工作經驗,談談自己對數據挖掘技術下統計工作創新研究的幾點思考。
1 數據挖掘技術與統計學
數據挖掘技術雖然起步比較晚,但是對于統計工作來說具有深遠的意義。從技術層面來看,數據挖掘技術高度統一了人工智能、統計學、數據庫管理、數據倉庫、可視化、并行計算與決策支持等,通過數據庫、數據倉庫技術存儲及管理數據,再結合統計學方法和人工智能分析數據等,深度研究數據挖掘技術在日常統計工作中應用,能有效快速統計瞬息萬變的數據信息,從而挖掘出更有效、更有意義的數據信息。
1.1 數據挖掘技術具有高智能化
隨著計算機網絡技術的高速發展,數據存儲技術、大數據推廣技術也得到快速發展與廣泛普及,隨后,統計學方法體系也得到完善。新形勢下,隨著“互聯網+”時代的到來,各行各業的發展都迎來“數據大爆炸”“知識匱乏”的現狀,而工作人員將數據挖掘技術與計算機網絡技術高度統一,以從海量數據信息中挖掘出更多有用的信息。數據挖掘技術與統計學由于都屬于數據處理專業,具有較高的連通性。統計學利用建模手段去挖掘海量數據信息中有用的數據;數據挖掘技術也有明顯的數據挖掘特征,旨在發現更多、更有益、可利用、可發掘的數據。由此可見,統計工作中充分利用數據挖掘技術非常重要
1.2 數據挖掘技術加快統計學的發展步伐
現階段,統計工作者的主要任務就是以數據信息為基礎,建立模型,并深度分析研究模型。建模之后,再分析數據,這一步非常重要,然而,從目前來看,統計工作者對模型的闡述與分析研究并不深入。利用數據挖掘技術,可以針對數據集,根據不同的需求利用不同的數據挖掘技術,例如:決策樹,神經網絡、聚類分析等,能大大提高數據處理的有效性。值得一提的是,數據挖掘技術處理數據具有很多優勢,例如:能有效處理量大、維數高、結構復雜及類型多樣的數據信息。由此可見,數據挖掘技術的種種優勢,能有效加快統計學發展步伐,提高統計工作信息化程度,進一步提升統計工作的質量與效率。
2 現階段統計工作存在的問題與缺點
2.1 易造成數據的冗余
我國現階段的統計部門所應用的數據格式并沒有完全統一的規定與要求,數據格式較多,比如VF、SQL、TEXT等。這樣一來會使統計數據產生冗余,格式不夠統一,使得數據在處理起來較為麻煩且復雜,給統計工作也帶來了很大的難度。
2.2 數據缺少統一的管理標準
由于數據的來源和獲取渠道極為廣泛,所以管理起來也會遇到很多的問題,存放較為分散,沒有一個統一且標準的管理模式,由此導致無法實現對數據進行進一步的深加工,繼而無也法更好地利用和開發所獲得的數據資源,造成數據資源的嚴重浪費。
2.3 缺少對數據資源的剖析和利用
統計工作在社會的各個層面皆有應用,統計指標多,擁有大量的數據資源。雖然統計部門獲取的數據資源較為豐富,但對于這些數據資源無法實現層次更深的分析和提煉,缺少深度挖掘數據資源的工具,從而不能有效地利用好數據資源,使得統計工作與信息化嚴重脫節。除此之外,對于已經挖掘出的數據信息也沒有進行仔細的甄別,無法判斷現有資源是否完全,對于決策的利弊也不得而知。
2.4 缺少有效的后續開發
對于統計工作來說,統計數據是為政府和企業提供重大決策的主要依據,需要對統計技術和統計工作有一定的創新和開發,但就目前的統計工作來看,只是單純地為制作表格而進行數據總結,并沒有實現后續的開發工作。這樣一來就使得數據資源不具備再次利用的價值,從而也降低了統計工作的質量與效率,無法實現對統計工作的進一步創新與開發。
3 數據挖掘技術在統計工作中的適應性
3.1 超強的綜合應用性
新形勢下,數據挖掘技術能利用具有超強綜合應用性的手段,來有效挖掘出統計工作者所需求的某種特性的數據,從而有效拓展統計工作的深度與廣度,加快統計工作的創新發展。
3.2 較強的實際有效性
數據挖掘技術是一種具有明確目的的數據深加工技術,工作性能非常穩定。首先,其能有效提高統計者分析整理相關數據的質量,其次,對聚類分析、神經網絡等技術手段的有效利用,能挖掘出更深層次、更高質量的數據信息,充分提高其實際有效性。
3.3 較高的技術適用性
現階段,統計工作需要龐大的數據庫作支撐,并為數據挖掘技術的應用提供廣闊的平臺。數據挖掘技術在這個平臺上進行數據整合,從而提高統計數據的真實性、完整性與有效性,從而獲取更深層次、更有用的信息資源。