李士猛 步倩
摘 要:大數據時代的來臨,海量般的數據從簡單的處理對象開始轉變為一種基礎性資源,如何更好有效地管理和充分挖掘利用大數據,對我國統計提出極大的挑戰。本文重點闡述大數據對經濟統計和政府統計帶來的影響,并提出相應的建議。
關鍵詞:大數據;統計數據;政府統計
一、引言
隨著信息技術的不斷發展和普及,大數據時代悄然而至,給世界各個行業帶來前所未有的變化。大數據時代不僅帶來海量數據,而且開啟了人們利用數據的新模式,給傳統統計帶來前所未有的強有力沖擊。企業、公司等如何利用海量數據,政府部門如何在統計工作中結合大數據改革現有統計流程,成為經濟統計學者們亟待思考和解決的問題。
二、大數據定義及其特征
1.大數據的定義。大數據概念最早源于IT行業的數據庫領域,被認為是表示數據量很大、數據形式多樣化的非結構化數據,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。從數據的類別上看,"大數據"指的是無法使用傳統流程或工具處理或分析的信息。究竟什么是大數據,目前還沒有權威統計的定義,但是大數據必將帶來社會新的變革。
2.大數據的特征。(1)數據容量巨大。從TB級別,躍升到PB級別。傳統的統計數據收集包括抽樣調查、普查等等,所得到的數據量和大數據容量不能相比。據統計,目前世界儲存信息量的速度比世界經濟的增長速度快4倍,計算機處理數據的速度比世界經濟增長速度快9倍。(2)數據類型繁多。包括網絡日志、視頻、圖片、地理位置信息,等等。世界每天以飛快的速度儲存著大量的數據,這些數據以復雜的形式記錄下來,來供人們利用,但是其中只有很小部分被利用。(3)價值密度低。以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。海量的儲存數據中,蘊含著巨大價值,但實際有意義的數據,就在其中的特別小的一部分。(4)處理速度快。這一點也是和傳統的數據挖掘技術有著本質的不同。物聯網、云計算、移動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,無一不是數據來源或者承載的方式。
三、大數據對統計的影響
1.大數據對經濟統計的影響。(1)數據收集方式的變化。傳統的數據收集方式通常包括:普查、問卷調查、抽樣調查、報表收集等等。傳統的數據收集方法已不能滿足現代人們的數據的需求,傳統的數據收集方式已也不適合大數據時代的數據收集,并且海量數據的處理和分析傳統的應用軟件也無法實現。這就要求需要轉變新的數據收集方式、處理分析手段與之相適應,才能更好的開發海量的數據庫。(2)不再依賴隨機抽樣。傳統的數據采集中,隨機抽樣、抽樣分析扮演著很重要的角色。但大數據時代的到來,我們需要分析更多的數據,甚至可以得到與某些現象的全部數據。全數據模式已成為一種可能,大數據分析采用所有數據,能帶來更高的準確性和時效性。(3)不再尋求因果關系。傳統的統計工作中,習慣性去尋求一種因果關系。在大數據時代,我們不需要再去發現事物之間的因果關系,而更需要我們關注的是事物之間的相關關系,通過分析數據之間的相關關系,來發掘數據中的價值。
2.大數據對政府統計的影響。與傳統政府統計相比,大數據能夠給政府統計帶來翻天覆地的變化:擴充記錄內容量,擴大調查樣本范圍,提高調查時效和結果的準確性。
(1)居民消費價格調查。當前采用的居民消費價格(CPI)中包含很多種類,包括食雜店、百貨店、超市、購物中心、農貿市場及服務消費單位等,每月發布一次,存在一定的滯后性。如果應用大數據技術,調查范圍更加廣泛,樣本量更大,得到的CPI是對市場價格的實時反映,可以做到每天發布,提高價格調查的時效性和數據質量。
(2)人口普查。我國是一個人口大國,傳統的人口普查是通過入戶調查、填寫問卷、光電掃描錄入或人口錄入數據而得到相關數據的。花費大量的人力、物力、財力,信息也有較大的時間滯后性。如果建立一套有效的人口管理系統,利用大數據庫,可以高時效和高精度地完成全國人口普查。
(3)統計數據質量。統計部門每年要對我國經濟社會各個方面進行檢測,通過抽樣調查獲得大量數據,難免會出現誤差。在大數據時代,政府部門如果建立一套有效機制,很好的利用大數據庫,不僅可以減少統計誤差,而且能夠保證發布數據的時效性和真實可靠性。
四、結論
1.改進統計方法,充分利用大數據庫。大數據時代帶來了海量的數據,傳統的數據收集方式已不能與之相匹配,全數據模式開啟了統計方法的變革。在大數據庫面前,傳統的抽樣調查沒有被淘汰,而是一些抽樣調查可以被全新的數據收集方式取代,通過新的收據處理可以更準確的反映社會經濟現象。
2.有效利用大數據,提高統計質量。傳統的政府統計,是在利用現有的統計方法來實現對社會經濟現象的觀測。大數據時代的到來,必然對原有政府統計產生強有力的沖擊。政府部門可以通過現有技術條件,有效利用大數據庫,不僅能夠提高統計數據質量,而且能夠提高數據發布的時效性。
參考文獻:
[1]喬晗.“大數據”背景下利用掃描數據編制中國CPI問題研究[J].統計與信息論壇,2014(2):12-18.
[2]曾凡斌.大數據:一場管理革命[J].中國傳媒科技,2013(1)
[3]涂子沛.大數據:正在到來的數據革命[M].廣西師范大學出版,2012(7)
[4]李國杰,稱學旗.大數據的研究現狀與決策思考[J].戰略與決策研究,2012(6)
作者簡介:李士猛(1987- )男,漢族,河南信陽人。現為河南財經政法大學統計學院2012級研究生,研究方向:經濟統計學;步倩(1988- )女,漢族,河南駐馬店人。現為河南財經政法大學統計學院2012級研究生,研究方向:經濟統計學endprint