許福嬌
(玉環縣統計局,浙江 臺州 317600)
淺論大數據背景下政府統計的轉變
許福嬌
(玉環縣統計局,浙江 臺州 317600)
大數據的作用日益被公眾所認識。本文介紹了大數據對促進政府統計改革發展的意義和政府統計面臨的挑戰,提出積極應對大數據所需要的幾個轉變,以期提高數據質量,重塑政府統計公信力。
大數據;挑戰;政府統計
2012年以來,大數據(big data)一詞風靡全球。對于大數據的研究和利用,一些發達國家已經上升到國家戰略的高度,同樣的在我國也引起高度重視。2013年5月,國家統計局馬建堂局長在科研所等單位上報的有關大數據的報告上批示:“我們對大數據對我國統計工作的機遇與挑戰,無論如何強調都不過分,甚至都不夠。抓住這一機遇和挑戰,當前的關鍵還是統一思想,堅定意志,主動進取。如果我們不想成為落伍者,而欲成為弄潮兒,就必須清醒地認識這一點。”因此,以數據質量作為生命線的政府綜合統計如何適應大數據時代值得深思。
近年來,工資“被增長”、CPI“被下降”、房價“被降低”、失業率“被減少”……因百姓的切身感受與統計數據之間的差異,導致了社會對統計數據的質疑,政府統計的權威性和公信力也因此受到質疑。這既可能是由于方法制度不完善造成的,也有可能是宣傳不到位和信息解讀不夠等原因造成。如何化解統計數據信任危機,重塑政府統計權威性和公信力?興許利用大數據能夠很好的化解這一危機。那么何為大數據呢,它具有什么特點呢?
維基百科認為,大數據是一個難以通過現有數據庫管理工具進行處理的大而復雜的數據集的集合。它是繼云計算、物聯網后的又一次顛覆性技術革命,它的特點可以用有四個以“V”為開頭的單詞表示,即數據量十分龐大(Volume)、產生頻率非常快(Velocity)、數據類型繁多(Variety)和數據量不穩定(Variability)。
政府統計如果挖掘這一數據寶庫,對于促進政府統計改革發展具有重大意義。主要表現為:通過利用客觀存在的海量數據,能夠有效降低調查成本;大數據化的采集方式減少了層層上報環節,有助于提高數據及時性、準確性。同時,通過對海量數據的分析、整理,可以對經濟社會運行情況進行多方面印證,減輕外界對于統計數據準確性的質疑。
1.統計設計方面。統計設計是對統計研究對象的內容和統計工作過程通盤規劃和統籌規劃的綜合。在大數據背景下,面臨兩方面挑戰。一是一套表設計不專不全。目前實施的一套表制度,還不完全是真正意義上的一套表,一方面,仍存在多頭設計、專業布置、分別收集、分別審核、分別匯總處理,僅僅是各種報表在數據處理程序上的簡單匯集而已;另一方面,針對住戶和個人調查的內容、部門以及“三下”單位仍沒有納入一套表。二是統計標準化較難。《統計法》雖然賦予國家統計局對部門統計調查項目的管理權、部門標準的審批權,但在實際工作中由于工作性質、職責權限和業務流程的不同,政府綜合統計和政府部門統計對數據采集的管理不統一、不規范,指標口徑范圍不可能完全相同,容易出現數據打架或者數出多門的現象。
2.數據生產方面。數據生產過程分為數據收集、整理和分析三大階段。一是數據采集模式。2012年,我國采用一套表網上直報制度,實現各級共享,但仍然沒有從根本上改變“我布置,你填報”的傳統數據采集模式,如果統計調查工作人員責任心不強或者調查對象配合程度不高,那么數據質量難以有效控制。二是數據整理模式。目前,我國數據生產模式主要以結構化數據處理為主,采用超級匯總方法得到。三是數據分析模式。在政府統計領域,部門對數據信息的敏感度不強,應用數據信息指導工作的意識不夠,導致很多數據資料并未被真正利用起來;同時,數據分析應用仍然處于低端水平,一般以描述性統計分析為主、短期性分析為主,對于長期性、趨勢性分析仍然較少,還未形成一套完整的數據綜合分析應用體系,因此造成數據服務決策的參考作用不明顯。
3.數據公布方面。一是數據發布時間滯后。2002年,中國正式加入國際貨幣基金組織數據公布通用系統(GDDS),但我國的統計實踐與GDDS和SDDS(數據公布特殊標準)的要求仍然存在一定距離。二是數據發布內容不全。目前,政府統計往往公布一個結果性的、匯總性的數據,而對于調查原始性、個性化數據提供較少,難以真正實現統計生產全過程共享,這就可能導致很多學者、研究人員處于想研究但無原始數據的尷尬。
4.統計服務模式。一是服務較為被動。一直以來,我國的政府統計部門以黨政機關為服務對象,對于廣大社會群體對數據產品需求服務仍然較少,缺乏服務主動性。二是服務鏈較短。由于政府統計往往公布一個結果性的、匯總性的數據,導致有些統計數據與社會公眾真實感受可能不一致,這既可能是由于方法制度不完善造成的,也有可能是宣傳不到位和信息解讀不夠等原因造成,換句話說服務鏈較短。
1.構建“大一套表”體系,將部門、專業統計轉變為調查對象統計。構建以調查對象為核心的一套表體系,這個“大一套表”體系相比傳統的一套表具有內容更廣、處理更集中的特點。在這個體系下,對于不同的調查對象設計相應的一套表,根據各自的特點靈活掌握,初步實現按調查對象實際情況“量身定做”統計調查內容;對于相同的調查對象全部統計內容集中統一布置、統一搜集,消除跨專業和跨部門對統一調查對象重復布置、重復統計,進而避免數出多門、數據打架的現象,從而減輕基層工作量。
2.構建“大標準”體系,將非標準化大數據轉換為標準化統計數據。要構建跨部門、專業的“大一套表”體系,其前提就是構建跨部門、專業的統一社會標準,構建“大標準”體系。在這個社會標準下,非標準化大數據可以轉換為標準化統計數據。因此,不管是行政記錄、商業記錄,還是企業生產記錄,都可以通過轉換為標準化統計數據,從而解決長期以來各專業、各部門以及民間數據處理互通性差、統計口徑不一、數據銜接性差的問題,推進了基礎工作的規范化;同時積極研發企業電子化生產經營記錄自動導入的軟件,用標準軟件采集數據,實現由有障礙交流轉變為無障礙交流轉變,加快大數據的應用步伐。
3.加快信息化進程,使數據采集從傳統報送向智能采集轉變。大數據背景下,不再單純依靠“我布置,你填報”的傳統數據采集方式,而是依賴測量技術設備和方法的成熟和完善的智能化數據采集方式,這種采集方式得到的數據是信息技術記錄的原始記錄,大大減少了由于調查對象責任心、理解水平不同造成的人為數據質量差異,大大減輕統計工作人員搜集數據產生的工作量。
4.培養復合型人才,使數據挖掘技術由結構化向半結構化、非結構化轉變。大數據要求的數據整理分析技術遠高于傳統數據分析方法,最關鍵的是數據分析和數據挖掘。因此,要培養復合型人才,對數學、經濟學、統計學以及計算機等知識熟練掌握,有能力對結構化數據進行分析挖掘,也能對言論、圖標、視頻等半結構化或非結構化數據進行深度挖掘分析,大幅縮短數據獲取、處理和分析響應時間,加快數據產品創新應用,充分挖掘政府信息的經濟價值,提高工作效率。
5.推進“大平臺”建設,使部門“自留地”轉變為政府“集體田”。目前,統計數據的流動性和共享性遠遠不夠,一些重要數據資源獲取難度較大。在大數據時代下,數據工業功能逐步體現,加快數據庫建設,打破政府各部門、政府于民眾之間的“信息孤島”現狀,降低因分散存儲管理而丟失統計數據的風險,構建跨系統、跨部門的政府綜合信息處理平臺,將原本分散、分離的碎片信息得到有效整合,使之在部門之間流暢協調,實現數據共享與數據處理過程同步,真正實現統計生產全過程共享。
6.推進“大應用”進程,使統計應用由“一枝獨秀”轉變為“百花齊放”。一直以來,大部份的政府統計數據仍然由統計部門生產并且掌握,這一優勢決定統計部門在政府統計分析領域處于“一枝獨秀”地位。但在信息化、網絡化技術迅猛發展的今天,整個社會無時不在產生著海量的生產、交易、價格等電子化信息,形成了許許多多的大數據,加上政府信息公開制度的完善,如何開發好、利用好這些數據資源,讓政府統計成果惠及全社會?面對大數據,僅靠政府統計自身力量是很難做到的,應該敞開統計的大門,讓更多的部門、大專院校、專家學者以及科研人員參與統計數據的分析研究工作,讓更多的人掌握統計數據的生產工藝和統計產品的生產流程,增加統計工作的透明度,提高政府統計公信力,加快統計數據應用向“百花齊放”轉變,實現“死數據”向“活信息”的轉變,讓統計科研成果迅速轉化為生產率。
7.提供“自主性”服務,使服務模式由“要我服務”轉變為“我要服務”。大數據背景下,對于調查數據現實性、針對性、人性化要求空前提高,同樣的價值需求下,人們需要的不再僅僅是一個結果性質的數據,更需要統計部門提供更為詳細的過程信息,以表格、圖表、文字等發布形式更為豐富的統計調查數據,滿足用戶多方面的個性化數據要求。2013年全國統計工作會議,首次提出建設服務型統計。在大數據背景下,服務型政府統計就是通過對大數據的開發,轉變服務方式,為黨政機關和社會各界人士提供更為廣泛、滿足不同層次需求的大服務。因此要找準統計服務切入點,用統計理念引導服務對象,用統計方法指導服務對象,用統計標準規范服務對象,延長統計服務鏈,將數據采集、數據整理、數據分析等全過程公開,提供更為及時貼心的統計服務。
[1]楊海燕.大數據時代的圖書館服務淺析[J].圖書與情報,2012(4).
[2]鄭京平,王全眾.官方統計應如何面對Big Data的挑戰[J].統計研究,2012(12).
[3]王樹良,丁剛毅,鐘鳴.大數據下的空間數據挖掘思考[J].中國電子科學研究院學報,2013(2).
[4]許小樂.“大數據”與政府統計改革[J].調研世界,2013(5).
10.3969/j.issn.1674-8905.2014.03.017
牛域寧)