裴來輝 劉 暢
(深圳市維度數據科技股份有限公司,廣東 深圳 518000)
數字經濟時代,數據與資本、勞動力、土地、技術共同構成新的生產要素,帶來了生產方式變革,創造了新的業態。2022 年12 月2 日,《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》出臺,初步搭建起我國數據基礎制度的“四梁八柱”,促進數據要素價值加快釋放。而政府統計數據作為數據要素中不可忽視的重要組成部分,在加快培育數據要素市場中有著重要的示范作用。在此背景下,推動政府統計數據治理,構建現代化智慧統計體系,成為各級政府規劃中數字政府建設的重要內容,在國家治理體系和治理能力現代化中處于牽一發而動全身的重要地位。
依據聯合國統計署《政府統計基本原則》的描述,政府統計為“政府、經濟部門和公眾提供有關經濟、人口、社會和環境狀況的數據”,公正不偏地編纂“有實際用途的官方統計結果并加以公布”。政府統計數據是政府為了履行職能,通過統計機構和相關部門根據科學的統計方法制度依法組織實施統計活動,獲得的與經濟社會相關的數量化信息。它是重要的決策依據,有著“晴雨表”“風向標”“測量儀”“指示器”的作用,是公共資產也是公共資源,是政府治理的工具,也是政府治理的對象,是最重要的公共產品之一。
雖然政府統計數據與其他企業數據、大數據均是以數據搜集、整理、分析、應用為生產流程,但是由于核心目標的差異導致政府統計數據區別于其他大數據關注對象,其具有清晰的業務特性,主要表現在三個方面。
1.有明確的業務場景。政府數據均是根據政府職能確定的相關業務范圍進行采集,政府統計數據區別于其他部門數據,有明確的統計方法制度、精準的指標定義、法定的分類標準以及有規律的采集頻次,有非常強的業務特性。比如規模以上工業產值根據規模以上工業統計方法制度調查得到,對調查頻次、調查對象范圍、產值定義均有清晰的規范,脫離方法制度理解“規模以上”“工業”“產值”的概念就可能出現口徑不一的問題。
2.包含大量的分析數據。政府統計數據不僅包含第一手數據,更包含大量經過處理、加工、匯聚而形成的數據、信息、知識、智慧。以規模以上工業增加值增速為例,它是對規模以上工業企業上報的產值結合行業增加值率進行加工,在計算增速時既需要考慮價格因素的可比性,還需要考慮產業活動單位的地域情況,最終還會參考規模以上工業企業的能耗稅收及實際經營情況等,是典型的分析數據。
3.數據維度立體性強。政府統計數據是典型的面板數據,包含較長的時間維度和較多的橫截面維度,比如數據的主體、區域等。以數據主體為例,每一條政府統計數據關聯的用戶信息都很重要,且與業務制定和設定的數據采集規則密切相關,每個企業和項目主體都可能對數據進行一定程度加工,同時數據收集者也是數據構建的參與者。這些維度構成立體的政府統計數據面板。
《DAMA 數據管理知識體系指南》中指出數據治理是對數據資產管理行使權力和控制的活動集合,是一項系統性工程,包含角色與職責、流程與規則、質量和數量,核心是數據流動。政府統計數據治理則是對政府統計數據資源充分挖掘、盤活,根本目的是提升政府統計數據的價值。
目前國內對政府數據治理流程的研究結論主要是從頂層設計建立起統籌協調的機構,到摸清各部門數據家底、建立統一數據資源平臺實現數據融合,再到建立內部需求對接機制實現共享、建立對外開放模型實現開放,最后實現市場化的利用,數據安全貫穿始終。隨著政府數據化轉型的加快,這一整套流程在各地都有不同程度的實踐和落地,《中國政府開放數據利用研究報告(2022)》提到全國333 個地級行政區中建成公共數據開放平臺的地區已達58%,雖然還未完全成熟,各地建設效果也存在差異,但都是很有意義的嘗試。這部分嘗試大多借鑒參考了國際國內先進企業通用的數據治理經驗,偏重技術,當政府統計數據歸集其中時會發現有許多無法兼容的問題,其根本原因在于忽略了政府統計數據的專業特性。
政府數據的治理對專業性提出了更高的要求,需要考慮四大關鍵環節。
1.數據集成管理充分考慮流程再造。20 世紀80年代西方國家將企業管理中的“流程再造”理論引入到了公共管理領域,有美國學者創造性地提出了將廣泛應用于商業領域的流程再造理論引入政府治理領域中的觀點,主要包含環節流程再造、組織結構重組與信息資源整合等環節,在政府數據治理中主要需要考慮環節流程再造和信息資源整合。政府統計數據來源大致可以歸納為三大類,第一類是來源于業務系統,主要是國家聯網直報平臺的數據;第二類是來源于部門統計數據,有相對固定的采集頻次和報送方式;第三類可以統一歸納為外源數據,包括上級部門反饋的各類加工匯總數據、協調的部門數據、不定期實地調查的企業信息以及部分互聯網數據等,渠道多樣,對接方式和頻次不固定,數據格式沒有統一標準,還存在一些非結構化數據。政府統計數據集成管理需要通盤考慮數據流轉,按照不同地區政府數據流轉的要求和業務流程,借助數據歸集類平臺支撐,進行貼近工作場景的數據采集流程簡化和重組,同時明確數據采集主體和修改權限,構建有序、合理、持久運轉的數據采集規范。
2.數據清洗充分考慮妥善處理數據缺失問題。政府統計數據采集在很多情況下會出現數據值缺失,例如新入庫企業沒有上年同期數值,這是符合統計方法制度的正常上報情況,在對這種不完整數據清洗時需要分辨正常數據缺失狀況,根據不同的業務場景和需求選擇適當的處理辦法。
3.數據規范管理充分考慮符合業務的標準化處理。目前數據治理技術中通用的數據規范辦法主要是規則處理引擎和標準代碼庫映射,一般遵循行業或者國家標準。但是在政府統計數據規范化管理的過程中會發現其業務特性太強,直接影響應用中數據的通用性、共享性、可移植性及數據分析的簡便可靠性。這就需要按照統計業務規范去建立標準代碼庫,導致政府統計數據治理產生較高的業務門檻。需要在專業人員的參與下建立統計元數據管理規范和標準,建立標準統一、動態管理的統計數據資源目錄,也就是“一數一源一標準”,實現各類統計指標的唯一識別和統計數據精準入庫。
4.政府統計數據的流轉需要充分兼顧數據共享和數據安全。數據只有流通到最需要的地方,實現多元優質數據根據業務需求在特定場景匯聚融合才能釋放更大的價值。政府統計數據分析中越來越多地考慮引用外部數據,同時越來越多的機構、部門和公眾對于政府統計數據的需求日益凸顯,安全獲取、解析和交換數據需要考慮政府統計數據的特殊性。《中華人民共和國統計法》第三章第六條規定“統計調查中獲得的能夠識別或者推斷單個統計調查對象身份的資料,任何單位和個人不得對外提供、泄露,不得用于統計以外的目的。”針對政府統計數據的特殊性更要強調數據安全有序、合法合規流通,比如考慮隱私計算“原始數據不出域”“數據可用不可見”的流通范式、利用區塊鏈技術增強數據保密能力等。
黨的十九屆五中全會作出推進統計現代化改革的重大部署,《“十四五”時期統計現代化改革規劃》明確規劃了完善統計標準和指標體系、健全統計調查制度體系、優化統計數據采集體系、完善國民經濟核算體系、健全統計監測服務體系、健全統計法治監督體系、深化統計體制改革和對外開放、推進統計信息化建設、健全統計工作保障機制等9 個方面內容,其核心是要求現代化的統計體系必須面向需求、面向治理、面向應用,是從實際出發、符合社會經濟發展要求、與國家治理體系和治理能力現代化相適應的,在當前數字經濟時代背景下集中體現在“智慧”一詞。

圖1 智慧相關詞源
“智慧”一詞有典型的中國傳統文化底蘊。在中國古代,智慧不僅指聰明才智,還代表了把握真理的能力。習近平總書記指出:“運用大數據、云計算、區塊鏈、人工智能等前沿技術推動城市管理手段、管理模式、管理理念創新,從數字化到智能化再到智慧化,讓城市更聰明一些、更智慧一些,是推動城市治理體系和治理能力現代化的必由之路,前景廣闊。”可以看到在城市治理過程中,數字化到智能化再到智慧化是一個層層推進和提升的過程。
現代化的智慧統計體系是借助互聯網的全感知、全連接、全場景、全智能的特性和新型技術設備,結合區塊鏈、云計算、大數據、人工智能、數字孿生、ChatGPT等技術優勢,催生新的統計思想、理論和方法,更大程度激發數據整理、統計分析、監測、質量控制、風險防范等不同場景下的統計服務能力,以實現科學決策、智能管理、個性化精準服務的統計體系。
政府統計數據治理的落腳點是服務于構建現代化智慧統計體系,讓“以數據治理”成為可能,在技術潛力不斷釋放的智慧城市、智慧統計信息化平臺建設中衍生出許多具體的應用場景。
1.多元數據庫。創建多通路數據集成入口,對統計部門工作中使用的各類數據進行統一歸集處理,對統計數據進行回溯和管理。在存儲方面,探索與互聯網特征相適應、與信息安全要求相匹配的數據存儲方案,穩步推動分布式數據庫應用,實現數據高效存儲和彈性擴展;同時預留對外共享的服務接口,探索進行數據加密處理后的數據共享、交換、流通。
2.智能名錄庫。在目前統計系統的基本單位名錄庫建設基礎上,與市場監管、稅務、能耗、金融、征信、電信、互聯網等業務數據緊密結合,進一步提高統計標準和統計數據質量,實現名錄庫信息的及時更新、實時更新,描繪更加立體、生動、準確的企業畫像,根據指標對比和條件設置對名錄庫進行智能分類,動態更新儲備庫、“準四上庫”、風險提示庫等,并不斷擴大基本單位名錄庫的應用范疇。
3.模型算法庫。通過建模方法進行估算和推斷,尋找數據特征、相關關系和變化規律,在此基礎上進行匯總和推斷;通過數據挖掘和機器學習等技術,沉淀統計工作中涉及的模型算法工具,支撐數據加工、數據分析和深度挖掘。在目前實踐中比較典型的模型算法有主要宏觀經濟指標預測模型、企業達規預測模型、園區活躍度監測模型、企業動遷預測模型等。
4.統計產品生產平臺。通過報表自動引擎和智能機器人(RPA 技術)實現統計年鑒、統計月報、領導干部手冊、主要經濟指標簡析等統計產品自動生成。探索實現數據智能化分析,從宏觀、中觀、微觀各層面論證分析結論。
5.數據質量提升平臺。通過設定不同數據審核規則,對多元數據進行比對,通過數理統計分析開展數據質量可靠性評估,應用算法模型對數據進行預審,提升數據質量。
6.經濟預測預警平臺。運用經濟數據推算預測模型,結合主要經濟指標的核算辦法,從行業、產業、企業生產經營及就業、物價、居民收入、結構調整、質量效益、區域對比等方面深入分析經濟運行態勢,在宏觀層面數據下追蹤微觀主體運行狀態,預測未來重點指標數據走向,按照歷史數據進行宏觀、中觀、微觀三級數據的預測分析,尋找影響經濟發展的正向因素,識別負向因素,通過落地到企業層面來實現經濟數據調度,生成智能化調度清單,輔助領導和部門對經濟工作進行指揮調度。
7.經濟數據可視化空間化。結合GIS 和數字孿生技術,動態可視化呈現各項經濟指標的歷史趨勢、內部結構、關聯信息和在地圖上的具體點位,直觀感知、生動演繹經濟數據反映的具體內涵、空間區位、發展態勢,滿足演示、匯報、會議等多種形式,促進信息的深度洞察和深層挖掘。
8.辦公移動化。打造手機端智慧應用,建立移動駕駛艙,支持隨時查數找數,實現數據生產進度監測、數據審核過程跟蹤、統計產品及時查看、主要經濟指標實時更新等功能。
針對數字政府建設、統計數字化和智慧統計建設的發展趨勢,結合不同區域對智慧統計建設的實踐經驗,對智慧統計建設提供幾點建議。
1.建設統一的統計數據資源管理中心。建立統計元數據管理規范和標準,對統計部門工作中使用的各類數據進行統一歸集處理,實現不同類型統計和經濟數據的快速接入,經數據集成、抽取、轉換、加載、融合后形成歸集庫、基礎庫和主題庫,實現統計數據回溯和管理,構建宏觀、中觀、微觀的統計數據庫,為智慧統計應用提供統一的數據支撐。
2.建設統一的內部工作門戶和外部服務門戶。建設智慧統計內部工作門戶,基于不同用戶的使用特點,為各級統計工作人員、統計機構、政府部門、相關單位等政務公共網用戶提供智慧統計服務平臺使用入口,按角色權限提供統計生產、管理和服務等各種功能,為用戶提供更好的統計服務門戶和平臺。
3.建設統一的智慧統計業務應用體系。根據實際需要進行應用完善和升級。建設統計生產應用體系,包括統計制度設計子系統、統計數據采集子系統、統計數據評估子系統、統計數據加工子系統、統計產品發布子系統等;建設統計管理體系,包括基本單位名錄管理應用、統計隊伍管理應用、統計執法管理應用、統計工作督導管理子系統、數據質量評估應用等;建設統計服務平臺,包括智慧統計一張圖應用、宏觀經濟分析預警預測應用、經濟數據共享應用等。◆