相麗玲 李彥如 陳夢婕



摘 要:[目的/意義]對當前中外政府數據開放平臺的運行方式及保障機制的實證對比研究,有助于我國政府數據開放的建設與發展。[方法/過程]以各國Data.Gov平臺數據為基礎,運用實證分析法、統計分析法、比較分析法,從政府數據開放平臺的數據層、平臺層、管理層3個層面,分析各國政府數據開放的整合與利用機制、開放與協作機制及管理與評估機制的現狀。[結果/結論]我國應借鑒國外先進技術與管理經驗,加快完成各省市試點工作,早日建成基于CKAN的國家級Data.gov專業平臺建設。
關鍵詞:美國;英國;歐盟;澳大利亞;中國;政府數據開放;運行機制;平臺建設;CKAN
DOI:10.3969/j.issn.1008-0821.2020.01.015
〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821(2020)01-0134-10
An Empirical Analysis of the Open Operation Mechanism of
Chinese and Foreign Government Data
Xiang Liling Li Yanru Chen Mengjie
(School of Economics and Management,Shanxi University,Taiyuan 030006,China)
Abstract:[Purpose/Meaning]The empirical comparison of the current operation mode and guarantee mechanism of Chinese and foreign government data open platforms will contribute to the construction and development of government data opening in China.[Methods/Processes]Based on the Data.Gov platform data of various countries,using empirical analysis,statistical analysis,and comparative analysis,the government data was analyzed from the data layer,platform layer,and management level of the government data open platform and the status of open integration and utilization mechanisms,openness and collaboration mechanisms,and management and evaluation mechanisms were analysed.[Results/Conclusions]Drawing on foreign advanced technology and management experience,we will speed up the completion of pilot projects in various provinces and cities,and build a national-level Data.gov professional platform based on CKAN.
Key words:America;Britain;EU;Australia;China;open government data;operating mechanism;platform construction;CKAN
所謂“政府數據開放的運行機制”是指大數據環境下,促進政府公共數據再利用并實現其增值,提高政府辦事效率的運行方式及保障機制。包括指導數據開放實施的具體原則,以及滿足各環節正常運行的體制機制。按照數據開放流程,具體包括:政府數據開放的整合與利用機制、開放與協作機制、管理與評估機制[1]。
自2009年美國率先開放國家級政府數據開放平臺(Data.gov)以來,澳大利亞、英國、歐盟等西方發達國家也相繼建立起本國的Data.gov平臺,旨在通過與公眾之間的雙向互動不斷提升平臺開放質量及水平,提高政府工作效率,提升公眾參與度。2012年我國也搭建完成bjdata.gov.cn(北京市政務數據資源網)首個政府數據開放平臺,并在2015年8月的《促進大數據發展行動綱要》中提出了構建我國政府數據統一開放平臺的目標[2]。2018年1月,我國《公共信息資源開放試點工作方案》中提出在5個省份試點建立統一開放平臺,形成統一制度和標準規范的工作要求[3]??梢娢覈當祿_放平臺建設雖然在時間節點上落后于西方發達國家,但卻是當前政府數據開放工作中的頭等大事。
通過對近十年“政府數據開放”相關中外文文獻進行分析,筆者發現2013年以前多是基于“開放政府”“開放數據”等概念的理論性研究[4-5],2014年以后多轉為對政府數據開放的具體實施及創新應用的研究[6-7]。且因國內外在政府數據開放運動的起步時間及開放進程上存在差距,所以在相關研究的進展和內容上也存在一定差異。國外側重于對數據更新、平臺建設、開放效能評估等的實用性研究[8-9],國內則大多還處于借鑒國外先進經驗及研究成果的階段,對于平臺搭建、數據利用、應用開發等的創新性研究還較少。近兩年來,以馬海群、黃如花等[10-11]為代表的專家學者對國內外政府數據開放平臺的現狀進行了調查分析,對其開放利用效果進行了比較研究,為加快我國政府數據開放進程提供意見建議。
本文在前期理論研究[1]的基礎上,擬采用實證研究法,分析目前各國政府數據開放平臺在開放水平及運行機制上的特點與優勢,為我國構建國家級開放平臺提供可借鑒的經驗。
1 實證設計
1.1 評估目標
本文主要評估2018年中外各國Data.gov開放平臺在數據整合與利用機制、數據開放與協作機制、數據管理與評估機制3個方面的優勢及特點,具體對其在政府數據開放中的數據質量、開放范圍、開放程度、技術要求、管理方式、監督措施等內容進行評估。
1.2 對象選取
國外選取美國(data.gov)、英國(data.gov.uk)、歐盟(data.europa.eu)、澳大利亞(data.gov.au)幾個代表國家和地區的政府數據開放平臺,國內選擇北京市政務數據資源網(bjdata.gov.cn)為代表,進行實證分析研究。(注:截至2018年上半年,我國仍無國家級政府數據開放平臺,省市級政府數據開放網站由原先的19個增至46個,其中省級平臺8個,地市級38個,2018年新增網站就達21個。)
1.3 數據來源
本文數據均來自選取對象國家或地區的相應政府網站(美國usa.gov、英國gov.uk、歐盟europa.eu、澳大利亞australia.gov.au、中國gov.cn)及政府數據開放平臺(美國data.gov、英國data.gov.uk、歐盟data.europa.eu、澳大利亞data.gov.au、中國bjdata.gov.cn)。
1.4 評估方法與評估體系
本文以各國Data.gov政府數據開放平臺的數據為依據,采用數據抓取、人工觀察、比較分析等方法,定量數據與定性評估相結合開展實證研究。并通過對已有評估體系的研究分析,結合實際使用感受,抽取并重組各項指標,從政府數據開放平臺的數據層、技術層、管理層3個層面,分別分析各國平臺在數據的整合與利用機制、開放與協作機制、管理與評估機制方面的優劣,并據此細化為15個維度,構建了以下評估體系(見圖1)。
圖1 各國政府數據開放平臺評估維度
圖1顯示,數據整合與利用機制(數據層),可以反映政府數據開放平臺對于數據的建設與實施狀況,如數據集的數量(開放程度與范圍)、數據的分類(整合程度)、更新速度(及時性)、獲取方式(便捷程度)與處理工具的種類(增值程度與公眾參與度);數據開放與協作機制(平臺層),可以體現出政府數據的共享程度(元數據)、對外協作程度(CKAN平臺)、內部協作程度(API應用程序接口)、數據開發程度(關聯程度)以及數據利用程度(數據應用);數據管理與評估機制(管理層),反映了平臺管理的方式方法,如網站的頁面布局(實用與便捷程度)、用戶交互(交流與反饋程度)、隱私政策與Cookies政策(用戶隱私保護程度)及監督管理(職責明確程度)。
2 運行機制比較
政府數據開放運行機制是實現政府數據開放與利用的運行方式及保障機制,而政府數據開放平臺正是政府對外開放數據的“窗口”,平臺的正常運行與維護有賴于各個技術層面的支持。
2.1 基于數據整合與利用機制(數據層)的比較
數據層是平臺中最基礎、最直觀的層面,也是公眾最為關注的層面。數據的整合利用通常在平臺的數據層完成,并需要一定的技術支持。其中數據集的數量、分類,反映數據開放的程度與整合度;數據集的格式、更新速度以及相關的數據分析工具,是用戶獲取與利用數據的重要途徑,同時也是評估開放平臺效能的重要指標,反映數據利用的便捷度。
2.1.1 數據集數量:數據開放程度與開放范圍比較
1)數據開放程度(透明度)比較
政府數據開放主要以數據集為單位向公眾公開數據,開放的數據集數量是各國開放程度最直觀的體現。自各國平臺上線以來,美國和英國的數據集開放數量一直處于領先水平,澳大利亞和歐盟緊隨其后。如圖2所示,當前美國政府數據集數量最多,數據開放程度最高。而我國由于目前還未建成國家級的政府數據開放平臺,北京市政務數據資源網只開放了北京市內的政府數據,因此數據集開放數量較少,差距較為明顯。
2)數據開放范圍比較
主題數據領域反映政府數據開放范圍,按最常使用的主題分類方式,5個國家都具有的主題數據領域有政府、商業與經濟、海洋及運輸、環境、教育,各領域開放數據集數量如下圖所示(見表1),其中排名前3的主題分別是政府、經濟與民生領域。美英兩國占絕對優勢,我國則主要集中在政府和經濟領域。英國在5個主題領域中的數據集開放數量都較多,而澳大利亞則較少,我國雖然開放總數較其他國家少很多,但在部分領域(如政府類)仍有略微優勢,環境方面應是今后的開放重點。此外,農業、健康、安全也是幾國都較為關注的主題。
2.1.2 數據分類:數據整合度比較
清晰和多樣的數據分類方式,可使公眾在查找數據時精確檢索范圍、提高檢索效率,方便有效地獲取數據。相較其他國家,美英兩國除數據開放數量較多以外,數據分類檢索方式也較為多樣(見表2),除各國都具有的按主題及發布機構分類之外,美國Data.gov還可按數據集的類型、標簽、格式、組織及組織類型刪選數據,英國Data.gov.uk還可按發布狀態、采集、API、執照、資源格式、架構/詞匯、代碼清單、開放分數、破解鏈接、位置數據集類型進行檢索。此外,美國和英國還具有基于地圖的搜索功能,通過搜索地名、郵編或坐標找到感興趣區域,然后繪制搜索區域顯示管理區域,最終查找選定區域的數據。澳大利亞也具有此類通過“添加分類—地圖顯示—數據具體信息”實現的地圖檢索(見圖3),可重復添加并在地圖上顯示數據覆蓋區域,最終在準確選擇數據位置后以表格形式顯示數據的具體信息,包括辦公類型、站點名、地址、城郊、州、郵編、經緯度、開放及關閉時間等。而歐盟和我國則目前僅具有最基本的兩種分類方式,分類檢索方式落后、單一,數據資源整合度低,是今后需重點完善的方面。
2.1.3 數據更新:及時性比較
在數據更新上,各國基本都遵循靜態數據按年或按需更新,動態數據按月/周/日或實時的速度更新。通過對各國政府數據開放平臺自2017年10月至2018年3月半年間各月開放數據集數量的統計,得到如下數據更新速度表(見表3)。
數據集數量最多,更新速度也最快,按月新增的數據集數量也最多,從幾百到上萬不等,最多達到20 000以上,其他國家每月新增數量都在1 000以下。相較國外各國,我國以數月一更的速度增加開放數據集,更新速度較慢,但就數據集總量來看,新增數據集數量較多,較之前翻1番。今后,應在保證數據質量的前提下,加快更新速度,保證數據的及時性與可用性。
2.1.4 數據獲?。嚎色@取數據的便捷程度比較
對數據的獲得、使用和增值過程是開放數據的主要目的,因此各國政府以服務公眾數據需求為原則,通過提供多樣便捷的開放渠道和服務,免費向用戶提供各種類型和領域的公共數據。具體表現在數據格式、檢索方法、數據下載條件3個方面。
1)數據格式
數據以何種形態在網絡上存在和傳播稱之為數據格式,它對數據是否方便展示和取得起到重要影響。政府數據開放對開放數據格式的要求是可機讀,即能夠容易地用計算機程序提取數據的格式,也就是數據結構合理地被構造為允許自動處理。常見的機器可讀格式有PDF、WMS、Geoj SON、SHTML、HTML、XLS、CSV、do、XML、WFS、JSON、XML、RDF、XSL、KML/KZM、Open XML、ZIP、Net CDF,其中CSV為五國都較常用的可機讀格式,它與JSON、XML、RDF同屬結構化文件格式。關聯數據的組成就需要數據以結構化的形式發布,關聯各方促進數據開發與利用[12]。此外,美國還提供ESRIShapefile等地理空間數據格式,Shapefile格式的優點在于結構簡單,容易實現,因此也得到了較廣泛的應用。英國和歐盟還提供了SPARQL查詢語言,通過SPARQL端點查詢編輯器來搜索存儲中的元數據。
2)檢索方法
在檢索方法上,各國基本都提供快速檢索與高級檢索方式,除按主題詞進行快速匹配檢索外,還可按內容類型、文檔類型、組織類型、行業、狀態、結果、原因、字詞位置、日期等縮小搜索范圍進行高級檢索。美國和英國還支持布爾邏輯檢索、字段限制檢索及段與短語檢索,歐盟和我國還在首頁顯示最熱及最新下載數據,并定期進行更新。檢出內容按相關性進行排序,顯示檢出數據集數量、標題、機構、時間、下載量及瀏覽量等。
3)數據下載條件
數據下載獲取需要在網站進行注冊并登錄,注冊及登錄需要用戶提供部分個人信息,設置用戶名及密碼,并進行驗證。目前各國政府數據開放網站對用戶獲取數據都采取免費政策,即用戶無需付有費用就可以獲得所提供數據的獲取權和部分使用權。歐盟提供的數據可以免費在數據庫、報告或項目中重復使用,并可用于商業或非商業目的,且不受任何版權限制,只有少數數據受重用的特定條件限制,其中大部分與保護第三方知識產權有關;北京政務數據資源網站所提供的數據全部可供下載,但用戶不得有償或無償轉讓在網站中所獲取的各種數據資源,同時網站按照程序對特定數據性質和使用的需要對一些組織和個人開放部分定向數據,其他用戶無法下載使用,有權限獲取到定向數據的用戶不得將其轉讓他人使用,否則將依法追究責任。澳大利亞除了開放的數據集外,Data.gov.au目錄也還包括未發布的數據和可供購買的數據。
綜上,國外各國特別是美英兩國的政府數據開放平臺,無論是在數據格式還是檢索方法上都較為多樣,在數據下載方式上也較為規范,為用戶提供了豐富且可靠的數據獲取方式與途徑。我國目前除在數據下載條件上與其他各國基本一致外,數據的開放格式極少,僅具有CSV和WPS兩種格式,檢索方式也僅有按主題、機構和時間3種,雖然基本滿足當下的數據獲取需求,但在今后的發展中必然需要提供更加多樣的數據格式與檢索方式,以滿足更廣泛的數據獲取與利用需要。
2.1.5 數據處理工具:增值程度與公眾參與度比較
數據增值的前提是對所獲取的數據進行一定程度的加工與分析,政府數據開放區別于政府信息公開的主要特點,即將這種加工與分析的過程交由公眾自己來完成,實現自主權與參與權。因此,為方便用戶對數據的分析與利用,各國開放平臺為用戶提供了部分數據分析工具,工具的版權及相關信息歸原作者或來源機構所有。歐盟提供Python、Java、JavaScript、PHP、Ruby、C等數據分析工具;北京政務數據資源網共提供4類數據分析工具:1)Hadoop相關工具(Hadoop、HDFS、MapReduce、Hbase、Hive、ZooKeeper);2)數據分析工具(Spark、Storm、SPSS、Weka、RapidMiner);3)數據搜索工具(Solr、Lucene);4)數據可視化工具(ECharts、Tableau)。其中Java、Lucene、SPSS因操作簡單易學,成為使用最多的數據分析工具。平臺對數據處理工具的推薦與提供,不僅為用戶獲取、分析與利用數據提供了便利,而且保障了軟件工具開發者對軟件的所有權。
2.2 基于數據開放與協作機制(平臺層)的比較
平臺層是政府數據開放網站的核心技術層,為政府數據的開放利用提供密集的技術支持,并提供供各部門組織間或國家之間交流協作的程序框架。其中,元數據、CKAN平臺、API、數據關聯、數據應用在政府數據的開放與協作機制中發揮著至關重要的作用。
2.2.1 元數據:數據重用(共享)程度比較
元數據,簡單來說即對數據進行描述的數據。通過元數據對信息資源的描述,可以實現數據確認、數據檢索及數據交換等,有助于對數據資源的分類、整合、開放與共享。
2)免責聲明
各國網站都在免責聲明中對政府及網站的權利、義務與責任作出說明,包括網站會合理謹慎地鏈接到其他網站,但無法直接控制這些網站中提供的內容或這些網站的可用性,不能保證任何鏈接網站上的材料不會侵犯任何人的知識產權或任何其他權利;網站不授權復制這些材料,不認可或推薦任何外部網站或第三方內容的鏈接,包括通過這些網站或其內容提供的產品和服務等;雖然網站歡迎用戶的反饋意見,但無法保證能夠糾正與數據集相關的任何問題;用戶因使用網站所提供數據而造成的任何損失,由用戶自行承擔。
3)數據使用原則
美、英兩國都提出無障礙原則,即努力確保所有用戶都能訪問所有功能,所有內容均可訪問網站,努力提高網站的可訪問性和可用性。Data.gov網站通過技術標準清單、屏幕閱讀器、政策專家和殘疾人深入測試,提高網站的可用性。網站也經常進行審查,以符合W3C最新的Web可訪問性倡議指南。Data.gov.uk則通過調節文字大小、工具下載(JAWS、Lynx、Opera)、無障礙服務(HTML驗證器、網頁向后兼容性查看器、Lynx Viewer)提高網站性能。
相較國外,我國目前還未成立專門的數據開放小組負責政府數據開放的一系列事物,在網站中向公眾展示的是實施政府數據開放的總體目標,未提供明確清晰的階段性開放目標供公眾了解和監督,且對數據開放情況的監督與管理多是自上而下的政府內部模式,還未形成公眾廣泛參與的社會監督模式。
3 結論與建議
3.1 結 論
政府數據開放平臺是公眾獲取與利用數據的主要渠道,其數據層、平臺層及管理層三者之間的協調運作是政府數據開放程度與效率的保障。以美英為代表的國家政府數據開放平臺歷經十年建設,其平臺運行機制已日臻完善。數據集之龐大,數據開放與整合度之高,數據更新速度之快,檢索效率、數據共享、開發利用程度之高,都顯示出支持平臺運作核心技術的先進性。特別是在數據管理層方面的數據分析技術、應用程序、制度設計上,如監督機構與職責界定,隱私保護政策等方面,為起步階段的我國政府數據開放平臺建設提供了直接可借鑒的寶貴經驗與技術。
與國外相比,現階段我國政府數據開放平臺建設中存在以下主要問題:1)數據整合與利用機制(數據層)方面,開放數據集少、開放范圍小、整合力度差;2)數據開放與協作機制(平臺層)方面,尚無基于CKAN的強大數據運行與管理系統,平臺系統結構簡單,缺少聯系協作,API接口、關聯數據、APP應用開發都較少;3)管理與評估機制(管理層)方面,政府職責界限不清、部門協作不暢、公眾參與度不高。
3.2 建 議
1)加強數據集的開發,借鑒國外在數據整合與利用方面的先進技術與方法,著力提高政府開放數據的質量和水平。
一方面,可以學習英美兩國經驗,擴大環境、教育、醫療等民生領域的相關數據集開發;增加數據資源格式,特別是機器可讀及可下載數據格式;提高數據更新速度與每次新增數據集數量。另一方面,可以借鑒歐盟和澳大利亞詳細的分類方式,規范數據處理工具的提供和使用;加強與第三方對數據應用程序的合作開發,拓展數據應用領域,彰顯開放數據潛力。
2)著力開發基于CKAN的強大數據運行與管理系統及相關軟件應用程序。
一方面,可以借鑒國外或自主開發基于CKAN的強大數據運行與管理系統及相關軟件應用程序(特別是APP應用),以實現政府各部門組織、公眾及國家間的交流協作、反饋、參與機制。另一方面,積極提供開源工具與共享服務,形成數據開放模式,規范元數據信息,實現數據關聯;加快完成各省市試點工作,最終實現Data.gov國家級政府數據開放平臺的順利運行。
3)設立我國的數據開放領導小組和負責團隊,對政府數據開放的整體流程進行嚴格管理。同時加強“用戶交互”平臺建設,提高公眾參與度。
“政府數據開放領導小組和負責團隊”,可以統領各個政府部門的數據開放工作,解決目前政府職責界限不清的問題;同時,負責提供中央和地方政府部門及其他公共機構的數據,確保數據以及時和可訪問的方式發布,促進政府各部門之間的協調。
“用戶交互”平臺的優劣直接關系到政府數據開放的服務質量與公眾的參與度。一方面,我國應進一步完善“用戶交互”平臺的建設,通過不斷監控政府數據的更新、反饋、評價與監督信息,形成政府與領導小組、專家學者及公眾之間的順暢交流互動;另一方面,通過引入Cookies政策,開展定期宣傳活動等,及時了解公眾需求,提高公眾的參與熱情。
總之,我國應積極借鑒國外政府數據開放中的相關先進技術與管理經驗,加快完成各省市試點工作,早日建成基于CKAN的國家級Data.gov專業平臺建設。
參考文獻
[1]相麗玲,陳夢婕.中外政府數據開放的運行機制比較[J].情報科學,2017,35(4):9-14.
[2]國務院.國務院關于印發促進大數據發展行動綱要的通知[EB/OL].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm,2018-12-30.
[3]中央網信辦,發展改革委,工業和信息化部.公共信息資源開放試點工作方案[EB/OL].http://www.echinagov.com/policy/201408.htm,2018-12-30.
[4]吳旻.開放數據在英、美政府中的應用及啟示[J].圖書與情報,2012,(1):127-130.
[5]相麗玲,王晴.論開放數據的法律屬性、責任義務及其相關機制[J].國家圖書館學刊,2013,(5):38-44.
[6]李盼,翟軍,等.基于Drupal的政府開放數據平臺構建[J].現代情報,2016,(8):37-43.
[7]鄧崧,葛百潞.中外政府數據開放比較研究[J].情報雜志,2017,(12):138-144.
[8]Hui-Ju Wang,Jin Lo.Adoption of Open Government Data Among Government Agencies[J].Government Information Quarterly,2016,(33):80-88.
[9]Sayogo D S,Pardo T A.Exploring the Motive for Data Publication in Open Data Initiative:Linking Intentionto Action[EB/OL].
[10]馬海群,江尚謙.我國政府數據開放的共享機制研究[J].圖書情報研究,2018,(1):4-11.
[11]黃如花,王春迎.我國政府數據開放平臺現狀調查與分析[J].情報理論與實踐,2016,(7):50-55.
[12]徐佳寧,王婉.結構化、關聯化的開放數據及其應用[J].情報理論與實踐,2014,(2):53-56.
[13]The Childrens Online Privacy Protection Act of 1998[EB/OL].http://www.coppa.org/coppa.htm,2018-12-30.
[14]Data Protection Act 1998[EB/OL].http://www.legislation.gov.uk/ukpga/1998/29/pdfs/ukpga_19980029_en.pdf,2018-12-30.
[15]Australian Government Com Law.Privacy Act 1988[EB/OL].https://www.comlaw.gov.au/Details/C2015C00279,2018-12-30.
(責任編輯:郭沫含)