何 丹
(杭州市大數據管理服務中心,杭州 310026)
隨著計算機技術和網絡技術的發展和普及,信息化與網絡化已滲入我們生活的每個角落,數據作為其重要產物,也已經迅速成為各個國家和地區發展的核心生產要素,驅動各行各業尋求變革創新。如何讓數據更好地服務社會,關鍵在于數據的融合、共享與開放[1]。2015年8月,國務院印發《促進大數據發展行動綱要》,明確提出要加快建成國家政府數據統一開放平臺,率先在重要領域實現公共數據資源向社會合理適度開放。2017年,中共中央辦公廳和國務院辦公廳印發《關于推進公共信息資源開放的若干意見》,要求推進公共信息資源開放、加強規劃布局,進一步強化信息資源深度整合,進一步促進信息惠民,進一步發揮數據大國、大市場優勢,促進信息資源規模化創新應用,著力推進重點領域公共信息資源開放,釋放經濟價值和社會效應。2020年,《中共中央 國務院關于構建更加完善的要素市場化配置體制機制的意見》提出,要研究建立促進企業登記、交通運輸、氣象等公共數據開放和數據資源有效流動的制度規范。
自然資源數據作為政府公共數據的重要組成部分,引導其合理、有序開放能進一步促進數據價值再提升,創新政府治理能力。2019年,自然資源部發布《自然資源部信息化建設總體方案》,多次提到推進自然資源數據開放,并指出通過數據開放引導市場主體開展基礎地理、土地、地質、礦產、海洋等數據的深度挖掘。目前,數據開放整體存在數據數量少、數據質量不高、運行機制不清晰、民眾參與反饋不準確等現實難題[2]。以杭州市為例,自然資源數據開放也處于較低水平。本文基于國內外自然資源數據開放情況的調研,對自然資源數據開放的定義與概念進行了闡述,并從杭州市自然資源數據開放工作實際情況出發,分析制約自然資源數據開放的關鍵因素,提出工作提升策略,期望為推進我國自然資源數據開放工作提供參考。
1.1.1 數據開放與自然資源數據開放
根據英國開放知識基金會(Open Knowledge Foundation)定義,數據開放是指數據可被人們自由使用、重復使用和重新發布,不受任何法律、技術或社會限制,其主要特點是可訪問、可使用、可重復使用和分發、普遍參與[3]。定義強調了“開放”這一行為,旨在說明數據可被無限制、無障礙獲取,補充對“數據”這一關鍵要素約束。文中的自然資源數據開放可定義為自然資源管理部門在履職過程中產生、收集和擁有的數據,脫敏脫密處理后主動向社會公眾免費、無差別且無需授權進行提供的一種行為。
1.1.2 數據共享、數據公開和數據開放
數據共享、數據公開和數據開放有著緊密聯系,許多人對這三類行為容易產生混淆,厘清其區別有助于理解數據開放工作。根據所涉的實際內容,本文將數據范圍限定于政府數據。
數據共享在實際工作中往往是指政府部門因開展相關業務需要使用其他部門數據的行為,其主要目的是打破數據壁壘、消除數據孤島、提高數據協同能力。數據公開是指政府主動將數據向社會公眾或依申請向特定的個人或組織公開,其主要目的在于保障公眾的知情權。數據開放是指政府向社會公眾提供可使用數據的行為,其主要目的是實現數據價值最大化。
由此可見,數據共享與數據開放最主要區別在于數據流向不同,數據共享是組織內部的數據流轉,數據開放是組織內向組織外的數據流轉。數據公開與數據開放的最主要區別在于數據形式差異,數據公開是信息層面,數據開放是數據庫層面[4]。
1.1.3 開放數據與數據開放
開放數據與數據開放區別在于所表述側重點不同,開放數據表述的是“數據”資源,指開放的具體內容;數據開放表述的是“開放”行為,涉及開放過程中的利益協調、安全研判、平臺保障等[5]。兩者是密切相關的,數據開放是具體工作與行為,其核心產物就是開放數據。
隨著大數據時代的來臨,為進一步提升政府透明度、釋放社會價值與商業價值、提高社會治理公民參與度[6],數據開放已成為世界性潮流并不斷地蓬勃發展,其中最直接的表現就是開放數據門戶網站在世界各國相繼建立。2009年,美國data.gov上線,目前已提供28萬余個在線下載數據集;2010年,英國data.gov.uk上線,目前已提供14個領域、2.8萬余個在線下載數據集。自然資源數據是世界各國重要的開放數據內容之一,以美國為例,其土地管理局發布了1774個數據集,均為豐富的地圖和地理空間類型自然資源數據。
我國多個省、市政府部門也相繼推出了數據開放平臺,部分組織機構定期對各地政府數據開放水平進行綜合評估,如復旦大學和國家信息中心數字中國研究院聯合發布的“開放數林指數”,該指數于2017年5月首次發布。2021年上半年的評估報告統計表明,目前22個省(直轄市)和152個地級市建立了數據開放平臺,表1展現了“開放數林指數”排名前5的城市自然資源數據開放目錄情況(統計時間為2021年9月15日)。

表1 排名前5的城市自然資源數據開放目錄情況
筆者對202個自然資源數據開放目錄進行高頻詞分析,排名前20的高頻詞結果如表2所示,排名前列的詞組為信息、規劃、建設等。經歸納匯總,較為常見的自然資源數據目錄包括用地規劃許可證、測繪資質、選址意見書、土地出讓信息、土地評估等機構信息數據。

表2 排名前20的高頻詞列表
杭州市數據開放平臺(https://data.hangzhou.gov.cn/)于2019年底上線運行,截至2021年9月15日共發布1034條數據目錄,涉及了50個市級單位和13個區、縣(市)。其中,杭州市規劃和自然資源局共發布市區國土資源日常測繪從業單位名單信息、城市建設用地分類和代碼信息、城鄉用地分類和代碼信息、征地區片綜合地價信息4條數據開放目錄,如表3所示。提供數據接口調用和數據集直接下載兩種數據開放利用方式,提供JSON、XLS、XML、CSV、PDF等支持可機讀的下載數據集文件格式。
通過分析杭州市自然資源數據開放目錄,主要發現以下幾個方面問題。①開放目錄數量少。通過對比表1,可發現杭州市自然資源數據開放目錄數量明顯低于全國數據開放工作先進城市自然資源數據開放目錄數量。②數據價值不高。通過分析表3,可發現已發布的4條數據開放目錄基本均屬于不更新數據,且實際數據條數也相當少,這種開放數據的實際利用價值必然是不高的。③工作持續性差。通過分析表3,可發現已發布的4條數據開放目錄發布時間均為2020年9月或10月,最近一年,自然資源數據開放目錄無任何新增。

表3 杭州市自然資源數據開放目錄表
思想認識的差異分歧主要表現在4個方面。①對開放理解不足,對數據開放的理解占位不高,沒有將該項工作與國家大數據戰略結合起來思考。②風險規避意識過濃,由于數據開放引發的各類風險而不敢或不愿開放數據。③存在產出衡量難的思維,數據開放涉及數據編目、歸集、更新及后續維護等一系列工作,需要耗費大量的人力、物力、財力,對部門本身而言這些工作增加了負擔卻難產生可見收益。④存在數據私有化意識,部門認為業務管理產生的數據為其私有資源,而不斷積累的數據可能會帶來較大的經濟利益。
現階段國家層面沒有出臺數據開放的相關法律,雖然省、市層面出臺了一些數據開放相關規范性文件,包括《浙江省公共數據開放與安全管理暫行辦法》《浙江省公共數據開放工作指引》《杭州市政務數據管理暫行辦法》等,但是并未對開放數據的質量、內容等進行強制性規定,對各個部門的數據開放水平也沒有硬性規定和嚴格標準。數據開放等級的界定也比較模糊,哪些數據選擇怎樣的開放等級,以及為什么選擇這一等級也沒有相關解釋。同時由于數據標準不統一,即使是省、市與區(縣)三級層面所產生的同種業務領域、同樣類型的開放數據,也會存在內容和質量參差不齊、尺度各異的情況。
自然資源數據開放工作尚未建立全面科學的管理機制。①工作流程不明確,例如,編目、采集、治理、發布等數據開放具體流程和各類數據申請、審核等使用流程應逐一明確。②人員分工不明確,例如,數據開放目錄的范圍、字段、更新周期等由誰負責確定,數據開放目錄編制、數據獲取與歸集由誰負責具體實施,數據開放脫敏審核、安全保障由誰負責承擔。③配套的數據管理制度細化不足。應對所有數據進行合理分級,結合現有的資源和技術,針對每個級別的數據制定明確的安全防護標準和技術措施等[7]。
數據開放平臺作為數據開放工作的載體,具備目錄編制與發布、數據建表與匯集、數據檢索與下載、統計分析、互動交流、應用成果發布與展示等功能,技術上不難實現各項功能,核心問題集中在數據開放過程中的數據使用所帶來的數據安全與個人隱私問題。除做好數據防護、數據管控、數據審計等工作外,本文認為可重點考慮以下兩個方面:存在間接識別情況,當與其他數據集結合時,即通過對比不同數據庫或將輔助信息與間接識別數據相結合,看似無害的數據可能暴露出問題[8];對涉及個人隱私和國家安全的重要數據進行脫敏處理,若數據處理過度導致數據變形、數據扭曲,這給數據再利用增加難度[9]。
通過建立自然資源數據開放領導小組及其辦公室,推進自然資源數據開放工作有序開展,保證自然資源數據開放發布及時性、規范性。承擔全局數據開放規劃、組織協調、指導推進、監督檢查等工作,具體包括制定自然資源數據開放發展戰略、總體規劃和階段性目標,組織協調部門之間資源,決議數據爭議,指導與監督檢查等工作。在領導小組工作指導下,業務部門與信息部門應共同協商,建立高效便捷的工作協同機制。
明確數據開放工作實施細則,確定數據開放工作的業務流程與責任部門。按照工作實際,數據開放分為主動開放與依申請開放兩種方式,數據開放等級分為無條件開放、有條件開放與不予開放三種類型。主動開放為按照領導小組制定的數據開放規劃與年度計劃逐步開展開放數據目錄編制與歸集發布工作,業務部門負責做好數據目錄梳理與編制,完成開放等級、所屬領域分類等數據分級分類工作;信息部門負責做好數據目錄規范性、脫敏脫密等內容審核;信息部門負責數據歸集并完成開放數據的發布工作。依申請開放有兩種情況:一種是社會公眾申請有條件開放數據,信息部門負責做好申請人信用、數據安全保護、數據存儲處理等方面的資質審核,審核通過后予以開放數據;另一種是社會公眾提交未開放的數據需求申請,業務部門負責做好需求判定工作,明確數據是否可以開放,若可以予以開放則參照主動開放流程實施,若不予開放則應告知申請人并說明理由。
統籌全局數據資源目錄,逐步完善數據目錄開放清單。新建信息化項目時,應同步做好數據資源的規劃和目錄編制工作,確保業務數據全部納入數據資源目錄大清單,同時對數據目錄與數據項進行分級分類,逐步形成并不斷完善開放目錄小清單。由于分級分類實際操作過程中主觀判定因素對結果影響較大,可建議參照信息公開相關內容做好開放等級判定。《自然資源部政府信息公開指南》涉及的自然資源管理有關法律、法規、規章和其他規范性文件,組織機構情況,國土空間規劃,統計信息,政務服務清單、指南、流程及相關辦理結果,執法種類、依據、程序以及處理結果,部門預算、決算信息,政府采購信息等數據應納入開放數據目錄清單;《國務院辦公廳關于推進重大建設項目批準和實施領域政府信息公開的意見》提及的開放重點也應在開放數據目錄清單中突出編制,包括重大建設項目批準和實施過程中所涉及的重點公開批準服務信息、批準結果信息、招標投標信息、征收土地信息、重大設計變更信息、施工有關信息、質量安全監督信息、竣工有關信息。
數據開放經常被提及的案例就是“消防栓的啟示”。美國波士頓開放了市內1萬多個消防栓的位置數據,社會組織開發了一款名為“領養消防栓”的應用軟件,可以顯示消防栓的位置信息并進行動態監測,市民可申請“領養”消防栓。當消防栓被雪掩埋,它的主人將收到手機消息通知及時前往鏟除積雪。該模式通過數據開放實現了數據增值,同時發動社會公眾共同參與了城市治理,優化了政府管理模式。激活數據活力、創造更多的數據價值是數據開放核心意義,浙江省自然資源管理部門擁有豐富的基礎地理、土地、地質、礦產等數據資源,可依托浙江省數據開放創新應用大賽等活動,研究分析優秀參賽隊伍數據需求,提供定制開放數據服務。
自然資源管理公共數據向社會的開放與共享不僅是一種數據的流動,也是知識和權利的流動,是貫徹“服務型政府”理念的重要體現[10]。雖然其本身不會直接帶來價值,但可創造公共價值,對于不涉及國家安全、商業機密和個人隱私的自然資源數據實施開放工作,將進一步助力經濟發展和社會創新。同時,自然資源數據開放既可能帶來收益,也可能造成風險[11]。在實際工作中,相關部門除了最大程度引導市場參與數據價值開發,也要做好數據開放后的風險防控工作。下一步,本研究將圍繞自然資源數據開放工作實踐,總結積累經驗并提升成熟理論與技術成果,逐步完善形成并發布一系列科學合理的工具性行業指南,包括制定指導開放數據戰略設計、開放數據質量內控指南、數據發布規范、數據許可協議等方面的規范性手冊,為自然資源數據開放工作提供參考意見。