黃思棉,張燕華(廣西大學 公共管理學院,南寧 530003)
當前中國政府數據開放平臺建設存在的問題與對策研究
——以北京、上海政府數據開放網站為例
黃思棉,張燕華
(廣西大學 公共管理學院,南寧 530003)
大數據時代,政府數據公開日益受到各界關注。筆者分析了北京、上海兩市政府數據開放網站建設和運營情況,針對網站存在的開放數據范圍窄、更新周期長、含金量及利用率低等問題,提出促進政府數據開放平臺建設的有關對策。
政府;數據開放;平臺;大數據
大數據時代,政府作為最大的公共數據資源擁有者,有責任和義務通過數據資源開放,提升政府治理水平、促進透明政府建設,推動整個社會挖掘政府數據的巨大價值,以增加民眾福祉。從2009年美國政府提出“開放政府計劃”并建設政府數據公開平臺Data. gov網站起,包括英國、法國、加拿大、澳大路亞、新西蘭和新加坡等國家也陸續制訂和實施了具有本國特點的政府數據開放計劃。中國政府也逐步意識到大數據時代所帶來的機遇和挑戰,正采取措施積極應對。2013年8月,中國國務院發布的《關于促進信息消費擴大內需的若干意見》中明確提出,要加快政府職能轉變和管理創新,促進信息資源開放共享和企業公平競爭,推動市政公用企事業單位、公共服務事業單位等機構開放信息資源。目前,中國國家層面的政府數據開放平臺尚未開始建設,但是部分信息化建設和政務公開的先進城市,例如北京、上海、青島、杭州等城市已嘗試開展政府數據開放的工作。
從全球經驗來看,政府數據開放平臺往往采用專門數據網站的形式,以滿足社會公眾對數據訪問和下載的需求。目前,中國政府數據開放方面宣傳較多、影響面較大的城市有北京市和上海市,這兩個城市均是直轄市,且社會、政治、經濟和文化發展均走在全國各省區的前列,有典型示范作用。通過這兩個網站的建設與服務情況分析,可以了解中國政府數據開放的實施情況和存在的問題。為此,筆者根據網站公開的信息收集了有關數據(數據截至2015年4 月10日),對數據項個數、應用程序個數、下載量、更新時間和頻度進行了統計。
1.1北京市政務數據資源網建設基本情況
北京市政府數據資源網(www.bjdata.gov.cn)由北京市經濟和信息化委員會牽頭建設,北京市各政務部門共同參與,于2012年10月開始試運行。據筆者統計,該網站匯集了36個政府部門的313個數據項,數據文件下載格式有CSV、DBF、SHP、SHX、TXT等幾種,累計數據下載26 754次。該平臺目前僅有7個App可供下載,無下載量顯示,總關注量為7 230次。企業、科研機構和個人只要在該網注冊,同意網站免責聲明的用戶都可以在數據資源網下載和上傳內容。該網站最大的亮點是免費提供大量的地圖API、搜索API及其開發樣例。據其介紹,用戶可根據自己的需求創建自己的地圖應用程序,可在自己的網站中構建操作簡單、功能豐富的地圖應用。數據項的更新情況見表1。
1.2上海市政府數據服務網建設基本情況
上海市政府數據服務網(www.datashanghai.gov.cn)由上海市人民政府辦公廳、上海市經濟和信息化委員會牽頭建設,相關政府部門共同參與,于2014年5月正式開通。2014年11月,在中國智慧政府發展年會上,該網站榮獲本屆政府網站特色評選“數據開放實踐領先獎”。據筆者統計,該網站匯集了35個政府部門的466個數據項數據,數據文件下載格式為XLS,目前累計數據下載35 353次。在這個數據平臺上,可供下載的應用程序目前有15個App,185次用戶下載。目前,該網注冊功能尚未完善,外地IP地址用戶還不能夠順利下載數據。數據項的更新情況見表2。

表1 北京市政務數據資源網數據更新時間情況統計表

表2 上海市政府數據服務網數據更新頻度統計表
從北京市政務數據資源網和上海市政府數據服務網的數據下載次數、應用情況及用戶體驗來看,筆者認為這兩個網站還遠遠未達到其推動信息惠民和社會化開發利用,更好地滿足社會信息消費需求的目標。這兩個數據開放平臺主要存在如下問題。
2.1開放數據的范圍太窄,數據規模小
政府數據涉及到民眾的方方面面,種類繁多,形式多樣,規模巨大。有研究認為,中國政府掌握著社會80%以上的數據資源。因此,獲取政府數據是大數據技術能廣泛應用繞不過去的一道至關重要的門檻。然而,北京市政務數據資源網2012年10月開始運行迄今,可公開的數據項只有313個,應用工具7個;上海市政府數據服務網從2014年5月運行至今,可公開的數據項也才466個,應用工具15個。在這兩個平臺網站的公開數據項中,較多的是統計數據、簡單的單位地址數據以及經過簡化后的審批數據,均不具有與民生相關的實時交通、物價、天氣和經濟運行等數據。相比之下,美國Data.Gov于2009年5月上線發布,到2011年12月,就開放了原始數據3 721項(注意是原始數據),匯集了1 140個應用程序和軟件工具、85個手機插件。由此可見,這種差距是相當巨大的。
2.2更新周期過長,影響數據的使用價值
數據時效性是數據的生命所在,數據價值隨著時間的推移將逐步貶值。時效性是大數據可用性的重要指標,信息集合中每個信息應在合理的周期內更新,以確保使用效能。例如,某數據庫中的用戶聯系方式在2011年是正確的,但在2013年未必正確,即數據過時了。據統計,商業和醫療信息庫中平均50%的用戶信息在2年內可能過時,而過時信息將會導致嚴重后果。根據筆者統計,北京市政務數據資源網上,2013年12月以前的數據項有256個,占總數據項的82%;而上海市政府數據服務網更新頻度3個月以上的數據項有367個,占總項數的79%。很顯然,缺乏及時有效的更新機制,嚴重滯后的數據、時效性不強的數據,是難以獲得公眾的關注和青睞的。
2.3數據含金量不夠,缺乏研究和挖掘的價值
在這兩個平臺網站開放的數據項中,相當多的是單位地址數據和政府審批統計數據,據筆者粗略統計約占總數據項的85%以上。其他的數據也主要是經過簡化后的審批數據,不具有較高信息量的行政管理數據和與民生相關的實時交通、物價、天氣以及經濟運行等原始數據。例如,北京市政務資源網上公開的星級酒店數據項,該數據是北京市旅游發展委員會登記注冊的北京市星級飯店信息,內容只包括名稱、星級、區縣、地址、電話和郵編等屬性字段,沒有各類客房數量、客房空置率以及房價等方面的關鍵內容。另外,各部門間提供的數據彼此間缺乏關聯,沒有參照項,單個數據項的記錄數基本上在1 000條以內,無法挖掘其內在價值。政府數據開放的目的是促進數據的綜合應用,挖掘數據的內在價值,但信息蘊含量如此“貧瘠”的數據難以實現信息的增值服務。
2.4數據實際利用率低,主動服務意識淡漠
據筆者統計,北京網站數據下載總量是2.67萬次,上海網站是3.53萬次,另外,這兩個網站可供下載的應用程序的數量合在一起也不超過30個,應用程序的下載量更是少得可憐。這一方面是數據內容、含金量的問題,很多數據下載后并無多少挖掘的價值;另一方面也是網站服務意識淡漠、宣傳推薦不夠導致的。以筆者體驗上海市政府數據服務網的用戶注冊功能為例,經反復嘗試始終無法實現用戶注冊(可能是限制了外地IP地址注冊,但沒有任何說明),另外,該網站也沒有提供任何反饋技術故障、提供服務咨詢的聯系方式。以這種敷衍和不負責的態度開展數據開放工作,難以獲得社會認可,也達不到數據開放的實際效果。
從當前北京市政務數據資源網和上海市政府數據服務網的應用情況看,所謂數據資源網,資源不足;所謂數據服務網,服務不到位,這與當前社會各界對大數據應用的熱切展望形成了非常大的反差,令人深思。筆者認為,要促進政府數據開放平臺的建設,需認真分析其問題產生的原因,采取有針對性的措施。
3.1提升信息公開的法律地位,為公開數據提供法律保障
當前《政府信息公開條例》的法律效力低于《保守國家秘密法》《檔案法》等以信息保密為立法取向的法律,限制了政府數據公開的深度和廣度。目前我國政府數據公開還處于起步階段,考慮到公開的數據可能會涉及到公民的個人隱私、國家安全等重要領域,過于謹慎地防范數據侵權安全風險,制約著政府數據公開的實施。數據公開造成的法律風險遠大于數據不公開的法律風險,從這個角度看,北京市和上海市有關部門在數據公開方面的謹慎態度也是可以理解的。為促進政府數據公開的快速可持續發展,政府應考慮在法律頂層設計方面充分改進制度框架,將《政府信息公開條例》提升為《政府信息公開法》以加強信息公開的法律地位,建設相關的配套地方法規和部門規章,進一步明確哪些數據必須面向公眾開放,哪些數據可以對特定公眾開放,以及數據更新的頻度,同時對數據開放中出現的特殊情況制定免責條款,給予一定的制度容錯和救濟。針對數據開放方面,可適當放松政府行為的管束,以促進政府數據公開;而對數據的利用,可以考慮給予數據使用者較嚴格的限制和規定,以保護國家秘密、商業秘密以及個人隱私。
3.2以攻堅克難的工作態度和擔當精神,積極推進數據開放
政府數據從理論上來講都是財政投入產生的,除涉密數據以外都應公開。另外,根據《政府信息公開條例》的規定,醫療衛生、教育、供水、供電、環保以及公共交通等與社會公眾利益密切相關的公共企事業單位在提供社會公共服務過程中制作、獲取的信息均應主動公開。可事實上政府部門普遍不愿意開放數據,主要是基于以下幾點考慮。一是把數據資源看成是本部門的權利資源,壟斷數據有可能給部門或下屬企事業單位帶來巨額利益;二是開放數據將把政府部門的決策和管理過程進一步置于公眾的監督之下,將大大限制政府部門的運作權力和辦事效率;三是開放數據有可能引起公眾針對數據的大量咨詢和質疑,也涉及到后續的數據更新和維護,大大增加工作量,本著多一事不如少一事的本位主義,不愿意開放數據。而政府管理的公共企事業單位為維護其壟斷地位和所謂的商業秘密,其擁有和掌握的數據資源更難開放。由于政府數據開放工作牽涉的部門眾多,事項繁雜,各種利益糾結其中,光靠某一部門牽頭負責,在現有的管理體制下,同級機構之間沒有隸屬關系,協調難度大。由此可見,數據開放實際上是一個管理課題或政治課題。因此,政府數據開放要真正重視和推動起來,就要以政府為主要領導牽頭,將其列入年度“民辦實事”的事項之中,對各部門的數據收集和整合做好全盤統籌協調、制定詳細的實施進度,明確責任追究辦法,才能取得實效。
3.3充分依托現有信息系統,以備份或鏈接方式實現數據開放
我國經過20多年的電子政務建設,政府的管理信息系統及數據的采集處理幾乎覆蓋各業務部門和主要公共服務,各個部門的業務信息系統建設都卓有成效。北京市、上海市各個政府部門的門戶網站都建設得非常好,網站公示給社會公眾的信息種類和信息數量,要遠遠大于提交給政府數據開放平臺的數據。由此可見,很多政府不是沒有數據,也不是不能公開數據,而是愿不愿意將這些數據單獨提交出來供社會研究與應用。因此,當前亟需進一步破除部門分割的數據壁壘,以便政府數據能及時、有效地面向社會公開。筆者認為,現階段可以通過以下兩種方式實現政府數據公開平臺的數據收集和整合工作:一是對政府各部門的業務信息系統進行改造和升級,特別是針對其后臺數據庫系統以數據備份的方式將數據同步到政府數據公開平臺上,再由數據平臺提供給社會訪問;二是規范數據接口的訪問方式,將數據平臺上的數據項訪問條目直接連接到相應的政府各部門政務網站上,由政府部門的門戶網站提供需要的數據。這樣可用極少的代價和很短的周期實現政府數據開放平臺的功能,取得政府數據開放的實效。
3.4推動社會評議制度建設,加強對數據開放的績效考核
數據開放本質上還是政府信息公開的一種形式,因此,完全適用《政府信息公開條例》中指出的要建立健全政府信息公開工作考核制度、社會評議制度和責任追究制度,定期考核評議的要求。但在實際執行過程中,考核往往流于形式。一方面,相關責任人在考核評議過程中,認識不到位,搞形式主義;另一方面,信息公開是一項專業性較強的技術行為,由于大量的非專業人士參與考核導致監督缺乏專業性,從而使得體制內的監督難以達到應有水平。筆者認為,政府數據開放工作既然是直接面向社會公眾,為社會公眾服務的,就應該摒棄之前政府自我執行、自我監督的弊端,倡導、推行社會評議的方式。數據開放工作做得好不好,滿不滿足社會實際需要,不能由有關部門自說自話,應由社會公眾來評價。這就要求政府轉變思維模式,從傳統的統治型和管理型轉為服務型,在征集社會評議上以服務水平、服務效率以及服務實效作為設立評價指標的出發點,具體實施中要明確評議的范圍、實施流程和具體落實方式等。另外,還要將社會評議的結果與對部門的考核及干部的選拔任用和獎罰結合起來。這樣可促使政府部門及其負責人更加重視數據開放工作,不斷提高數據服務意識,得到上級和社會的肯定。
對于大數據應用而言,政府數據獲取是一道繞不過去的門檻,數據開放也已成為各國的共同趨勢。目前,我國政府數據開放步伐較落后,國家層面的政府數據開放平臺尚未開始建設,而北京、上海等城市的數據開放平臺建設遇到的困難也警示我們,政府數據開放工作任重而道遠。數據開放工作是個政治課題,需要破除部門壁壘,斬斷利益糾葛,中國政府進行數據開放平臺建設必須要有擔當精神、服務意識和惠民意識。
主要參考文獻
[1]李建中,劉顯敏.大數據的一個重要方面:數據可用性[J].計算機研究與發展,2013(6).
[2]申燦,閆利平,張寶來.大數據時代地方政府信息公開的現狀[J].法制博覽,2015(2).
[3]中國信息產業網.英美:數據公開、社交互動成潮流[EB/ OL].(2015-05-20)[2013-07-30].http://www.cnii.com.cn/ thingsnet/2013-07/30/content_1193700.htm.
10.3969/j.issn.1673 - 0194.2015.14.134
D63
A
1673-0194(2015)14-0175-03
2015-05-02