文/常江(華東政法大學經濟法學院,上海200042)
公共數據具有巨大的社會價值和經濟價值。特別是隨著大數據時代的來臨、數字經濟的蓬勃發展,數據逐漸成為一種重要的生產要素。政府逐漸意識到,開放這些數據,有利于提高政府自身的治理能力。為此,上海市、貴州省率先開展了公共數據開放的實踐。早在2012 年,上海市就建立了全國省級政府第一個公共數據開放平臺。截至2021 年10 月,我國已有193 個省級和市級的地方政府上線了數據開放平臺。與2020 年下半年相比,新增51 個地方平臺。①復旦大學數字與移動治理實驗室:《中國地方政府數據開放報告——省域(2021 年度)》,http://www.dmg.fudan.edu.cn/wp-content/uploads/2021ycity.pdf,訪問日期:2022 年3 月18 日。與平臺建設相對應,各地快速推進立法。2019 年,上海市率先出臺了《上海市公共數據開放暫行辦法》(上海市人民政府令第21 號),這是國內首部專門規范公共數據開放的省級政府規章。隨后,廣東①《廣東省公共數據管理辦法》(廣東省人民政府令第290 號)。、江蘇②《江蘇省公共數據管理辦法》(江蘇省人民政府令第148 號)。、山東③《山東省公共數據開放辦法》(山東省人民政府令第344 號)。等省也陸續出臺了有關公共數據開放的地方立法。
公共數據開放所釋放的數據價值、經濟效益似乎并未達到預想的效果。一是數據集覆蓋面不夠,數據呈現碎片化趨勢。本應作為一個數據集的大類數據,被按照行業、地域拆為多個數據集,大大降低了數據價值,很難被開發。二是數據格式單一,有的并未采用可機讀格式。例如,某省級政府公共數據平臺資源使用排名第一的數據,是該省會城市的政區圖,開放格式為jpg 圖片壓縮格式。這樣的“數據”,實際上僅是掃描的紙質地圖,不能被加工成數據產品。三是數據的時效性不夠。大部分數據都是靜態的一次性數據,即使有一部分動態數據,如交易數據、環境監測數據、市場監管數據等,也更新不及時。四是數據的價值與時效性密切相關。市場主體期待獲取高頻實時更新的數據,以滿足商業模式創新和數字產品開發的需要。各地數據開放平臺還普遍存在公共數據和政府信息混雜的情況,將本應屬于政府信息公開的內容,如機構職責、領導人信息、統計公報等混雜在公共數據當中,進一步稀釋了數據價值。④公共數據與政府信息存在顯著不同,政府統計報告、政府數據可視化、政府數據應用等,都不應列入公共數據開放的范圍。鄭磊:《開放不等于公開、共享和交易——政府數據開放與相近概念的界定與辨析》,《南京社會科學》2018 年第9 期。事實上,國外的公共數據開放平臺,也存在類似問題。如美國的政府數據平臺,同樣存在缺乏元數據、數據質量參差不齊、數據群未能覆蓋全部數據等問題。⑤陸建英、鄭磊、Sharon S. Dawes:《美國的政府數據開放:歷史、進展與啟示》,《電子政務》2013 年第6 期。即使在發達國家,政府數據開放度仍不高,低于各國的預期。⑥才世杰、夏義堃:《發達國家開放政府數據戰略的比較分析》,《電子政務》2015 年第7 期。政府數據開放運動在全球范圍內陷入發展瓶頸。⑦胡業飛、田時雨:《政府數據開放的有償模式辨析:合法性根基與執行路徑選擇》,《中國行政管理》2019 年第1 期。
本文試圖從制度建設層面分析現行立法原則,嘗試尋找公共數據開放陷入瓶頸的制度原因,并就如何構建公共數據開放路徑提出建議。需要說明的是,本文所稱的公共數據,是指公共機構在履行公共管理和服務職能過程中所收集和產生的數據。一些論文使用了政府數據的概念。和公共數據相比,政府數據是將數據的收集和產生主體限定在行政機關,在數據的管理要求、開放原則等方面沒有實質性差異。⑧鄭春燕、唐俊麒:《論公共數據的規范含義》,《法治研究》2021 年第6 期。故下文在討論時我們會同時使用公共數據和政府數據這兩個概念。
2007 年12 月,30 位開放政府倡導者在美國加利福尼亞州舉行會議,提出了政府數據開放的八項原則,為評估政府數據開放制度提供了參考。①Open Government Data Principles,https://public.resource.org/8_principles.html,訪問日期:2022 年3 月6 日。此后,有關政府間協議、非政府組織等在此基礎上完善了開放原則。②2013 年7 月,八國集團領導人簽署的《開放數據憲章》提出了數據開放的五項核心原則(默認數據開放原則、數據質量和數量原則、人人可用原則、為改善治理發布數據原則、為激勵創新發布數據原則);2015 年,《國際開放數據憲章》提出了數據開放的六項原則(默認開放原則、及時全面原則、可訪問和可用性原則、可比較和可互操作原則、改善治理和公眾參與原則、促進包容性發展與創新原則)。這些公共數據開放原則,提出的角度各不相同:有的反映了數據開放應當遵循的目標,如《開放數據憲章》認為數據開放應當遵循改善治理和公眾參與原則③Building Global Open Data Principles,https://opendatacharter.net/our-history,訪問日期:2022 年3 月17 日。;有的反映了實踐層面的技術要求,如英國開放知識基金會(Open Knowledge Foundation)認為開放數據應當遵循原始性、機器可讀性、非專有格式等原則④Open Definition:Defining Open in Open Data,Open Content and Open Knowledge,https://opendefinition.org/od/2.1/en,訪問日期:2022 年3 月17 日。;還有的原則是從公共數據提供者與使用者關系角度出發,涉及不同主體之間權利義務的分配,屬于構建公共數據開放制度的指導性原則。默認開放、免費開放、無差別開放等三項基本的立法原則得到了比較廣泛的認可,分別涉及數據開放范圍、成本負擔和開放方式。
默認開放原則是指全部公共數據默認處于“可開放”的狀態。除了特定原因,如國家秘密、商業機密、個人隱私、版權保護等可以不開放外,其他公共數據一律無條件開放。《國際開放數據憲章》認為,政府需要證明保持封閉的數據是合理的,例如出于安全或數據保護等方面考慮,否則就應當對數據進行開放。⑤International Open Data Charter,https://opendatacharter.net/principles,訪問日期:2022 年3 月17 日。
免費開放原則是指政府應免費提供數據開放,不得因提供數據收取任何費用。開放數據工作組認為費用是公眾獲取政府數據的最大障礙。⑥Ten Principles for Opening up Government Information,https://sunlightfoundation.com/policy/documents/ten-open-dataprinciples,訪問日期:2022 年3 月17 日。美國訪問量最大的免費國會數據下載網站創始人Joshua Tauberer 在《政府數據開放》一書中歸納了數據開放的十項原則,其中首條原則就是免費。他認為,如果政府數據不能在互聯網上免費獲得,那么這樣的數據開放沒有意義。⑦Joshua Tauberer,Open Government Data,Second Edition(2014),https://opengovdata.io/2014/online-free-primarytimely-accessible,訪問日期:2022 年3 月17 日。免費開放原則至少傳達出三層含義:數據開放行為本身不得收取費用;數據格式采用開放性的文件格式,不需要使用專用收費軟件即可實現數據利用;賦予的數據許可條款是全面的、充分的。
無差別開放原則是指數據一旦開放,即對所有社會公眾開放,任何人都可以無條件獲取該數據。根據英國開放知識基金會的定義,無差別性是開放(openness)應當具備的基本元素,必須確保使用者獲得訪問、獲取、使用、增值、演繹、拷貝、傳播數據的權利。①Open Definition:Defining Open in Open Data,Open Content and Open Knowledge,https://opendefinition.org/od/2.1/en,訪問日期:2022 年3 月17 日。該原則側重保護公眾的數據獲取權利,強調獲取數據無須申請和注冊,可以進行完全匿名的訪問。②Joshua Tauberer,Open Government Data,Second Edition (2014),https://opengovdata.io/2014/no-discriminationlicense-free,訪問日期:2022 年3 月17 日。
受公共數據開放運動的影響,有關國家公共數據開放法律和政策在設計時也體現了這些原則。例如,2020 年,美國國會通過了《開放政府數據法案》,對開放政府數據資產,采納默認開放原則和免費開放原則,即在法律未另行禁止的情況下,聯邦政府維護的公共數據資產和非公開數據資產應以開放格式提供,同時不向公眾收取費用。③Open,Public,Electronic,and Necessary Government Data Act (OPEN Government Data Act),https://www.congress.gov/bill/115th-congress/house-bill/1770/text,訪問日期:2022 年3 月17 日。加拿大政府在《開放數據憲章——加拿大行動計劃》中明確提出,要保證發布的開放數據能夠免費使用。④才世杰、夏義堃:《發達國家開放政府數據戰略的比較分析》,《電子政務》2015 年第7 期。2012 年,英國政府發布的《開放數據白皮書——釋放數據潛能》對開放數據提出三項標準,其中之一是不限制用戶身份和意圖,都可以獲得政府數據。⑤王萬華:《論政府數據開放與政府信息公開的關系》,《財經法學》2020 年第1 期。2013年,韓國出臺《公共數據提供和使用法》,對公共數據開放的范圍,采取負面清單的方式,除保密信息和未獲得法律合法許可的信息外,公共機關負責人應當向公眾提供由有關公共機構持有和管理的公共數據。⑥《公共數據提供和使用法》,http://www.odsc.go.kr/user/nd82389.do,訪問日期:2022 年3 月10 日。許多國家在不同時期的法律中,將默認開放、免費開放和無差別開放等原則作為制度設計的基本指導思想。當然,也有部分國家在立法中對上述原則做了一定程度的調整。⑦英國明確公共數據開放可以采取邊際成本收費;法國的《再利用法案》規定,為了限制部分數據集的使用,可以實行定價收費。才世杰、夏義堃:《發達國家開放政府數據戰略的比較分析》,《電子政務》2015 年第7 期。
2015 年,《國務院關于積極推進“互聯網+”行動的指導意見》(國發〔2015〕40 號)明確了開展公共數據開放改革試點,推進政府和公共信息資源開放共享,支持公眾和小微企業充分挖掘信息資源的商業價值,促進互聯網應用創新。在該文件的指引下,各地從2017 年開始,在地方性法規和政府規章層面,開展了大量的立法探索。
國內立法對默認開放原則的表述有三種表達方式:一是完全的默認開放。貴州省是我國大數據產業發展領先的省份之一,2017 年《貴陽市政府數據共享開放條例》(市人大字〔2017〕4 號)明確規定,除涉及國家秘密、商業秘密、個人隱私和法律法規規定不得開放的政府數據外,應當向社會開放政府數據。2022 年,《山東省公共數據開放辦法》(山東省人民政府令第344 號)更是將“公共數據以開放為原則,不開放為例外”確立為立法的基本原則。二是限縮式的默認開放。2022 年,《黑龍江省促進大數據發展應用條例》將開放范圍表述為“確定為有條件開放和不予開放數據的,應當以法律、法規或者國家有關規定作為依據”。雖然這種表述對范圍有所限縮,但是仍然是一種非常寬泛的負面清單式的立法表述。原因是,公共數據開放是近年來出現的新生事物,現行法律法規和國家規定在起草頒布時,沒有考慮數據開放的情形,極少有法律會對公共數據的開放作出明確的肯定或否定的表述,即使事實上這類公共數據應列為不予開放的范圍。三是附條件的默認開放。此類以廣東省、浙江省的立法為代表。2021 年,《廣東省公共數據管理辦法》(廣東省人民政府令第290 號)規定,法律、法規、規章以及國家規定要求開放或者可以開放的公共數據,應當開放;未明確能否開放的,應當在確保安全的前提下開放。這實際上將法律未明確開放的數據也列入了開放范圍。所謂“確保安全”,是開放的一個前提條件,并非對開放范圍的約束。此外,也有部分地區未采用默認開放原則,而是采用了以正面清單為主的開放原則。
在公共數據開放是否收費的問題上,目前國內立法基本上秉持了免費開放的原則,但是在表述上有所差別。有的地區明確規定了免費開放原則。2020 年,《山西省政務數據管理與應用辦法》規定,政務服務實施機構按照政務數據開放目錄,向社會免費開放經過脫敏和標準化處理、可機器讀取的數據。2020 年,《浙江省公共數據開放與安全管理暫行辦法》(浙江省人民政府令第381 號)規定,除法律另有規定外,公共數據開放主體應當免費開放無條件開放的數據、獲取本人或本單位的受限開放類數據、第三人經授權的受限類開放數據等。雖然有的地區對公共數據開放是否收費未作直接規定,但是概括性規定把相關工作經費納入財政預算。2021 年,《上海市數據條例》規定,公共管理和服務機構開展公共數據收集、歸集、治理、共享、開放及其質量和安全管理等工作涉及的經費,納入市、區財政預算。2021 年,《江蘇省公共數據管理辦法》(江蘇省人民政府令第148 號)規定,公共數據管理工作所需經費納入本級財政預算。實際上,從目前各地實踐情況來看,基本上實行了免費開放的原則。
國內立法也涉及無差別開放原則。例如,《貴陽市政府數據共享開放條例》(市人大字〔2017〕4 號)規定,政府數據應當以可機讀標準格式開放,公民、法人和其他組織可以在線訪問、獲取。其并未對獲取數據的主體予以特定限制,任何人都可以無條件獲取數據。《成都市公共數據管理應用規定》(成都市人民政府令第197 號)也有類似規定。但是不少地方意識到難以運用無差別開放原則,對該原則做了一定程度的修正,將公共數據的開放情形設計為無條件開放、有條件開放和不予開放等三類,允許對某些領域的公共數據設定獲取條件。
默認開放原則能夠獲得較為廣泛的認可,有其特定的背景。該原則是國際公共數據開放運動初期就提出來的一項基本原則,此時公共數據開放仍處于起步階段,來自政府外部的聲音要求政府推進公共數據的開放,各國政府尚未達成一致的行動共識。絕大部分公共數據仍然塵封在政府信息系統當中。因此,為了快速推動政府數據開放運動的發展,借鑒了政府信息公開的原則,一些國家提出了默認開放原則。隨著公共數據開放的深入推進,如果完全采納默認開放原則,可能會面臨一系列問題:一是必要性不足。政府數據涉及面極為廣泛,包括農業、氣象、能源、海事、環境、醫療、衛生、國防、人口、經濟等方面。公共數據開放有別于政府信息公開的一個顯著特點是,信息公開的價值目標是保障公眾的知情權,而公共數據開放的主要價值目標是實現數據的經濟社會價值。在目標層面,政府信息公開目標側重“知”,而公共數據開放側重“用”。①王錫鋅、黃智杰:《公平利用權:公共數據開放制度建構的權利基礎》,《華東政法大學學報》2022 年第2 期。因此,與確保知情權實現不同,數據開放首先應考慮數據價值維度。在開放序位上,并非所有數據都有立即開放的價值和必要,而應當根據社會需求,優先開放與經濟社會發展密切相關的數據。二是風險性難以把握。公共數據涉及國家秘密、商業秘密和個人敏感信息,即使經過脫敏脫密處理,也很難保證在算法、算力進一步升級后可能存在新的風險。特別是一旦開放全領域的數據,融合、比對、交叉使用不同數據集,可能會產生不可預知的風險,即公開數據與其他數據混合分析會產生“馬賽克效應”。三是數據開放的成本問題。默認開放很難實行的一個重要原因是,幾乎所有的公共數據開放的倡導者都忽略了數據開放的成本問題。目前公共部門控制的公共數據,是不同機構在不同時期積累形成的,層級不同,格式不同,元數據單元不同。如果要形成具有社會利用價值、可以對外開放的數據集,必須對數據進行清洗、變換、規約、集成、脫敏、脫密等,每一步都意味著成本投入。同時,數據的儲存、安全保護也需要大量資金支持。更何況,面對公眾不同的數據開放需求,還需要有相應技術能力的工作人員進行研發、管理。即使公共部門形成了數據,由于數據制作與開放之間存在漫長鏈條,事實上無法實現所有數據都達到可以開放的狀態。四是默認開放原則可能帶來濫訴問題。默認開放原則作為政府信息公開的基本原則有其合理性,因為政府信息公開作為政府的法定義務,根植于政府合法性理論;公共數據開放是政府提供的服務,根植于政府有效性理論。②Beth Simone Noveck,“Is Open Data the Death of FOIA?”Yale Law Journal Forum 126(2016—2017),pp.273-286.默認開放原則使公共數據開放變為公共部門的一項法定義務。在這種原則的約束下,公眾可以隨時要求公共部門開放數據。但是公共部門由于技術能力、時間、成本所限,如果無法提供相應的數據,就意味著處于不作為的違法行為狀態,可能導致公共部門承受不必要的訴訟負擔。默認開放原則導致政府負有開放義務的數據范圍過大,還要應對潛在的不作為挑戰,在資源有限的條件下,政府無法集中優勢力量聚焦高價值數據的治理、開放,不能釋放公共數據真正具有的價值。
免費開放原則同樣存在問題。如上所述,公共數據從采集到能夠對外開放的狀態,有很長的數據處理鏈條。更何況,很多數據需求方,特別是商業化的利用需求,往往要求接口開放、持續供給、實時更新,同時對數據內容和數據質量有很多特定需求。滿足這些商業化需求需要投入更高的成本,如果也由財政資金來支付,那么顯然有失財政負擔的公平性。也就是說,不應當通過財政支出來滿足商業企業數據利用的個性化需求。①羅培新:《數據立法的基本范疇:數據權屬及數據處理的頭部、中部及尾部規則》,中國法律評論公眾號,2021 年4 月29 日。實行公共數據免費開放模式,就相當于向全體公民征收“數據稅”,但是納稅人并沒有從這些數據開放行為中獲益。②胡業飛、田時雨:《政府數據開放的有償模式辨析:合法性根基與執行路徑選擇》,《中國行政管理》2019 年第1 期。對公共部門來說,其原有的預算、人力、技術能力并不足以支撐市場所期待的數據開放需求。一個合乎邏輯的現實情況就是,在公共數據免費開放的情況下,公共部門自然選擇開放那些數據治理成本低、開放難度小的數據,而不去提供高質量但同時需要負擔高額開放成本的數據,即使這類數據才是公眾最需要的數據。之所以會出現數據碎片化、數據時效性差、數據與信息混雜等問題,是因為免費開放原則導致政府投入不足,沒有足夠能力和動力提升數據質量。
無差別開放原則的本意是在公共數據開放中,對數據利用主體不應當設定差異化條件,所有數據均應一視同仁地對外開放。在實踐中推行該原則同樣困難重重。主要原因是,在公共數據中,確實有些數據是可以對不特定的公眾開放的,任何人均有權獲取。這些數據往往是基礎性、非敏感的數據,如開放某地基本氣象數據、企業注冊的基礎數據等。對于某些行業的高價值數據,如公共交通數據、地鐵人流數據、企業納稅數據、居民用水用電數據等,屬于高敏感的數據集,對數據利用主體的技術水平、管理能力都有相應要求。如果向公眾實行無差別的開放,在不了解數據利用主體自身能力、應用場景的情況下,就會存在較大的數據失控風險。因此,在無差別原則的約束下,政府部門實行公共數據開放時,只能基于社會公眾的一般數據管理能力水平來確定開放內容,同樣導致數據質量無法達到社會預期的問題。
默認開放原則、免費開放原則、無差別開放原則當然具有積極意義,對公共數據開放運動在全球迅速興起發揮了很大推動作用,在一定范圍內也取得了共識。但是這些原則導向與政府的實際能力和現實基礎之間存在偏差,當以這些原則來指導立法,并借助立法的力量將公共數據開放運動向更大范圍、更深層次推進時,就不可避免地出現了上文所提及的問題。因此,只能說這些原則是具有理想色彩的宏大目標,更適合作為推動公共數據開放運動的理念,而不宜作為立法的原則。為了將公共數據開放工作向更深入的方向推進,同時為國家層面開展公共數據開放立法提供參考,立法者有必要對公共數據開放的立法原則予以修正。
正面清單開放原則與默認開放原則秉持不同的理念。默認開放是推定式的開放,也就是說,只要沒有被納入禁止開放的清單,一律要對外開放。正面清單開放是指建立可開放的數據資產清單目錄,凡是被列入清單的,屬于可以開放的范圍;未被列入的,即屬于不可開放的范圍。正面清單開放的好處是,公共部門可以將有限的資源投到經濟社會最需要的數據當中,優先將數據價值高、社會需求大的數據,納入數據開放的范圍。同時,通過正面清單,還可以標注數據的開放形式、條件等信息。正面清單開放的弊端可能是開放的數據范圍較小。為了彌補這一問題,可以引入公眾參與機制,允許公眾對數據清單的開放范圍提出評議意見,公共部門根據社會需求及時擴大清單范圍。同時,也應當允許公眾在開放數據清單之外提出數據需求,采取一事一議的方式,確定開放的范圍。如此一來,既可以通過正面清單聚焦社會的需求重點,將有限資源聚焦于最有價值的數據,也可以通過公眾參與和例外申請來不斷擴大開放范圍,從而更務實地劃定開放范圍,提升數據開放的質量。實際上,已經有部分省份對正面清單開放原則進行了探索。例如,《上海市公共數據開放暫行辦法》(上海市人民政府令第21 號)規定,數據開放主體應當在公共數據資源目錄范圍內,制定公共數據開放清單,列明可以向社會開放的公共數據。其后續的制度設計,均圍繞該清單展開。雖然并未明確清單外的數據是否可以公開,但是按照行政職權法定的原則推斷,行政機關不得在清單之外向社會開放數據,故可以認為采取的就是正面清單的開放思路。在立法的推動下,上海市在數據開放質量、開放利用度等方面,在省級政府中都取得了較高的得分。①復旦大學數字與移動治理實驗室:《中國地方政府數據開放報告——省域(2021 年度》,http://www.dmg.fudan.edu.cn/wp-content/uploads/2021ycity.pdf,訪問日期:2022 年3 月18 日。
如上所述,免費開放原則作為一種倡導的理想,是有其價值的,但是必須與收費開放原則相結合。兩者并非矛盾的,而是可以并存的,各自有著不同的適用場景。免費開放的數據主要聚焦于基礎性、通用性,與普通社會公眾生產、生活、學習研究有較強關聯性的數據。這些基礎性、通用性的數據,大多是公共部門在推進智慧政府、一網通辦建設等過程中所積累的監管數據和服務數據。公共部門對這些系統的建設已經投入了大量財政經費,數據只是這些系統運行的“副產品”,實行免費開放屬于題中應有之義。而對于收費開放的數據,我們應當從兩個方面把握。一方面,這些數據屬于機構用戶的專業性需求,特別是具有商業目的的數據使用需求,其數據用途本身就具有營利性。另一方面,商業目的使用的數據往往是跨領域、跨部門的大型數據集,具有復雜的數據結構和數據層級,面臨艱巨的數據治理任務,脫敏脫密的難度也較大,數據從積淀在有關政府部門的初始狀態到實現可開放狀態,必須支付高昂的處理成本以避免“巴別塔困境”(Tower of Babel)。②高價值數據集的形成猶如建設巴別塔,只有整合不同數據集,才能形成真正具有價值的大型數據集。Open Knowledge Foundation:Open Data Handbook,http://opendatahandbook.org/guide/en/what-is-open-data,訪問日期:2022 年3 月17 日。實際上,實踐中企業大多數表示愿意通過適度付費的方式來獲取公共數據。①羅培新:《數據立法的基本范疇:數據權屬及數據處理的頭部、中部及尾部規則》,中國法律評論公眾號,2021 年4 月29 日。政府數據開放的有償模式有利于實現政府的數據收益權、降低行政成本、提升政府部門開放數據的動力、保障政府開放數據的質量。②張會平、顧勤、徐忠波:《政府數據授權運營的實現機制與內在機理研究——以成都市為例》,《電子政務》2021 年第5 期。為此,在公共數據開放立法中確立免費和收費相結合的立法原則,既是必要的,也是可行的。具體的收費標準和收費方式,需要考慮數據類型、數據需求和數據開放路徑等方面。對專業性、個性化以及治理成本高的數據應當實行收費。對于商業性需求,可以實行覆蓋成本的全額收費方式。對于公益性需求,可以實行政府補貼的收費方式。不同的數據開放路徑所對應的成本補償機制有所不同,故收費方式也存在差異。對此,本文將在公共數據開放的路徑構建部分展開進一步討論。
公眾對公共數據的使用需求千差萬別。公眾可能會出于個人獲取信息、監督政府的目的存在數據需求。科研機構在科學研究中有獲取批量化的環境、醫療、交通等數據需求。商業機構有創新商業模式、研究市場、開發新的數據產品的需求。不同場景對數據范圍、顆粒度、時效性的要求也不一樣。對公眾用戶而言,可能只要通過開放平臺下載數據包即可滿足,而商業機構可能需要以接口方式持續獲取數據。對于一些敏感度較高的數據,還要采取數據沙箱、隱私計算等數據可用不可見的方式來開放數據。同時,對這些復雜的數據需求,政府還需要承擔后續監管義務。因此,面對不同的社會主體和不同的數據需求,我們很難按照某一類型或某一場景設定統一的無差別數據供給模式和路徑,必須基于不同的應用場景,在分類開放的原則下,設計具體的開放路徑。
公共數據開放路徑以是否可以直接從行政機關獲取數據來劃分,分為直接開放和間接開放兩大類。
完全授權型開放,是指公共部門將適合向不特定公眾普遍開放的數據,免于審批賦予數據利用主體全部數據權利的開放方式。這種方式屬于公共數據直接開放的方式之一,主要滿足公眾基礎性、普遍性的數據需求。公眾可以通過開放平臺直接獲取數據。該模式具備以下四個方面特征:第一,開放范圍限于基礎性數據,目的是滿足公眾對公共數據的基本需求。例如,基礎的企業主體數據、環境監測數據、地理信息數據等,該范圍與其開放對象和授權內容相匹配。第二,向不特定主體免費提供。正因為這類數據是面向公眾普遍開放的,任何人都有權獲取和使用這些數據,故采用財政資金負擔數據開放的成本,不存在公平性問題。第三,免于審批。即不需要申請、審批即可直接獲得數據的完全授權,這是這種開放模式的核心特征。允許公眾無條件地獲取、使用、傳播數據,同時對使用目的、場景沒有限制。數據利用主體既可以用于個人目的,也可以用于商業目的,同時鼓勵市場機構對這些數據加工、提升價值后開發數據產品繼而出售。為了避免法律風險,便于數據利用主體后續數據開發形成衍生數據及數據產品的權利保護,可以借鑒國外開放許可的做法,由公共部門通過開放平臺發布權利聲明,賦予數據使用主體完全的數據權利。①國外數據開放領域,有多個可以普遍適用的法律授權文本,例如開放政府許可協議(OGL)、開放數據共享公共領域奉獻和許可(PDDL)、開放數據共享署名許可(ODC-By)、知識共享組織(Creative Commons)的公共領域貢獻聲明(CC0 1.0)等。第四,匿名化。因為這類數據不存在使用條件,也不需要數據利用主體披露個人信息和用途,所以平臺應采取免于注冊、免于實名認證的方式,便于數據的獲取和傳播。從國內政府數據開放平臺來看,絕大多數平臺都是需要注冊的,有的平臺還需要進行實名制的身份認證。之所以出現這種情況,是因為目前平臺上開放的數據,混雜了可以普遍開放的數據和不宜向所有公眾開放的數據,不得不統一設定了身份認證要求。這從一個側面證明了應當區分不同類型數據的開放路徑,從而提高數據獲取效率。
有限授權型開放用在非基礎性的公共數據,主要是特定行業的專業性數據集。因為這些數據的數據量和敏感性不同于普遍開放數據,且對數據利用主體自身數據安全管理水平、技術能力有著較高要求,所以不宜采取完全授權型的方式對外開放,而應明確數據利用主體的使用條件,并賦予其有限的數據使用權限,也就是“有限授權型開放”。
有限授權型開放面向特定主體。特定主體,是指對該主體有專業資質、數據處理能力、安全管理能力、數據使用場景等某些約束性條件限制。考察這些條件,主要目的是解決開放行為的安全合規和隱私保護等問題。這些要求很難通過普遍適用的行政性規定來統一明確。比較可行的做法是將數據使用條件通過協議方式予以明確。一個有爭議的問題是,該協議究竟是民事協議,還是行政協議?其本質問題是這種開放行為究竟是民事行為,還是行政行為。筆者認為,界定該協議為行政協議比較妥當。一是從協議主體來看,該協議的一方主體是行政機關。盡管公共數據中部分數據的控制主體是事業單位、公用企業等,并非行政機關,但是這些單位基于政府授權具有合法采集和管理公共數據的職權,這些主體簽署的協議,應被認為符合行政協議的主體標準。②邢鴻飛:《政府特許經營協議的行政性》,《中國法學》2004 年第6 期。二是從協議目的來看,行政機關簽署數據開放協議,是為了履行公共管理和服務職能,與滿足其自身作為私主體的需要有顯著差異。三是從合同標的角度來看,行政機關將其管理的公共數據交由社會主體開發利用,將特定數據權利賦予對方,運用的是一項公權力,而非民事權利。公共部門不是數據“批發商”,開放數據也不是交易行為。
開放的數據是特定領域的專業數據集,且僅授予數據利用主體部分權利。例如,上海市在推進普惠金融試點應用中,對接了四家試點銀行,支持銀行開發了四個普惠金融信貸產品,共向試點銀行開放了八個委辦局386 項累計3.8 億條公共數據。①《上海深化公共數據利用開展普惠金融試點》,載國家發展和改革委委員會網站,https://www.ndrc.gov.cn/xwdt/ztzl/szhzxhbxd/zxal/202007/t20200713_1233616_ext.html,訪問日期:2022 年4 月4 日。這些數據包括市場監管局法人庫企業處罰、稅務評級、法人變更信息、市稅務局企業資產負債情況、銷售盈利情況以及成本等數據。這些數據包含大量個人信息和企業信息,具有高敏感性特點,不宜將數據的所有權利都授予利用主體,而應匹配數據利用主體的需求予以有限授權,對數據的傳播方式、利用領域、開發目的以及是否可以對數據進行修改、再授權都有相應的約束。
有限授權型開放面向所有符合條件的主體非排他地開放數據。雖然有限授權型開放對數據利用主體存在條件限定,但是這種條件應當是公開的,遵循非歧視和非排他原則。凡是符合條件的主體,均有權獲得數據,不會因為主體規模、機構性質的差別而受到不同對待。同時,對數據利用主體也不存在數量上的限制。雖然數據是一種有價值的資源,但是其并不屬于有限的排他性資源。數據具備開放條件后,其復制的成本極低。某一個主體使用,并不妨礙其他主體同時使用。數據在使用中會不斷產生新的數據,價值可能會隨著使用愈發增加。因此,一旦某個數據集已經處于可開放狀態,最有利于發現價值的路徑就是允許符合條件的所有主體都使用該數據。
有限授權型開放采用有償使用原則。特定領域的數據開放有必要采用有償使用模式。從對支出成本補償的角度而言,有償使用可以采取三種方式,即市場定價、行政收費和稅收。根據經濟學理論,市場定價適合私人產品的成本補償。公共數據具有公共產品或準公共產品屬性,不適合采取市場定價方式。行政收費適用于受益直接且明顯、受益范圍特定、可以排除未繳費者受益且排除成本較低的事項。稅收則適用于受益范圍不特定、受益不直接、不能排除未繳費者受益或排除成本很高、征收的費用比較穩定的事項。②江利紅:《論行政收費范圍的界定》,《法學》2012 年第7 期。在有限授權型開放的模式下,公共數據的利用主體直接從數據中獲益。由于稅收是向全社會征收的,并沒有具體到利用數據所獲益的企業,如果采用稅收方式,反而將這個負擔加到其他企業和公民身上。為此,采取行政收費的方式較為妥當。至于收費的標準,畢竟公共數據具有公共產品屬性,故應以保本微利為基本原則。在計算成本時,數據提供方應當僅僅計算數據開放而發生的直接成本,不應把數據采集、系統建設的成本統計在內。因為這些成本在公共部門履行公共服務職能時,可以由財政預算予以保障,數據的積累是履職行為的自然結果。在收費對象上,數據提供方也要考慮具體的主體性質和目的。比如,收費對象主要限于商業化的利用開發主體。對于非商業化的利用,如開展科學研究等,可以視單位性質和具體用途,考慮低于成本或者免費提供。
公共部門和數據利用主體均承擔“開放后”義務。在完全授權型開放中,數據利用主體獲取數據后,開放行為即終止,公共部門和數據利用主體均不承擔后續的其他義務。在有限授權型開放中,由于對數據使用存在條件限制,數據利用主體只擁有數據的部分權限,公共部門需要考慮如何避免數據利用主體超權限使用的問題。因此,數據利用主體在獲取數據后仍承擔相應義務,如需要對使用情況進行報告、在限定范圍內傳播和修改數據、不允許重新識別數據主體身份。公共部門為了滿足數據利用主體的要求,不僅承擔持續性的數據供給義務,而且對數據利用主體的開發利用行為也有監管職責。
上述兩種路徑屬于公共數據的直接開放方式,即從公共數據的控制主體直接獲取數據。直接開放方式的好處是開放鏈條短,數據利用主體能夠從公共部門獲取原始數據,但缺點是公共機構考慮到技術力量、成本、數據本身特性等,能夠提供數據的范圍和種類是有限的,無法完全滿足社會多層次的數據利用需求。因此,各地已經開始實踐探索公共數據的授權運營、資產運營等不同形式,如成都市①張會平、顧勤、徐忠波:《政府數據授權運營的實現機制與內在機理研究——以成都市為例》,《電子政務》2021 年第5 期。、貴陽市②曹謙、范佳佳:《從理論視角看政府數據資產運營的得與失——基于貴陽實踐的思考》,《上海商學院學報》2020 年第5 期。等。國家相關文件也有諸如公共數據授權運營③《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035 年遠景目標綱要》正式提出“開展政府數據授權運營試點,鼓勵第三方深化對公共數據的挖掘利用”。、特許開發④2022 年1 月,國務院印發《“十四五”數字經濟發展規劃》,提出“對具有經濟和社會價值、允許加工利用的政務數據和公共數據,通過數據開放、特許開發、授權應用等方式,鼓勵更多社會力量進行增值開發利用”。等表述,從而在更大范圍內推進公共數據開放。但是究竟何為授權運營、何為特許開發尚無統一的界定,與公共數據開放究竟是何種關系也未達成一致意見。筆者認為,這些概念的一個核心特征是采用公私合作(Public-Private Partnership,PPP)的方式來開展公共數據開放。公私合作分為政府撤資(divestment)、政府委托(delegation)、政府淡出(displacement)等三種類型。⑤Emanuel S. Savas,Privatization,New York:Routledge,1997,p.822.政府委托的具體方式包括合同外包(contracting out)、特許經營(franchise)、提供補助(grant)、抵用券(voucher)、強制(mandate)等五種。筆者認為這種新型的數據開放方式,從理論上說具備政府特許經營的特征,故以特許經營型開放這一名稱來歸納并進行分析。
特許經營型開放,是指政府將數據資源的開發利用權授予特許經營者,由其幫助政府共同進行數據治理、開發數據產品,從而實現公共數據的開放。在整個開放鏈條中,與前兩種開放路徑相比,這種路徑增加了特許經營者這一主體,數據利用主體不是從政府直接獲取數據,而是從特許經營者那里獲取數據或者數據產品。筆者將其界定為公共數據的間接開放方式,以區別于上述兩種政府直接提供數據的開放模式。這種模式由于有專業機構介入,既可以發揮其數據治理的專業能力,又起到了防火墻隔離風險的作用,因此可以開放的數據范圍更廣,更有利于提高公共數據的生產要素價值。
特許經營型開放本質上是以契約型公私合作提供公共數據開放的一種形式。根據資金來源不同,契約型公私合作可進一步分為委托模式和特許模式。①李霞:《論特許經營合同的法律性質——以公私合作為背景》,《行政法學研究》2015 年第1 期。在委托模式中,社會主體接受政府委托,以政府名義提供公共服務,社會主體從政府獲取資金,即通常所稱的“政府購買服務”。在特許模式中,社會主體從政府處取得經營權,以自己名義提供公共服務,并可以向服務接受者收取費用以彌補經營成本。委托模式實質上仍然是以稅收來支付公共數據的開發成本,上文已論述了稅收方式的弊端。公共數據作為有價值的生產要素,天然具備使用者付費的條件,故采用為特許模式是恰當的。政府部門和社會主體通過簽訂公共數據特許經營協議,將數據運營權授予社會主體。政府提供公共數據的原始資源,社會主體提供資金和技術力量,對公共數據進行治理和開發利用,并進一步向社會提供可以開放的公共數據和數據產品,替政府履行了部分公共服務職能。
特許經營型開放的數據范圍是非特定數據,并不指向具體的應用場景和特定的數據集。與有限授權開放根據使用人需求開放特定類型數據不同,特許經營型開放指向的數據范圍,不是根據已經確定的數據用途,而是根據特許經營者的數據處理能力來確定的。例如,將某省級區域公共交通出行的所有數據,或者將某個行政區域內所有的公共數據,統一授權給某個社會主體運營,由社會主體基于自身的技術能力對這些數據進行處理、挖掘,從而形成公共數據供給的一級市場和二級市場。
特許經營者的選擇是競爭性的,而非行政指定的,也不應是排他或者獨家所有的。特許經營者處理的是非特定化的公共數據,需要承擔與政府同等的數據安全管理責任。為了充分挖掘公共數據蘊含的價值,政府部門還需要掌握相應的專業技術。為了選出合適的合作對象,最佳解決方式就是借助市場力量,通過競爭性手段選擇特許經營者。目前,采用招標、競爭性談判等方式選擇特許經營者是通行做法。應當遵循公開公平公正的原則擇優選擇公共數據的特許經營者。根據數據資源的特點,將公共數據特許某個主體運營后,并不影響其他具有能力的主體進行運營,故特許對象不應是排他的。當然,為了防范風險,有必要對特許經營者的股東背景、信用等級、安全管理能力、運營水平等設定必要的條件。
運營成本主要靠向用戶收費來彌補。為了保護特許經營者的利益,同時形成完整的利益鏈條,應當允許特許經營者向數據最終使用方收取費用。由于公共數據的“公共屬性”,即使采取特許經營的方式,公共數據開放屬于公共服務的屬性仍未發生變化,特許經營者對用戶的收費也應當接受政府管制,實行政府定價或者政府指導價格。對收費無法彌補成本的,政府部門可以考慮予以補貼,以保證特許經營者能夠維持良性運作。由于特許經營者是擁有專業技術的機構,且擁有原始的公共數據資源,除了向社會開放公共數據外,還可以基于已開放的數據開發相應的數據產品,類似于在基礎服務之外,提供增值服務。對這部分服務,特許經營者可以采用市場定價的原則獲得收入。
政府部門對特許經營者的經營過程實施全程監管。特許經營合同作為行政協議的一種,政府部門擁有行政優益權。政府部門既要監管特許經營者的數據開發行為,又要監管特許經營者的數據開放行為。政府部門不僅要監督、評價特許經營的效果,也要對違反協議約定的行為行使行政優益權,采取約談、信用懲戒等手段,嚴重的可以實行處罰、解約等措施,保障公共數據開放服務的質量和效率。
特許經營型開放與有限授權型開放都是采用行政協議的收費開放模式,有相似之處,也存在實質性不同:一是法律關系不同。有限授權型開放的數據利用主體與行政機關直接建立數據供給法律關系;特許經營型開放的特許經營者和行政機關建立特許經營的法律關系,數據利用主體再與特許經營者建立數據供給法律關系。二是數據范圍不同。有限授權型開放是根據數據利用主體的需求,點對點供給特定數據;特許經營型開放是將某個區域或行業的數據批量開放給特許經營者,由其進行治理后再進行二次開放。三是收費性質不同。有限授權型開放的收費屬于行政事業性收費,特許經營型開放的收費屬于經營服務性收費。四是授權內容不同。有限授權型開放僅授予數據利用主體部分數據權利;特許經營型開放既可以完全授權,也可以有限授權,由特許經營者視具體場景而定。綜上所述,特許經營型開放作為公共數據的間接開放方式,引入了專業的社會第三方實施數據的治理和開放,賦予了該主體更大的數據權限,彌補了有關政府部門專業能力的不足,通過市場機制滿足社會主體更加多樣化的數據需求,有助于推動公共數據開放向更深層次發展。
總體而言,公共數據開放屬于法學和公共管理領域的新興話題。本文認為,公共數據開放是一個廣義的概念。凡是公共部門向社會提供公共數據的行為,均可以被納入公共數據開放的范疇,其本質是將公共數據這一生產要素向社會分配的過程。公共數據開放目前面臨的問題,與現行立法和實踐所奉行的原則有一定的關系。過于宏大的目標作為長遠的理念有其合理性,但是制度設計更應關注可行性,有必要對立法原則予以適當修正,以減小制度實施的難度,增強有關主體的內生動力。基于修正后的立法原則,公共數據開放的路徑設計應區分不同的數據利用主體,匹配與數據需求相適應的利用權限,既能釋放公共數據的價值紅利,又能保護好商業秘密和個人信息,構建高效、安全、合規的公共數據開放制度。