高富平


摘要:在我國,越來越多的地方立法呈現出以公共數據開放替代政務(政府)數據開放的制度趨勢。公共數據被定義為公共機構在履行公共管理和公共服務過程中所形成的數據。凡落入公共數據范疇,就應當匯集于公共數據開放平臺以向社會開放。但公共數據不是被事先界定的,而應當依據數據開放行為的性質來定義所開放數據的性質,既充分實現數字政府的公共數據服務職能,同時使公共機構所持有的數據資源對接數據要素市場,滿足社會對高質量可再利用數據要素的需求。在數據成為生產要素,數據持有者權成為數據基礎制度核心的背景下,應當分別確立社會主體、政府和其他公共機構的數據持有者權,以清晰界定數據治理、流通利用的權責邊界,從而構建多元的數據開放體系。
關鍵詞:公共數據;數據開放;數據持有者權;數據基礎制度
《中共中央國務院關于構建數據基礎制度更好發揮數據要素作用的意見》(以下簡稱《數據二十條》)提出建立公共數據、企業數據、個人數據的分類分級確權授權使用和市場化流通交易制度,并將數據開放明確為流通數據的重要方式。同時,《數據二十條》還提出建立數據資源持有權、數據加工使用權、數據產品經營權等結構性產權分置來構建數據流通利用秩序。這三種數據產權是圍繞數據價值形成和實現的過程(即數據生產、流通、使用過程),針對不同數據形態的一種制度安排,本文將其抽象地表達為數據持有者權。
自從2015年《促進大數據發展行動綱要》提出政府數據開放共享,實現基于數據的科學決策政策以來,各地方開展大量的探索,通過專門的公共數據立法或一般的數據條例,③探索建立公共數據開放制度。這些地方立法通過建立寬泛的公共數據概念,將政府(包括公共管理機構)和公共服務機構(公用和公益企事業單位)的數據也包括在內,并建立無條件、有條件和不開放三種開放模式。在《數據二十條》分類確權授權使用數據的指導思想下,如何確認公共機構的數據權利,并在此基礎上構建公共數據的要素化利用制度以接軌數據要素市場,成為數據基礎制度建設的重要任務。本文依據《數據二十條》的基本精神,在對地方立法探索檢討的基礎上,做出政府與其他公共機構的區分,分別確認政府、其他公共機構和社會主體的數據持有者權,以此為基礎構建符合數據要素特征的多元化數據開放體系。
一、公共數據:公共機構持有的數據資源
“政務數據”一詞已經成為我國正式的法律用語,為《數據安全法》等法律所使用,且已被用于國家政務服務平臺建設。但是,在地方政府的數據開放中,立法卻選擇了“公共數據”這一概念,旨在界定公共機構可以向社會提供的數據。換句話說,一旦被定義為公共數據,公共機構即應當向社會提供或具有向社會提供的義務。
在國家層面上,早期涉及公共數據的規范性文件更多指向信息資源。民政部2011年頒布的《國家地名和區劃數據庫管理辦法(試行)》第17條規定:“公共數據是指經篩選并脫密處理的數據,面向社會公眾,通過互聯網、閉路電話、觸摸屏等平臺提供相關信息。”顯然,這里的公共數據指向可向公眾提供并為公眾自由使用的政府信息,是按照數據的共用性來定義公共數據范疇的。2016年,國務院發布的《政務信息資源共享管理暫行辦法》所定義的政務信息則類似于目前的公共數據概念,只是該《辦法》是從政府部門之間數據共享的角度來定義的,更多服務于政府體系內部的共享目的,很難作為公共數據對外開放的制度藍本。
目前,我國政府數據開放仍處于地方探索過程中,對于所開放數據的三種表述是政府數據、政務數據和公共數據,公共數據是主流。從地方立法來看,目前關于公共數據定義的基本邏輯是,公共機構在依法履職過程中生成或獲取的數據。也就是說,公共數據的定義基本上有兩個要素,一是主體,“公共機構”,二是數據應當在主體“履行職責”過程中生成。(如圖1)簡而言之,系通過以公共機構和履行公共職責來定義數據“性質”,以生成數據作為公共機構“擁有”數據的依據。而在筆者看來,以公共機構履行職責過程中形成的數據是數據歸屬于特定機構管理的依據,而不能直接界定產生數據的性質。因此,這樣的定義本質上是確認公共機構持有其所生成數據的一種定義。也就是說,公共數據本質上是對公共機構持有生成數據控制狀態的描述。
(一)公共機構的范疇與數據性質
現行地方立法對公共機構范疇界定不完全相同,大致存在廣義和狹義兩種界定,狹義的將公共機構限于政府(含授權執行公共事務機構),而廣義的除政府之外還包括公益事業和公用事業機構。
2020年出臺的《貴州省政府數據共享開放條例》為狹義定義的代表,它將公共機構限定于政府,并稱為政府數據。不過,該條例將授權執行公共事業的機構采“參照適用”方式,即法律、法規授權具有公共事務管理職能的組織實施的數據共享開放活動,適用本條例,但是將“教育、衛生健康、供水、供電、供氣、供熱、環境保護、公共交通等與人民群眾利益密切相關的公共企事業單位開展數據共享開放活動”留白,僅規定“依照相關法律、法規和國務院、省有關主管部門或者機構的規定執行”。這給這類機構的數據開放利用提供足夠的探索空間。《天津促進大數據發展應用條例》將數據資源區分為政務數據和社會數據,而政務數據限于政務部門“在履行職責過程中制作或者獲取的,以一定形式記錄、保存的文件、資料、圖表和數據等各類信息資源”,而政務部門“指各級政府部門和行政執法機構”。天津市定義的政務數據與貴州省定義的政府數據相近似。該條例將公共機構數據之外的數據定義為社會數據,只是鼓勵這些單位向政務數據平臺提供數據,用于數據共享和開放。貴州省和天津市的做法與《大數據促進行動綱要》保持一致,不使用公共數據,而僅規范政府數據共享開放,未將公共數據定義延伸到公用事業、公益事業機構(即其他公共機構)。
上海市人民政府2019年10月頒布的《上海市公共數據開放暫行辦法》所定義的公共機構包括行政機關以及履行公共管理和服務職能的事業單位(以下統稱公共管理和服務機構),只是又設置了“遵照執行”條款將水、電、氣、通信等公用事業納入適用。不過,2021年的《上海市數據條例》則直接將后者納入公共機構,對公共數據作了較為寬泛定義:“國家機關、事業單位,經依法授權具有管理公共事務職能的組織,以及供水、供電、供氣、公共交通等提供公共服務的組織(以下統稱公共管理和服務機構),在履行公共管理和服務職責過程中收集和產生的數據。”
2022年1月頒布的《浙江省公共數據條例》則將公共機構直接擴張到一切公用事業運行者。條例所稱公共數據,是指本省國家機關、法律法規規章授權的具有管理公共事務職能的組織以及供水、供電、供氣、公共交通等公共服務運營單位(以下統稱公共管理和服務機構),在依法履行職責或者提供公共服務過程中收集、產生的數據。而且明確的規定“根據本省應用需求,稅務、海關、金融監督管理等國家有關部門派駐浙江管理機構提供的數據,屬于本條例所稱公共數據”。
上海市和浙江省代表了最寬泛的公共數據范疇。這樣的立法也影響了之后的地方立法,使公共數據界定走向寬泛化,如重慶市、四川省和廈門市等①。這些地方立法為了定義公共數據,將主體的“公共性”擴展到了業務公共性,凡是從事公用事業和公益事業的組織所生產的數據皆為公共數據。于是,公共數據的生產主體包括了政府等公共管理機構和從事公共服務的其他公共機構(本文合稱為公共機構)。
(二)現行公共數據定義的困境與反思
上述公共數據的定義旨在劃定公共機構應當向社會開放的數據范圍,一旦被貼上公共數據的標簽,數據持有者即具有向社會開放的義務。現行地方立法從數據持有主體的角度而不是從數據性質來定義公共數據。這實質上是按照數據生成或生產關系來界定的,是以業務(行為)性質來界定其產生的數據的性質,而不是按照數據本身的性質或數據重用的目的來界定數據的性質。這一定義造成的問題是,由具有公共性質的業務活動所產生的數據是否都屬于公共數據? 筆者認為,地方立法對公共數據的定義是以初始業務的性質定義數據的性質,由于公共機構的業務性質屬于公共性質的,因而其產生的數據也當然屬于公共性質。這里忽略了一個問題,公共數據是為了界定哪些數據可以向社會開放,或者便于政府推動數據開放,因而其目的是界定數據再利用或重用的數據的性質。以“依法履職過程中”來限定所生成和獲取的數據的公共性,似乎并不周延。很顯然,公共管理業務和公共服務業務運行過程中形成的數據并不一定適合開放或者作為公共數據開放。
履行公共管理職責或者公用或公益事業服務所生成的數據覆蓋到業務運行的全流程和各領域,幾乎是這些公共機構“主營業務”。這些機構業務運營生成的數據,也并不都適合開放或定位于公共數據。以政府數據為例,政府在履行公共管理和服務過程中形成的數據至少包括以下類型:(1)來源于社會各主體提供的數據,比如社會主體為獲得許可(或項目或資質等)提交的文件資料如申請書、申報書、招投標信息;(2)為社會管理,而采集社會各主體的基礎數據,如法人和社會組織登記、自然人戶籍登記管理、車輛登記信息等;(3)為實施公共管理過程中形成的地理空間布局、建筑物、設備基本狀況信息;(4)各類行政執法記錄、行政處罰的信息等。這些并非窮盡式列舉類型中,除了純粹地上建筑物或設備的水文地理信息外,幾乎所有的公共機構從事公共事務管理的初始數據都涉及管理自然人和法人組織或關聯到這些主體,因而這些主體的合法利益自然也延伸到這些數據上。顯然,公共機構在從事公共事務管理中形成的數據并不都屬于法律意義上公共數據——可以開放給任何人自由使用的數據。
公用事業和公益事業主體所從事業務或提供服務具有社會性和公共性,但這些法人組織在從事公用或公益服務的過程形成的數據也并不都當然屬于公共數據。比如,燃氣公司擁有組織和個人用氣數據,通常包括用戶編號、用戶地址、用戶姓名、當月或年度用氣量等;同樣,類似的電力公司、水務公司等也擁有類似用戶用電量、用水量的數據。顯然,這些服務具有公共性,但是這些公共服務生成的數據并不具有公共性,并不是可供任何主體使用的數據。更何況公用或公益事業機構本身是獨立的法人機構,所生成數據當然地隸屬于該組織管理,應當由該組織控制和依據法律規定進行開發利用。
為了有效地實施數據開放,我國地方探索出有條件開放和無條件開放兩種方式,以解決公共數據開放的困境問題。早在2016年《貴州省大數據發展應用促進條例》就創新性提出主動開放和依申請開放。兩年后,貴陽市頒布的《貴陽市政府數據共享開放實施辦法》明確提出“應當按照無條件開放、依申請開放、依法不予開放等三類對開放的政府數據進行管理”,2020年的《貴州省政府數據共享開放條例》,將三類開放表述為“無條件開放、有條件開放和不予開放”。一直積極探索公共數據開放的上海市也在2018年9月發布的《上海市公共數據和一網通辦管理辦法》中,明確將公共數據開放分為無條件開放、有條件開放和非開放三類;同時,這也是2018年《天津市促進大數據發展應用條例》對政務數據開放的分類。因此,不管使用怎樣的概念,在數據開放時均面臨根據數據的性質或特征進行分類,再區分為不同類型的開放方式的開放流程。無條件開放的數據,是政府主動發布的,置于公開可下載或瀏覽狀態,任何主體可以自由使用的數據,是真正的公共數據。有條件開放則依申請,滿足政府認可的條件者才能獲取,數據使用者既不具有公眾性,對數據的使用也受一定條件約束。顯然,有條件開放的數據既不公開,也不開放(限主體),是提供給特定人使用的數據,不能歸入公共數據,這說明,在定義了公共數據之后,再實施不同的開放方式與公共數據的目的或性質相悖。
綜上,以公共機構履行公共職責或公共服務來定義數據“性質”,本質上是在界定隸屬于公共機構的數據,這樣的定義與其重用數據的性質和開放目的都存在著邏輯斷層。基于此,我們不妨直接將隸屬于公共機構的數據界定為由公共機構持有的數據,確立公共機構的數據持有者權。
在承認公共機構數據持有者權的前提下,重新探討以公共機構持有的數據開放性質來定義數據性質。凡是能夠落入普惠性公共服務范疇的數據開放,開放數據應當是無條件或自由使用的數據,即是法律意義上的公共數據:而不能納入普惠性公共服務范疇的數據開放,則應當是有條件開放,而有條件的開放則不再是法律意義上的公共數據,而是受公共機構控制的數據。
二、公共機構數據持有者權的確立
一旦我們將數據理解為生產要素,那么我們就必須按照生產要素有效利用的制度規則對待數據。數據本身又是具有風險的資源,其本身既需要安全控制,又需要合規管理。隸屬于公共機構的數據,不管是機構自用、在公共機構之間共享,還是向社會主體開放利用,都需要首先確立公共機構對其生產的數據資源具有某種管理權。本文認為這種數據資源管理權即是公共機構的數據持有者權。
(一)數據持有者權的本質內涵
為解決數據確權和授權難題,《數據二十條》按照價值創造受保護的原理,區分設置了數據資源持有權、數據加工使用權和數據產品經營權,在本質上賦予了數據持有者以數據持有者權,以構建安全有效的數據利用秩序。而數據持有者權不僅僅是社會數據(非公共數據)市場化的產權解決方案,同時也是可以適用于公共機構所生產數據的制度安排,用來構建公共機構數據共享和開放利用秩序。由于《數據二十條》所確立的數據持有者權制度仍然停留在政策層面,還沒有進入立法層面,本文這里從法理上探究其法律理念和制度邏輯。
對數據的持有是對數據控制的一種事實描述。與傳統生產要素相比,數據要素具有價值多元、利益并存性、技術依賴性等特征,數據的價值又在于流通利用,這一切都離不開控制。雖然控制數據并一定享有權利或不等于享有權利,但是控制是主張數據權利的基礎和前提。持有是對特定主體與特定數據之間事實控制關系的描述。“持有”在物權法體系中表示臨時占有物的一種狀態,而“占有”則屬于具有物權推定效力的事實。為了避免與既有的物權占有制度混淆,《數據二十條》選擇以“持有”來表述數據實際控制狀態。將“持有”應用于數據資源管理和價值實現實踐,可以恰當地表示在其控制和使用過程中對數據管理、控制的含義。這里的控制既是積極利用和獲取利益的前提,也有對數據使用的安全和合規性負責的含義。這表明數據持有者應當履行數據安全管理和控制數據風險的義務,包括自己使用和流通利用數據的風險。為了構建數據資源社會化利用的秩序,國家則首先需要維護數據的安全秩序,而不是確立某種數據權利。在這個意義上,數據安全是數據持有者必須履行的公法上的義務。
數據安全管理既是履行公法義務,也具有私法效果。一方面是維護數據持有者權益的工具。
數據持有者對數據的安全措施,可以實現對獲取數據的控制,防范他人非法獲取,使其事實上控制數據,為己所用(安全管理)。另一方面,數據安全管理也是維護數據上各種利益的必要措施,防范數據泄露和數據濫用導致侵害他人權益、社會公共利益的風險(合規管理)。因此,安全和合規管理是數據持有者利用數據的自我管理措施,遵守法律,維護數據上的權益貫穿于數據獲取、存儲、分享和使用整個過程,成為數據資源轉化為可用數據資產的前提條件。在這個意義上,數據安全和合規管理義務形成數據利用的第一道秩序,使數據持有者成為數據的責任主體,也是數據持有者享有任何私法上權利的前提。
數據安全管理維護的是數據利用秩序。數據持有者對所控制的數據是否應當享有或享有怎樣的權利,涉及數據持有者與其他人及其整個社會的關系。我們需要尋求賦予任何權利的正當性,而不是僅憑事實控制即享有支配性權利。事實控制(或安全措施)并不當然產生法律上的權利,數據持有者享有的權利依賴法律明確規定。在數據生產、流通、使用過程中,個人、企業、政府、社會、國家等相關主體對數據有著不同的利益訴求。數據上可并存多重利益,數據持有者權并不能消滅數據上承載的合法利益。面對數據邊界界定和成立單一的排他性支配權賦權困境,《數據二十條》提出淡化所有權、強調使用權,聚焦數據使用權流通數據的數據產權新思想,②構建“數據使用權交換和市場化流通”的數據基礎制度。在筆者看來,數據持有者所能夠享有的權利是基于事實控制的使用權,數據持有者可以通過轉讓數據使用權、許可他人使用(訪問、計算等)、授權他人經營(創設經營權)等方式實現數據的流通利用。
由于數據來源于社會各主體,亦為各社會主體所需要,具有顯著的社會性和公共性,一個良好的數據基礎制度設計還必須保持數據的開放性或可獲取利用性,以激勵創新,充分實現數據要素價值。因此,基于事實控制的持有權也不能絕對化、持久化或者變相成為排他支配性質的權利。
為此,數據持有者享有權利的前提除了取得和控制數據具有合法性外,還必須對數據進行加工處理,創造價值,以尋求法律保護其利益。對合法取得數據進行加工處理,創造新數據價值或添附了新價值,成為持有者處分其加工后數據的權利的正當性基礎。單純的控制或持有并不享有賦予保護實現該利益。從本質上來看,數據持有者享有的使用權不是單純對數據事實控制的保護,而是對持有者所創造價值的保護。
(二)公共機構的數據持有者權
如前所述,數據持有者的權利配置旨在構建數據的重用秩序,實現數據社會價值(數據資源社會配置效率)的最大化。包括公共機構在內的任何社會主體生產的數據只要能夠用于分析客觀世界規律,都可以成為生產要素。而且由于公共機構從事公共管理和公共服務,因而其產生和匯集形成的數據是社會最基礎數據資源,具有普遍的社會需求。因此,公共機構也能成為數據要素市場的供給者。從20世紀90年代起,國際社會即開始提出以政府數據開放促進數據再利用。八國集團(G8)于2013年6月簽署的《G8開放數據憲章》提出的政府數據開放五項原則,除了強調政府數據以開放為原則(稱為“自動開放數據”)和“改進治理”外,還強調“確保高質量和足夠數量的數據”“使數據可為所有人使用”和“促進創新”。政府數據開放被定位于推進大數據應用,實現數據資源化(即要素化)利用戰略舉措。《促進大數據發展行動綱要》提出“推進數據資源向社會開放”“推進數據匯集和發掘,深化大數據在各行業創新應用”思想。如何構建政府數據開放基礎制度,使政府或公共機構成為數據要素的供給者就成為制度設計的關鍵。
在語義上,“開放”與“封閉”相對,基本含義是解除封鎖或限制。“開放”一詞應用到數據領域,其基本含義為允許他人訪問、獲取、使用數據。數據開放被定義為“面向社會提供具備原始性、可機器讀取、可供社會化再利用的數據集”。在數據為生產要素的背景下,開放在經濟學上可被理解為生產要素(資源)的供給行為,在法律上可理解為讓與使用權或許可使用的行為。
現在一般籠統地稱之為提供數據的行為,提供數據者稱為數據提供者,而接收數據者稱為數據接受者(亦即使用者)。數據開放需要構建數據提供者與使用者的數據利用秩序,這不僅僅是因為它是一種數據資源流通利用關系,涉及對數據使用者使用行為的限定(甚或支付一定費用),而且是因為數據本身是有風險的資源,數據提供者需要控制數據流通的風險,使風險可控制,責任可追溯。因此,在生產要素視角下,數據開放是公共機構的一種經濟活動或“交易”關系,應當在公共機構的“控制”之下。筆者曾撰文指出“數據開放規則的基礎是承認數據持有人對數據的事實控制權”。應當“確認公共機構對公共數據的管理權”,“作為公共數據管理人,公共機構有義務開放數據,也有義務維護和管理好公共數據的利用秩序,而這些都以明確其權利為前提”。
這里的公共機構對其生產的數據的管理權實質上就是公共機構的數據持有者權。
公共機構的數據持有者權旨在明確公共機構的合法數據使用權,以推動公共機構參與數據市場培育,構建公共數據重用秩序。各地方立法探索中,對公共數據的定義基本上是從隸屬于公共機構的數據的角度定義,其本身是對公共機構數據持有關系的確認。為實現數據共享和開放利用,公共機構首先也要依法開展數據安全和合規管理。《網絡安全法》《數據安全法》《個人信息保護法》等法律均適用于公共機構和社會主體,只是安全責任的范圍和內容略有差異。比如,《數據安全法》第6條是專門規范政府部門的安全責任及其分工,第8條則是對所有數據處理者的安全和合規義務的原則性規范,第四章數據安全保護義務,亦是一視同仁地適用于包括公共機構在內所有數據處理者。因此,公共機構亦像其他社會主體一樣,應當履行相應的安全管理義務,維護數據上合法權益和安全有序利用秩序。
(三)公共機構數據持有者權的制度價值
公共機構的數據持有者權與社會主體的數據持有者權差異主要在于公共機構(業務)的性質會對數據持有者權產生影響。從事公共管理和公共服務的機構只能在法律明確規定的職權或職責范圍內行使所持有的數據資源管理權,以實現法律規定的目的,而社會主體在法律限定的范圍內享有自主行使數據持有者權,實現各種利己目的。這一差異主要源自公法與私法的基本理念不同,在公法領域,法無明文不可為,而在私法領域,法無禁止皆可為。因此,受公法調整的公共機構,其所謂的數據持有者權,僅能在法律規定的目的或用途內行使權利,超出該范圍即是違法。這種數據持有者權本質上就成為了公共機構依法律規定的目的而行使的資源管理權。
確立公共機構數據持有者權的意義在于明確數據資源的管理職責,使每個公共機構生產的有用的數據資源具有明確的責任主體,在確保數據資源安全管理的前提下,使其要素價值得到充分發揮。從現行法律來看,公共機構的數據的要素價值主要體現在以下三方面:其一,以數據支撐本部門決策,提升管理績效和服務質量與效率。構建靈敏的數據采集和匯集架構,采取機器學習等智能手段分析數據,成為公共機構提升治理能力和服務效率的新手段。每個公共機構都應當充分運用數據智能,建立“用數據說話、用數據決策、用數據管理、用數據創新”的管理與服務機制,實現基于數據的科學決策。同樣,數字化也改變公共服務提供方式和質量,為各種公共服務提供便利高效的手段。其二,通過數據共享推進公共機構的科學決策能力、治理能力現代化。數據要素化還體現于,通過政務數據共享,支撐整個政府的智能決策,推進政府治理體系與治理能力現代化,進而提升整個社會資源配置管理和利用效率。其三,通過數據開放支撐社會經濟創新和高質量發展。公共機構所生產和持有的數據具有明顯的社會性、公共性,是整個社會智能化運行的基礎數據,公共機構持有的數據向社會開放,與社會各行業數據匯集融合,可以支撐各行業和主體智能決策,產品和服務創新,形成社會經濟發展的新動能,構建國家競爭新優勢——數據生產力。
無論是提升各自智能決策和管理水平,還是機構之間共享、對外開放均需要各公共機構承擔數據資源的管理職責,將數據治理成為可用、可再利用的數據要素,充分實現其要素價值。治理數據或管理數據就成為數字時代公共機構的一項新職責和新能力,成為提升政府社會治理能力的基本要求。每個公共機構都需要按照統一規范、標準和流程治理數據,實現數據匯集融通,實現跨層級、跨系統、跨部門、跨地區共享,同時對接社會需要,向社會提供可機讀、可再利用的數據要素。這樣數據治理工作首先要界定數據持有邊界,分清各自的職責,并在此基礎上實現統籌協調,對既有的公共機構管理按照數據治理要求進行組織架構、業務流程、管理機制調整,以適應以數據為核心資源的綜合治理體系,精準計算和高效配置各類數據資產,應用于行政管理、公共服務、經濟社會發展等領域。而支撐這樣數字政府形態的就是構建以數據持有者權為基礎的基礎制度,在此基礎上形成公共機構治理數據、使用數據、管理數據、流通(共享和開放)數據的能力。為了與社會主體數據持有者權相區分,建議將公共機構的數據持有者權稱為數據資源管理權。數據資源管理權本質上是數據持有者權,只是需要嚴格依據法律規定目的、流程等來行使數據持有者權。這樣,我們就可以以公共機構的數據資源管理權來構建多元的數據開放體系。
三、基于公共機構數據持有者權的多元數據開放體系
確立公共機構的數據持有者權,以此為基礎構建公共機構的數據開放利用體系,意味著改變地方立法先界定公共數據、再構建數據開放制度的慣常做法。簡言之,就是在法律明確公共機構對其形成的數據資源擁有相應持有權的前提下,按照數據使用目的或用途來確定開放數據的性質及配套的開放機制,以最終形成多元化的數據開放體系。
(一)數據開放二分:數據公共服務與數據要素供給
正如本文前述,關于公共數據開放的地方探索將數據開放定位于數字時代的公共服務,而立法為推進這項公共服務,定義了寬泛的公共數據,將所有從事公共服務(公用和公益事業)的機構在履行公共服務過程形成的數據視為公共數據,以支撐、推進公共數據開放事業。提供公共服務需要公共數據,公共數據支撐公共服務,因而,公共數據的定義、數據開放的定位都與公共服務有著密切的聯系。從發展源流上來看,我國公共數據定義受到了國際社會“開放數據(Open Data)”運動的影響。開放數據中開放(Open)一詞源自知識共享或知識開放運動,意味著任何人都可以出于任何目的自由訪問、使用、修改和分享(最多只需遵守保留來源和開放性的要求)開放數據和內容。《國際開放數據憲章》認為,開放數據(Open data)是指向公眾提供的數字數據,它在技術上和法律上可以為任何人在任何時間和地點進行自由地使用、再使用和再分發。在政府數據開放運動中,多援用了這樣的開放數據概念,認為政府應當向社會提供開放政府數據(Open Covernment Data),并視為政府在數字時代的新型公共服務。
公共服務往往被理解為是由公共投入的政府行為。但在現代社會,更科學的是將公共服務分為基本公共服務和非基本公共服務。政府僅對基本公共服務承擔保障供給數量和質量的主要責任,引導市場主體和公益性社會機構補充供給,而非基本公共服務是在政府引導下由公益性社會機構或市場主體多元主體供給。《國家基本公共服務標準》基本限定了政府基本公共服務范圍,而非基本公共服務仍然呈一定開放性。不過,非基本公共服務也應當具備普惠性(即普惠性公共服務),而普惠性則是從產品或服務的受眾的開放性、大眾性、平等性來判斷的。在這個意義上,私主體或市場主體也可以提供公共服務,一旦其生產產品或服務可以以普惠性的價格為社會公眾直接接受,仍然屬于公共服務。這意味著,公共服務與主體性質無關,而與產品或服務普惠性有關。
在數據成為生產要素的情形下,我們應當按照這樣的邏輯來區分和定位公共機構的數據開放,將無條件數據開放定義為基本公共服務,而將有條件數據開放定位于非基本公共服務(如表1)。
當數據是為社會公眾所需且也適宜公開讓社會主體自由獲取和使用,就應當將數據作為公共產品,向社會無償提供。它應當成為政府在數字時代的一項基本公共服務。當向社會提供數據設置條件時,如限制獲得主體、使用條件甚至收取費用,就不再是提供公共產品,不屬于基本公共服務。
此時,雖然數據使用可能導致創新、效率提升,最終改進社會福祉,體現數據的社會價值,但因數據使用者屬于少數或特殊群體,數據使用直接目的服務于組織的業務目的,就不能視為應當由政府提供的基本服務,也很難將該數據定義為“公共數據”。相反,有條件開放是使用受控性質的提供數據行為,本質上屬于《數據二十條》的“流通利用”行為。將其定位于非基本公共服務,使政府可以通過授權運營方式,使公共機構持有的數據資源可以接軌數據要素市場,使政府成為數據要素的重要供給者。依據這樣的界分標準,公共機構持有的數據既可以作為公共數據向社會提供,亦可以作為非公共數據向社會提供。前者落人數字政府新增的公共服務范疇,后者則使政府合法地向數據需求者提供公共機構所持有的數據,滿足大數據時代各社會主體對數據的日益增長的需要。
數據開放的二分理論是建立在原始數據和原始數據分析結果二分基礎上的。原始數據基本上是存儲在特定系統中,標準化的可機讀或機器學習的數據,具有受控使用特性;而原始數據關聯分析或機器學習的結果轉化可公開發布和傳播的,亦可為人識讀的信息。在筆者看來,能夠滿足大眾消費(使用)的只有信息或知識,信息或知識經過大眾學習和傳播轉化為人類智慧,形成社會生產力。而作為產生信息或生產知識的要素的原始數據,并非所有的社會主體都有這樣的需求和轉化能力,因而不適合公開的自由使用方式(這樣的使用方式存在較大風險),只有在一定制度安排下,流通、匯集、融合以支撐機器智能或人工智能。我們也并不因此否定無條件開放的信息資源的要素性——對社會生產力促進作用,只是原始數據更加基本,是支撐機器智能的關鍵生產要素。
(二)基于公共機構數據持有者權的數據開放機制
上述兩類數據開放的思想不是對地方立法探索的否定,而是對地方探索做出更符合法律邏輯的解釋。這得益于《數據二十條》提出數據資源持有權和公共數據確權授權開放的思想。現行地方已經提出公共數據可以有條件開放,并提出公共數據的授權運營機制,而《數據二十條》進一步提出“有條件有償”的數據開放.這為公共數據接軌數據要素市場或者公共數據市場化利用提供了極為重要的供給制度路徑。但是如前所述,若事先將公共機構持有的數據定位于公共數據,將公共數據開放定位于公共服務,將會為公共機構持有數據接軌數據要素市場設置理論障礙。與之相反,若按照開放的行為性質來定義開放的數據性質,使得公共機構可以在做好數據公共服務的同時,可以向社會提供可機讀、可再利用、可供機器學習的高質量原始數據,以滿足日益增長的數據要素的社會需求。問題在于,如何解釋公共機構因履行公共職責(管理或服務)產生的數據可以作為非公共數據而接軌要素市場。回答這一問題的關鍵是公共機構在從事公共管理和服務過程中所形成的數據是否應當作為公共產品(或公共服務)向社會提供。
在筆者看來,無論政府等行政管理機構還是公共服務機構,只要提供數據的行為仍然是傳統公共服務的延伸,那么應屬于公共服務范疇;如果提供數據的目的超越原來公共服務的目的范圍,那么就必須重新評估該提供行為是否應當是滿足公共服務的目的。本文之所以提出數據開放二分理論,就是因為公共機構在運行過程中會形成兩類有價值的“數據”。一類是信息資源,即公共機構在履行公共管理和從事公用或公益事業過程中形成關于公共管理或服務業務的基本信息、統計報表等。這些成果屬于公共管理和公共服務本身的自然延伸,因其為公共業務性質,因而其產生的成果自然應當作為公共服務的一部分或延伸而向社會公開提供,供全社會自由使用。另一類為原始數據,即為公共管理和公共服務運營所生成的支撐管理和服務業務的事實數據。這些數據在公共管理和公共服務中的直接使命已經完成(如支撐公共業務運營,產生業務成果),作為“副產品”,這類數據開放的目的則是為了更多地滿足數據社會價值,為社會主體重用或再利用,這種再利用已經脫離了原始業務目的范疇。不僅如此,這些原始數據本身并不是天然可用的資源,還需要進行加工處理(即數據治理)才能形成有用的或可再利用數據產品(亦被稱為數據資產),成為可開放的數據。在這個過程中,不僅僅要對原始數據進行分類、清洗、匯集、標注和必要格式轉換等,使數據轉化為生產要素(即要素化),還要對數據處理和流通利用的全過程實施安全和合規管理,以便防控數據開放利用的風險。而所有這些不僅需要巨大的資源投入,而且其本身是專業性生產活動或經濟活動,需要配置相應的權利以給予必要激勵,構建對外提供(開放、共享、流通交易)的秩序。由此可見,原始數據的對外提供(開放)并不是原始公共業務的延續,不能簡單地落入既有公共機構業務性質范疇。因此,我們不能因為原來業務屬于公共服務,所產生的數據也當然地作為公共產品提供,還要重新定位或評估開放數據行為的性質。
因此,公共機構持有數據的開放應當根據數據使用目的或普惠性來定義其數據開放的性質,再根據開放的性質界定開放的數據的性質。前述的二分理論實際上就是按照這一邏輯定義數據開放,將可為公眾自由使用的信息資源的開放納入無條件開放,開放出不受限制使用的數據;而將原始數據的開放界定為有條件開放,按照社會主體對數據的需求,提供特定需要、使用特定數據,實現特定目的。這樣數據開放本質上屬于滿足特定需求交易行為,因而可以按照依據情形設定條件和收取相應費用。之所以要設置條件,最為重要的理由是控制數據的風險。因為原始數據的風險遠高于分析利用形成的結果(信息或知識)風險,而數據風險不僅源自于數據本身(比如隱私風險、國家安全),而且更來自數據的使用,尤其是流通(包括開放)利用。因此,應當允許公共機構選擇適格的數據使用者,建立相應信任和約束機制,以使開放的數據風險可控,責任可追溯。
收費(有償)并不是公共機構持有數據開放的條件,而是有條件開放項下解決數據治理成本問題的一項策略。有條件的數據開放亦可以不收費,亦可以收費,這取決于數據開放性質。一旦公共機構開放的數據存在普遍需求或者直接的公益目的需求(比如基礎教育、慈善事業等),可將開放定位于普惠性公共服務,可以由國家財政(公共資金)投入和運營數據開放,免費向社會提供。如果國家財政不能承擔數據治理和開放的運營成本,需要引入社會資本運營,承擔數據治理和對外提供的管理運營成本,那么亦可以將其定位于非基本公共服務,收取一定的運營成本費,以增強其普惠性。比如,政府持有的人口戶籍、組織登記、地理信息三大基礎數據庫數據,即可以采取這兩種開放政策(選擇收費或不收費)。當數據受眾不具有普惠性、大眾性,而限于特定行業、特定主體,或者用途不具有公益性而是商業目的使用時,則公共機構持有的數據開放則應當采取有償原則,按照市場規則運營。
因此,一旦我們承認公共機構持有數據資源,數據資源開放不再按照公共機構初始業務性質定位原始數據開放,而是按照數據作為生產要素的再利用性質定位數據開放,那么數據開放就應當在確立公共機構數據持有者權的基礎上根據開放行為的性質,來選擇數據開放運行機制。若數據開放可以視為非基本公共服務,那么可以選擇“有條件+有償”或“有條件+無償”;若數據開放不具有普惠性,不能視為非基本公共服務,那么數據開放應當納入市場化的方式。這樣的定位是符合廣義公共機構持有的數據的要素化和市場化利用制度需求的。為此,我們還需要分離作為公共管理機構的政府所持有的數據和公用或公益企事業組織等其他公共機構所持有的數據,為不同數據持有者配置不同權利,設計多元化的開放機制。
(三)建立多元化的數據開放機制
為了推進和擴大公共數據開放,地方立法將公共服務機構(公用事業和公益事業的企事業組織)的數據納入公共數據。而在數據成為一種經濟資源或生產要素,在《數據二十條》明確公共數據可以確權授權實施條件有償開放政策背景下,筆者認為我們應當區分政府的數據持有者權和其他公共機構(公用或公益企事業組織)的數據持有者權,采用不同數據開放(提供數據)行為,加上一般社會機構的數據持有者權,三類主體數據持有者權的區分可以構建適合數據特征和數據要素化利用規律的數據基礎制度。
1.基于政府數據持有者權的數據開放
政府是專門生產公共產品,承擔公共管理職能和基本公共服務職責的公共機構,因而政府向社會提供的服務一定是均等和普惠性的,且以無條件和無償為原則。隨著政府社會管理日益數字化,數字政府亦成為現代政府基本運行模式,其中很多公共服務也都以數字化方式提供,同時也不斷擴大公共服務的類型和范圍,比如數字社區居家養老、智慧出行、數字閱讀等生活新圖景和便民措施,而政務信息資源開放亦被認為是數字政府的一項新的基礎公共服務,應當無條件和無償向社會提供。在當前公共數據開放實踐中,所開放出來的數據基本屬于可公開為大眾使用的信息資源。此類數據開放可以視為既有公共服務在數字時代的延伸,納入基本公共服務范疇。
但是,可機讀、可再利用的原始數據開放并不當然屬于既有公共服務的自然延伸,而是一種向社會提供的新服務,這種服務的性質需要根據數據受眾是否具有普惠性來重新評價,并且也要考慮數據治理(要素化)和運營管理的成本。從現在數據開放的實踐來看,此類數據開放宜定位于非基本公共服務,可以設置獲取者條件并可以收費,除非某些數據的開放被定位于普惠性服務,由財政支撐所有的運營成本。由于政府不能有經營行為,所以要實現有條件和有償的政府數據開放,就需要以授權運營方式,通過引入社會資源將政府持有的數據要素化,并對接社會需求,按照政府調控的價格向社會供給數據。因此,在確認政府的數據持有者權的基礎上,還要有科學的授權運營制度,使政府持有的數據能夠合法安全地提供給社會,政府成為數據要素的供給者。關于授權運營制度,本文不再贅述。
綜上,承認政府作為數據資源持有者享有數據持有者權的意義僅在于使得政府可以具備授權適格機構運營數據開放并管理數據開放的權力基礎,得以使政府的數據最大化實現社會價值的同時,確保數據開放利用的安全和合規,并最終使全體人民能夠分享數據開放的紅利。顯然,只要承認政府對數據資源的管理權足以實現該目的,通過將公共管理活動延伸到對數據資源的管理,即可以通過授權運營的方式實現政府所持有數據要素資源的有效供給。
2.基于其他公共機構數據持有者權的數據開放
在本文中,其他公共機構即是地方立法中公共服務機構,一般指醫療、教育、供水、供電、供氣、通信、文旅、體育、環境保護、交通運輸等公共企業事業單位。顯然,這些企事業單位在提供公共服務過程中收集、制作的數據并不一定都是公共數據,更不是可供全社會主體自由使用意義上的公共數據。為了更準確定義,《重慶市數據條例》開始以“涉及公共利益”來限制其他公共機構生產的數據。《廈門經濟特區數據條例》甚至將其他公共機構生產的數據直接分為公共數據和非公共數據兩類。
本文否定以業務性質來定義數據公共性,并認為只有無償無條件開放的數據才滿足公共數據性質,因而在允許政府數據有條件有償開放政策背景下,將其他公共機構的數據納入公共數據已經沒有太大意義。正因此,筆者認為應當承認其他公共機構獨立的數據持有者權,賦予其自主開發利用其產生數據資源的權利,同時施加向政府提供公共基礎信息的義務,從而在實現數據資源自主處理的基礎上,也可以為政府提供實現公共服務目的所需要的基礎數據。
應當承認,無論立法表述,還是政府或立法者本義都不是要將其他公共機構所持有的全部數據納入公共數據的范疇,而是以支撐開展數字時代的各類公共服務為根本目的。最為直接的是為實現“一網通辦,一網通管、一網協同”的基礎公共服務,需要打通各部門和各領域數據,實現互聯互通、智能化應用數字底座或數據基礎設施。這就需要接入醫療、教育、供水、供電、供氣、通信、文旅、體育、環境保護、交通運輸等公用和公益企事業單位的數據。顯然,政府從事公共管理和服務需要采集這些行業的基礎數據是非常正當的,這是從事公共服務的企事業單位應盡的社會義務。不過,將其他公共機構所持有的數據納入公共數據范疇還應當具有更深層的制度目的,即支撐政府新的公共服務活動——數據開放。所開放的數據被定位于社會可再利用的原始數據,而政府又依賴于各行業社會主體(包括其他公共機構)所提供的各種原始數據,才能形成公共管理和公共服務所需要的數據集。因此,地方立法就探索出前述先定義公共數據,將公共數據匯集到統一開放平臺,再由政府實施開放的制度方案。
這樣的方案存在兩個問題:一方面,其他公共機構是獨立的法人,對于各自運營形成的資產享有所有權。在數據成為生產要素,可以轉化為資產的背景下,其他公共機構自然成為其生產的數據資源的持有者,享有資源持有權,自主使用(包括開放)。將這些數據直接界定公共數據,提供給政府再向社會開放,這是對其他公共機構資源持有權或使用權的侵犯。另一方面,數據開放是提供可再利用數據,從原生數據到可再利用數據需要數據治理,且要根據產生場景、過程等開展校對驗真、語義標注等。一旦脫離原始生產環境,數據治理變得異常困難或成本無限增加。在未明確治理責任的情形下,將數據匯集到統一平臺,再實施開放,就會出現治理難題。誰是這些數據的開放(提供)主體,誰對這些數據的質量和合規性負責,誰承擔治理的成本等,將成為公共數據開放亟待解決的問題。其他公共機構數據持有者權的確立需要我們承認其他公共機構的數據持有者權和管理權,并在此基礎上破解這些難題。按照《數據二十條》的“誰投入、誰貢獻、誰受益”原則,應當以“誰投資數據治理,誰持有和決定流通利用,誰受益”來構建數據開放利用秩序,在確認其他公共機構數據持有者權的基礎上,施加數據開放義務,使其成為數據開放的責任主體,允許其自主對外開放數據,包括通過政府的開放平臺。這也意味著其他公共機構除支撐政府的數字化公共服務外,不再作為公共數據開放的主體或者承擔政府開放數據的義務。雖然如此,并不是減輕其他公共機構的數據開放義務,而是強化其開放義務,尤其擔負起提供非基本數據公共服務的職責,為社會提供更多更高質量的數據要素。
最后,按照本文的思路,數據具有社會性和公共性,作為非公共機構的一般社會主體也具有開放數據的義務。不過對于社會主體而言,除非法律施加明確地向社會無償或無條件開放數據義務,如何向社會提供數據應當是數據持有者根據自身意志所決定的事項。對于其他公共機構而言,其本身肩負著公共服務基本職責,因而有義務在傳統公共服務范圍內提供信息服務或者數字化提供公共服務。這樣,其他公共機構向社會(通過政府匯集)提供公眾需要或者向政府提供基本公共服務需要的數據,就是這些機構既有公共服務的延伸,是應盡的義務。只要法律予以明確,這些機構就應當免費無償提供。但是,如同政府一樣,這些機構生產的數據并不一定都是或適合滿足公眾需要、可自由使用的數據,對于那些沒有這樣的共用性、公益性的數據,則應當由這些公用公益企事業單位自主決定,行使數據持有者權。由于其他公共機構本身是獨立的法人,有獨立資產,且不屬于公權力機關,因而沒有必要將其數據持有者權稱為數據資源管理權,而應當直接稱為數據持有者權。為滿足政府向社會提供基本公共服務所需數據,只要在法律中明確這些公用公益企事業單位的公共數據提供的義務即可。
另外,不僅其他公共機構具有向社會開放數據的義務,而且一般社會主體也具有這樣的義務。
因為每個組織都是一個社會存在,社會需要基本公共服務和公共管理,政府為實施公共管理,提供基本公共服務,需要社會主體提供滿足公共利益所需要的數據。為此就需要向社會主體施加向政府提供滿足公共利益需要數據的義務,但應當嚴格限定于公共利益目的或基本公共服務需要。
對此,本文不再贅述。基于上述,本文試圖構建三類數據持有者權,即政府的數據持有者權(即數據資源管理權)、其他公共機構的數據持有者權和社會機構的數據持有者權,在承認這三類主體都享有數據資源持有者權的前提下,分別施加不同的數據開放義務,設計差異化的數據開放方式和機制,構建多元化數據開放利用體系,實現全面數據開放的制度愿景。
結論
數字技術不僅賦能人類處理和駕馭信息的能力,而且使人類具有利用原始數據的能力,這便是通過機器發現數據背后所蘊含的客觀世界的規律,預測趨勢的能力。數據日益成為有價值的資源,在我國將其表達為生產要素,《數據二十條》提出了以數據持有者權為核心的數據基礎制度,以構建數據生產、流通和利用的秩序,激活數據要素潛能,增強經濟發展新動能,構筑國家競爭新優勢。問題的關鍵在于這樣思想如何貫徹到公共機構生產和控制的數據當中,以銜接地方立法中形成的公共數據開放制度體系。本文認為,先界定公共數據,再對公共機構施加以開放義務,構建不同類型的數據開放體系不僅在邏輯上存在斷層,而且在實施上存在困境。從本質上來看,公共機構所生產的數據,無論是公共機構自用(提升部門或單位智能決策能力和公共服務能力)還是共享(提升整個政府部門治理能力和效率)和開放(流通數據以賦能社會),都需要承認公共機構的數據持有者權,然后根據數據目的或用途定義數據開放(提供行為)的性質,再由數據開放的性質定義數據的性質。依照這樣邏輯,只有開放出來供全社會自由使用的數據,才是真正意義上的公共數據。
實際上,在數字政府建設的背景下,政府(及其他公共機構)能夠開放的公共數據一方面包括了其數字化運營所形成的可開放的信息資源,這樣的信息資源可以納入基礎性公共服務的范疇;另一方面也包括了其機構運行所產生的原始數據,這些原始數據并非直接能夠對外提供使用,需要治理之后才具有再利用價值,而且對這樣的原始數據的利用需求并不具有普遍性,存在明顯的行業和技術能力限制。同時,原始數據對外提供需要控制風險,這導致數據提供者與接受者之間存在可受調控的數據使用關系,而不是公開之后成為可自由使用的數字化信息。因此,原始數據的開放一定是有條件且受控制的。原始數據的對外開放已經脫離公共機構的初始業務目的,初始業務的公共性并不當然地導致公共機構將所生產的數據應當無償提供給社會再利用于其他目的,特別是商業目的。我國目前地方立法提出有條件開放已經初步意識到這一問題,以使公共數據開放不完全等同于域外開放數據。《數據二十條》也明確公共數據可以有條件有償開放更加強化的數據作為生產要素的供給特性。因此,公共機構的數據資源的有條件開放應當定位于數據要素供給行為,應當按照經濟規律來設計開放制度機制。可行的方案是將其定位于非基礎公共服務,可以引入社會資源彌補公共資金投入的不足,為社會盡可能提供更多更高質量的數據要素。作為解決數據生產、控制和流通利用秩序的數據持有者權不僅應當適用于社會主體(非公共機構),也應當適用于公共機構。既然不宜將公共機構生產的數據直接定位于公共數據,那么我們也無需過分追求使公共機構與政府構建完全一致的數據基礎制度。而應當直接賦予這些公共機構法人組織以數據持有者權,使其獨立行使流通和使用數據的權利;同時,向其施加向政府提供公共數據的義務甚或在特定情形下無償開放原始數據的義務,以此限定公共機構的數據持有者權。至于政府的數據持有者權,則僅在實施數據開放時才有意義。因此,政府的數據持有者權可以稱為數據資源管理權,只是管理者具有依法管理數據開放的權利和義務,而此時政府是作為數據持有者對外提供數據或開展授權運營的。
綜上,數據持有者權可以分為三類:社會主體的數據持有者權、政府的數據持有者權和其他公共機構的數據持有者權。三類持有者權的目的均在確認三類主體對數據資源的控制權或管理權,以構建全面數據流通利用的秩序。其中,政府的數據持有者權是依照法律規定管理數據資源的權利。法律可以授權政府授權運營其持有的數據資源,對接數據要素市場。而對于社會主體和其他公共機構而言,將原始數據轉化為生產要素,通過各種流通方式向社會提供數據資源的權利,還是應當還原于社會主體和其他公共機構自身。
(責任編輯:王玎)