石旭雯
天津醫科大學醫學人文學院,天津,300070
大數據對于信息社會的意義,在于把人類“實現目的”變成專業化的工作[1]。以醫療大數據為基礎的精準醫療可以視為是上述大“目的”中的子目標。大數據不僅改變了人們的生活和工作方式,更是變革了人們的思維方式,也對傳統的法律體系提出了挑戰。有關大數據的法學研究集中于大數據的法律性質、數據確權和數據交易以及個人信息保護。對于大數據的性質,學者觀點并不一致,例如梅夏英否認數據的客體性和財產性[2];龍衛球則認可數據上存在人格和財產的雙重利益[3];王玉林等人也認可大數據具有財產屬性,是信息財產權的客體[4]。相應地,前者認為大數據交易應以數據服務合同的方式處理,從而回避數據的客體及權屬問題;而后者則認為應當在不同主體之間以數據財產權的模式進行復雜的權利配置。在認可數據產權的基礎上,學者還研究了數據交易的法律問題,例如王德夫認為數據交易法律制度的完善應當包括明確交易主體、交易行為的類型化分析,并突破現有的財產權制度進行架構[5]。目前法學界對于醫療大數據的研究成果較少,且集中于研究醫療大數據中的患者個人信息和隱私的保護[6]。本文認為,雖然個人信息和隱私的保護是醫療大數據應用中必須正視的問題,但是如何合理分配數據利益,設置數據權利架構,促進醫療大數據的共享,同樣具有重要的理論和現實意義,也是本文試圖解決的問題。
目前尚沒有一個有關大數據的精準的界定。從類別上看,大數據是由于數據量巨大,無法使用傳統的信息技術進行分析和處理的數據;從功能上看,對于大數據通過運用新系統、新工具、新模型的挖掘,使得海量數據獲得洞察力和新價值。人們常常用4V來描述大數據的特征,即大量化(volumes)、多樣化(variety)、快速化(velocity)和價值化(value)。醫療大數據包括醫療系統產生的電子病歷數據、健康檔案數據、大量隊列研究和科研數據,還包括各種可穿戴設備采集的生理數據、測序技術產生的巨量組學數據以及零散分布在互聯網上的健康數據、疾病檢測與衛生監督形成的公共衛生數據[7]。因此,概括而言,醫療大數據是以患者為中心,在人們疾病防治、健康管理等過程中產生的與健康醫療相關的數據。
1.2.1 醫療大數據的公共性。關于公共性(publicity)的基礎性研究主要存在于政治哲學和經濟學領域。在政治哲學的角度,以哈貝馬斯為代表,將“公共性”的內涵確定為“公共領域”,而公共領域是介于政治生活和私人生活之間的領域。有學者在承認“公共性”概念難以界定的前提下,對于公共性的樣態進行列舉,公共性具體體現為:①共在性、共處性、共和性;②共有性、共用性、共利性;③共通性、共謀性、共識性;④公意性、公義性、公理性;⑤公開性、公平性、公正性等[8]。在經濟學領域,公共性是通過對公共物品的討論而被定義的,經濟學家認為,公共物品是與私人物品相對應的,公共物品具有非競爭性、非排他性和強烈的外部性。
從社會價值和經濟價值角度觀察,醫療大數據不僅僅與每個人的生活息息相關,對于它的挖掘和利用更是影響著全世界的疾病的防控和新藥的研發。因此,大數據負載著重大的公共利益,具有“公共性”的向度。另一方面,與傳統的生產要素相比,大數據具有新的特征。傳統的生產要素被利用后,要么價值減損,要么被轉化為產品而消失;但是大數據被利用后,不僅沒有磨損折舊,還會衍生出新的要素產品,數據本身還具有可復制性。隨著時間的推移和場景的轉換,數據在不斷地產生,規模在不斷地擴大。由此可見,大數據具有非競爭性和非排他性,具有公共產品的屬性。
1.2.2 醫療大數據的利益多元性。在大數據的搜集、儲存、挖掘、預測與利用的過程中,涉及到對數據價值的產生具有作用力的不同主體,并且這些主體對于數據利益均具有合理需求和利益分享的正當基礎,本文稱其為大數據的利益相關者。荷蘭學者Zwitter從數據產生和發展的角度,將大數據的利益相關者區分為基本的3種類型,即大數據收集者、大數據利用者和大數據生產者[9]。大數據的收集者是指基于特定目的而搜集和保存特定數據的主體;大數據的使用者是利用大數據工具對已經收集和存儲的數據進行挖掘、預測和利用的主體;大數據的生產者是指主動或者被動地提供個人信息或者活動痕跡的社會主體。具體到醫療大數據領域,患者位于大數據生產者的地位,他們在求醫問診的過程中主動或被動地提供或產生的個人信息構成醫療大數據的基本元素,但他們往往無法掌控醫療大數據,更難以預知醫療大數據未來的利用方向。醫療機構、醫療器械廠商、互聯網醫療平臺是最主要的醫療大數據的收集者;而醫療健康大數據產業是醫療大數據的使用者,醫療大數據的使用者還包括政府和社會。
因此,醫療大數據利益相關者之間的利益關系可以抽象為龐德所謂之個人利益、社會利益和公共利益。個人利益是從個人生活的角度出發,以個人生活的名義所提出的主張、要求和愿望;社會利益是從文明社會的社會生活的角度出發,以社會生活的名義所提出的主張、要求和愿望;公共利益是從政治生活的角度出發,而由個人所提出的主張、要求和愿望。醫療大數據包含大量的患者信息乃至患者隱私,維護患者的人格利益始終是醫療大數據治理的核心問題。同時,信息技術、大數據技術和算法已經或者正在成為現代社會公共性的基礎設施,而由此衍生出來的大數據已然成為蘊含社會利益的公共資源,正如在公共衛生事件中,無人會否定通過大數據進行疫情預報、追蹤和反饋的正當性。所以盡管醫療大數據包括無數的個人信息,但在特殊情況下,公共利益優位于個人利益;在醫療衛生事業的發展過程中,為了醫學研究和醫學進步,系統地收集和披露個人信息具有正當性。
1.2.3 醫療大數據的倫理共享性。要想實現大數據價值的最大化,必須促進數據的流動和分享,從而消除“信息孤島”現象。在醫療大數據領域,對于數據的共享更是一種道德律令[10],正如臺灣地區《臺北宣言:健康數據庫與基因數據庫之倫理考慮》前言第5條指出,使用健康數據庫和基因數據庫之研究可顯著加速對健康、疾病以及預防性、診斷性與治療性措施的有效性、效率、安全性與質量的了解,健康研究代表了共同利益,既符合患者個人的利益,也符合群體和社會的利益。資源共享,意味著在不同主體之間進行資源的開放和流動。海量的醫療大數據存放在不同的數據池中,只有對海量數據進行挖掘、分析和整合,才能真正產生價值。另一方面,醫療大數據具冗余性特征,有價值的信息常常深藏其中,這就需要數據挖掘算法、可視化分析等技術對海量數據進行挖掘,而這個過程往往需要更多的參與者,在數據共享的前提下得以實施。
資源共享不僅是醫療大數據的倫理理想,也是世界范圍內的數據實踐。例如加拿大的Healthy Infoway項目建立了可共享的電子健康平臺;美國的NHIN項目通過公共及私有醫療機構之間交換藥物使用記錄、臨床護理記錄及檢驗結果,方便患者轉診;美國的PatientsLikeMe是一個病友社交平臺,通過分享醫療記錄,尋找相似病友,并為研究人員提供醫療數據。我國在上海、湖北等地區也進行了醫療大數據的共享實踐[11]。
有學者否認數據的客體性,認為數據沒有特定性、獨立性,亦不屬于無形物,不能歸入表彰民事權利的客體[12]。本文認為此觀點過于強化數據的技術特征,而忽視了數據的社會屬性,割裂了“數據”和“信息”之間的關系,根據國際標準化組織對于數據的界定,數據是信息的可重復解讀的表達方式,其可用于通信、技術或處理。因此信息是數據的內容,數據是信息的形式[13]。數據是物理的,信息是釋義的,數據反映的是事物的表象,信息反映的是事物的本質。雖然數據不具有客觀可視的形態,也無法適用有體物的控制模式,但完全可以納入無形物的范疇。隨著社會的發展,法律調整的客體的范圍也在不斷地擴大,呈現出極大的包容性,大數據上體現出復雜的利益關系,是數據被納入法律關系客體范疇的根本原因。《中華人民共和國民法典》(以下簡稱《民法典》)第127條規定,法律對數據、網絡虛擬財產的保護有規定的,依照其規定。這也從立法的角度認可了數據的客體性。
“物”是源自羅馬法的非常古老的客體概念,現代法律已經將“物”的范疇從“有形物”擴大及“無形物”。“有用性”“稀缺性”和“可控性”是“物”的基本要件。本文認為,“有用性”和“稀缺性”是法律調整“物”的關系的根本要件,在符合這兩個要件的前提下,可以通過法律技術手段實現對于“物”的可控性。“有用性”強調客體能夠滿足人的需要,隨著人類從農業社會變遷到工業社會,乃至今天的信息社會,“物”的價值不僅僅是滿足主體生存及生活所需,更是具有生產要素的含義。在數據為“王”,萬物皆“數”的今天,大數據是信息時代的“石油”,是新的生產要素。大數據的意義絕不是僅僅存在于數據的大體量,而是通過對大數據的交換、整合、挖掘和分析,從而發現新的知識、創造新的價值、帶來“大知識”“大科技”“大利潤”“大發展”[14],其所蘊含的價值難以估量。以醫療大數據為例,通過大數據分析和發掘,可以建立醫學專家數據庫,以支持和指導臨床決策;生物醫學和基因組學數據有助于實現精準醫療,改善現有的診療模式;在市場分析階段和藥物研發階段通過大數據分析,能夠有效降低藥物研發的成本、縮短研發周期。
由此可見,醫療大數據的社會價值和經濟價值都非常可觀。另一方面,大數據雖然體量巨大,但是對于人類的求知欲和探索精神而言,大數據依然是稀缺資源[15]。對于無形物而言,可控性表現為其是否能獨立于主體,并具有確定的范圍。從技術角度而言,大數據的獨立性和確定性是可以實現的。觀察大數據的生產過程:信息經過采集、分類、隱匿和加工,最終以結構化、半結構化和非結構化的形式,通過二進制代碼存儲在相應的介質、載體等設備中而特定化;大數據在形成的過程中已經與數據源相分離,其內容能夠為人類所控制和管理,并且能夠通過技術手段進行轉讓。
醫療大數據具有財產性的判斷更多來源于對于實踐的觀察,據統計,在2016-2020年的全球大數據市場中,全球健康領域中大數據應用的潛在價值將在3000億到4500億美元[16]。醫療健康大數據正在成為新的投資領域,受到投資者的青睞,因此醫療大數據具有可交易的商業價值。而實現醫療大數據的共享互通,挖掘醫療大數據的商業價值,也是實現醫療資源優化配置的必要手段。而我國2015年成立了政府主導的貴陽大數據交易平臺、武漢東湖大數據交易中心、華東江蘇大數據交易平臺以及企業主導的數據交易平臺。
醫療大數據具有典型的價值低密度性。在醫療領域,每天都會產生大量的多余的數據,同一人在不同醫療機構可能會產生相同的醫療數據,整個醫療大數庫中包含大量重復和無用的數據,因此,只有數據的控制者之間通過數據的流通與共享構建起數據間的關聯關系,從數據中分析患者、疾病和藥物使用中的核心信息,提高不同來源獲取的結構化與非結構化數據的活性,才能讓數據資產保值增值。收集信息固然至關重要,但還遠遠不夠,因為大部分的數據價值在于它的使用,而不是占有本身[17]。因此,大數據具有“分享增值性”[18],即醫療大數據價值的實現依賴于大數據的分享和流動。
正如牛津大學教授維克托在《大數據》中指出,大數據是人們獲得新的認知、創造新的價值的源泉,大數據還是改變市場、組織機構以及政府與公民關系的方法。因此,大數據不僅是技術層面的變革,也對人們之間的社會關系和社會的治理模式提出新的挑戰。大數據以全樣本分析為根本特征,個人信息是大數據的基本分析要素,如果按照傳統的個人法模式對于大數據的信息特征進行調整,就會不適當地割裂大數據的整體性,增加數據行為的交易成本,從根本上不符合大數據社會的本質要求。另一方面,大數據不僅在微觀上影響個人行為,還在宏觀上具有社會效應,因此,有關大數據的法律調整不應局限于私法的范疇之內,也不應限定在某一特定的私法關系之內,例如僅僅在財產法體系或者契約法的路徑上。事實上,數據保護的法益形態多樣,散見于不同的法律層面,例如信息自決權、數據主權、對數據的財產權及處分權、尊重私人和家庭生活的權利、尊重住宅和通訊的權利、隱私權、作為絕對權的數據保護等。數據保護法也因法益多樣性而呈現出多元的部門法維度: 公共領域的數據保護法是行政法的一部分,規制私主體的個人數據處理是私法的一部分。數據保護法雖未直接規制消費者,但有明顯的消費者保護功能,是消費者保護法; 數據保護法既是信息法、媒體法和電信法的一部分,也是經濟法的一部分,更是風險法,揭示了信息技術發展對個人自由和社會公平的風險所在[19]。
如上文所述,醫療大數據上不僅負載有個人利益,同時還有公共利益。醫療大數據包含有雙重的公共利益,其一為經濟利益,醫療大數據是國家重要的基礎性戰略資源,在國家之間的競爭和博弈中越來越具有重大的意義。其二為安全利益。就醫療大數據的來源和構成來看,除了醫療機構日常處理的患者的診療和病歷信息,還包括藥品、醫療器械企業掌握的和患者/試驗對象有關的臨床試驗數據、不良反應數據;政府和相關機構掌握的人口健康數據、遺傳資源數據等。這些數據包含大量的個人私密信息,其中的人口健康數據和遺傳資源數據以及民族基因信息更是涉及國家公共安全和生物信息安全的高度敏感信息。因此,僅僅在私法的領域對醫療大數據的利益關系進行調整是完全不夠的,還必須借助公法的調整。
傳統國家主權的范圍包括領土、領空和領海。然而網絡技術的發達,使得人類的知識領域和交流與溝通已經突破物質世界,延伸到無形的網絡和數字世界。在網絡和數字領域,信息的儲存和流轉沒有物理疆域的限制,如果任由諸如醫療大數據此類敏感數據在數字空間中任意流轉,必然會對國家安全造成極大的隱患,因此國家對于數據的主權管轄也成為大數據時代國家主權制度發展的必然結果。數據主權是指國家享有對其政權管轄地域內的數據生成、傳播、管理、控制、利用和保護的權利[20]。它是國家主權在信息社會的拓展,是信息時代國家主權的新的表現形式。與傳統的主權體系相對應,數據主權也包括對內效力和對外效力。對內體現為一國對于其政權管轄范圍內任何數據的生成、傳播、處理、分析、利用、交易等擁有最高權力;對外則表現為一國有權采取必要措施保護本國數據權益免受他國的侵害[21]。
大數據的無形性決定了對其控制無法采取適用于有形物的控制手段,因此,大數據主權更多體現為以下幾點:對于數據信息基礎設備的安全保障;對于數據產生、存儲、流轉、利用過程的標準設計和監管;對本國數據跨境傳輸的監管與限制。《中華人民共和國網絡安全法》第37條規定,關鍵信息基礎設施的運營者在我國境內運營中收集和產生的重要數據應當在境內儲存,數據如需出境應當進行安全評估。根據2018年公布的《關鍵信息基礎設施安全保護條例》之規定,衛生醫療信息屬于保護范圍。因此,根據以上法律法規,醫療衛生機構被納入“關鍵信息基礎設施運營者”,并且應承擔數據本地化、數據處境安全評估等法律義務。
患者的個人信息是醫療大數據的主要來源,也是目前調整的重點。有學者認為應當明確個人在數據權利體系中的地位,在立法中確認個人數據權[22]。但本文認為醫療大數據中涉及到的患者數據仍然應該在個人法的體系內予以規范,而不適宜再確定所謂“個人數據權”。理由如下:患者就醫過程中所形成的數據主要包括患者的體征數據、化驗數據、住院信息以及醫生對患者的臨床診治等數據。此類數據在個人場景下顯然缺乏財產價值,人們警惕的是未經許可泄露給個人精神安寧所帶來的傷害,對上述信息的立法要點并非強調患者對于個人數據的積極的控制支配權,而是一種受尊重的權利,一種人身不可侵犯的權利。因而,其本質負載的是人格利益而非財產利益。其次,上述數據落入《民法典》個人信息權益的保護范圍。根據《民法典》第1034條的規定,上述信息屬于能夠單獨或者與其他信息結合識別特定自然人的健康信息,屬于個人信息權益的保護范圍。《民法典》第1035條到1039條,對于個人信息權益的保護規定了如下的法律框架:規定可對個人信息使用的合法、正當和必要的基本原則,自然人對于自己的個人信息,享有查詢權、更正權和刪除權。同時也規定了信息處理者不得泄露自然人個人信息等義務。醫療大數據收集過程中對于其中所涉及的患者個人信息,應當遵循《民法典》關于個人信息保護的基本框架規定。
雖然患者的個人信息在《民法典》個人信息保護權益的保護框架之內,但本文認為,以患者為中心的醫療信息的收集和適用具有較強的特殊性,應該在《民法典》的框架之下,以單獨立法的方式對于患者信息權利的保護進行針對性的延伸和精細化的規定,為醫療機構及相關機構收集和使用此類數據提供更加詳細的可操作的規定。
醫療大數據可以提高醫生的工作效率、對患者進行精準醫療、為患者提供遠程指導和干預。除此之外,醫療大數據還具有強大的市場價值,可以實現商業化應用。但是在“信息孤島”的狀態下,上述價值無法實現,因為數據如果不流動是沒有價值的。數據治理不僅僅是數據的保護,更為重要的是通過數據的流通與使用以實現數據的財產價值,從而釋放數據紅利,使數據真正成為數據經濟的基礎性資源[23]。實現醫療大數據的流通和共享是數據治理的目標,而數據確權是數據流通和共享的基礎,也是發揮大數據價值的前提。不建立初始的權利界定,就不可能有交換和重組這些權利的市場交易[24]。
根據世界經濟論壇的觀點,可以對于大數據中所包含的數據進行類型化分析,分為“個人提供的個人信息”“被觀察到的個人信息”和“推測的個人信息”。醫療大數據主要由“個人提供的個人信息”和“被觀察到的個人信息”混雜形成,前者主要體現為患者的個人身份信息(如姓名、性別、年齡等),后者主要包括醫療機構利用醫療知識和技術所發生的醫療數據、移動醫療和可穿戴醫療設備所產生的醫療數據等。以電子病歷為例,根據《電子病歷基本數據集》,電子病歷記載的內容包括患者的基本信息和基本健康信息、患者的門(急)診病歷、患者的檢驗檢查記錄、醫療機構的治療處理記錄、護理記錄、住院病程記錄、住院醫囑記錄等。再觀察可穿戴設備產生的醫療數據,可穿戴醫療設備不僅能收集用戶的基本信息,而且還能采集實時的客觀生命體征信息和主觀輸入的事件信息。因此,在醫療大數據情境中,“被觀察到的個人信息”具有多元化的產生途徑,其所蘊含的利益關系也較為復雜,此類醫療信息反映患者的個人體征,其中的健康信息和生物信息由于其無限接近于個體的人格核心,理應被視為新興的人格權客體,屬于個人信息權益的調整范圍。
但另一方面,醫務人員在醫療行為中記錄的數據、通過儀器設備采集的患者信息等,凝聚了其多年學習積累而成的醫學知識、經驗,也投入了可觀的工作時間[25]。如果沒有醫師和醫療機構的專業技能、離開醫療設備的檢測能力,則“被觀察到的個人信息”無從產生,而此類數據才是醫療大數據的核心價值所在。因此,本文認為,應該賦予醫療大數據收集者對于大數據享有獨立的產權,從而建立數據流動和分享的權利基礎。理由如下:醫療大數據的產生基于數據智力型投入,從其價值實現的角度觀察,將醫療大數據中的個人信息打散分解給患者個人會完全毀滅醫療大數據的社會和經濟價值。醫療大數據應用的關鍵并不針對個人隱私性數據,個人數據上所蘊含的經濟價值非常少,通過技術手段存儲的海量的個人數據才真正具有經濟價值,因此必須認可數據收集者對于總括性的醫療大數據的權益。有學者將其歸屬為知識產權,但本文認為,與著作權對獨創性進行保護的價值追求不同,大數據更加強調數據的體量和數據的混雜型,而不是編排的獨創性。因此,目前的知識產權法不足以調整與大數據有關的社會關系,現有物權體系也無法容納大數據權益的特殊性,因此,本文認可在大數據上成立新型的財產權利,并將數據權益歸屬于數據的收集和加工主體。
當然,在確權基礎上對于醫療大數據的利用,必須合法收集并經過脫敏化處理,這個目的的實現則有賴于數據處理技術和個人信息權益保護的精細化立法。