陸 婷 張 燕
·綜述與進展·
人工智能科研項目中的隱私問題研究
陸 婷1張 燕2
1.北京大學腫瘤醫院暨北京市腫瘤防治研究所倫理委員會,北京 100142; 2.北京大學腫瘤醫院暨北京市腫瘤防治研究所胃腸腫瘤中心一病區,北京 100142
隨著人工智能(artificial intelligence,AI)、大數據技術在臨床研究中的廣泛應用,其面臨的隱私問題越來越突出。本文從倫理審查的角度分析了北京大學腫瘤醫院的人工智能項目受試者隱私保護存在的問題,并針對存在的問題提出受試者隱私保護的建議,以期在充分保護受試者個人信息和隱私安全的基礎上推動規范開展人工智能科研項目。
人工智能;臨床科研;隱私保護;數據管理;倫理審查
人工智能(artificial intelligence,AI)是一門基于計算機科學,以智能行為為目標的橫斷學科,可分為強人工智能和弱人工智能[1]。近年來,我國開始推行“互聯網+健康醫療”的政策方針,人工智能技術在醫療領域的應用不斷擴展和延伸。人工智能技術不僅可應用于健康管理、輔助臨床決策、疾病的篩查和診斷、臨床資料或文獻的分析、醫院管理等[2],其數據整合和數據處理能力在醫學研究方面也發揮重要作用。人工智能提供更便攜的技術支持的同時,也為臨床研究帶來了更多的機會和可能[3]。
隨著個人信息和臨床數據廣泛應用于人工智能的相關研究,受試者數據安全和個人隱私問題逐漸突顯[4]。筆者以北京大學腫瘤醫院2018至2022年經過倫理審查的共30項人工智能科研項目為對象進行分析,對發現的受試者隱私保護的常見問題進行梳理歸納,并針對存在的問題提出可行性對策。
人工智能科研項目屬于較新的研究,研究者及申辦者對此類項目的受試者隱私泄露風險認識不足。北京大學腫瘤醫院90%的人工智能項目中研究者及申辦者均未重視個人數據的不正當處理、個人隱私泄露、侵害隱私權所可能帶來的社會風險。根據《民法典》[5]第111條和第1034條規定,研究者及申辦者應重視個人信息泄露對數據主體(受試者)可能產生的嚴重風險。同時,在醫學研究倫理審查中,除關注受試者生命健康安全外,還應注意審查信息數據安全管理措施是否得當且充分,高度重視大數據時代受試者個人數據泄露的風險,防患于未然[6]。
為確保研究項目資料的保密性,通常采用特有的受試者識別(identify code,ID)編號而非醫院病歷號來標記受試者的研究數據和生物樣本,該編號無法識別受試者的姓名、照片等身份識別信息。北京大學腫瘤醫院多數人工智能項目中,僅對受試者姓名、性別等身份信息用代號或數字代替,而忽略了對受試者相關視頻圖像等健康信息采取相應的保密措施。
此外,在查閱標有受試者ID編號的研究數據或樣本時,需要向訪問者明確以下情況:①審查受試者信息(包括含有可識別受試者身份個人信息的病歷)是為了確保研究過程符合要求。②保證受試者研究數據在擁有良好數據保護法律環境且符合我國數據安全和保護法要求的國家和地區被查閱和分析。③當涉及受試者基因信息時,僅可提供所需的基因組信息,如遺傳特征信息,不應標有受試者姓名、照片或任何其他個人身份識別信息。
總之,根據適用的數據隱私保護法和數據安全相關法律、法規、行業規范、國家標準和臨床研究相關的法律法規和部門規章,使用多種方法保護受試者隱私[7]。
人工智能研究通常涉及與第三方單位的合作,北京大學腫瘤醫院研究者及申辦者在遞交倫理審查材料時,多數未提供第三方合作單位的資質文件及合作協議,但此類文件是倫理審查過程中必不可少的。事實上,選擇有資質的第三方合作單位就是保障受試者個人信息安全的主要措施之一,因為在合作協議中對雙方責任、義務及權利,知識產權,受試者隱私及數據保護、保密等方面進行了明確規定[8]。
研究中通常需要嚴格相關人員訪問數據的權限,以保證數據共享的可控性,如相關政府部門(如監督本次研究的倫理委員會)、申辦者自身及為申辦者工作或與其合作的人員;儀器供應商和實驗室等服務提供方的試驗醫生、工作人員。
知情同意和倫理審查是保護受試者隱私的重要的兩個環節。知情同意可以使受試者充分獲知所參加臨床試驗內容和風險,同時也是試驗過程中受試者相關數據采集和使用授權。北京大學腫瘤醫院人工智能項目中申辦者及研究者存在知情告知范圍不全面的問題,侵犯了受試者的知情同意權。
關于人工智能項目中的數據安全及隱私保護問題,倫理委員會應根據研究預期目的、數據的收集方式及涉密性、敏感性、研究所帶來的社會價值、重新獲取知情同意的難度及管理措施等,來判斷項目應采取具體的知情同意、廣泛的知情同意、免除知情同意,還是選擇退出程序及知情同意的撤回形式[9]。
為充分保護個人隱私權,各國政府陸續出臺相關法律或規范性文件,如美國的《健康保險流通與責任法案》,歐盟的《通用數據保護條例》,并在實踐過程中不斷完善[10,11]。我國應借鑒國際已有條款,盡快針對人工智能項目中的隱私問題立法,保護個人數據隱私[12],并建設合作、配套的監管制度,建立隱私風險評估機制和行業自律體制。同時,應定期、廣泛開展受試者隱私保護的培訓,以提升利益相關者的隱私素養。
人工智能的發展離不開有效地監管,建立健全的監管體系,更有利于其健康發展。2022年3月20日,中共中央辦公廳、國務院辦公廳發布了《關于加強科技倫理治理的意見》[13],該意見是我國國家層面科技倫理治理的執行性文件,提出了五條科技倫理原則:增進人類福祉、尊重生命權利、堅持公平公正、合理控制風險、保持公開透明,并要求“從事生命科學、醫學、人工智能等科技活動的單位,研究內容涉及科技倫理敏感領域的,應設立科技倫理(審查)委員會”[14]。
臨床研究開展前,倫理委員會應嚴格審查人工智能臨床試驗中的有關受試者隱私及保密的具體措施,并決定是否同意開展本研究。此外,在臨床試驗項目進展過程中,倫理委員應對其進行全過程監管,一旦發受試者的個人信息或隱私存在泄漏風險,應責成相關方排除風險;如受試者隱私權受到侵犯的或造成嚴重后果的,應當要求責任方給予賠償或依法承擔相應法律責任[13]。
為保證受試者的隱私數據安全,以北京大學腫瘤醫院胃腸中心為例,在開展人工智能科研項目時,任命一名數據工程師作為隱私保護專員,該專員將確保所有臨床科研數據在交付過程中的隱私保護措施得以執行。具體措施如下:
2.2.1 數據操作標準化 ①相關數據管理軟件中需進行數據流程申請,由主任、副主任雙重審核備案并留痕,以供隨時查閱歸檔數據信息,形成數據使用后的反饋機制。②數據使用后的銷毀和反饋機制:牽涉第三方使用受試者數據使用時,需簽署經本院律師審核過的、相對嚴謹的第三方數據保密協議。③設定相應的數據訪問權限,如僅對部門負責人設有高級管理權限,而其他普通工作人員僅有限時瀏覽權限。另外,臨床試驗輔助人員進入科室系統均需提交申請,防止第三方人員利用個人用戶信息進行醫療詐騙等惡意行為。④設置高級別密碼并定期修改,通過系統升級、禁用弱口令、啟用強口令(必須包含數字和字母,8~10位)等措施,有效保護系統信息安全,降低醫療數據安全風險隱患。⑤采用單通路(北京大學腫瘤醫院內網環境下的辦公系統)傳輸數據,以避免網絡的非法獲取,不可使用微信、QQ在線傳輸等[14]。
2.2.2 數據的脫敏處理 采用醫療行業數據脫敏系統對醫療系統內的敏感數據進行脫敏保護,防止醫療數據被非法篡改,及在醫院信息系統的開發、測試環境中被第三方泄露。
2.2.3 訪問者的實名認證 北京大學腫瘤醫院搭建了醫生實名認證的電子簽名系統,每次登錄會出現UKey提示,防止匿名用戶的登錄;使用界面設有定時退出功能,避免因長時間不使用而增加信息泄露的風險。
2.2.4 加強數據管理,建立數據共享與管控機制 對于每一項臨床研究,統計分析結果首先在本地數據集進行計算,得到本地統計數據后發送至業務終端,然后匯總每個數據提供者的單個結果,以獲得分析的最終匯總結果。與個體方面的數據比較,局部統計數據具有較低的維度,因此在去中心化的數據共享模型中,被重新識別的風險較低,這樣就能有效地避免了因內部敏感數據被拷貝和竊取,從而出現導致個人信息泄露等問題[15]。
2.2.5 數據二次利用的管控 對于已存儲數據進行二次研究的管控對于生物標本庫及相關數據庫非常重要。生物標本庫保存著生物標本及相關的表型和人口統計數據,在將其分發給第三方研究人員進行二次研究前,生物樣本及其相關需通過關鍵編碼等方式處理,確保二次研究的團隊無法識別其個人信息主體[16]。
數據共享中存在敏感數據難以保護、隱私數據泄露等受試者數據安全及隱私問題。針對數據共享中侵犯受試者隱私權的問題,可通過樹立正確的倫理價值觀、加強倫理監管等方式來避免;可以采用數據收集限制原則、數據的質量提升原則、目的明確化原則、利用限制原則、安全保護原則、開放原則、個人參與原則、問責原則等隱私治理原則[17]。監管機構應賦予患者積極保護自己的權利,通過監控患者的電子病歷來保護其隱私。
對受試者隱私保護并非信息孤島,而是數據共享的適當條件。為了更好地實現“科學數據共享價值的最大化”與“隱私風險的最小化”治理目的,受試者數據共享中的隱私治理需政府、倫理委員會、申辦者、研究人員及受試者等多方主體積極參與、協同治理,才能有效降低隱私泄露的風險[19]。
知情同意書應包括隱私保護的內容。知情同意過程中,對受試者進行充分告知,取得受試者知情同意,使受試者知道其個人信息和隱私受到法律保護,研究團隊也會將按法律法規和知情同意書等文件的要求合理使用其數據[20,21]。
如有個人信息或隱私被侵犯的情況發生,受試者可向研究方提出撤銷對個人信息的繼續使用和共享許可,研究者及申辦方應尊重受試者意愿,將其相關數據刪除。若因各種原因無法刪除其相關數據,應向受試者做出書面說明,并提交倫理委員會備案。隨后,若該受試者將退出實驗,研究者不再收集其新研究數據。但是,根據臨床試驗規則的要求,可能仍然會在采取知情同意書描述的措施保護受試者隱私的前提下使用已收集到的健康數據。
綜上所述,人工智能的發展日趨成熟,已經滲透到臨床試驗的各個領域。人工智能應用于臨床試驗為其帶來了新的發展機遇的同時,也對受試者的隱私保護帶來了新的挑戰。除借鑒發達國家和地區系統的隱私保護政策以外,提高對隱私保護的認識、加強人工智能項目的倫理審查監督、完善數據管理體系建設、加強對受試者隱私數據共享的安全管理、注重受試者知情同意權保護等方面的措施,是保護受試者個人信息和隱私安全的重要工作。
[1] 任相閣, 任相穎, 李緒輝, 等. 醫療領域人工智能應用的研究進展[J]. 世界科學技術-中醫藥現代化, 2022, 24(2): 762-770.
[2] 王姍姍, 翟曉梅. 人工智能醫學應用的倫理問題[J]. 中國醫學倫理學, 2019, 32(8): 972-976.
[3] 胡獻紅. 人工智能的國際倫理原則探討: 聚焦隱私和數據保護問題[J]. 新媒體與社會, 2021(1): 3-20.
[4] 王瑞, 陳曉英. 人工智能的倫理困境和解困之道[J]. 遼寧工業大學學報(社會科學版), 2022, 24(1): 17-19.
[5] 民法典. 北京: 人民法院出版社, 2020.
[6] 劉瑞爽. GDPR對我國醫學研究倫理審查的啟示[J]. 醫學與哲學, 2019, 40(3): 29-33.
[7] 吳何奇. 大數據時代個人隱私保護的刑法路徑——從醫療人工智能的隱私風險談起[J]. 科學與社會, 2020, 10(2): 89-110.
[8] 劉丹, 周吉銀. 臨床科研項目受試者隱私保護的倫理審查[J]. 中國醫學倫理學, 2021, 34(10): 1306-1310.
[9] 謝小萍, 何曉波, 張玲希, 等. 涉及醫學人工智能研究的倫理審查要點分析[J]. 中國醫學倫理學, 2021, 34(7): 844-850.
[10] 李明, 李昱熙, 戴廉, 等. 醫療人工智能倫理若干問題探討[J]. 醫學與哲學, 2019, 40(21): 1-4.
[11] 藥物臨床試驗受試者隱私保護·廣東共識[J]. 今日藥學, 2020, 30(12): 807-814.
[12] 烏守恒, 劉芯如, 楊建英, 等. 醫互通微信隨訪平臺在PAC隨訪中的應用[J]. 中國計劃生育學雜志, 2018, 26(2): 156-159.
[13] 中共中央辦公廳. 國務院辦公廳. 關于加強倫理治理的意見[OL]. (2022-03-20) [2022-12-28], www.gov. cn/ zhengce/2022-03/20/content-5680105.htm.
[14] 劉星, 盧曉然, 吳影, 等. 人工智能應用于臨床試驗的倫理問題分析及對策[J]. 中國臨床藥理學與治療學, 2022, 27(3): 322-327.
[15] 張海洪. 健康數據二次使用研究的倫理審查探討[J].醫學與哲學, 2019, 40(3): 26-28.
[16] 王國豫, 黃斌. 論大數據技術對知情同意的挑戰[J]. 自然辯證法研究, 2020, 36(4): 61-66.
[17] 孟祥菡. 我國人體臨床試驗受試者知情同意權的法律保護[J]. 人權, 2022(1): 150-167.
[18] 柳薇, 吳丁娟. 醫療信息隱私保護的研究進展[J]. 軟件, 2020, 41(5): 66-71.
[19] 朱貝, 王傳清. 我國科學數據共享中的隱私治理探析[J]. 圖書情報工作, 2020, 64(22): 37-47.
[20] 李憲辰, 康玫, 邱燕, 等. 研究者發起的臨床研究中受試者個人隱私保護探討[J]. 中國醫學倫理學, 2020, 33(12): 1459-1462.
[21] 周琬琳. 人工智能醫學應用的分類與倫理問題反思[J].中國醫學倫理學, 2020, 33(7): 826-830.
張燕,電子信箱:zhangyangoog@163.com
(2022-07-25)
(2022-09-11)
R920.4
A
1673–9701(2022)36–0109–03