周建文
(中南大學湘雅三醫院,長沙 410013)
隨著大數據時代的來臨,各行業和領域都開始涉及大數據。筆者所在的中南大學湘雅醫院,每年所產生的醫療數據非常龐大,所以大學相關研究部門開始收集和研究學校附屬醫院的臨床資源和數據,通過臨床研究來推動醫學的發展。在此基礎上,中南大學還專門設立了湘雅臨床大數據系統建設項目。同時,由于個人的數據具有一定的隱私性,應該受到法律和法規的保護。本文通過對當前醫療大數據的研究和應用現狀的分析,深入討論了大數據應用中可能存在的隱私保護問題,在此基礎上對現有的防護技術和手段進行梳理,希望能夠找到大數據環境下對醫療隱私數據的保護方法。
現代化的醫院中,普遍采用電子病歷,徹底改變了傳統的就醫模式,實現了由紙質病歷向電子化病歷的轉變,并由醫院對這些病歷進行統一保存。這些電子病歷中所存儲的各種各樣的醫囑數據、診斷數據為科研教學提供了直接的數據支持。此外,在一份比較完整的電子病歷中,還包含了醫技科室中所產生的各種檢驗和檢查信息,這些數據都可以在科研中加以應用。
現在,在專業化的醫技科室中,采用了很多專業的信息化系統,比如在檢驗科室中所采用的LIS系統等,可以通過檢驗儀器與信息系統的連接,實現在系統中對各種實驗樣品、數據的管理與存儲,此外,還能開展其他相關的服務,從而實現檢驗科室的規范化、智能化與自動化。此外,還有一些其他系統,如PACS系統、手術麻醉系統等,都能夠為相關的專業科室提供更加便捷的服務,有助于提高醫院的管理水平和醫療質量,大幅減少各種醫療事故的發生。這些專業的醫療信息化系統的廣泛使用,使得收集醫療數據更加便利,也讓電子病歷更加完整。但是,隨之而來的個人隱私的泄露問題也同樣不容忽視。
所謂的非交互式泄露,就是在醫院的內部信息化系統出現隱私泄露問題。需要強調的是,現在醫院中的多個業務流程存在很多節點,都能夠對數據進行訪問,存在非交互式隱私泄露的可能。
交互式的醫療數據泄露,主要是由于醫療數據內容的特殊性,這些數據在沒有經過妥善處理的情況下,會給相關人員造成極大傷害。比如,如果將某個孕婦的個人信息泄露出去,則可能引發一系列的推銷、詐騙等問題。而這種隱私泄露的危險性在大數據環境中,不再僅僅局限于泄露問題本身,而在于以這些數據為依托所進行的下一步行為的預測。比如通過對某個患者檢驗指標的獲取,就可以得到對健康狀況的準確判斷,進而為下一步行為做出預判和分析。在很多情況下,人們普遍認為只要能夠對數據進行匿名處理,或者隱藏重要的信息字段,個人隱私就可以免于泄露,但是,大量的事實證明,通過收集其他信息,就可以很容易對個人進行定位。
在具體的患者診療檔案中,通常都會以該患者的姓名、證件號碼等作為唯一標識,但是,這些信息本身就是應該予以保護的內容,所以,正確的做法應該是在不影響信息準確性的前提下,對信息進行匿名保護。針對這種思路,有的研究人員進一步提出在隱私保護數據發布過程中,對身份進行保護的匿名方法,即在需要發布的數據中首先進行身份標識刪除,然后再對準標識數據進行匿名處理,這樣,就可以在保護隱私的基礎上,進一步提高信息的準確性,而在此方法的實施過程中,可以采用概化和有損連接等兩種方式。
不同的信息,在隱私保護中的權重并不一樣,所以,如果對這些信息一概而論,都采用高級別的保護手段,則會實際的應用效率產生影響,還會造成資源的浪費。但是,如果只針對核心信息進行防護,也可能造成隱的信息泄露。所以,需要構建比較完善的數據分級制度,對于不同級別的個人信息和數據采用不同的保護措施。
在醫療領域信息化系統中,其隱私防護的難點主要在于參與的人員比較多,使得潛在的泄露點也相應增加。利用訪問控制技術,可以對不同的人員設置不同的訪問權限,進而訪問不同的數據和內容,這樣做也可以有效解決數據的分級問題。比如,對于財務部門的人員,就應該只能訪問患者的費用相關信息,而不能對醫生的診斷信息進行查看。現在廣泛采用的訪問控制技術,主要為基于角色的訪問控制,能夠很好地控制訪問內容和擁有的操作權限。但是在實現規則設置與權限分級中,其具體過程和手段比較復雜,難以通過統一的規則設置來實現統一的授權,很多情況下需要針對特殊情況進行單獨設置,難以實現整體的管理與調整。所以,還需要對規則引擎在醫療領域中的具體應用進行深入研究。
在大數據理論和技術迅猛發展的推動下,醫療大數據應用也初露端倪,醫院需要對隨之而來的個人隱私泄露問題進行探討。要解決這問題,應該通過技術手段與各項規章制度的緊密結合,以醫療領域中的大數據特性為基礎,構建起比較完整的醫療防護體系,為個人信息防護提供保障。
[1]童云海,陶有東,唐世渭.隱私保護數據發布中身份保持的匿名方法[J].軟件學報,2010(4):771-781.