張永婷,王換換,趙辰陽
(徐州醫科大學 醫學信息與工程學院,江蘇 徐州 221000)
隨著就醫人數及病患信息地不斷增加,醫院信息統計工作變得尤為重要。雖然互聯網技術的快速發展為現有病患信息統計系統的開發及病患信息統計工作提供了一定程度的技術支持,但目前的病患信息統計系統所包含的模塊功能相對單一,操作步驟也較為繁瑣,出現了病患信息遲交、病患情況分析不深入及病案信息共享延遲等問題[1-3]。針對上述問題,本文從門診掛號統計、病案統計、出入轉統計三個方面展開,設計了一種基于差分隱私保護技術的醫院信息統計系統,該系統統計了病患入院掛號、治療及出院過程中所產生的數據信息,同時技術人員利用差分隱私保護技術[4],對傳入系統的數據進行加噪處理,有效提高了病患信息存儲及管理工作的效率,實現了對病患信息的實時統計及隱私保護功能。
醫院信息系統(Hospital Information System,HIS)是指利用計算機及電子通信設備,為醫院提供病患信息收集、存儲、處理等功能的系統[5]。該系統對醫院各科室進行了整合,能夠保證各科室間的信息共享,提高醫務人員的工作效率及醫院的管理水平。
差分隱私(Differential Privacy)這一概念最早于2006 年由微軟的C.Dwork 團隊提出,技術人員根據數據類型選擇拉普拉斯機制(Laplace mechanism)、指數機制(Exponential mechanism)及高斯機制(Gaussian mechanism)中的一種對數據進行加噪處理,實現保護數據隱私的目的。相對于同態加密(Homomorphic encryption)及零知識證明(Zero-knowledge proof)而言,差分隱私保護能夠抵御任何背景知識下的攻擊,是一種嚴格數學意義上定義的隱私保護框架,具有更重要的理論研究意義。
現有的醫療信息統計系統主要是病案統計系統,而將掛號信息統計模塊、病案信息統計模塊及出入轉信息統計模塊整合的系統很少。雖然現有的病案信息統計系統版本多樣,但接近半數醫院因系統開發商技術薄弱或索價過高,導致系統版本無法更新,無法適應醫療信息快速增長的時代,同時多數病案統計系統仍存在信息查詢困難、存儲空間小、數據共享性差、安全性低等問題。針對以上問題,該模塊在建立查詢索引時將保存索引頁中的鍵值及指向其他索引的指針或數據頁,保證查詢速度及系統信息反饋速度[6];同時建立多個與醫學信息系統(HIS)相連的接口,在統計完相應模塊的數據信息后及時上傳醫學信息系統,以此解決存儲空間小及數據共享性差的問題。病患信息上傳及共享流程圖見圖1。

圖1 病患信息上傳及共享流程圖
最后采用差分隱私保護技術(Differential Privacy)對上傳到醫學信息系統中的數據進行加噪處理。考慮到所統計的數據類型為離散型數據,所以采用指數機制進行加噪處理。
設有任意函數f,敏感度Δf 的定義為:Δf=maxD,D′||f(D)-f(D′)||1,其中D 與D′是鄰近數據集,|| ||1是向量的L1 范式。在不同案例中Δf 往往是可以求出來的,此處僅需設定一個ε 表示隱私Δf=maxD,D′||f(D)-f(D′)||1保護預算即可,ε 值的大小與隱私保護水平成反比,ε=0 時,隱私保護水平最高,但加噪后的數據不能反映出數據集D 的任何特征,因此需要設定一個適當的ε 值才能做到既保護了隱私安全,又使數據具有研究價值。
設隨機算法A 的輸入是數據集D,輸出結果為r∈Range,q(D,r)->R 為可用性函數,其中Δq 為可用性函數的敏感度,當算法A 以正比于exp(εq(D,r)/2Δq)的概率從Range 中選擇并輸出r 時,那么算法A 提供ε-差分隱私保護。在離散型數據中,f(D)-f(D′)結果多為1,因此Δq 默認取值為1,概率密度函數為:

此處選擇某醫院一周內所產生的各類掛號量總和作為示例進行加噪處理,數據加噪前后對比如圖2 所示。

圖2 醫院掛號信息加噪圖
掛號信息是眾多醫療信息中的一種,統計室系統中的掛號統計模塊從科室掛號工作量、醫生掛號工作量以及掛號預約報表三個方面進行統計,幫助統計科室及時準確地掌握產生的掛號信息。
病案作為醫療信息的一種主要載體,相對于掛號統計模塊及出入轉統計模塊而言更加重要。病案信息統計工作不僅是整個醫院正常運行的關鍵,還是醫院開展各項工作、執行各種計劃的重要依據。本文設計的病案統計模塊主要對疾病分類(合計)、疾病分類(女)、疾病分類(男)、住院醫生工作量、30 個病種出院情況、科室出院情況、切口情況分級、手術情況分級、住院病人費用、病房工作量輔助報表、醫院工作量動態報表、損傷中毒轉歸情況及前100 位[ICD-10]順位等方面產生的數據信息進行統計,并在技術人員對原始數據進行加噪處理后,上傳到醫療信息系統,各科室醫生可通過分析訪問系統后臺數據庫得來的病案信息制定相應的計劃,并根據實際情況轉移工作重點,達到更加快速、準確、有效地治療病人及解決醫院問題的目的。
出入轉信息統計是醫院信息統計工作中的重要一環,主要從病區(科室)床位維護、病區(科室)出入院、病區(科室)出入院統計明細及出入院數據修正幾個方面進行統計,幫助醫護人員及時有效掌握病人出入院信息以及病床位信息,為快速準確地分配醫療資源創造了良好的條件。
醫院每日產生海量數據信息,做好醫療信息的存儲及管理工作是醫院正常運行和執行各項計劃的基礎。國內醫療行業現有的醫療信息統計系統普遍存在功能模塊單一、操作步驟繁瑣、版本更新換代慢等問題,很難滿足醫院的實際需求。本文設計的基于差分隱私保護技術的醫院信息統計系統能夠實現對各類掛號信息、病案中的疾病分類信息、手術情況信息及出入院信息的統計,并在統計室系統統計完各項信息后,使用指數機制對要上傳到醫學信息系統中的數據進行加噪處理,確保醫學數據信息的安全性。同時系統中的數據具有共享性,各科室醫生可通過訪問并分析已有數據,科學地制定工作計劃,醫院可根據實際情況適當轉移工作重點,以確保病人入院治療流程的合理順暢。此外,統計室系統所統計的數據信息量過大,技術人員在對其進行加噪處理的過程中需要耗費較多時間,導致數據信息共享到醫學信息系統的時間延長,后期研究將針對因數據量大導致加噪處理時間長的不足進行改善,使整個系統具備更完善的統計和信息共享功能。