王維,宋倩
(新鄉醫學院 三全學院,河南 新鄉 453003)
在信息化時代背景下,醫療領域逐步推進大數據平臺建設管理工作,已取得一定成效,但總體而言,仍存在一定問題,如信息孤島普遍存在、標準化難以實施、數據安全缺乏保障等,因此,為提高醫療數據共享安全平臺建設效果,應合理運用區塊鏈技術,在其防篡改加密機制、共識機制、智能合約的應用下實現數據分布式管理及平臺共享共治,以此提升醫療數據共享安全平臺應用實效。
隨著醫療領域信息化改革進程的推進,各醫療相關機構紛紛搭建了大數據平臺,但具有目前所表現出的效果來看,仍存在一定缺陷,平臺信息收集缺乏統一標準,收集的信息零散,難以形成一套記錄患者完整醫療信息的數據系統。針對上述問題,研究人員借助區塊鏈技術天然適合記錄數據信息的特性,將不準確和存在差異影響的醫療記錄上鏈,此時各醫療機構可依據所采集的完整數據鏈提取各自所需信息,以此有效解決了大數據平臺缺乏統一標準的弊端。除此之外,還可基于區塊鏈技術構建電子病歷,用于整理疾病數據、健康數據(生命體征、病史手術、診斷結果、記錄服藥等)、涉醫數據(如醫療器械、醫護人員等)。
現階段部分醫療領域項目內已充分應用了區塊鏈技術,如阿里健康所提出的“醫聯體+區塊鏈”試點項目,其將區塊鏈技術融入到了基層醫聯體管理中,為當地部分醫療機構提供了高安全、低成本的數據互聯互通方式,在一定程度上緩解了醫療機構數據安全、信息孤島問題。結合上述分析可見,區塊鏈技術與醫療領域大數據共享安全管理的適配度較高,因此,在設計醫療數據共享安全平臺時,需合理利用區塊鏈技術。
新鄉醫學院三全學院重視創新改革工作,在醫療大數據的技術應用上,有著充足的實驗平臺,為提高醫療數據共享安全管理效果,新鄉醫學院三全學院與翔宇醫療、中科曙光等國內一線軟件公司、醫療大數據公司開展深度的戰略合作,致力于借助區塊鏈技術設計醫療數據共享安全平臺。
傳統的醫療大數據平臺是依托Hadoop 或Spark 等大數據技術實現的一整套處理醫療大數據、臨床大數據、健康大數據等的平臺。傳統化數據共享主要是借助大數據平臺、數據倉庫對醫療數據進行采集篩選、處理存儲、分析應用,在實踐應用期間,傳統大數據平臺缺陷逐漸暴露,如記錄遺漏、篡改失真、信息孤島、灰色交易、隱私泄露等,極大限制了醫療大數據在特定范圍內的流通傳遞與共享應用。新鄉醫學院三全學院通過分析和整理區塊鏈技術架構和大數據平臺技術架構,基于醫療數據的特殊性、涉密性、隱私性、不可篡改等特性,在現有醫療大數據平臺應用架構基礎上,在數據整理層和數據處理層之間新增加一層區塊鏈層,依托于區塊鏈技術對醫療數據進行加密,防止數據篡改問題,同時實現醫療數據同步管理、自動預警及節點實時監控,以此搭建行之有效的醫療大數據平臺,實現醫療數據共享,并提升醫療數據安全性。圖1 為基于區塊鏈技術的醫療云大數據平臺應用架構,即本次醫療數據共享安全平臺設計的整體架構思路。

圖1 基于區塊鏈技術的醫療云大數據平臺應用架構圖
在明確醫療數據共享安全平臺設計架構思路基礎上,應進一步梳理項目實現步驟,具體如下:(1)將VisualBox虛擬機安裝至本地平臺內,同時建立多個節點操作系統;(2)使用Nginx 搭建Web 環境,使用Java 或Python 編程語言來開發業務邏輯功能;(3)采用“Mysql+Mycat”的模式搭建醫療領域區塊鏈數據庫應用平臺;(4)經綜合對比,運用“ECC+AES+MD5”算法組合來實現區塊鏈中相關數據的加密解密功能;(5)突出區塊鏈共識功能,對Raft 協議進行開發挖掘;(6)借助Python、Java 編程語言而實現區塊鏈智能合約功能,為醫療大數據平臺的共享共治奠定基礎;(7)基于ECharts 搭建可視化模擬平臺。
新鄉醫學院三全學院所開展的醫療數據共享安全平臺設計項目主要用于解決信息孤島問題,并緩解數據安全缺乏保障、標準化難以實施等問題。結合區塊鏈技術特征提出具體解決方案,在原有醫療大數據平臺基礎上進行改進,并從分布式數據管理、平臺共享共治兩方面設計醫療數據共享安全平臺功能。
2.2.1 分布式數據管理
醫療數據一向比較敏感,特別是患者的臨床數據,涉及到個人隱私,因此,醫療數據共享安全平臺內的患者關鍵敏感數據必須進行匿名化或脫敏操作,以此避免隱私信息泄露而損害患者權益。在本次平臺設計過程中,依靠區塊鏈技術,將傳統大數據平臺的集中式數據管理邏輯更換為分布式數據管理邏輯,憑借區塊鏈技術的公開透明、集體維護、數據追溯、全程留痕、去中心化等特征提高醫療數據應用合理性,避免出現一人或幾人控制全部數據的增刪改查操作,減少或杜絕數據被破壞的風險和數據不可用的概率,從而實現數據的安全共享。在分布式數據管理邏輯設置過程中,還可依靠區塊鏈技術的防篡改加密機制而提升數據安全性,數據一旦保存在區塊鏈中,就無法再進行任何數據的更改操作,以此避免了數據糾紛問題,杜絕醫療篡改病歷等不良事件,并為醫患糾紛的處理提供良好依據。
2.2.2 平臺共享共治
基于區塊鏈技術設計架設醫療數據共享安全平臺時,可借助區塊鏈技術的智能合約與共識機制而創設平臺共享共治功能,以此保障醫療數據共享效果。依托于區塊鏈技術建立醫療數據共享平臺,能夠將醫療信息孤島銜接為一體,以此保障醫療數據傳遞傳輸效果,同時依靠區塊鏈技術的節點隔離、DDOS 抵抗、多重加密、共識機制、智能合約、授權監管等特性實現醫療數據的共享與協作。除此之外,基于區塊鏈技術所構建的醫療數據共享安全平臺可用于臨床研究中,借助該平臺存儲患者信息(如年齡性別、生理信號、癥狀診療、實驗數據、用藥療程等),并將醫療數據共享安全平臺內的患者信息實時更新共享至醫療大樣本疾病隊列內,用于研究重大慢性病及疑難雜癥,而在區塊鏈技術共識機作用下,即可保障醫療數據的安全性。
醫療數據共享安全平臺主要可從數據共享設計、數據共治設計兩個方面實現共享共治功能。第一,數據共享設計。數據共享通過數據共識算法來實現,而在平臺設計架設時常用的數據共識算法主要包括DpoS、PoS、Raft、Ripple、PoW等,而結合醫療大數據平臺需求來看,其主要借助該平臺控制數據流轉,在實際設計過程中,應綜合考慮實現難度及效率而選擇數據共識算法。在本次醫療數據共享安全平臺設計中,所選擇的數據共識算法為Raft 算法,其主要依靠分布式一致性協議管理醫療數據,并采用分布式的方式存儲醫療數據。在分布式算法邏輯實現過程中,為保障醫療數據準確性與實時性,應實現ACP 外部一致與ACID 內部一致,用于提高分布式數據節點間存儲及節點間同步的有序性及正確性。第二,數據共治設計。數據共治采用數據區塊預警及節點監控的思路,使用智能合約程序來進行自動化管理,在此過程中無需人為干預。在醫療數據共享安全平臺應用之前,需以業務需求為依據編寫算法程序并運行,由程序來實時監控區塊數據及各個節點的運行是否正常,如果發現區塊數據出現異常或節點運行出現故障,則馬上報警并通知相關研發人員進行處理,提高系統的健壯性和魯棒性。
2.3.1 設計思路
為有效解決傳統醫療大數據平臺所存在的數據傳輸安全性,借助區塊鏈技術對醫療數據進行加密,在平臺設計過程中,最常應用的加密算法主要包括三類,即非對稱密鑰算法(如ECC、RSA)、對稱密鑰算法(如AES、DEA)、Hash 算法(如SHA1、MD5)。在平臺安全設計過程中,醫療數據傳輸期間常見安全影響因素進行分析,并依托于區塊鏈技術展開針對性解決,在實際設計過程中,應在保障平臺數據安全與運行效率基礎上,合理選擇加密算法。在本次醫療數據共享安全平臺設計項目中,將三類加密算法進行整合,應用混合加密算法“ECC+AES+MD5”加密并驗證醫療數據,使三類加密算法協同發揮作用,大幅提升醫療數據安全性。
2.3.2 算法對比
為驗證加密算法安全保護效果而對比分析三類加密算法。
第一,非對稱性密鑰加密算法對比。表1 為非對稱性密鑰加密算法對比結果,根據表1 可見,ECC 算法計算量相對較低、攻擊能力強、處理速度快、帶寬要求低,因此,在非對稱算法中,本次選擇了ECC 算法,但該算法不適用于大數據解密加密,故需與其他加密算法協同應用。

表1 非對稱性密鑰加密算法對比結果
第二,對稱性密鑰加密算法對比。表2 為對稱性密鑰加密算法對比結果,根據表2 可見,相較于DES 算法,AES算法更具優勢,因此,在對稱性密鑰加密算法中,本次醫療數據共享安全平臺安全設計選擇AES 算法,而AES 算法在加密數據量相對較大的情況下更適用,故為保障數據加密效果,還需合理選擇HASH 算法。

表2 對稱性密鑰加密算法對比結果
第三,HASH 算法對比。HASH 算法可將目標醫療數據文本轉化為相同長度的消息摘要或不可逆哈希字符串,而加密算法則可目標醫療數據文本轉化為可逆密文,在安全設計過程中,借助HASH 算法保障數據傳輸安全性。表3 為HASH 算法對比結果,而MD5 算法與SHA1 算法各有優缺,但MD5 算法的處理速度更佳,故在本次設計中,選擇MD5算法檢驗醫療數據是否已被篡改。
表3 HASH 算法對比結果

對比項目 MD5 算法 SHA1 算法密鑰長度(相同加密強度) 128 160 CPU 占用情況 少 高內存占用情況 少 高網絡消耗情況 低 高加密速度 快 慢破解難度 破解難度大一定難度抗攻擊性 強 較弱可擴展性 高 低
2.3.3 實現路徑
哈希算法具有不可逆特征,而加密算法具有可逆性,本次基于區塊鏈技術所設計醫療數據共享安全平臺構建了哈希算法、加密算法的共用邏輯,選用了“ECC+AES+MD5”算法組合,其中ECC 算法可加密小數據量,AES 算法可加密用戶信息等大數據量,而MD5 算法可用于加密小數據量,同時可檢驗醫療數據是否存在被篡改現象,以此借助“ECC+AES+MD5”算法組合最大限度地提高醫療數據安全性。
第一,經濟效益。對于醫療機構而言,基于區塊鏈技術的醫療數據共享安全平臺能夠全方位分析并監測醫院質量指標,采用橫縱向比較的方式幫助醫療機構人員提取高價值信息數據,且可進一步展開指標趨勢分析及室成本消耗變化趨勢分析,便于醫療機構不斷優化調整,以此降低醫療機構運營成本,提升醫療機構經濟效益。從臨床服務角度來看,依靠該醫療數據共享安全平臺可幫助醫療機構實現智慧醫療建設目標,并可在平臺幫助下降低信息傳輸成本,同時可提升醫療服務質量,繼而促進經濟效益的增長。第二,社會效益。醫療數據共享安全平臺可追蹤研究不同傳染性疾病的發展情況,幫助醫療工作者作出精準判斷,繼而更全面地預防疾病及用藥治療,以此大幅提升疾病治療效果,由此可見,該平臺具有顯著的社會效益,極具應用價值。
該醫療數據共享安全平臺在本次疫情管理期間大放異彩,基于系統數據共享安全管理功能,設置了疫情仿真模擬界面,在數據整理統籌分析的同時,起到一定模擬預測的效果。圖2 為醫療數據共享安全平臺疫情仿真模擬界面,相關數據可直觀性呈現,并可采用趨勢圖的方式展示疾病控制效果,圖3 為基本數據及舉措數據詳細界面。

圖2 為醫療數據共享安全平臺疫情仿真模擬界面

圖3 基本數據及舉措數據詳細界面
綜上所述,區塊鏈在加密保護、共享共治方面具有較高優勢,可將其應用到醫療數據共享安全平臺的建設工作中,在整體結構架設期間,應注意突出區塊鏈技術優勢,根據平臺架設區域確定平臺整體框架,在此基礎上,做好功能設計與安全設計,借助各種算法程序不斷完善醫療數據共享安全平臺,以此良好解決現階段大數據平臺所存在的缺陷。