崔宇楊 ,許琳琳 ,陳雨琳 ,余澤華 ,李書艷
(1.徐州醫科大學醫學信息與工程學院,江蘇徐州 221000;2.徐州醫科大學醫學影像學院,江蘇徐州 221000)
醫療器械是一個具有多學科交叉、知識密集、資金集中等特點的高新技術產業。隨著遠程醫療、人工智能、云計算等新技術的應用與發展,現階段醫療器械行業呈現出高度信息化、數字化和智能化的發展趨勢[1]。在新冠疫情影響、市場需求刺激和政策支持的大背景下,醫療器械在整個醫療行業中的重要地位越發凸顯,醫療器械市場正迎來巨大的發展機遇。但是,盡管我國醫療器械市場規模龐大,但在高端醫療器械領域中,國內市場仍被大多數歐美企業所壟斷。
此外,統計顯示我國醫療器械行業中超過90%為中小型企業,大都處于“小而散”的發展階段,對在醫療器械云端化過程中存在諸多技術及安全問題缺乏積累,導致市場競爭力有限,難以進入國際高端醫療器械市場,更不利于我國先進醫療技術的發展[2]。
因此通過對醫療器械快速云端部署的關鍵共性技術的研究及安全平臺的構建,來為中小型企業實現醫療設備云端化提供解決方案和技術指導具有十分重要的現實意義。目前在醫療器械領域實現快速云端信息化存在一些普遍的挑戰主要包括數據安全、數據傳輸、數據存儲和云端部署等方面。
在數據安全方面,醫療器械信息化過程面臨數據安全和隱私泄漏風險。醫療器械云端信息化為醫療數據存儲、數據共享、遠程醫療提供了便利,但也加大了數據安全風險,易出現數據訪問、數據隔離風險,導致重要信息泄露或隱私信息被盜[3]。
在數據傳輸方面,云端通信傳輸過程中采用超密集型異構模式的網絡架構,但這種通信模式對邊緣數據的傳輸存在部分延遲問題,面臨數據感知延時性問題。此外,云端平臺通常為多租戶框架,多方數據同時傳輸很容易構成通信傳輸干擾或信道占用問題[4],甚至有可能造成數據傳輸錯誤,降低云端傳輸的穩定性和可靠性。
在數據存儲方面,醫療數據云存儲存在數據兼容性差和效率低的問題。醫療器械涉及的數據類型繁雜多樣[5],云端需面對大吞吐場景。云端存儲必須提供高效的查詢方案和安全的存儲,以支持醫療診斷和數據分析需求。
在云端部署方面,醫療器械實現云端部署缺乏統一標準和安全管理平臺。醫療器械快速云端部署需要面對醫療器械與云端的集成、醫療器械的不同類型和生命周期,以及云端平臺的不同部署模式和架構的問題[6]。
綜上所述,以上醫療器械實現云端化過程中存在的問題,密切相關,互有聯系,是制約醫療器械實現快速云端化的關鍵問題。針對以上面臨的問題,本文以建立云端環境下數據安全和防護和隱私保護策略為基礎支撐,提出基于分布式云存儲和區塊鏈技術的多級云端存儲架構作為平臺安全保障,同時創新性研究基于5G技術和差分隱私譜聚類算法的高效云端數據傳輸方案,最終融合以上多項關鍵技術,構建了一種適用于醫療器械實現快速云端化的安全技術平臺,助力實現醫療設備快速云端化和智能化。通過實驗對平臺性能測試,結果表明該平臺具有良好的數據安全性和可擴展性,能夠滿足醫療器械信息化的需求。
在總體架構上,醫療器械快速云端部署安全平臺以云服務為基礎,構建基于BaaS 架構的集管理服務、數據云存儲、安全共享和智能分析等功能為一體的安全云平臺模型,實現滿足數據安全云存儲服務、云端隱私保護和各類信息化的醫療器械快速接入服務等服務。首先,基于云計算技術,結合多種云端化模塊,建立醫療器械管理服務,實現包括設備管理、人員管理和系統管理等相關的服務功能,利用云計算提升整體醫療服務和管理水平。利用多個節點的虛擬服務器和分布式存儲模式,提供云端環境下海量圖像數據處理服務和海量存儲空間,以滿足醫療器械云端部署的數據存儲需求。采用混合云存儲架構,提供公有云和私有云兩種入口,公有云平臺存儲保密性要求不強的數據信息,私有云平臺存儲著重需要隱私保護的敏感信息。整體的平臺設計架構具體如圖1所示。

圖1 基于BaaS架構的醫療器械快速云端化安全平臺架構圖
傳統的隱私保護方法往往存在數據失真或不完全保護的問題,隨著隱私保護日益備受關注,差分隱私[7]作為一種新興的隱私保護技術應運而生。差分隱私技術的關鍵思想是在隱私與數據利用之間尋求平衡,通過對數據添加精確校準的噪聲,模糊具體信息,但盡可能保留整體數據在統計意義上的有效性和可用性。差分隱私數學定義如下:
定義1 差分隱私:假設存在一個函數A,使得A在給定的兩個近鄰數據集Q,Q′(即|||Q-Q′|1≤1)上得到的任一輸出集合B的概率滿足:
則稱該函數A滿足ε-differential privacy,簡寫為ε-DP。其中近鄰數據集(neighbordatasets)是指僅有1條記錄不同的兩個數據集,| || |1是指L1范式,Pr[]是指事件發生的概率。ε是隱私預算,其數值的大小代表隱私保護的程度。數值越小,隱私保護效果得越好。
可以通過對算法的輸入、目標函數、梯度或輸出添加符合特定機制的噪聲來實現差分隱私模型。噪聲的添加機制有適用于連續型數據普拉斯機制、適用于離散型數據的指數機制以及適用于圖像數據的高斯機制,而噪聲的大小和算法敏感度相關。
定義2 敏感度Δf:設有函數f:D→Rd,對于兩個近鄰數據集D,D’,敏感度為:
敏感度是計算待引入噪聲大小的重要參數,它衡量了對數據集進行更改(例如剔除某條記錄)對結果造成的最大變化。
本研究根據醫療設備產生數據的類型和特點對數據進行分類管理,明確各類數據信息安全防護要求,完善信息安全管理機制,設置不同的敏感度等級并配備相應的安全防護措施,提升此階段數據信息的抵抗能力。根據各類數據的特點,綜合采用數據加密技術和差分隱私保護機制對數據進行適當的加密和隱私保護處理。
具體而言,擬使用安全管理機制、數據加密技術和差分隱私處理三個過程對醫療器械產生的數據進行全面的安全化處理。
過程一,制定完善的信息管理機制,加強數據訪問權限管理。在云端環境下,首先根據數據類型特點進行類別劃分,明確各類數據的安全防護要求,針對性設置不同防護措施。其次加強數據訪問權限管理,根據接入用戶和設備的數據訪問需求,設置不同的訪問權限,實現數據信息的綜合管理。此外,增加系統風險監管,實時監控云端系統各項重要信息,重點包括對所有用戶進行身份識別認證,驗證用戶密鑰信息;及時掌握云服務器負載狀況,分析數據流量是否正常,避免數據信息被盜取。
過程二,根據上一過程中對數據的類別劃分,對于需要進行加密的數據采用數據加密算法進行加密處理。對于不同數據,可分別使用不同的加密算法,如針對文本數據使RSA算法,并且在加密過程中默認選擇超長RSA密鑰,確保無法破譯密文,明顯提升平臺存儲數據的安全性。此外還可以使用CP-ABE 加密策略,結合云端重加密技術進行高性能加密處理,可以有效對重要數據進行重加密,增強數據的安全防護能力。
過程三,針對過程一中需要進行隱私化處理的敏感數據,使用差分隱私機制進行隱私保護處理。這一過程首先需要對數據建立敏感度模型,根據數據隱私保護程度的不同劃分不同的敏感度等級,分別進行響應的隱私保護處理。本項目中按照敏感系數取值范圍初步將敏感度等級劃分為三個等級,即輕度、中度敏和重度敏感數據。依據敏感度等級模型,可進一步將數據分為共享數據和非共享數據,對于非共享數據,可根據數據屬性特征分別采用拉普拉斯機制、指數機制和高斯機制進行差分隱私處理,從而有效實現隱私信息的保護。
譜聚類是當前機器學習領域研究的熱點,廣泛應用于遙感測繪、自然語言處理和生物信息學等領域。與傳統k-means 算法和EM 算法相比,譜聚類算法適用于任意形狀的數據集,也無須事先假設數據的概率分布,算法思路簡單易于實現。
譜聚類算法的其基本原理在于:將樣本數據視為無向圖中的一個個頂點,然后基于相似性函數計算出各頂點間的相似度Wij,作為頂點間的權重,最后按照分割準則將圖分割,每一個子圖相當于一個簇。
在算法具體執行過程中,相似性函數常采用高斯核函數:
其中si,sj為樣本中的數據點,d(si,sj)是指數據點之間距離,一般指歐氏距離;σ為規模參數,σ取值影響Wij的計算,間接影響了算法的聚類結果。不同數據集的最優σ值也不一樣,因此實踐中σ的取值需要依據具體的數據集,多次實驗確定。
圖的分割準則主要有最小割集準則、比例割集準則、平均割集準則、多路規范割集準則等[8]。考慮到醫療數據的多樣性和復雜性,本文所使用的基于差分隱私保護的譜聚類算法采用多路規范割集準則:
基于差分隱私保護的譜聚類算法(DPSC)[9]在執行過程中,需要先對原始數據進行隱私保護處理,然后再進行聚類操作。因此,可以將其分為隱私保護階段和聚類階段兩個部分。在隱私保護階段,通過差分隱私模型對原始數據添加噪聲,擾動具體信息,以保護個體隱私信息。在聚類階段,則使用處理后的數據進行聚類分析。具體流程如表1所示。

表1 差分隱私譜聚類算法
為有效處理醫療器械數據采集和傳輸過程中的意外產生的數據空缺值和噪聲值,平臺使用聚類算法從大量數據中過濾噪聲信號,并對正常數據進行標準化預處理,從而避免數據傳輸過程中出現的干擾對后續數據分析使用造成的影響。對于云端數據傳輸存在延時問題,構建結合5G 通信技術的綜合傳輸響應機制,加強大數據技術的充分利用,有效實現數據的分類多渠道傳輸,提升數據整體傳輸效率。

圖2 平臺醫療器械接入界面展示圖
具體實踐中,本文首先對從醫療器械接入的數據使用DPSC 算法進行聚類預處理。DPSC 將接入的每一個數據看作是圖中的一個節點,并按多路規范割集準則對圖分割來進行聚類,將所有數據分配到最近的簇中,然后將不屬于任何組或屬于非常小的組的數據點視為異常值,由此在實現隱私保護的前提下過濾出噪聲和異常數據。隨后將篩選出的正常數據進行標準化預處理,在提高數據傳輸效率的同時,保留相關統計特征,進而避免數據傳輸過程中出現的干擾對數據分析使用造成的影響。
最后,將準備進行云端傳輸的數據進行整合劃分,綜合利用云端技術優勢,實行數據的分布式傳輸,提升數據整體傳輸效率。對于部分實時性要求較高的數據,融合5G通信技術的綜合傳輸響應機制,優先采用5G 通信進行傳輸,在保障關鍵信息的及時傳輸的情況下,進一步緩解傳輸和響應的延時問題。
數據存儲是醫療器械云端化的重要部分,考慮到醫療器械產生的數據具有不同業務需求,整體的存儲方案設計采用多層級的分布式存儲結構,并將各存儲節點按需劃分為緩沖庫、數據倉庫、匯總庫、備份庫等不同存儲功能,以滿足不同設備對數據存儲和查詢的需求。此外針對一些特別重要的安全敏感數據,為避免數據被私自盜用和修改,因此引入區塊鏈存儲方案。
具體設計中,充分考慮醫療器械存在的多種數據類型以及存儲要求,以滿足數據存儲和使用需求為目的,設計建立具有多層級的分布式存儲結構,提供關系型、列式、鍵值、文件等存儲服務,具體包括緩沖庫、數據倉庫、匯總庫、備份庫等不同存儲功能的數據庫。其中數據倉庫作為數據存儲核心,其他數據庫作為輔助存儲,并配合形成完整的數據支撐架構。輔助存儲系統實現包括任務調度、數據管理、運維監控、日志管理等功能,對外可提供高效的數據查詢計算能力。緩沖數據庫負責接入原始數據并進行臨時存儲,接入方式以流、批數據為主要特點,負責對數據倉庫存儲節點進行數據更新,進行自動數據同步。匯總數據庫負責對原始數據結構進行拆分、重組、關聯,以形成相互關聯的匯總信息表,并針對具體的功能服務,按數據類別、時間等字段類別進行匯總,目的是分離熱數據存儲庫,支持頻繁地讀寫和修改操作任務。備份庫目的則是保障數據安全,使用與緩沖數據庫相同的數據結構進行同步數據備份。另一方面,考慮到醫療數據的特殊性,存在部分極為重要的敏感數據對存儲安全性要求極高。針對這類數據進一步融合以區塊鏈為基礎的存儲結構,實現去中心化的數據存儲,建立數據塊密碼安全機制,防止數據庫被隨意修改或損毀。
在平臺總體功能測試中,本文主要進行了數據共享、通信傳輸、數據安全、圖像處理和容災備份等功能的測試。通過測試可知,平臺能夠實現數據預處理,DPSC 算法能夠在添加少量噪聲的期刊下篩選異常值。此外,遠程醫療器械能夠迅速與平臺建立通信并上傳數據,平臺端能夠正常響應醫院端器械各項請求,在進行了相應操作后自動將反饋結果給醫院端操控平臺。測試結果表明,本文提出的醫療器械快速云端部署安全平臺能夠滿足設計需求。
本文描述了醫療器械快速云端部署安全平臺總體架構和各子模塊設計。該平臺基于BaaS架構,允許醫療器械快速接入、存儲數據和保障云端環境下數據隱私安全。本平臺有望為中小型企業提供可靠的技術方案,從根本上解決設備廠商實際中的難點和痛點,實現醫療器械的快速云端化、智能化,加速醫療器械產業發展,提高行業競爭力。