周合永 戚莉莉(通訊作者)
(山東大學第二醫院 山東 濟南 250033)
2015 年,國務院辦公廳出臺《關于促進和規范健康醫療大數據應用發展的指導意見》,文中指出健康醫療大數據是國家重要的基礎性戰略資源,提出推進數據互聯融合、開放應用。隨著醫院信息化業務的不斷深化,業務系統的不斷拓展,臨床數據越來越龐大,形成孤立的、碎片化、異構的、分布式數據。臨床數據中心就是將分散在HIS、LIS、PACS、EMR 等各類系統的數據進行獲取、存儲、更新、流通及挖掘的信息系統共享數據平臺。目前臨床數據中心已在各級醫院逐步實施,是這幾年來醫院信息化建設的熱點和應用難點。
一般來說,臨床數據中心在行業內有完全集中式、邏輯集中式、歸檔集中式三種方法。完全集中式就是將整個醫院信息系統的數據集中存儲,每個業務系統負責自身數據的錄入和輸出,數據中心集中進行數據存儲與控制處理,此種方法為理想狀態,無異構系統,標準統一,數據一致。邏輯集中式就是保持原有各個業務系統的物理分布特性,各種類型業務數據仍由原系統負責管理和維護,從邏輯上將這些分布式存儲的數據集中起來,為各種上層應用提供統一數據訪問接口,實現數據的邏輯集中展示分析功能。歸檔集中式就是各種類型的數據仍由相應的臨床信息系統負責管理和維護,依然保持原有的物理分布特性,采用技術手段將這些分散存儲的數據經過提取清洗歸檔,集中于物理上的臨床數據中心,為各種應用提供統一的的數據訪問接口。
通過對以上三種臨床數據中心構建方法的分析,完全集中式適用于新建醫院數據中心的構建,對于已建立了各種信息系統的醫院,完全集中式意味著推倒重建,資金投入大,開發周期長。邏輯集中式是一種松散的數據中心構建思路,數據運行效率低。歸檔集中式在完全集中式與邏輯集中式中找到了一個平衡點,從技術角度和經濟角度上實現了最優,既保證了舊系統的連續性,又提高了數據運行效率。
數據接口是實現數據傳輸、信息交流的通道。只有需要傳輸交流的系統共同遵循接口規定的標準規范,才能進行正常通信,進而實現信息的開放與共享。臨床數據中心的數據交換接口應遵循系統性、實用性、可擴展性和科學性的原則。
臨床數據中心建設遵循的數據接口標準一般為HL7V3 標準、HL7CDA 標準及受控詞匯表等。HL7V3 標準是醫療領域不同應用之間電子傳輸的協議,它匯集了不同廠商用來設計應用軟件之間接口的標準格式,允許各個醫療機構在異構系統之間,進行數據交互,在設計臨床數據中心的過程中,要嚴格遵守HL7V3標準,充分考慮臨床業務的多樣性和可擴展性,以及與其他業務系統的整合及數據共享等。HL7CDA 標準是實現臨床醫療文檔跨系統交互的標準,因此要結合CDA 文檔架構對臨床文檔的結構和語義進行標準化和本地定義。受控詞匯表要參考相關術語編碼規范,如ICD9、ICD10 以及衛生部電子病歷數據元及數據集標準,在數據層次上定義數據的編碼、規范、組成、內容等。
臨床數據中心總體架構分為數據資源層、數據處理層、數據中心層、分析展現層四個層次。在數據資源層,通過歸檔集中方式將醫院各業務信息系統的數據從業務庫實時或準實時采集到復制庫,在復制庫上處理數據;數據處理層面,將ETL 工具kettle 封裝到中心管理系統中,對數據進行抽取、清洗、轉換及加載處理并采集到數據中心,使整個采集過程及數據校驗可視化;在數據中心層進行標準化管理,數據中心自由構建,將采集方式、數據模型等進行統一管理,建立智能化數據管理平臺;在分析展現層,深入分析不同數據應用需求,建立不同應用的數據產品,以臨床全息視圖、輔助決策、智能報表等形式進行數據展現。
總體功能架構詳見下圖:
3.2.1 業務數據捕獲 臨床數據中心需要實時或準實時的從業務系統抽取數據。如果采取完全數據源抽取,則效率較低。為減少對運行的業務系統的影響,先對業務系統數據進行復制,然后在復制庫上捕獲變化數據源抽取。
具體實現架構圖如下:
3.2.2 增量數據加載 通過C D C 技術捕獲業務系統的數據變化集后,需要實時高效的智能化加載工具加載數據變化集到C D R 中。通過智能化數據載入工具,從應用業務系統到C D R 的數據載入可以達到分鐘級別,報表系統數據最大延遲一小時左右,對于實時監控數據,技術上可以做到秒級左右。
數據質量是數據應用的基礎。這就要求在數據匯集過程中,確保數據質量。完整性、一致性、準確性、及時性是優質數據的標準。從業務數據到C DR 的數據導入過程中,做到實時顯示,定期對數據所有維度表進行完整性校驗,對數據源和目標數據表之間的數據分組聚合進行驗證。
隨著臨床數據整合的不斷深入,基于臨床數據中心的精細化、過程性、相關性的分析等的數據挖掘應用成為可能。臨床數據中心存儲的大量臨床數據可支持很多領域的研究,包括以臨床業務、教學工作、科學研究為核心開展的患者全息視圖、臨床輔助決策、教學服務支持、科研服務支持、醫院運營決策等臨床數據中心應用項目。
臨床數據中心建設是數據應用的前提,只有夯實數據共享交換融合平臺,才能深化數據應用。海量醫療數據的存儲、清洗、標準化、分析挖掘、安全隱私保護是臨床醫療數據中心建設的關鍵技術。數據標準規范、數據安全法律法規的健全、信息化人才的培養是臨床數據中心建設的保障。