李雯
蘇州大學附屬第二醫院,江蘇蘇州 215004
大數據時代醫學數據管理研究
李雯
蘇州大學附屬第二醫院,江蘇蘇州 215004
以大數據為時代背景,挖掘我國醫學數據管理的研究價值,探討醫學數據管理應用的新方向。通過查閱大量的文獻資料,結合自身的工作實踐,對國內醫學數據管理的現狀進行梳理,總結問題并有針對性地提出應對策略。以數據獲取、數據挖掘為技術支持,充分發揮醫學數據的潛在價值,通過提出“保障信息安全、完善平臺架構、優化治療及研發”的管理舉措,解決醫學數據管理方面的問題。在大數據時代,重視醫學數據管理有利于推動醫院管理,提升醫療服務品質。
大數據;醫學數據;管理研究
21世紀是一個高速發展的時代,科技發達、信息流通,人與人的交流日益密切,生活也日益方便,大數據是這一時代的必然產物。阿里巴巴的創始人馬云曾說過:“未來的時代將不是IT時代,而是DT時代。”在這個數據爆炸式增長、信息高度復雜化的時代,隨著計算機科學與網絡技術的飛速發展,信息化已融入醫療衛生領域。信息系統被日益廣泛地運用于醫療機構,醫院的數據庫容量不斷膨脹,醫學數據的信息量飛速增長,然而大數據的價值含量、挖掘成本、管理利用遠比數據數量重要的多。因此,如何使海量的醫學數據更好地服務于醫院管理、治療優化;如何將醫學數據信息轉化為知識力量,推動醫院發展及醫療建設;如何提升大數據時代醫學數據的管理水平,改善醫院的服務品質,正日益被人們所關注。
大數據即海量數據,泛指數據量規模大到難以在合理時間內獲取、整理、分析并提煉的數據。醫學數據主要來源于醫院的臨床診治、科研教學和日常管理過程,還包括:基于醫學研究或疾病監測產生的專項醫療數據,及基于移動客戶端或物聯網記錄的身高、體重、心跳、血壓、呼吸、睡眠、鍛煉等有助于疾病識別、防控及臨床診療的健康數據等。
我國在《國家中長期科技發展規劃綱要(2006-2020)》及《國民經濟和社會發展第十二個五年規劃綱要》中均表現出對大數據研究的重視。在國家“863”計劃中,醫學研究技術領域還部署了醫學大數據開發利用的關鍵技術研究。隨著研究的深入,越來越多的學者開始關注大數據在醫療衛生領域的影響。
醫院的數據中心包括HIS、LIS、EMR、CPOE等業務系統,還包括基于臨床數據中心(CDR)及運營數據中心(ODR)的科研分析系統及運營管理系統等。僅電子病歷系統就涵蓋了首頁、病程記錄、檢驗結果、醫囑等信息,結合醫院門急診量及住院人數,一般的社區醫院就能生成并積累數個TB甚至PB級別的數據。如此龐大的數據信息必將增加數據的維護成本;同時,在數據存儲、利用時,還難免會存在信息篡改、刪除等影響數據真實性、完整性的行為;此外,某些不當操作及系統漏洞還可能造成信息泄露,侵犯患者隱私及科研成果的知識產權,存在安全隱患。
醫院的數據類型繁雜,不僅包括患者的基本數據、入出轉院等結構化數據,還包括醫學影像數據、診療數據等非結構化或半結構化數據。大數據時代,信息爆炸引發醫學數據井噴式增長,各類數據存在結構不統一、存儲分散等問題。醫院層面,職能科室及臨床醫技部門的各類信息平臺難以實現一體化管理;醫療系統層面,各個機構間未建立緊密聯系,阻礙資源共享,導致醫學數據的利用率較低。
在大數據環境下,數據的價值密度與數據總量成反比,以影像數據為例,在幾百兆影像資料中可能僅幾個片段有助于醫學診斷。醫學數據不僅與患者生命息息相關,而且數據之間關系復雜,只有快速分析、及時處理才能使其發揮醫療價值,支持臨床診療及決策。目前,國內的醫療機構還無法實現海量數據中有效信息的挖掘優化,因此,在大數據背景下,提升信息處理速度是醫學數據管理的重要環節。
2.1.1 醫學數據獲取技術 醫學數據含有較多專業術語,包括大量疾病、診斷、手術、藥品名稱及海量的病例信息、檢驗影像等結構化數據;同時,醫學數據是臨床診療過程中產生的數據,相互之間關聯復雜,且易受主客觀因素的影響,導致數據存在一定的偏差。因此,需重視數據獲取,確保數據安全、可控。
醫學數據包括:關系數據庫、文件系統及網絡數據等多種數據源,源數據在名稱、格式、數據結構上存在差異。因此,在獲取數據時要對差異項逐步統一,并注重以下幾個方面:首先,非結構化的電子病歷、影像報告、網絡數據等,應進行概念描述并提取數據特征,盡可能借由相關屬性使不同數據源逐步結構化、條理化,便于深入研究。其次,醫療機構大多采用關系數據庫作為信息系統的后臺數據管理模式,在收集此類數據時,應先將關系數據庫中的數據信息剝離,使信息獨立于管理系統,并在適當的時機進行聯機分析。此外,剝離后的數據必須完整、準確,且元數據間的關系不可缺失[1]。最后,在收集數據的過程中應充分考慮患者個人信息及涉密科研信息的安全性。采取前端控制,對涉及私隱和受知識產權保護的內容進行加密,對相關字段進行替換或添加備注,并設置閱知權限。
2.1.2 醫學數據挖掘技術 當下,很多醫療機構對數據的處理仍停留在增、刪、改、查等較低層次,在輔助臨床診斷、開展科室評估等方面未發揮其潛在價值。因此,醫療機構應對醫學數據進行有效存儲、處理、查詢、分析,借助數據挖掘技術從海量患者信息中發現規律、模式及發展趨勢,幫助醫生做出更科學、準確的診斷和用藥決策,輔助管理者對醫療發展做出預判及引導[2]。
在醫學領域,數據挖掘技術的運用主要體現在以下3個方面:①在生物醫學上,人類24對染色體的基因測序已全部完成,數據挖掘技術開始運用在DNA序列分類及基因序列數據分析領域中。②在臨床診療上,由于疾病診斷、治療及恢復相對復雜,且醫生作為個體面對海量臨床數據存在一定挑戰,所以,借助數據挖掘算法和關聯統計技術可以形成診療分析模式并完善評估體系,有利于醫生開展臨床決策,并有效減少誤診、漏診,提升醫療服務品質。③在疾病預防方面,由于疾病防控建立在實驗監測及現場調研基礎上,人工統計數據易于出錯且工作量巨大,因此,借助數據挖掘技術可以對醫學數據做好存儲、關聯及分析并形成預案,有利于對傳染病進行預防和監控,減少生命威脅和財產損失。
2.2.1 重視健康管理,保障信息安全 ①個體醫療。個體醫療以患者信息為基礎,通過綜合分析、挖掘患者在病理、生理學等方面的特點,個性化制定適用于患者的最佳診療、預防方案,提高醫療針對性并追求療效最優化[3]。Leroy Hood首次提出了“P4醫療”的觀點,要求對個體數據進行整合分析,認識個體生物網及分子在疾病產生過程中的作用,并主動建立個性化模型來幫助患者預防或治療。2003年,人類基因組計劃歷時13年后順利完成,并于2012年借由DNA元素百科全書計劃嘗試填補研究空缺。美國還開展了“腫瘤基因組圖譜計劃”,為新型腫瘤的預防及早期診療提供依據。此外,大數據的獲取、分析、挖掘、存儲也不斷推動臨床病理發展,為醫生做出個性化診斷提供幫助。
②家庭醫療。家庭醫療與個體醫療密不可分。微軟公司在2007年就曾發布“Health Vault”目標,通過開放式接口導入移動便攜設備及第三方管理軟件的健康數據,集合多源數據,實現個人和家庭的健康管理。據統計,我國65歲以上的老年人住院比例為青年人的2倍,且老年人人均患有2~3種慢性疾病。因此,完善家庭醫療不僅可以利用醫學數據實現醫養結合,還有利于發現家族病史,幫助家庭成員盡早預防或得到醫療救治。
2.2.2 實現資源整合,完善平臺架構 大數據時代,醫學數據的平臺架構從整體上來看主要包含以下幾個部分:①業務架構:具體指醫院數據中心支撐的所有應用系統部署和相互間的關系。②CDR架構:具體指數據倉庫在運行時的關鍵功能及服務流程,包括應用系統模塊的數據構成、相互關系及存儲方式,及數據標準和管控手段等。③物理架構:具體指網絡、服務器、存儲設施等為應用系統提供硬件支持的基礎架構平臺。④安全架構:具體指覆蓋醫院數據中心,涵蓋運維、應用、基礎設施等各方面安全性的所有服務、技術工具的總和。⑤運維架構:具體指用于管理架構和開發架構,面向信息工作者,為醫院信息系統搭建統一平臺提供管理維護工具的系統[4]。
目前,較為常用的醫院管理平臺有:醫院信息系統,包括行政管理、醫療管理、決策支持及各類輔助系統;電子健康記錄系統,包括個人健康記錄系統、電子醫療記錄系統及患者電子記錄系統;以及醫學文獻檢索系統、數字圖書館系統等獨立的醫學數據庫系統。當然,平臺構架也離不開人才支持。因此,在大數據時代,醫療機構需重視數據挖掘技術人才的培養,鼓勵技術人員學習大數據知識,為新技術環境的到來提供應對措施,充分利用數據資源為智慧醫療的創建提供保障。此外,宏觀層面應加強醫療衛生領域信息化發展標準化、規范化工作的指導,使醫療衛生網絡早日實現互聯互通。只有衛生系統成功構建了標準統一的醫學數據管理大平臺,才能真正實現醫療資源的整合與共享。
2.2.3 發揮醫學數據價值,推動治療優化及研發工作 傳統的臨床研究以病歷報告為工具進行書面數據獲取(PDC),大數據時代,電子化的數據獲取(EDC)將成為臨床研究數據獲取的主流方式。EDC直接將臨床數據錄入系統,有利于提高工作效率,保證數據實時、高效;系統自帶邏輯檢查功能,避免因數據錯誤造成不可挽回的損失;系統檢查發現疑問后會直接輸出或標記相關數據項,可直接修改并標注原因;系統在臨床研究過程中即可獲取全面精準的醫學數據,并在安全監測后得出引導性結論,為臨床醫生或統計專家提供決策支持。此外,采用電子數據獲取后,數據將分散于藥物臨床試驗機構,數據管理者可以更專注于管理的設計、教育培訓及數據質量的維護等。EDC在國際上已成功推行,雖然我國目前僅有少數臨床研究機構嘗試,但是完善電子數據的采集、交換、傳遞標準,完善法律保障并營造良好的工作環境,是大數據時代臨床研究及科研、藥品研發的必要途徑。
目前,借助互聯網技術諸多醫院已實現患者實名制管理,并提供在線掛號預約、問診及繳費服務,還實現了電子處方交易及處方藥品自動監管配送服務,工作效率日益提高,醫療服務品質日益加強。
在大數據背景下,醫學研究應加強與信息技術的融合。引入云計算技術,數據傳輸、分析及共享技術,異構源數據整合及互操作等技術支撐,在確保數據安全并保障患者隱私的基礎上,通過結構化手段提高醫學數據的質量,追求基礎數據、診療數據、研發數據的無縫對接,開發標準統一的數據存儲平臺,拓展醫學數據的關聯并深度分析、挖掘,推動數據資源發揮醫療價值最大化。此外,一旦權威機構明確了安全標準并進行有效監管,高質量的醫學數據可以脫離醫院而存在,通過互聯網為人們提供更加便捷高效且有安全保障的實時醫療服務,實現大數據時代的信息惠民。
[1]王靜,辛玉明,高鴻雁.檔案數據挖掘中數據采集與準備問題淺析[J].現代情報,2012(6):72-74.
[2]徐所鳳,喬雅莉,楊斌,等.大數據時代下的智慧醫療建設探討[J].醫學信息,2015(15):1.
[3]Ginsburg GS,Willard HF.Genomic and personalized medicine:foundations and applications[J].Transl Res,2009(6):1-10.
[4]楊志玲,韓榮華,王超.基于大數據的醫院數據中心建設思考[J].中國數字醫學,2015(4):77-80.
Data Management Research in the Big Data Era
LI Wen
The Second Affiliated Hospital of Suzhou University,Suzhou,Jiangsu Province,215004 China
s]In the context of the big data,the value of medical data management in China has been excavated,and the new directions of medical data management have been discussed.Through consulting a large number of literatures,in combination with the writer’s own work practice,combing the current situation of domestic medical data management,the problems were summarized,and some targeted strategies were put forward.Supporting by the data acquisition and data mining,the potential value of medical data should be given full play,management measures of“ensuring the safety of information,improving the platform architecture,optimizing treatment,research and development”was put forward,the problems in the management of medical data were solved.In the age of big data,medical data management is helpful to promote hospital management and improve the quality of medical service.
Big data;Medical data;Management research
R19
A
1672-5654(2017)08(b)-0048-03
2017-05-15)
10.16659/j.cnki.1672-5654.2017.23.048
李雯(1989-),女,江蘇常州人,碩士,助理館員,研究方向:文檔管理與信息開放。