賀曉松 胡川麗
1.重慶工程學院大數(shù)據(jù)與人工智能研究所;2.陸軍軍醫(yī)大學第二附屬醫(yī)院
隨著經(jīng)濟的迅速發(fā)展和信息技術的變革,大數(shù)據(jù)正在改變?nèi)蚪^大部分行業(yè),醫(yī)療領域也不例外。本文概述了大數(shù)據(jù)概念、特征和醫(yī)療大數(shù)據(jù)的發(fā)展,總結(jié)了大數(shù)據(jù)在醫(yī)療領域的應用現(xiàn)狀,并對大數(shù)據(jù)應用于醫(yī)療領域的挑戰(zhàn)和展望作了深入探討,旨在為我國醫(yī)療大數(shù)據(jù)的發(fā)展提供參考和借鑒。
隨著信息化進程的不斷加快,醫(yī)療健康領域逐漸進入大數(shù)據(jù)時代。大規(guī)模、多渠道、多樣的數(shù)據(jù)可為醫(yī)療護理實踐提供新的方法和思路,在提高醫(yī)療實踐水平、醫(yī)療數(shù)字化管理、臨床決策支持和養(yǎng)老服務等多個領域具有應用價值。然而,目前由于區(qū)域經(jīng)濟發(fā)展不平衡等原因?qū)е碌尼t(yī)療資源分布不均,通過更加有效地利用醫(yī)療大數(shù)據(jù),推進跨區(qū)域、跨機構(gòu)、跨部門的健康醫(yī)療數(shù)據(jù)共享,充分發(fā)揮數(shù)據(jù)資源潛力、激活數(shù)據(jù)資源價值成為新的關注點[1]。另外,醫(yī)療大數(shù)據(jù)也面臨著醫(yī)療信息數(shù)據(jù)安全和隱私保護不當、數(shù)據(jù)質(zhì)量參差不齊的挑戰(zhàn),本文將深入探討這些問題。
大數(shù)據(jù)(Big Data)是指使用傳統(tǒng)軟件或基于互聯(lián)網(wǎng)的平臺無法管理的大量數(shù)據(jù),它超越了傳統(tǒng)使用量的存儲、處理和分析能力[2]。國際數(shù)據(jù)中心(International Data Center,IDC)將大數(shù)據(jù)歸結(jié)為“4V”特點的數(shù)據(jù)資料[3]:容量(Volume)、多樣性(Variety)、速度(Velocity)、準確性(Veracity)和價值(Value)。醫(yī)療大數(shù)據(jù)保留了大數(shù)據(jù)的特點外,額外兼具有鮮明的醫(yī)療行業(yè)特征,即時效性、冗余性、不完整性、隱私性的特點[4]。
醫(yī)療大數(shù)據(jù)是人類與醫(yī)療及生命健康相關的活動過程產(chǎn)生的與健康醫(yī)療相關的數(shù)據(jù)集合。早期,醫(yī)療相關的大部分數(shù)據(jù)都以紙質(zhì)印刷形式而非電子信息化方式存儲,但隨著強大的數(shù)據(jù)存儲,計算平臺,及移動互聯(lián)網(wǎng)的發(fā)展,醫(yī)療數(shù)據(jù)也向數(shù)字化方向快速發(fā)展。
我國醫(yī)療大數(shù)據(jù)伴隨著國家政策的推動也迎來了快速發(fā)展的階段,2015 年8 月國務院發(fā)布了《促進大數(shù)據(jù)發(fā)展行動綱要》,指出鼓勵和規(guī)范有關企事業(yè)單位開展醫(yī)療健康大數(shù)據(jù)創(chuàng)新應用研究,構(gòu)建綜合健康服務應用[5]。2016 年6月,國務院辦公廳印發(fā)了《關于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應用發(fā)展的指導意見》,指出要大力推進不同醫(yī)療系統(tǒng)數(shù)據(jù)的融合和共享,促進醫(yī)療大數(shù)據(jù)安全規(guī)范和創(chuàng)新應用[6]。2016 年8 月國務院印發(fā)《“健康中國2030”規(guī)劃綱要》,提出將大數(shù)據(jù)醫(yī)療及其產(chǎn)業(yè)經(jīng)濟發(fā)展成“十三五”時期醫(yī)療體系及醫(yī)療服務最高戰(zhàn)略[7]。2018 年國家衛(wèi)健委發(fā)布《國家健康醫(yī)療大數(shù)據(jù)標準、安全和服務管理辦法(試行)》,就加強標準管理、安全管理、服務管理,為醫(yī)療大數(shù)據(jù)的實施提供了政策指導。
醫(yī)療大數(shù)據(jù)主要來源分為如下4類[8]:(1)醫(yī)療機構(gòu)的患者就醫(yī)數(shù)據(jù)和運營系統(tǒng)數(shù)據(jù),如病種治療和成本數(shù)據(jù)、醫(yī)藥、耗材、采購管理數(shù)據(jù)等,醫(yī)院信息系統(tǒng)(HIS)、電子病歷系統(tǒng)(EMRS)、醫(yī)學影像存檔與通信系統(tǒng)(PACS)等;(2)臨床醫(yī)療研究和實驗數(shù)據(jù),主要是實驗中產(chǎn)生的數(shù)據(jù),也包含患者產(chǎn)生的數(shù)據(jù),沒有嚴格的邊界區(qū)分;(3)制藥企業(yè)研發(fā)數(shù)據(jù),藥物研發(fā)是一個復雜漫長的過程,臨床試驗是驗證一個藥物有效性和安全性的最佳方式,大量臨床試驗過程產(chǎn)生的數(shù)據(jù);(4)可穿戴設備產(chǎn)生的數(shù)據(jù),隨著移動互聯(lián)網(wǎng)技術的發(fā)展和穿戴設備核心硬件技術的成熟,各種健康設備通過云端上傳方式收集用戶生命體征數(shù)據(jù),如血壓、體溫、心電、脈搏等。
醫(yī)療大數(shù)據(jù)的研究和應用有如下幾方面的現(xiàn)實意義[9]:(1)提高診斷準確性。醫(yī)生利用醫(yī)院共享的大數(shù)據(jù)系統(tǒng),能夠分析醫(yī)院積累的大量臨床數(shù)據(jù),結(jié)合目標患者信息,能夠及時、有效地為患者選擇治療方案;(2)減少醫(yī)患矛盾。通過建立移動護理信息系統(tǒng),實現(xiàn)病人護理文檔的電子化,將醫(yī)生、護士、其他醫(yī)務人員工作閉環(huán)執(zhí)行,使患者得到有效治療;(3)節(jié)約醫(yī)療資源。通過云計算技術,將信息資源集成和共享,降低成本的同時提高效率;(4)個性化醫(yī)療。通過大數(shù)據(jù)挖掘技術,對個體差異性特征在普遍特征數(shù)據(jù)分析的基礎上進行優(yōu)化分析,進而輔助以醫(yī)療服務子單元,滿足個性化醫(yī)療服務要求。
在醫(yī)療健康大數(shù)據(jù)越來越多樣化的背景下,大數(shù)據(jù)技術也逐步從前沿技術轉(zhuǎn)變?yōu)楝F(xiàn)實應用。無論是生產(chǎn)生活還是醫(yī)療健康行業(yè),大數(shù)據(jù)的應用場景也越來越豐富。
醫(yī)療信息化即醫(yī)療服務的數(shù)字化、網(wǎng)絡化、信息化[10]。早期的醫(yī)療記錄的常見做法是以手寫筆記或打印報告的形式,隨著計算機系統(tǒng)的出現(xiàn)及其潛力,醫(yī)療保健系統(tǒng)中所有臨床檢查和病歷的數(shù)字化已成為當今的標準和廣泛采用的做法。由Murphy、Hanken、Waters 定義的電子健康記錄(Electronic Health Records,EHR)是用于患者過去、現(xiàn)在或未來的身體/心理健康或狀況有關的任何信息的計算機化醫(yī)療記錄系統(tǒng),方便醫(yī)療人員訪問患者的醫(yī)學診斷、處方、與已知過敏相關的數(shù)據(jù),提高醫(yī)療識別和治療效率[11]。與之類似,電子病歷(EMR)、個人健康記錄(PHR)、醫(yī)療實踐管理軟件(MPM)和許多其他醫(yī)療數(shù)據(jù)系統(tǒng)共同為提高醫(yī)療質(zhì)量、服務效率和降低成本以及減少醫(yī)療錯誤提供有力保障。
在傳統(tǒng)的醫(yī)療診斷主要依靠醫(yī)生個人經(jīng)驗和目標患者的信息,局限性很大,由于患者的個體差異,同樣診斷治理方式應用在不同患者身上的效果也可能不同。為此,可借助大數(shù)據(jù)建立一個智能診斷系統(tǒng),如果將所有患者的就診信息整合,運用數(shù)據(jù)挖掘技術分析患者信息,提高診斷準確率[4]。另外,可利用自然語言處理技術對電子病歷文本進行分析,圖像智能識別技術對醫(yī)學影響建模,實現(xiàn)智能診斷。這能促進診斷更加科學化、合理化,提高診斷準確率,有效降低誤診率。
在醫(yī)療科研領域,包括治療方案的療效判斷、新藥研發(fā)、器械研制、疾病危險因素分析等各類臨床科研[4]。運用大數(shù)據(jù)技術對各種數(shù)據(jù)進行篩選、分析,可以為科研工作提供強有力的數(shù)據(jù)分析支持。如:(1)探索疾病關聯(lián)關系。將離散數(shù)據(jù)進行整合與規(guī)范化,對大量、關聯(lián)性的疾病數(shù)據(jù)進行分析整理,構(gòu)建醫(yī)療知識圖譜,可以探索疾病的關聯(lián)關系;(2)進行臨床預測。通過數(shù)據(jù)挖掘技術對各類疾病的癥狀,監(jiān)控疾病治療效果數(shù)據(jù)進行建模,預測處于早期癥狀的疾病的發(fā)展趨勢[12]。
大型醫(yī)院已經(jīng)基本實施了信息化建設,但相應的數(shù)據(jù)資源仍然分散在不同的數(shù)據(jù)池中,互不相連,形成信息孤島,導致醫(yī)院之間無法共享護理數(shù)據(jù),全社會衛(wèi)生系統(tǒng)的相關數(shù)據(jù)無法共享和有效整合,進而影響醫(yī)療資源數(shù)據(jù)池的形成。
掣肘健康醫(yī)療數(shù)據(jù)共享的關鍵問題主要體現(xiàn)在管理機制和技術標準兩個方面,因此亟需解決以下2 個問題:(1)由于我國經(jīng)濟發(fā)展的地區(qū)性差異,不同地區(qū)和級別的醫(yī)療機構(gòu)自成體系、自建標準,不同類型醫(yī)療機構(gòu)間缺乏充分的跨業(yè)務數(shù)據(jù)共享,因此應該健全協(xié)作機制,調(diào)整利益沖突并通過管理手段達成共識;(2)醫(yī)療大數(shù)據(jù)本身多源異構(gòu)性的特點,存在大量結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),信息標準并不統(tǒng)一,按照標準規(guī)范建立起跨機構(gòu)甚至跨區(qū)域的數(shù)據(jù)共享平臺及數(shù)據(jù)交換機制[12]。
大數(shù)據(jù)在促進數(shù)據(jù)傳輸和共享的同時,也帶來了新的挑戰(zhàn),數(shù)據(jù)隱私保護就是其中之一[12]。我國對于醫(yī)療領域隱私保護的立法及政策法規(guī)的制定處于起步和發(fā)展中,盡管已有相關法律法規(guī)對保護患者隱私提出了相應的要求和規(guī)定,但是大部分規(guī)定缺乏可操作性,僅規(guī)定了對患者的保密醫(yī)務,而沒有規(guī)定違反該義務的后果,不利于具體司法實踐操作,而且大多數(shù)條款對患者信息權(quán)利的具體內(nèi)容、權(quán)利保護的方式等都沒有規(guī)定。大數(shù)據(jù)時代,要搞數(shù)據(jù)共享,這在很大程度上受到嚴格的數(shù)據(jù)保護的限制;只有保障大數(shù)據(jù)的共享和保護,才能最大限度地發(fā)揮醫(yī)療大數(shù)據(jù)的潛在價值。
為了能夠最大程度上保護公民的隱私安全,需要加強對數(shù)據(jù)的保護工作。首先在法律的內(nèi)容上,應盡快制定相關政策法規(guī);除完善相關配套法規(guī)標準外,也要在執(zhí)法和司法過程中強化保護患者隱私與個人信息,嚴格要求數(shù)據(jù)安全保障義務與責任,堅持知情同意原則,數(shù)據(jù)的收集、存儲、使用、分析等行為應獲得數(shù)據(jù)主體的知情同意,原則上應獲得明示同意;其次在治理手段上,在強化隱私保護技術對個人隱私保護效果支撐作用的同時,致力提升數(shù)據(jù)加工者合法合規(guī)使用數(shù)據(jù)的自覺意識,形成注重數(shù)據(jù)倫理安全的良性氛圍,倡導公民形成正確的個人隱私觀。
醫(yī)療數(shù)據(jù)在大部分應用場景中,對數(shù)據(jù)的質(zhì)量都有比較高的要求。醫(yī)療數(shù)據(jù)質(zhì)量風險可能導致一系列問題:(1)即時接受診療的患者因為醫(yī)生收到了錯誤的基本疾病信息受到不合理的治療甚至承擔安全風險;(2)醫(yī)療科研有可能因為出現(xiàn)的錯誤數(shù)據(jù)而得到錯誤的結(jié)論,輕者會導致整個科研過程失敗,耗費人力財力,重者可能會錯誤引導醫(yī)學理論發(fā)展方向,影響整體醫(yī)學發(fā)展進程。
為了提高醫(yī)療數(shù)據(jù)的準確性、真實性、適用性,須建立一套標準化數(shù)據(jù)治理模式,各級醫(yī)療機構(gòu)在開展醫(yī)療數(shù)據(jù)采集、存儲、整合、分析等工作的時候,以相同或相近的標準,確保內(nèi)容準確、術語規(guī)范、信息數(shù)據(jù)接口一致等[13]。此外人工智能技術也正在應用于醫(yī)療數(shù)據(jù)的提取和識別過程中,通過自然語言處理、人工智能、OCR 等技術直接識別電子病歷系統(tǒng)并完成有效數(shù)據(jù)的提取,這一過程的實現(xiàn)將有效減少醫(yī)療數(shù)據(jù)提取過程的人力耗費且有可能通過機器學習提高數(shù)據(jù)的準確性。這些醫(yī)療數(shù)據(jù)提取的自動化策略必然是醫(yī)療數(shù)據(jù)提取的重要未來方案,對于解決當下的醫(yī)療數(shù)據(jù)準確性安全性風險意義重大。
引用
[1] 石晶金,于廣軍.健康醫(yī)療大數(shù)據(jù)共享關鍵問題及對策[J].中國衛(wèi)生資源,2021,24(3): 223-227+237.
[2] 侯黎莉.護理信息化的發(fā)展及臨床應用[J].上海護理,2022,22(5):72-75.
[3] 大數(shù)據(jù)戰(zhàn)略重點實驗室.大數(shù)據(jù)概念與發(fā)展[J].中國科技術語,2017,19(4):43-50.
[4] 戴明鋒,孟群.醫(yī)療健康大數(shù)據(jù)挖掘和分析面臨的機遇與挑戰(zhàn)[J].中國衛(wèi)生信息管理雜志,2017,14(2):126-130.
[5] 中華人民共和國國務院.促進大數(shù)據(jù)發(fā)展行動綱要[J].成組技術與生產(chǎn)現(xiàn)代化,2015(3):51-58.
[6] 國務院辦公廳.國務院辦公廳關于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應用發(fā)展的指導意見[EB/OL].(2016-01-21)[2021-02-20].http://www.gov.cn/gongbao/content/2016/content_5088769.htm.
[7] 中共中央國務院印發(fā)《“健康中國2030”規(guī)劃綱要》[EB/OL].(2016-10-25)[2018-03-22].http://www.gov.cn/zhengce/2016-10/ 25/content_5124174.htm.
[8] 楊朝暉,王心,徐香蘭.醫(yī)療健康大數(shù)據(jù)分類及問題探討[J].衛(wèi)生經(jīng)濟研究,2019,36(3):29-31.
[9] 李宜瑾,崔豫然.醫(yī)療大數(shù)據(jù)研究面臨的機遇與發(fā)展趨勢[J].信息與電腦(理論版),2019,31(19):29-31.
[10] 汪萌.醫(yī)療信息化助力醫(yī)院發(fā)展[D].南京:南京郵電大學,2017.
[11] Miriam Reisman.EHRs:The Challenge of Making Electronic Data Usable and Interoperable[J].Pharmacy and Therapeutics,2017,42(9):572-575.
[12] 王海星,張靚,楊志清,等.醫(yī)療大數(shù)據(jù)在臨床科研中的應用探討[J].中國醫(yī)院,2020,24(7):63-64.
[13] 葉清,劉迅,周曉梅,等.健康醫(yī)療大數(shù)據(jù)應用存在的問題及對策探討[J].中國醫(yī)院管理,2022,42(1):83-85.