劉夢迪


摘要:現如今,我國醫學行業已經與現代化信息技術融合得越來越深入,而在互聯網等現代信息技術的推動下,與人們生命健康密切相關的醫療數據也逐漸呈現出爆炸式增長的特點。其中,醫療大數據不僅作為業界展開相關研究的重要基礎,同時更是人們對現有資源進行再分析和再利用的關鍵突破點。而醫療大數據平臺的建設與應用,往往可以更好地幫助工作人員完成過去僅靠傳統思維、技術方法等無法解決的工作,從而進一步從整體上提升我國醫療服務的質量。然而,由于目前的醫療數據大都呈現出多源異構、信息涉及隱私等特點,所以這也就大大增加了人們對數據的采集與應用難度,可見當前醫療大數據平臺的建設還存在一定的困境有待解決。
關鍵詞:醫療大數據平臺;建設困境;應對策略
中圖分類號:TP311? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)15-0019-03
一般情況下,醫療大數據的來源通常有四個方面,即制藥企業、臨床醫學的實驗數據、費用報銷以及社交網絡,而這些數據的應用領域極為廣泛,譬如可以用于研究、支付、個性化治療、疾病分析等多個方面。對此,為了更好地為大眾提供優質醫療服務,社會各業界紛紛為人們提供了大量的數據資源和相關技術,所以,這也就為醫療大數據平臺的建設帶來了機遇。當然,既然存在發展的機遇,那么必然也會存在一定的挑戰需要解決,因此,本文簡要闡述了當前建設醫療大數據平臺所面臨的困境及其應對策略,旨在進一步完善我國的醫療服務體系。
1 當前醫療大數據平臺建設的發展機遇
1.1 國家醫療政策體系的不斷完善
自2015年9月份以來,我國相關部門專門頒發了一系列關于醫療大數據發展的政策和文件,譬如《促進大數據發展行動綱要》《關于促進和規范健康醫療大數據應用發展的指導意見》等。這些政策的提出不僅深入分析了當前醫療大數據的發展形勢及其意義,同時還進一步完善了醫療大數據平臺的統籌與規劃體系,從而極大地促進了健康醫療大數據的全面深化與改革。另外,從醫療大數據產業目前的發展情況來看,可以說人們所提出的一系列行業性、專業性的政策為其今后的穩定長遠發展提供了便利,并且還在福建、江蘇等多個地區建設了醫療大數據試驗區來響應國家所提出的醫療政策[1]。
1.2 現代化技術的不斷發展
一方面,自從進入大數據技術時代以來,大數據技術架構體系得到了進一步完善,尤其是大規模的服務器、基礎軟件等產品的不斷涌現,大大加快了當前信息化時代的發展步伐。近些年來,以Spark和Flink為代表的新型計算引擎已經逐漸取代了MapReduce框架,并且還涌現出了很多其他種類的數據技術結構框架,譬如Greenplum框架、Impala、SparkSQL等一系列結構化數據處理技術,旨在更好地滿足數據處理的需求,最終真正將數據問題解決好[2]。當然,除了結構化數據處理技術以外,社會中還興起了很多非結構化的數據處理技術,如語音識別、圖像識別等智能技術,從而大大提升了醫療大數據的深度整合。另一方面,二代測序技術的推出和應用大大降低了醫療基因測序的成本,也正是因為技術的進步和成本的降低,使得我國醫療行業與數據技術的融合發展成為必然趨勢,從而讓醫療研究真正步入大數據信息化時代。
1.3 數據資源的優勢不斷凸顯
作為世界第一人口大國,我國不僅有著豐富的醫學研究資源,同時還擁有大量的疾病數據資源,畢竟目前社會人口老齡化的問題越來越明顯,再加上居住環境、經濟發展以及生活方式等的變化,最終必然會讓人類的死亡率和各類疾病發病數逐漸呈現出不斷增長的趨勢。因此,從這一角度來看,龐大的診療人群和各種病學特征都可以作為極為可靠的醫學科研數據資源。
2 醫療大數據平臺建設所面臨的困境
2.1 數據標準化
到目前為止,雖然我國已經累計制定并發布了多項衛生信息標準,但是對衛生信息標準的制定起點相對較低,起步也比較晚,而且也缺乏具有強制性和有效性特點的執行措施,所以往往會在制定與執行的過程中存在各種問題[3]。譬如,由于每個醫藥廠商的信息系統并不是十分規范,而且各個醫療單位的數據采集與整合質量也是各不相同的,所以導致各種醫療數據難以真正實現完全互通和共享。中國醫院協會信息專業委員會通過對醫院信息化管理的現狀進行調查和分析,了解到大部分的信息化產品與數據采集起來比較困難,只有極少數的醫療單位對數據互通的標準化程度相對成熟一些。由于各醫療單位所使用信息化產品的廠家數量非常多,管理結構也各有不同,所以這也是導致醫療數據不規范、不準確、不互通等問題出現的重要原因,仍需要建設有一定標準的數據管理平臺。
2.2 數據挖掘的現狀及其挑戰
深入分析目前的醫療大數據,可以發現絕大多數數據都是非結構化的自由錄入,其中就包括病人的出入院記錄、病情診斷報告、手術記錄等信息,所以這些數據信息通常有著極高的參考和研究價值[4]。然而,這種非結構化的數據信息錄入方式往往會呈現出多模態、多源等特點,再加上原始信息的不完整、漢字也存有歧義性,所以這也就大大增加了數據信息提取和技術融合的難度,同時也更不利于工作人員對有價值信息的篩選與整合。雖然近些年來BERT、XLNET、ERNIE等工具已經在處理醫學領域自然語言方面取得了一定成績,但是仍然不能很好地對醫療行業的常識問題進行處理和推理。即便人工智能在我國醫學研究領域的應用越來越廣泛,但是由于標注數據比較稀缺,標注的過程也非常復雜并且周期較長,再加上復雜的醫療概念和隱私性較強的數據信息大大增加了數據標注的成本和難度,所以人工智能技術的發展并不是很順利。除此之外,從目前國內相關專業人士對醫學術語標準化的建設情況來看,雖然已經取得了初步的研究成果,但是由于起步較晚,數據信息和醫學知識的來源渠道也非常廣泛,所以這就導致有很多臨床證據、醫學文獻等資料中的內容經常會出現不一致的問題,從而致使醫療領域出現越來越多新的醫療概念、產品和治療方式。這樣一來,怎樣更好地對醫學產品、概念、治療方式等內容的標準進行統一就顯得尤為重要,只有不斷更新和完善醫療專業知識的準確性與時效性才能靈活應對今后醫療領域存在的挑戰。328914AB-F61E-4124-8E19-47EC583A36D2
2.3 醫療大數據的共享與應用
從一定角度來看,數據信息往往有著自身的歸屬權、使用權和隱私權,但是由于目前的數據開放和共享機制還不夠完善,所以并不能明確人們所需要承擔的法律后果,由此可見,不同行業和部門在公開、流動和交易這些醫療大數據時,就必須要進一步制定出一套相對完善的國家政策和創新機制以作保障[5]。然而,目前我國醫療大數據的外部應用環境和技術平臺還是比較脆弱的,所以往往在面對如此龐大的數據信息時,就極容易出現醫療大數據泄露的問題。因此,為了避免醫療大數據泄露事件的出現,怎樣有效保證醫療大數據平臺建設和應用的安全性與平衡性,值得每位工作和研究人員引起關注。
3 解決醫療大數據平臺建設困境的應對策略
3.1 醫療大數據平臺的建設與規劃
1)建設以各類疾病為中心的醫療大數據平臺
疾病的種類有很多,而且還有的疾病有著較高的發病率和死亡率,比如惡性腫瘤等,而這些疾病將會給人類的身體健康造成極為嚴重的生命威脅。就以惡性腫瘤臨床醫療大數據平臺建設為例,我國目前尚未建立比較完善的以該疾病為基礎的研究平臺,再加上關于腫瘤發病與治療的各種數據還不夠精準,并且在腫瘤防治、醫學研究、治療評價等方面有著一定的盲目性,所以就必須要建立起更完善的以各類疾病為中心的醫療大數據平臺,并加強平臺的管理與應用,從而為疾病的預防與治療提供標準和依據。另外,國家也要制定并發布相關的政策體系,為醫療大數據平臺的建設與應用提供政策支持,從而讓各類疾病的防治更規范、更科學,最終真正實現醫療與數字技術的深度融合。
2)平臺的建設原則
在醫療大數據平臺的建設過程中,必須始終堅持“1234”的基本原則,即:1個中心轉變、2個維度,3個互聯互通,4個環節。其中,1個中心轉變其實就是指各類疾病今后的發展將從治療逐漸轉變為預防,致力于早診斷、早治療、早康復,而這將直接影響著我國醫療數據信息的采集、分析與整理工作[6]。2個維度則主要指醫療服務對象的廣泛性,包括藥企、醫療公司等;現代技術的多元化,包括大數據、云計算等技術。3個互聯互通主要表現為醫療大數據平臺與各大醫療機構的數據、區域健康衛生信息平臺、醫療技術研究領域這三個方面實現互聯互通(如圖1)。4個環節則主要包括醫療大數據的采集、治理、賦能和聯動環節,從而通過嚴格把控各環節的數據信息來達到提升疾病預防和治療水平的目的。
3.2 各類疾病醫療大數據平臺相關技術領域的深入研究
1)數據的處理
一般情況下,醫療大數據的處理往往會涉及技術規范、治療流程、實踐戰略等多個方面的內容,其中,技術規范及其標準才是重要的核心關鍵,因此,在研究各類疾病醫療大數據的過程中,必須要對數據的處理引起高度重視。
2)數據的采集要規范且標準
在構建跨地域的醫院大數據采集平臺標準時,對元數據的檢索與數據管理就特別重要,因此有關技術人員一定要注意這些元數據的可讀性與一致性,從而更好地解決各大醫院數據的相關性問題。而在管理元數據時,就必須根據醫院項目的目標、數據特征等去構建一個最小的元數據集合,并在這一基礎上去展開元數據的建設與管理工作,盡可能保證醫療數據庫的規范性和科學性。而由于建立元數據管理主索引的工作相對比較復雜,經常會涉及患者個人信息、醫保卡號、治療日期等的關聯信息的匹配,所以這就需要不同的廠商和業務系統在數據交換時都必須進行專家論證和技術攻關,以保證數據信息的有效讀取。
3)數據的處理與轉化
由于目前我國的醫療大數據仍存在很多質量方面的問題,嚴重阻礙著這些數據資源的有效轉化,難以發揮出其自身的醫療價值,所以還需要相關研究人員和專業人士探索出更合適的數據處理與轉化技術,以便促進各大數據分析更加結構化和規范。而數據的管理與轉換通常都是一個循序漸進的過程,“數據—信息—知識”都可以互為因果來推動醫學的應用實踐,最后可以建立封閉式的醫學信息處理和認知轉換模式(如圖2)。
4)數據的安全采集與應用
安全作為醫療大數據平臺建設與發展的重要基礎,需要對一些敏感性的醫療數據實施分級分類管理,旨在進一步完善數據安全管理與應用體系。而在技術層面,需要從三個方面來保證數據的安全采集與應用:一是通過借助虛擬專網、強制訪問等控制技術來確保數據的安全存儲;二是借助可信網絡通訊、可信設備等來構建安全防御框架;三是認真學習關于數據安全與隱私等相關新型技術的應用方法,從而真正實現數據的安全互通。
3.3 醫療大數據平臺的建設實踐
1)數據處理
通過結合理論和臨床數據庫,醫療大數據平臺在進行數據信息處理時一般都是以CDM(Common DataModel)為基礎來創建數據庫的,通常會經歷數據的錄入、關聯、轉化、質控等一系列的處理流程[7]。在數據分析這一環節的過程中,醫療人員通常都會結合患者的電子病歷等信息,利用非結構化的數據運用模板來分析所采數據信息的文本格式;在數據清洗這一環節中,通常會涉及BERT、LSTM、SRF等技術的融合應用,以便更好地標識并合并患者的診療信息;在數據質控環節中,需要以專業規范的醫學術語和數字技術為標準,從而真正實現各項醫療數據的自動映射和歸一[8]。
2)數據平臺的實際應用
隨著互聯網技術的不斷完善和數據資源的不斷增加,醫療大數據的建設與應用也逐漸進入了一個更加深入的重要階段,各類疾病的標準化醫學術語也必然會越來越規范,同時對數據信息的處理技術也必然會更成熟[9]。因此,建設一個日趨規范且合理的醫療大數據平臺,必然會對今后我國醫療行業的創新發展提供更有力的數據信息支撐[10]。
4 結束語
總之,國家政府和醫療業界越來越注重醫療大數據平臺的建設和應用,旨在通過借助各種現代化信息技術,來更好地為我國醫療大數據平臺的建設與管理提供保障,最終達到逐步提升我國醫療水平的目的。經過上述分析,可以發現醫療大數據平臺的建設與應用過程中既存在機遇也存在挑戰,只有以國家政策為參考依據,將數據技術與醫療行業充分結合起來,才能更好地實現醫療行業智能化的有效轉型。
參考文獻:
[1] 吳燕秋,黎美秀,丁元杰,等.面向臨床科研的全院級醫療大數據平臺建設與數據治理實踐探索[J].中華醫學科研管理雜志,2021,34(2):81-86.
[2] 郭強,王叢,衡反修.醫療大數據平臺建設機遇、挑戰及其發展[J].醫學信息學雜志,2021,42(1):2-8.
[3] 姜瀚.健康醫療大數據產業分析與前景展望探討[J].產業創新研究,2020(18):21-22.
[4] 宋斐.區域醫療大數據建設存在的問題及對策[J].信息與電腦,2020(8):28-30.
[5] 王勝鋒,寧毅,李立明.健康醫療大數據互聯互通模式的經驗與挑戰[J].中華流行病學雜志,2020,41(3):303-309.
[6] 戴明鋒,孟群.醫療健康大數據挖掘和分析面臨的機遇與挑戰[J].中國衛生信息管理雜志,2017,14(2):126-130.
[7] 劉磊,鄭姍姍.大數據時代醫療信息安全現狀分析和發展對策[J].包頭醫學,2020,44(1):64-65.
[8] 侯巖.醫療大數據應用需求分析與平臺建設構想[J].中國新通信,2020,22(1):106.
[9] 汪鵬,吳昊,羅陽,等.醫療大數據應用需求分析與平臺建設構想[J].中國醫院管理,2015,35(6):40-42.
[10] 樂穎,劉南.醫療大數據平臺的建設路徑[J].電子技術與軟件工程,2018(3):198.
【通聯編輯:謝媛媛】328914AB-F61E-4124-8E19-47EC583A36D2