羅 旭 劉友江
(遵義醫學院 遵義 563000)
?
醫療大數據研究現狀及其臨床應用
羅 旭 劉友江
(遵義醫學院 遵義 563000)
介紹醫療大數據的內涵及其對醫學研究的影響,指出醫療領域大數據研究的必要性,總結現階段醫療大數據的研究現狀,提出醫療大數據研究中的若干問題。分析醫療大數據如何應用于臨床醫學,包括臨床診斷和臨床藥效分析等方面。
醫療大數據;研究現狀;臨床醫學
隨著信息時代的發展,產生了巨量數據。大量的數據來自于各個領域,反映了人們的生活習慣、社會規律、自然規律。數據成為與自然資源、人力資源同樣重要的戰略資源[1-2]。醫療行業每年會產生大量的醫療數據,一般的醫療機構每年會產生1TB~20TB的相關數據,個別大醫院的年數據量甚至達到了300TB~1PB。隨著大數據時代的到來,醫療與信息技術(IT)結合越來越緊密。開發這些大數據可以實現智慧醫療,即實現患者求醫便利化、疾病診斷自動化、醫療保健信息化。
2.1 概述
早在2008年,有研究[3-4]指出龐大的數據流即大數據是新的科學線索,需要新的方法來處理這些數據,而在《大數據時代》一書[4]中,明確指出大數據正在變革人們的生活、工作和思維。大數據時代最大的轉變就是放棄對因果關系的渴求,取而代之關注相關關系。只要知道“是什么”,而不需要知道“為什么”。 醫療領域是大數據應用的重要領域,Kayyali B等[5]從多方面闡述了大數據對美國醫療行業產生的影響,指出大數據對醫療行業的影響尚處于初步階段,許多潛在價值正在逐步被揭示。《大數據時代的個人健康革命》一書[6]指出大數據將對整個醫療系統包括管理與診斷手段都造成“創造性破壞”,進而對大數據醫療帶來的新景象進行展望。目前醫療領域內的大數據主要來自制藥企業,臨床診斷數據,患者就醫數據,健康管理、社交網絡數據。例如藥物研發是一個相對密集的過程,即使對于中小型企業而言,一項藥物研發的數據也在TB以上;醫療機構持有的數據增長速度非常快,即使是一張普通CT圖像,也含有大約150MB的數據,而一個標準的病理圖則接近5GB;患者就醫、健康監測的數據量更是每天在高速增長。
2.2 大數據對醫學研究的影響
大數據分析為許多醫學難題的解決提供了新途徑[7],改變了一些疾病診斷方式。例如通過分析大量的診斷數據便于對疾病進行快速識別,如圖1所示的心臟疾病分類,首先采集心臟數據并轉化為心臟圖譜,然后根據數據圖譜進行建模(關于僵硬度、壓力、張力),最后基于模型分析心臟疾病病型的過程。有些疾病的確診存在困難,通過基于大數據的數理統計方法輔助疾病確診,圖2示意了利用數理統計方法確診和分辨復雜的心臟疾病,即首先采集數據得到數據集,然后基于統計特征分辨疾病類型。基于大數據進行虛擬實體建模,可對疾病診治做出模擬分析,探討正確的疾病診斷方法,如在圖3中利用圖像處理技術,將心臟數據建模為一個虛擬實體,通過設置各種參數可以模擬觀測藥物或者手術對心臟運作造成的影響,為獲取疾病診治方法提供了手段。而且基于大量的流行病數據還可以進行統計研究,預測病情的擴散趨勢,為疾病防治提供參考。

圖1 心臟疾病分類

圖2 基于數據統計的心臟疾病診斷

圖3 虛擬心臟建模
2.3 醫療領域大數據研究的必要性
無論是流行病學調查、新藥物的研發,還是臨床實效研究,都貫穿著對數據的獲取、管理和分析。高效地利用研究數據將是決定現代醫藥學研究成敗的關鍵。當前優質醫療資源有限,患者往往爭奪優質資源。由于患者個體差異大,疾病種類繁多且復合疾病常見,診斷很難標準化和自動化,醫療過程缺乏病人的主動參與,再加上醫生工作強度大,醫療資源不足,存在許多誤診漏診現象[8-9],造成了許多醫患矛盾。在大數據醫療中,可以使患者主動參與醫療過程,結合患者的健康數據、既往病史,更有利于醫生做出正確的疾病診斷,并且由于醫院間互通數據,可避免患者在多個不同的醫院間進行重復診治而付出高額醫療成本,同時還節約了醫療資源。基于健康大數據的醫療服務提供了新的醫療模式,可減少醫患矛盾。因為有效的數據整合模式,大數據醫療滿足了以患者為中心的個性化醫療,提供了卓越的醫療技術平臺。醫療大數據的運用從醫學研究、臨床決策、疾病管理、患者參與以及醫療衛生決策等方面推動了醫療模式的轉變,尊重患者的價值觀、個體化特征和需求,協調和整合不同專業的醫療服務,保持醫療服務的連續性和可及性,提高醫療質量。
3.1 國內外研究現狀
3.1.1 實踐探索 醫保行業由于所涉及的數據規模較大,問題復雜,一直以來都是大數據公司關注的焦點。據報道:Predilytics公司運用大數據、機器學習技術來分析醫保領域透明、公正和業務驅動的結果,相對于傳統的統計/回歸模型,其提供的異常預測模型的分析深度要高出1~3倍;在流行病預測方面,谷歌公司開發了“谷歌流感趨勢”系統,該系統曾成功預測了甲型H1N1流感在美國境內的傳播,當然由于大數據研究目前處于起始階段,該系統還存在許多問題。自我國原衛生部出臺《全國衛生信息化發展規劃綱要》以來,“醫療大數據”成為我國醫療信息化的重要領域和重點發展方向,中南大學已與移動公司合作,負責開展“移動醫療”相關應用的原型系統設計開發,雙方合作利用現代通信、物聯網等技術,開展健康管理、醫患互動、院前急救、遠程醫療等服務,改變醫院看病的傳統方式。除此之外,還有許多小型企業從事健康數據采集、網上看病預約、網絡醫生等方面的應用開發。
3.1.2 理論探索 Lin C等[10]提出一種迅速處理、存儲、檢索、分析大型醫療數據的綜合方法。基于NoSQL技術給出一種病人驅使的數據結構以便于快速和靈活的數據擴展,克服不同醫院數據記錄模式差異帶來的問題。Don S 等[11]描述醫療網絡物理系統(MCPS)大數據處理框架的初始工作,該框架結合了衛生保健系統以及網絡方面的動態配置和完全彈性決策功能。Cowan B等[7]從疾病診斷、流行病預測方面中的多個問題入手,分析了從大數據角度解決這些問題的可行性。蔡佳慧等[12]對醫療大數據的基本概念進行了剖析,歸納總結了醫療大數據中面臨的數據整合、數據存儲、數據挖掘方面的挑戰。高漢松等[13]結合云計算提出一種基于Hadoop的醫療云數據挖掘平臺架構,詳細闡述其基礎層、平臺層、功能層以及業務層等各層功能。許德泉等[14]重點介紹了大數據在醫療個性化服務方面的應用并就應用過程中遇到的挑戰進行簡要分析。
3.2 應用領域
3.2.1 在線醫療 數據醫療的重要實現方式之一,患者通過在網上提供病癥數據獲得診斷信息。目前網上醫院,如39健康網,由在線醫生根據提供的病癥信息人工給予初步診斷。該醫療途徑僅能緩解醫療資源有限的問題。由于常常有非專業人員給出診斷答案以及缺乏詳盡的病理數據和診斷經驗,該方法目前有很大不足。
3.2.2 健康監測 結合智能穿戴設備以及移動APP實時獲取病人的健康信息,建立一個數據庫。對病人的健康做出預測和提醒性服務,例如提醒用戶及時服藥以及用戶可能會出現某一方面的健康問題,要求注意飲食和生活習慣。由于醫療物聯網由這些智能無線穿戴設備組成,每時每刻都會產生數據,與大數據密切相關。從目前的研究現狀來看,智能穿戴設備在當今以至將來,都是信息科技與醫療結合的主要攻關方向。
3.2.3 數據存儲、傳輸與共享 該方向的主要研究內容為如何存儲、檢索、傳輸大容量數據,以及搭建數據云平臺,實現醫院、社區、公共衛生相關部門的信息資源整合和共享。數據共享平臺的存在使得醫院間互通數據,節省了病患在多個醫院間進行診治的醫療成本。對存儲于平臺上的大量醫療數據進行分析,可用于流行病、慢性病調查、趨勢分析和預警,進而為制定防治、干預計劃提供有力的參考依據。
3.3 大數據研究中的一些問題
3.3.1 仍處于初級階段 由于醫療大數據是一項跨學科的研究,而跨學科進行研究存在一定的難度,并且由于醫療系統數據管制體系帶來的醫療數據難以獲取和信息孤島問題,使得醫療大數據研究難以在一般研究機構進行。因此目前醫療大數據研究尚處于初始階段。有關工作主要集中在工程應用部分,體現在數據采集、存儲和醫患互動方面。在理論研究方面,大多數工作現僅停留在評述醫療大數據是如何的大以及是如何的有用,針對醫療數據本身的挖掘計算、數據關系分析、數據調用等基礎支撐技術方面的實質性研究較少。
3.3.2 數據中的偶然性因素及真實性問題 大數據將對醫療診斷手段造成“創造性破壞”[6]的關鍵點在于數據挖掘,研究數據間的關系與揭示數據關系反映的科學規律,從而指導醫療自動化與智能化。目前醫療大數據研究尚處于初始階段,基于目前的研究現狀,本文認為在以后的醫療大數據的應用與研究中還需注意如下問題:首先,從數據的角度來說,醫療大數據尤其是醫療監控數據中囊括了太多的偶然事件、小概率事件,而這些信息對于醫學上的動態監測沒有什么參考意義,容易形成干擾。例如,探討某種藥物對某種疾病的療效,由于患者對療效的滿意度提高存在多種原因,有些僅僅是患者主觀感覺并無實質性好轉,有些是因為患者自身免疫力的提高,例如患者患病后有較好的作息習慣提高了機體免疫力使得病情有所好轉,如此數據便有很強的干擾性。然后,真實性是基于大數據的相關研究的基本要求,目前許多數據的真實性有待考察,如問卷調查數據、某些單位提供的行政檢查數據等。在數據獲取中難以保證100%獲取真實的數據,這就對正確得到數據映射的科學結果造成困難。
4.1 在臨床診斷中的應用
許多疾病的診斷都歸屬于“經驗性診斷”。 由于患者個體差異大,復合疾病常見,關系復雜,在診斷過程中醫生對某些病癥難以給出確切診斷,需要對相關疾病做出排查,甚至會出現誤診。利用大數據分析,統計大量的關于某項疾病的正確診斷案例,可以形成模擬“經驗”,對患者所患疾病進行自動化輔助診斷。在該問題中,關鍵在于得到可靠的數據判決經驗,其有效性與足量的樣本數量密切相關。實現該問題的一種可行的方法為:基于大量(PB級)的正確診斷的病例統計數據,記錄數據中的所有病型與癥狀,先挖掘疾病癥狀與病型之間的關系得到病型的“典型癥狀集”,后通過檢驗病人提供的癥狀與各病型“典型癥狀集”間的重合關系給出患者的確診信息。即通過大數據分析,利用數據反映的病型與癥狀之間的關系實現基于專家系統的自動診斷。
4.2 在藥物臨床藥效研究中的應用
目前,關于臨床藥效的研究大多局限于簡單的數學統計,例如祁鳳娥等[15]評價邁之靈治療進行性色素性紫癜性皮病的臨床療效,總計研究了96例患者,將邁之靈片與復方丹參片進行對比,得到的結論為邁之靈是進行性色素性紫癜性皮病治療的良好選擇。桂冬輝等[16]評價羅通定聯合曲唑酮治療阿片類物質依賴者稽延性戒斷癥狀的臨床療效及安全性,總計研究了120例患者,得到的結論為羅通定聯合曲唑酮是一種療效高,安全,耐受性好,無潛在藥物成癮性的治療稽延性戒斷癥狀的治療方案。黃永兵等[17]對九華痔瘡栓治療內痔的60個病例做簡單的統計分析,得到了九華痔瘡栓是否對內痔有效的局部性統計結論。這些研究并沒有挖掘病人的潛在信息,對于病人的抗藥性、即往病史、用藥量等信息未做分析,得到了僅停留于數據本身的信息,并且對比藥物選擇普遍較少。在基于大數據的藥效分析中避免少數藥物對比后僅能得到局部最優結果的問題,首先從數據庫中提取數據,建立針對某病型的結構化的用藥案例數據,包括藥物名稱、類型、患者病重程度、用藥后患者的關聯臨床檢驗數據、患者過往過敏史等,然后對于某病型,分析數據案例中包含的各類可行藥物,包括復合用藥對該病型的臨床效果,得到某病型的最佳用藥。相關藥效數據分析可以通過常用的概率統計方法實現。大數據藥效分析結合了計算機輔助計算,最終形成的數據訓練和經驗可以用來實現智能輔助給藥系統,為患者與醫生提供病癥用藥參考。在臨床藥效研究中,還可進一步挖掘臨床用藥的廣泛相關性與藥物的潛在特性,如某藥物對患者有哪些負面影響,藥物的適應人群是哪些等。
醫療大數據作為一種醫療資源,通過對其進行研究,不僅可以在以上兩個方面為臨床醫學提供解決問題的手段,隨著數據分析方法的不斷豐富,還可用于其它方面,例如可以僅針對某個病人,結合既往病史、抗藥性、身體狀況以及歷史健康數據量身設置疾病診治方案,而且數據分析可作為病人治療全過程的病情輔助分析工具,為獲取重癥病人的階段性診治方案提供參考。
本文闡述了什么是醫療大數據以及為什么要研究醫療大數據,對醫療大數據的國內外研究應用現狀進行了介紹和總結,指出了醫療大數據研究中的若干問題,最后對醫療大數據如何應用于臨床醫學進行了展望與分析。
1 鄔賀銓. 大數據價值堪比石油[EB/OL]. [2014-12-01]. http://www.cn-healthcare.com/conferences/hybd/2012-12-19/content_415555.html.
2 李國杰. 大數據研究的科學價值[J]. 中國計算機協會通訊, 2012, 8(9): 8-15.
3 Felice F, Rosalind R. Big data: distilling meaning from data[J].Nature, 2008, 455(7209): 30.
4 維克托·邁爾·舍恩伯格. 大數據時代[M]. 杭州: 浙江人民出版社, 2012: 1-5.
5 Kayyali B, Knott D and Kuiken S. The Big Data Revolution in US Health Care: accelerating value and innovation [EB/OL]. [2014-05-01]. http://www.mckinsey.com/insights/health_systems_and_services/the_big-data_revolution_in_us_health_care.
6 埃里克·托普·顛覆醫療:大數據時代的個人健康革命[M]. 北京:電子工業出版社, 2014: 1-5.
7 Cowan B. Big Data Medical Imaging[EB/OL]. [2015-01-03]. www.nihi.auckland.ac.nz/sites/nihi.auckland.ac.nz/files/pdf/informatics/bigdata/.
8 張超, 何勍, 阮狄克. 誤診為腰椎退行性疾病的腰腿痛癥候告群(附36例報) [J].臨床誤診誤治,2015, 11(4): 37-40.
9 孟慶義. 論急診誤診誤治問題[J].中國急救醫學, 2010, (9): 772-775.
10 Lin C, Huang L, Chou S, etal. Temporal Event Tracing on Big Healthcare Data Analytics[C]. Proceedings of 2014 IEEE International Congress on Big Data, 2014 : 281-287.
11 Don S, Min D. Medical Cyber Physical Systems and Bigdata Platforms[C]. The Fourth Workshop on Medical Cyber-Physical Systems, 2013.
12 蔡佳慧, 張濤, 宗文紅. 醫療大數據面臨的挑戰及思考[J]. 中國衛生信息管理雜志,2013, 10(4): 292-295.
13 高漢松, 肖凌, 許德瑋, 等. 基于云計算的醫療大數據挖掘平臺[J]. 醫學信息學雜志, 2013, 34(5): 7-12.
14 許德泉, 楊慧清. 大數據在醫療個性化服務中的應用[J]. 中國衛生信息管理雜志,2013, 10(4): 301-304.
15 祁鳳娥, 許力華, 謝明星, 等. 邁之靈片治療進行性色素性紫癜性皮病的療效[J]. 中國臨床藥理學雜志, 2012, 28(10): 788-789.
16 桂冬輝, 蔡丹丹, 黃燕燕,等. 羅通定聯合曲唑酮治療稽延性戒斷癥狀的臨床研究[J]. 中國臨床藥理學雜志, 2014, 30(4):309-311.
17 黃永兵, 蔡蘭蘭, 陳國文. 九華痔瘡栓治療內痔60例臨床觀察[J].中國實用醫藥, 2009, 11(4): 112-113.
Medical Big Data Research Situation and Its Clinical Application
LUOXu,LIUYou-Jiang,Zunyi
MedicalUniverstiy,Zunyi563000,China
The paper introduces the connotation of medical big data as well as the influences to medical research, points out the necessity of big data research in medical field, summarizes the current research status, points out some existing problems, analyzes how medical big data applying in clinical medicine, including clinical diagnosis and pharmacodynamic analysis.
Big medical data; Research status; Clinical medicine
2015-05-06
羅旭,博士,講師,發表論文7篇;劉友江,講師,發表論文3篇。
R-058
A 〔DOI〕10.3969/j.issn.1673-6036.2015.05.002