黃海燕
摘 要:隨著科技的不斷進步,人們處理數(shù)據(jù)的技術不斷增強,大數(shù)據(jù)的概念被越來越多的人所提及,并廣泛應用到各行各業(yè)。本文概述了大數(shù)據(jù)的基本含義,闡述大數(shù)據(jù)的基本特征,并對大數(shù)據(jù)在醫(yī)療行業(yè)的應用問題做了深入挖掘。
關鍵詞:大數(shù)據(jù);醫(yī)療;大數(shù)據(jù)挖掘
引言
隨著信息時代的不斷發(fā)展,海量的數(shù)據(jù)被產(chǎn)生出來。在人們的日常生活中,方方面面都可能產(chǎn)生數(shù)據(jù)。這些數(shù)據(jù)反應了社會規(guī)律和自然規(guī)律,被認為是一筆重要的戰(zhàn)略資源,與自然資源等可以相提并論。有統(tǒng)計顯示,一般的醫(yī)療機構每年會產(chǎn)生1TB到20TB的數(shù)據(jù),一些大醫(yī)院甚至可以產(chǎn)生300TB到1PB的數(shù)據(jù)。隨著技術的不斷進步,人們處理數(shù)據(jù)的能力和技術也不斷增強。從前,人們只能看著這些寶貴的數(shù)據(jù)白白丟失;現(xiàn)在,這些數(shù)據(jù)有望被運用到智慧醫(yī)療方面,即讓患者就醫(yī)更方便、疾病診斷更加高效,以及醫(yī)療信息更加準確。
一、大數(shù)據(jù)概述
(一)大數(shù)據(jù)的定義
隨著智能手機、平板電腦、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等各式各樣傳感器的涌現(xiàn),數(shù)據(jù)源呈現(xiàn)指數(shù)級增長,信息數(shù)量迅速擴大。從這些海量數(shù)據(jù)中提取有用信息并加以利用,已經(jīng)成為戰(zhàn)略性發(fā)展和要求。大數(shù)據(jù)可以通過在海量數(shù)據(jù)中提取的有用信息,挖掘新的認知,創(chuàng)造新的價值,從而改變市場關系和組織機構。
關于大數(shù)據(jù)的定義,目前學術界仍然沒有獲得統(tǒng)一共識。一般認為,大數(shù)據(jù)指的是巨量數(shù)據(jù)結合,是指無法在一定時間范圍內用常規(guī)軟件工具和軟件進行捕捉、管理和處理的數(shù)據(jù)集合,是需要更強的決策力、洞察發(fā)現(xiàn)能力才能加以挖掘和應用的數(shù)據(jù)。大數(shù)據(jù)不是單純的海量數(shù)據(jù),而是大量種類繁多、價值密度低、處理速度要求快和實效性要求高的數(shù)據(jù)的集合。目前,大數(shù)據(jù)在互聯(lián)網(wǎng)、金融、農(nóng)業(yè)等領域都有廣泛的應用。
(二)大數(shù)據(jù)的特征
通常,用4個V(即Volume, Variety, Value, Velocity)來概括。
一是體積巨大。截止到目前,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是300PB,大企業(yè)一年生產(chǎn)出的數(shù)據(jù)量大多處于TB量級。
二是數(shù)據(jù)種類繁多。對此,人們把這些數(shù)據(jù)分為結構化數(shù)據(jù)和非結構化數(shù)據(jù)。結構化數(shù)據(jù)多以文本為主,非結構化數(shù)據(jù)則包括音頻、視頻、地理位置信息等。這些數(shù)據(jù)為數(shù)據(jù)的挖掘處理能力提出了更高要求。
三是價值密度低。在大量不斷生產(chǎn)的數(shù)據(jù)流中,只有極少數(shù)的數(shù)據(jù)是有價值的,如何在海量數(shù)據(jù)中挖掘真正有用的數(shù)據(jù),進行數(shù)據(jù)“提純”成為大數(shù)據(jù)工作者研究的重點。
四是處理速度快。據(jù)統(tǒng)計,預計到2020年,全球數(shù)據(jù)使用量將達到35.2ZB。在如此海量的數(shù)據(jù)面前,各國政府及企業(yè)能否加快處理數(shù)據(jù)的效率,將成為成敗的關鍵。
(三)大數(shù)據(jù)的意義
大數(shù)據(jù)最重要的意義是預測。比如,商業(yè)公司對消費者日常的購買行為和使用商品習慣進行匯總和分析,了解到消費者的需求,從而改進已有商品并適時推出新的、消費者很可能會滿意的商品。知名互聯(lián)網(wǎng)公司谷歌對其用戶每天頻繁搜索的詞匯進行數(shù)據(jù)挖掘,從而進行相關的廣告推廣和商業(yè)研究。
由于大數(shù)據(jù)的處理迫在眉睫,近年來各國政府和全球學術界都掀起了一場大數(shù)據(jù)技術的革命,都在積極研究大數(shù)據(jù)的挖掘技術和分析手段。很多國家都把大數(shù)據(jù)技術研究上升到了國家戰(zhàn)略高度,提出了一系列的大數(shù)據(jù)技術研發(fā)計劃,從而推動政府機構、學術界、相關行業(yè)和各類企業(yè)對大數(shù)據(jù)技術進行探索和研究。
可以說大數(shù)據(jù)是一種寶貴的戰(zhàn)略資源,其潛在價值和增長速度正在改變著人類的工作、生活和思維方式。可以想見,在未來,各行各業(yè)都會積極擁抱大數(shù)據(jù),積極探索數(shù)據(jù)挖掘和分析的新技術、新方法,從而更好地利用大數(shù)據(jù)。當然,大數(shù)據(jù)并不能主宰一切。大數(shù)據(jù)雖然能夠發(fā)現(xiàn)“是什么”,卻不能說明“為什么”;大數(shù)據(jù)提供的是一些描述性的信息,而創(chuàng)新還是要人類自己來實現(xiàn)。
二、大數(shù)據(jù)對醫(yī)學研究的影響
(一)大數(shù)據(jù)改變醫(yī)學診斷手段
大數(shù)據(jù)分析為許多醫(yī)學難題的解決提供了新途徑,改變了一些疾病診斷方式。大數(shù)據(jù)可以挖掘出大量以往的相似疾病案例,通過分析這些診斷數(shù)據(jù),對疑難雜癥進行快速判別。如,在心臟病的診斷過程中,首先采集心臟數(shù)據(jù)并轉化為心臟圖譜,然后根據(jù)圖譜進行建模,模型中的變量包括壓力、張力、僵硬度等,最后根據(jù)這個模型分析心臟疾病病情,并作出相應的診療方案。此外,還可以利用圖像處理技術,將心臟數(shù)據(jù)建模成為一個虛擬實體,通過設置不同的參數(shù),模擬觀察各類手術或者藥物對心臟機能造成的影響,從而在診療之前就對診療后心臟疾病可能的走勢做出預測,為獲取疾病診治方法提供了手段。
(二)大數(shù)據(jù)可預測病情的擴散趨勢
當流行病發(fā)生時,可以對疾病已有的擴散趨勢和感染人數(shù)進行建模,對每一個時間節(jié)點的數(shù)據(jù)進行分析處理,從而對流行病進行統(tǒng)計研究,預測病情的擴散趨勢,為疾病防治提供參考。同時,當下一次疫情發(fā)生時,可以調出往年數(shù)據(jù)進行分析,了解規(guī)律,從而有望抑制病情的進一步擴張。
(三)大數(shù)據(jù)有望決定現(xiàn)代醫(yī)藥學研究成敗的關鍵
當前在我國,優(yōu)質醫(yī)療資源有限,患者往往需要爭搶醫(yī)療資源,才能獲得一個寶貴的治療機會。然而,患者個體差異巨大,疾病種類繁多,且仍然有很多現(xiàn)代醫(yī)療技術無法解釋和治療的疑難雜癥,使得診斷很難標準化和自動化。同時,醫(yī)生在治療時,治療手段和方法、治療進度等并不公開透明,缺少病人的主動參與。此外,醫(yī)生工作強度大,醫(yī)療資源不足,誤診漏診現(xiàn)象時有發(fā)生,使得醫(yī)患矛盾不斷加劇,醫(yī)患關系已經(jīng)在近年來成為了一個社會問題。大數(shù)據(jù)醫(yī)療則可以使患者主動參與到醫(yī)療過程中。醫(yī)生可以在海量數(shù)據(jù)中找到病人的既往病史、體質特征、健康數(shù)據(jù)等資料作為輔助,從而更好更快地為病人做出準確的判斷。
此外,以往醫(yī)院的醫(yī)療數(shù)據(jù)都是獨立的,病人若首次在某家醫(yī)院就診,醫(yī)生還需要花費時間和精力了解病人的既往病史,既降低了診治效率,也增加了病人就醫(yī)的時間成本。大數(shù)據(jù)使得醫(yī)院之間互通數(shù)據(jù)成為了可能,可避免患者在多個不同的醫(yī)院之間進行重復診治而付出高昂的醫(yī)療費用。大數(shù)據(jù)醫(yī)療有望構建一個以患者為中心的個性化平臺,為患者提供疾病治療、疾病管理、掛號預約、健康數(shù)據(jù)查詢等多方面的服務,充分尊重患者的價值觀和需求,協(xié)調不同專業(yè)的醫(yī)療服務。可以說,大數(shù)據(jù)有望帶來醫(yī)學研究、臨床決策、疾病管理、醫(yī)療衛(wèi)生決策等方面的改變甚至革新,從而帶來整個醫(yī)療模式的轉變。
三、大數(shù)據(jù)在醫(yī)療行業(yè)的應用
(一)疾病預防
大數(shù)據(jù)可以幫助研究者比之前任何時候都更了解健康影響因素。有統(tǒng)計顯示,大約只有10%到15%的健康影響因素已經(jīng)被現(xiàn)代醫(yī)學確定,而剩下的85%到90%的影響因素,包括基因、健康行為、自然和社會環(huán)境均未被確定。利用大數(shù)據(jù),研究者可以將患者的家族病史、醫(yī)療記錄等與平日的生活習慣、飲食習慣、收入、教育等方面聯(lián)系起來,通過對海量的數(shù)據(jù)進行分析比對,研究這些健康影響因素相互之間的關聯(lián)。通過對不同區(qū)域、不同年齡的人群進行評選,篩選健康相關危險因素,并制作健康監(jiān)測評估圖譜數(shù)據(jù)庫和知識庫,提出有針對性的疾病預防計劃,以促進居民健康水平的提高,降低患病風險。這樣一來,大數(shù)據(jù)可以顯著提高醫(yī)療和健康服務,且對不同的人群提供不同的干預措施和針對性的解決方案。
大數(shù)據(jù)還可以整合和分析公共衛(wèi)生數(shù)據(jù),提高疾病預報能力,加強對疾病的監(jiān)測。例如,Asthmapolis公司為哮喘患者研發(fā)了一種追蹤器,記錄患者吸入器的使用,并將數(shù)據(jù)傳輸?shù)街醒霐?shù)據(jù)庫進行分析,用來了解個人患者的疾病進程和使用習慣。將這些數(shù)據(jù)與疾病預防中心的哮喘危險因素數(shù)據(jù)結合,能夠有助于醫(yī)生為患者制定更加個性化的預防、治療計劃。
(二)臨床應用
在醫(yī)學臨床方面,大數(shù)據(jù)有著廣泛的應用天地,包括相對療效研究、醫(yī)療資料的透明化、病人病歷的進階分析、藥物副作用分析和遠距離監(jiān)測病患。
1.相對療效研究
信息時代使得電子病歷的普及成為可能。目前,電子病歷結構化數(shù)據(jù)已逐漸成熟,通過大數(shù)據(jù)分析海量的醫(yī)療數(shù)據(jù),比較分析不同的干預措施的有效性。這為臨床治療決策提供了非常有用的參考信息。在醫(yī)療護理系統(tǒng)中利用大數(shù)據(jù)實現(xiàn)相對療效研究,將大大提高疾病診療的效率,減少過度治療以及治療不足。
2.醫(yī)療資料的透明化
大數(shù)據(jù)分析可以對不同醫(yī)院的治療費用、治療質量與績效進行評估和比對,并快速呈現(xiàn)出來,讓患者一目了然。此外,大數(shù)據(jù)有望精簡業(yè)務流程,從而降低成本,提高醫(yī)療護理質量并給患者帶來更好的就診體驗。
3.患者病歷的進階分析
目前,電子病歷系統(tǒng)包括三部分數(shù)據(jù),即電子病例數(shù)據(jù)、醫(yī)學檢驗數(shù)據(jù)和醫(yī)學影像數(shù)據(jù)。電子病歷是病人自述病癥、醫(yī)生記錄產(chǎn)生的以文字標書為主體的數(shù)據(jù),是一種非結構化的數(shù)據(jù)。醫(yī)學檢驗數(shù)據(jù)來自于醫(yī)學檢驗設備,主要包括各種數(shù)據(jù),具有標準性和規(guī)范性的特點,是一種結構化數(shù)據(jù)。醫(yī)學影像數(shù)據(jù)則包括X光片、B超影像等來自醫(yī)學影像設備的數(shù)據(jù),由于這些數(shù)據(jù)以圖像為主,因此是一種非結構化數(shù)據(jù)。構建電子病歷系統(tǒng),可以全面掌握患者的病情演進情況。大數(shù)據(jù)可以對海量的患者病歷和檔案進行進階分析,確定哪些人是某類疾病的高危感染人群,并按照不同患者的既往病史為其提供不同的治療模式和不同的預防性保健方案,才能達到最佳治療效果。
4.藥物副作用分析
在臨床用藥的過程中,藥物使用可能會引起患者的不良反應。這種不良反應會導致藥物不能發(fā)揮原本的作用,治療效果減弱,嚴重時甚至導致患者死亡,同時不合理的用藥也可能大大集中患者的經(jīng)濟負擔。來自美國的統(tǒng)計顯示,每年美國有70度萬人因為藥物副作用受到傷害或者死亡。通過對產(chǎn)生藥物副作用的患者病情進行分析,挖掘出不同藥物的副作用可能產(chǎn)生的情況,從而提高患者疾病的治療質量,指導臨床用藥,減少藥物副作用或不當用藥對患者的傷害,并指導新藥研發(fā)。
5.遠距離監(jiān)測病患
隨著傳感器的進步和物聯(lián)網(wǎng)的發(fā)展,大量可穿戴設備、各類App等出現(xiàn),能夠實時獲取病人的健康信息。許多高血壓、心臟病、糖尿病患者在家中測量的血壓、心率、體重、血氧、吐氣流量等健康指標和數(shù)據(jù)都可以傳回醫(yī)院或健康管理中心,給醫(yī)療人員提供診斷參考,便于給患者提供飲食和生活建議。
(三)互聯(lián)網(wǎng)醫(yī)療
互聯(lián)網(wǎng)的發(fā)展與大數(shù)據(jù)技術的進步使得在線醫(yī)療成為了可能。在互聯(lián)網(wǎng)醫(yī)療網(wǎng)站上,患者提供病癥相關數(shù)據(jù),醫(yī)生根據(jù)這些病癥數(shù)據(jù),對患者的病癥情況進行初步判斷。該方法能夠在一定程度上環(huán)節(jié)醫(yī)療資源不足和分布不均的情況,但是無法從根本上解決這一難題。由于常常有非專業(yè)人員給出診斷答案以及缺乏詳盡的病理數(shù)據(jù),通過互聯(lián)網(wǎng)醫(yī)療網(wǎng)站很難得到準確的醫(yī)療治療。此外,網(wǎng)絡藥房也在近年來逐漸興起。通過網(wǎng)絡藥房,患者可以購買非處方藥,或是提供醫(yī)生的處方購買處方藥,等待藥品送貨上門的。這種方式減少了患者去藥房或者醫(yī)院的時間成本,有一定的發(fā)展空間。
四、大數(shù)據(jù)在醫(yī)療領域應用的幾個關鍵問題
將大數(shù)據(jù)全面應用于醫(yī)療領域中,構建醫(yī)療大數(shù)據(jù)系統(tǒng),除了國家政府從政策層面鼓勵支持和加強引導之外,各級政府及醫(yī)院等相關機構也需要行動起來,積極迎接大數(shù)據(jù)。
(一)推廣電子病歷,實現(xiàn)數(shù)據(jù)標準化采集
各級政府應鼓勵醫(yī)院使用電子病歷。在使用電子病歷的醫(yī)院中對醫(yī)生作出一些規(guī)范性的要求,使電子病歷記錄規(guī)范。此外,醫(yī)學檢驗數(shù)據(jù)和影像檢驗數(shù)據(jù)的采集和存儲也需要規(guī)范,同事要建立統(tǒng)一的數(shù)據(jù)庫存儲系統(tǒng)來分門別類的存儲這些信息。在推廣電子病歷和構建醫(yī)療大數(shù)據(jù)系統(tǒng)中,數(shù)據(jù)標準化十分重要,是技術實現(xiàn)的關鍵問題。
(二)確保數(shù)據(jù)庫的安全性
病歷是患者的個人隱私。將這些隱私信息被轉移到線上時,應該注意數(shù)據(jù)庫的安全性,保障患者的個人隱私。技術部門要持續(xù)更新病毒庫,定時對數(shù)據(jù)庫系統(tǒng)進行查漏補缺,同時不斷攻克技術難關,加強數(shù)據(jù)庫的安全性,確保患者隱私信息得到保障。
(三)大數(shù)據(jù)挖掘分析方法
要想真正將大數(shù)據(jù)為己所用,適當?shù)拇髷?shù)據(jù)挖掘分析方法必不可少。大數(shù)據(jù)挖掘的核心內容是數(shù)據(jù)的特征與屬性提取,并依據(jù)特征和屬性進行分類。在此基礎上,對不同屬性的數(shù)據(jù)類型進行關聯(lián)分析,從而獲得有價值的信息。目前,大數(shù)據(jù)挖掘分析方法包括分類、估計、預測、聚變等。大數(shù)據(jù)相關從業(yè)人員有必要不斷學習理論知識,同時在實踐中積累大數(shù)據(jù)挖掘分析經(jīng)驗,從而提高大數(shù)據(jù)分析能力。
五、結語
大數(shù)據(jù)分析是當前計算機科學與技術領域的熱點。各個領域都認識到了大數(shù)據(jù)可能帶來的好處,獲得大數(shù)據(jù)并挖掘其中有價值的信息對于領域發(fā)展十分重要,也是未來科學發(fā)展的必然方向。在醫(yī)療領域,大數(shù)據(jù)有著廣泛的應用空間,可以用在包括疾病預防、臨床應用、互聯(lián)網(wǎng)醫(yī)療等方面。可以說,醫(yī)療大數(shù)據(jù)是未來醫(yī)療領域的發(fā)展趨勢。目前,在醫(yī)療行業(yè)應用大數(shù)據(jù)方面,我國還處于初級階段,政府、醫(yī)院及數(shù)據(jù)挖掘技術人員需要共同努力,才能讓大數(shù)據(jù)在醫(yī)療領域發(fā)揮作用。
參考文獻:
[1]鄒北驥.大數(shù)據(jù)分析及其在醫(yī)療領域中的應用[J].計算機教育.2014(7):25-27
[2]周光華,辛英,張雅潔,胡婷,李岳峰.醫(yī)療衛(wèi)生領域大數(shù)據(jù)應用探討[J].中國衛(wèi)生信息管理雜志.2013(4):74-76
[3]王瀟,張愛迪,嚴謹.大數(shù)據(jù)在醫(yī)療衛(wèi)生中的應用前景[J].中國全科醫(yī)學.2015(1):102-106
[4]羅旭,劉友江.醫(yī)療大數(shù)據(jù)研究現(xiàn)狀及其臨床應用[J].醫(yī)學信息學雜志.2015(5):18-19