摘要:在大數(shù)據(jù)時(shí)代,醫(yī)療大數(shù)據(jù)是一種什么的現(xiàn)狀?發(fā)展中面臨哪些挑戰(zhàn)?對此,有什么對策來應(yīng)對這些挑戰(zhàn)?最終醫(yī)療大數(shù)據(jù)能帶給我們哪些意義?這些就是本文研究和探討的重心和要點(diǎn)。關(guān)鍵詞:醫(yī)療大數(shù)據(jù);共享;挖掘;安全
中圖分類號:R012 文獻(xiàn)標(biāo)識碼:A
在大數(shù)據(jù)時(shí)代,各個(gè)行業(yè)每天產(chǎn)生巨量的數(shù)據(jù),對我們的生活等各個(gè)方面產(chǎn)生了不可估量的影響,醫(yī)療領(lǐng)域自然也不例外。隨著大數(shù)據(jù)時(shí)代的繼續(xù),醫(yī)療行業(yè)每年產(chǎn)生海量的醫(yī)療數(shù)據(jù),有些單位甚至年產(chǎn)生300TB到1PB的醫(yī)療數(shù)據(jù)[1],那么,這些海量的醫(yī)療大數(shù)據(jù)的現(xiàn)狀如何?有沒有被充分利用起來發(fā)揮應(yīng)用的作用還是靜靜地隨歷史長河消逝?我們應(yīng)該采取哪些地措施來挖掘這些醫(yī)療大數(shù)據(jù)以更好地服務(wù)我們的患者?這正是本文想要探究的事情。
1 醫(yī)療大數(shù)據(jù)的概念及現(xiàn)狀
1.1大數(shù)據(jù) 大數(shù)據(jù)雖然已經(jīng)\"熱\"了幾十年,但對于到底什么是大數(shù)據(jù),其實(shí)到目前為止并沒有一個(gè)明確統(tǒng)一的概念。一般來說,從以下三個(gè)維度來理解大數(shù)據(jù):數(shù)據(jù)、思維、技術(shù)。從數(shù)據(jù)來理解,大數(shù)據(jù)通常就是指海量數(shù)據(jù),即強(qiáng)調(diào)數(shù)據(jù)的規(guī)模(Volume)、多樣性(Variety)、速度(Velocity)和價(jià)值(Value),這四個(gè)方面也經(jīng)常被指為大數(shù)據(jù)的4V特性;從技術(shù)上理解,主要是與傳統(tǒng)的數(shù)據(jù)技術(shù)進(jìn)行區(qū)分,對大數(shù)據(jù)進(jìn)行整合、存儲、挖掘、檢索、決策等的處理方式,這些功能是傳統(tǒng)的數(shù)據(jù)無法企及的。大數(shù)據(jù)家維克托給大數(shù)據(jù)是這樣定義的:大數(shù)據(jù)是當(dāng)今社會所獨(dú)有的一種新型的能力,它以一種前所未有的方式,通過對海量數(shù)據(jù)進(jìn)行分析,可獲得巨大價(jià)值的產(chǎn)品和服務(wù)[2]。
綜上所述,根據(jù)各方面對大數(shù)據(jù)的描述理解,我們認(rèn)為,所謂大數(shù)據(jù),是指用傳統(tǒng)數(shù)據(jù)管理工具,無法在合理時(shí)間內(nèi)進(jìn)行挖掘、管理并進(jìn)行分析的復(fù)雜的大規(guī)模的數(shù)據(jù)集合。
1.2醫(yī)療大數(shù)據(jù) 醫(yī)療大數(shù)據(jù)是隨著大數(shù)據(jù)的全面發(fā)展在醫(yī)療領(lǐng)域興起的與醫(yī)療有關(guān)的一切海量數(shù)據(jù),具體來說,可以從四個(gè)方面來理解醫(yī)療大數(shù)據(jù):①制藥企業(yè)的數(shù)據(jù),藥物研發(fā)可產(chǎn)生大量的醫(yī)療數(shù)據(jù);②醫(yī)院診療數(shù)據(jù),這主要是指臨床數(shù)據(jù)和實(shí)驗(yàn)室數(shù)據(jù),全國的醫(yī)院每天產(chǎn)生海量的臨床數(shù)據(jù)和實(shí)驗(yàn)室數(shù)據(jù)(我們所指的醫(yī)療大數(shù)據(jù)主要是從這個(gè)方面來理解);③醫(yī)療費(fèi)用數(shù)據(jù),隨著診療的患者越來越多,所產(chǎn)生的有關(guān)醫(yī)療費(fèi)用的數(shù)據(jù)也越來越海量;④健康管理數(shù)據(jù),隨著移動(dòng)設(shè)備的普及及個(gè)性化醫(yī)療服務(wù)的推廣,人們可以借助于手機(jī)等隨時(shí)利用網(wǎng)絡(luò)關(guān)注自己的健康信息,由此產(chǎn)生了不可估量的大數(shù)據(jù)。
1.3現(xiàn)狀 醫(yī)療領(lǐng)域是大數(shù)據(jù)應(yīng)用的重要領(lǐng)域,目前在中國醫(yī)療大數(shù)據(jù)的應(yīng)用還處于初級階段,醫(yī)療大數(shù)據(jù)的價(jià)值有待于進(jìn)一步被認(rèn)識、被挖掘進(jìn)而被利用。在醫(yī)療領(lǐng)域,海量的醫(yī)療大數(shù)據(jù)如果能夠被利用起來,則可以改變一些疾病的診療方式,有助于解決一些醫(yī)學(xué)難題。目前雖然醫(yī)療大數(shù)據(jù)一定程度的利用促進(jìn)了醫(yī)療領(lǐng)域的發(fā)展,對緩和醫(yī)患關(guān)系直到了輔助作用。但總的來說:由于醫(yī)療大數(shù)據(jù)的應(yīng)用并不單純是醫(yī)療領(lǐng)域的事情,而是一項(xiàng)跨學(xué)科的問題,這就給醫(yī)療大數(shù)據(jù)的應(yīng)用研究帶來了不小的難度,加之醫(yī)療大數(shù)據(jù)還存在比較嚴(yán)格的管制階段,這就使得醫(yī)療大數(shù)據(jù)的獲得難度加大,因此醫(yī)療大數(shù)據(jù)難以真正共享,故而難以充分利用其有效性,也難以在一般的機(jī)構(gòu)進(jìn)行醫(yī)療大數(shù)據(jù)的相關(guān)研究。目前研究主要體現(xiàn)在普通的醫(yī)療大數(shù)據(jù)的采集、存儲、醫(yī)患互動(dòng)的信息記錄等,而對于數(shù)據(jù)的深度挖掘及利用、數(shù)據(jù)的真正共享、數(shù)據(jù)的安全性等方面的實(shí)質(zhì)性研究則比較少。
2 醫(yī)療大數(shù)據(jù)面臨的挑戰(zhàn)
2.1挖掘深度不夠,數(shù)據(jù)的真實(shí)性有待提高 醫(yī)療大數(shù)據(jù)的重要性不言而喻,但是面對越來越多的海量醫(yī)療大數(shù)據(jù),一系列難題也隨之而產(chǎn)生:要將醫(yī)療數(shù)據(jù)的價(jià)值挖掘出來,提升數(shù)據(jù)的真實(shí)性,就一定要有相應(yīng)的挖掘人才,但由于醫(yī)療大數(shù)據(jù)的專業(yè)性特點(diǎn),挖掘人才一定要具備扎實(shí)的醫(yī)學(xué)知識和過硬的計(jì)算機(jī)知識,只有這樣,才有可能深度挖掘醫(yī)療大數(shù)據(jù),但目前的現(xiàn)狀是幾乎很少有人會完善地掌握這兩個(gè)行業(yè)的知識,因此對于不具備醫(yī)學(xué)知識的人來深度挖掘醫(yī)療大數(shù)據(jù)是比較困難的;更何況,要在短時(shí)間內(nèi)把醫(yī)療領(lǐng)域內(nèi)的所有活動(dòng)變成數(shù)據(jù),且從這些數(shù)據(jù)挖掘出專業(yè)信息,這是個(gè)很復(fù)雜又未解決的問題[3]。
2.2共享性不夠,數(shù)據(jù)未能被充分利用 最近十幾年,隨著大數(shù)據(jù)技術(shù)的進(jìn)步,醫(yī)療領(lǐng)域大數(shù)據(jù)共享平臺建設(shè)的一些技術(shù)難題得以解決,中國醫(yī)療大數(shù)據(jù)的共享取得了很大的進(jìn)展。但總的來說,由于起步較晚,我們的醫(yī)療大數(shù)據(jù)共享還處在較級階段,與發(fā)達(dá)國家相比存在較大的差距。盡管我國的醫(yī)療大數(shù)據(jù)堪稱海量,但是與國外相比,共享的程度很低,基本上屬于被擱置的狀態(tài),本身的作用沒有很好地發(fā)揮。在國內(nèi),醫(yī)療大數(shù)據(jù)的共享程度有所提高,但是也處于一個(gè)未充分共享利用的狀態(tài),結(jié)果就導(dǎo)致患者重復(fù)就醫(yī),醫(yī)生重復(fù)看病,給患者重復(fù)做同樣的檢查等等,既給患者增加了沉重的負(fù)擔(dān),延誤了治病的最好時(shí)機(jī),又浪費(fèi)了有限的醫(yī)療資源,從某種意義上可以說,這是造成醫(yī)患矛盾的一個(gè)重要原因。更甭說醫(yī)務(wù)人員利用海量的醫(yī)療大數(shù)據(jù)進(jìn)行科研,提高醫(yī)療水平了。之所以出現(xiàn)這種情況,有以下三方面的原因:①觀念比較陳舊落后,很多人員沒有真正認(rèn)識到共享醫(yī)療大數(shù)據(jù)的重大意義,故而從思想上就沒有對此給予足夠的重視;②醫(yī)療大數(shù)據(jù)的共享,需要先進(jìn)的IT技術(shù),而我們很多醫(yī)療單位的相關(guān)技術(shù)并沒有跟上時(shí)代的步伐;③醫(yī)療大數(shù)據(jù)的共享,是一個(gè)系統(tǒng)的工程,需要相關(guān)的所有部門的合作協(xié)調(diào),故而在短時(shí)間內(nèi)難以完成。
2.3安全性不夠,隱私易被泄露 大數(shù)據(jù)技術(shù)的發(fā)展,給醫(yī)療領(lǐng)域的發(fā)展帶來了不可估量的作用,但任何事物都有兩個(gè)方面,醫(yī)療大數(shù)據(jù)也不例外。在促進(jìn)醫(yī)療事業(yè)積極前進(jìn)的同時(shí),也出現(xiàn)了一些不可避免的問題,其中最主要的一項(xiàng)就是安全性問題。近年來醫(yī)療數(shù)據(jù)中的隱私泄露事件時(shí)有發(fā)生,這就給醫(yī)療大數(shù)據(jù)的安全監(jiān)控問題帶來了極大的挑戰(zhàn)。媒體時(shí)常報(bào)道醫(yī)院的信息系統(tǒng)遭黑客侵入,導(dǎo)致許多醫(yī)療數(shù)據(jù)外泄。更有甚者,由于政策的銜接不到位、管理監(jiān)督不嚴(yán)格等,個(gè)別不良單位和個(gè)人在利益的驅(qū)動(dòng)下,將患者的醫(yī)療數(shù)據(jù)及信息出售給一些商人,販賣醫(yī)療數(shù)據(jù)的事件時(shí)有發(fā)生,給患者造成巨大傷害,給社會造成惡劣影響。
3醫(yī)療大數(shù)據(jù)的對策
3.1突破目前的管理機(jī)制 醫(yī)療大數(shù)據(jù)的共享到目前為止沒有達(dá)到預(yù)期的效果,壁壘有兩個(gè):一是技術(shù)上的問題;一是技術(shù)之外的問題。而更大的壁壘就是來自技術(shù)之外。所謂技術(shù)之外的原因,主要是指醫(yī)療大數(shù)據(jù)共享需要不同地區(qū)的多個(gè)單位的配合協(xié)調(diào),因此,要真正實(shí)現(xiàn)醫(yī)療大數(shù)據(jù)的共享,首先要打破目前的管理機(jī)制。從微觀上來說,打破信息的壁壘屏障,醫(yī)院必須提高管理規(guī)范,制定完善的規(guī)章制度,從內(nèi)部規(guī)范協(xié)調(diào)好醫(yī)院的各部門,做到從醫(yī)院本身來說能真正及時(shí)有效地實(shí)現(xiàn)醫(yī)療大數(shù)據(jù)的共享。從宏觀上來說,就是需要國家、政府層面配套相關(guān)的完善的法律、政策,突破因?yàn)榈貐^(qū)、部門利益造成的壁壘,改變對醫(yī)療數(shù)據(jù)共享不太重視的傳統(tǒng)觀念等,打破傳統(tǒng)的管理機(jī)制的局限,為醫(yī)療大數(shù)據(jù)的共享提供一個(gè)有利的環(huán)境。
3.2加強(qiáng)對醫(yī)療大數(shù)據(jù)的深度挖掘,提高其真實(shí)性 目前醫(yī)療大數(shù)據(jù)是通過數(shù)據(jù)庫來接收各種醫(yī)療數(shù)據(jù)并進(jìn)行去偽、剔重、分析等處理,以滿足大多數(shù)常見的需求。但這些對醫(yī)療數(shù)據(jù)的處理,基本上處在表面階段,挖掘的深度不夠,數(shù)據(jù)的真實(shí)性沒有體現(xiàn)出來。因此我們一方面要加強(qiáng)計(jì)算機(jī)技術(shù)的研發(fā),比如數(shù)據(jù)挖掘技術(shù)、整合技術(shù)等,從技術(shù)上加強(qiáng)對醫(yī)療大數(shù)據(jù)的深度挖掘,將數(shù)據(jù)的真實(shí)性、關(guān)聯(lián)性、潛在價(jià)值性給挖掘出來;另一方面,打破部門之間的藩籬,加強(qiáng)部門、地區(qū)之間的合作,節(jié)省數(shù)據(jù)挖掘的資金,使得這種深度挖掘醫(yī)療大數(shù)據(jù)實(shí)現(xiàn)的日期指日可待。
3.3加快醫(yī)療大數(shù)據(jù)的共享 醫(yī)療領(lǐng)域的海量大數(shù)據(jù)對于推動(dòng)我國的醫(yī)療衛(wèi)生的發(fā)展提供了必要的條件,但是目前的現(xiàn)狀是醫(yī)療大數(shù)據(jù)在很大程度上散落于不同地區(qū)的醫(yī)療單位內(nèi)部,沒有實(shí)現(xiàn)共享。因此,我們要把醫(yī)療大數(shù)據(jù)的功能真正發(fā)揮出來,就一定要加快其共享性建設(shè)的進(jìn)程。一方面加快技術(shù)的改進(jìn),加快建設(shè)醫(yī)療大數(shù)據(jù)共享平臺的建立,讓醫(yī)療大數(shù)據(jù)的共享從技術(shù)上實(shí)施沒有問題;另一方面,是最關(guān)鍵也是最難做的,就是盡快出臺相關(guān)的政府法規(guī)來引導(dǎo)醫(yī)療大數(shù)據(jù)共享的建設(shè),突破種種原因造成的目前共享的藩籬;再就是從觀念上進(jìn)行引導(dǎo),讓大家明白醫(yī)療大數(shù)據(jù)的功能要真正發(fā)揮,就一定要實(shí)現(xiàn)共享,再無其他路可走。
3.4消除醫(yī)療大數(shù)據(jù)的安全隱患 對于醫(yī)療大數(shù)據(jù)的安全隱患問題,我們可以從法律和技術(shù)兩個(gè)層面來進(jìn)行解決。
法律層面上,我們可以借鑒歐美國家的成熟經(jīng)驗(yàn),出臺相關(guān)的隱私安全保護(hù)的法律。這一點(diǎn)已開始進(jìn)行,從2010年開始,我國已陸續(xù)出臺了《電子病歷基本規(guī)范(試行)》、《病歷書寫規(guī)范》等政策法規(guī),對于保護(hù)醫(yī)療大數(shù)據(jù)的隱私安全提供了法律依據(jù)。但因?yàn)闀r(shí)間較短,我們的這些政策法規(guī)比較寬泛、粗糙,今后應(yīng)繼續(xù)加強(qiáng)法規(guī)的細(xì)化建設(shè),尤其對于電子病歷的法律地位、如何管理、使用權(quán)如何管理方面的法律,要給予細(xì)化,使得這些問題有具體的、可操作的政策法規(guī)可以依據(jù)。同時(shí),對于違反醫(yī)療大數(shù)據(jù)安全的單位或個(gè)人,要嚴(yán)懲,從而杜絕類似現(xiàn)象的發(fā)生。
技術(shù)層面上,要加強(qiáng)數(shù)據(jù)安全技術(shù)的研發(fā)和更新,減少技術(shù)漏洞??梢酝ㄟ^采取技術(shù)手段來限制用戶對醫(yī)療信息資源的權(quán)限管理,從而使得各類醫(yī)療大數(shù)據(jù)在合法范圍內(nèi)使用,防止資源被濫用造成泄露隱私,產(chǎn)生安全問題。對于數(shù)據(jù)的關(guān)聯(lián)性挖掘,則要提升技術(shù),在統(tǒng)計(jì)頻繁項(xiàng)集的過程中保護(hù)隱私信息[4]。對于分布式聚類,則要加強(qiáng)計(jì)算加密后數(shù)據(jù)間的距離來提升數(shù)據(jù)的安全性[5]。
4醫(yī)療大數(shù)據(jù)的意義
4.1解決醫(yī)療資源的有限性問題 當(dāng)前我國因?yàn)榻?jīng)濟(jì)發(fā)展不平衡,造成醫(yī)療資源分布不均衡,尤其是優(yōu)質(zhì)醫(yī)療資源,因此經(jīng)常出現(xiàn)患者爭搶優(yōu)質(zhì)醫(yī)療資源的情況,這就造成醫(yī)生的工作強(qiáng)度加大,沒有辦法仔細(xì)地與患者交流,醫(yī)患矛盾加深。而在信息時(shí)代,醫(yī)療大數(shù)據(jù)可以在醫(yī)療單位之間共享,這就可以避免患者在做重復(fù)的檢查治療,既節(jié)約了醫(yī)療成本,又節(jié)省了時(shí)間,更進(jìn)一步節(jié)省了醫(yī)療資源,一舉數(shù)得,而且可以在很大程度上減少醫(yī)患矛盾,這對于中國的醫(yī)療改革是一個(gè)很好的措施。在醫(yī)療領(lǐng)域例如遠(yuǎn)程診療、臨床診斷、等方面充分利用、共享醫(yī)療大數(shù)據(jù),可以充分利用現(xiàn)有的醫(yī)療資源,,減少醫(yī)療資源的浪費(fèi),讓資源配置到確實(shí)需要的患者身上,提高有限的醫(yī)療資源的利用率。
4.2為臨床決策提供有力的支持 在大數(shù)據(jù)時(shí)代,要提高臨床決策的正確率,醫(yī)療大數(shù)據(jù)的充分利用是必不可少的,而且,充分利用已有的醫(yī)療大數(shù)據(jù),又可以在一定程度上節(jié)省臨床決策的時(shí)間,實(shí)現(xiàn)臨床決策的智能功能,在某種程度上降低醫(yī)生的工作強(qiáng)度。具體來說,可以從以下方面進(jìn)行:可以挖掘醫(yī)療大數(shù)據(jù)中文獻(xiàn)數(shù)據(jù)庫中的資料,讓醫(yī)師結(jié)合患者的具體病情做出更加合理的診斷,幫助醫(yī)師降低醫(yī)療風(fēng)險(xiǎn);利用越來越先進(jìn)的IT技術(shù)提高醫(yī)學(xué)影像的識別技術(shù)和分析技術(shù),幫助醫(yī)師更加準(zhǔn)確地判斷影像中的醫(yī)學(xué)信息,最終幫助醫(yī)生做出正確的診斷,給患者提供越來越好的服務(wù)。
4.3對流行病進(jìn)行監(jiān)測與預(yù)報(bào) 大規(guī)模流行病的爆發(fā)嚴(yán)重影響人類的健康安全,比如SARS,埃博拉等,給整個(gè)人類的生活造成了重大的影響。如果能及時(shí)監(jiān)測和預(yù)報(bào)流行病的發(fā)展軌跡,這對于人類無疑是重大的好消息。醫(yī)療大數(shù)據(jù)使得這一切都有可能變?yōu)楝F(xiàn)實(shí)。我們可以利用醫(yī)療大數(shù)據(jù)和先進(jìn)的技術(shù),來監(jiān)測和預(yù)報(bào)流行病,這就可以大大降低流行病對人類的危害程度,加強(qiáng)人類對流行病的控制,保護(hù)整個(gè)人類的生命安全。在我國,國家傳染病與突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)直報(bào)系統(tǒng)已經(jīng)投入運(yùn)行,該系統(tǒng)覆蓋了全國所有縣級以上的疾控機(jī)構(gòu),借助這個(gè)系統(tǒng),能夠?qū)ο嚓P(guān)的醫(yī)療大數(shù)據(jù)進(jìn)行全面的疫情監(jiān)測,并能預(yù)測病情的傳播途徑、時(shí)間等,這就可以讓政府部門采取有力的措施及時(shí)控制疫情,降低傳染病的感染,保護(hù)人民的健康安全。
參考文獻(xiàn):
[1]羅旭、劉友江.醫(yī)療大數(shù)據(jù)研究現(xiàn)狀及其臨床應(yīng)用[J].醫(yī)學(xué)信息學(xué),2015(5):10.
[2]維克托·邁爾-舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].盛楊燕,周濤譯.杭州:浙江人民出版社,2013:17.
[3]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013(3):149.
[4]Clifton C,Kantarcioglou M,Lin X,et al.Tools for Privacy Preserving Distributed Data Mining[J].ACM SIGK-DD Explorations,2002,4(2):28-34.
[5]Jagannathan G,Pillaipakkamnatt K,Wright RN.A New Privacy-preserving Distributed k-Clustering Algorithm[C].Proceedings of the 2006 SIAM International Conference on Data Mining,2006:492-496.
編輯/王海靜