潘艷軍
摘 要 隨著大數據時代的來臨,互聯網和物聯網技術的快速發展帶來了數據的上傳和下載等更多的便利,促使互聯網上的數據量出現了急劇增長的狀態,在這樣的環境下,也就產生出了專門針對大數據的存儲、計算、分析以及處理等一些新的問題。而在醫療領域中,大數據的作用也就顯得越來越重要。因此,基于基因組學和現代生物醫學技術的個性化醫療,也就成了未來醫學領域發展的主要方向。但是目前,怎樣對大數據進行獲取、分類、存儲、將其中有價值的信息挖掘出來,以及怎樣將其更加有效地應用在醫療領域中也就成了熱點話題。為了對此進行更加深入的研究和分析,文章對大數據及其特征、大數據分析技術以及其在醫療領域中的應用作了如下綜述。
關鍵詞 大數據;醫療領域;應用;分析
中圖分類號 G2 文獻標識碼 A 文章編號 1674-6708(2018)218-0117-02
隨著科技時代的到來,各個領域中均出現了數據的爆炸式增長,而大數據也成為當今社會被研究的重點話題,并且其數據的分析以及應用也已經成了世界科技界以及各國政府所關注的焦點話題,“大數據時代”真的已經來到了我們的身邊。但是目前所面臨的難題依舊是怎樣更好的獲取、分類、存儲、處理和傳輸這些數據。在醫療領域,我國正處在一個醫學信息爆炸的時代,如醫學圖像、電力病例記錄、基因序列、多中心臨床藥物試驗等各個領域每天都會產生大量的數據,這也對醫療領域在對大數據技術對比應用起到了推進的作用[ 1 ]。
1 大數據及其特征
大數據具有以下幾個特征,即極大的數據量:來自于互聯網、物聯網以及電子商務等多個方面的數據;模態極多:其有文本、視頻、語音、網頁等半結構化和非結構化的數據模態;速度快:其所產生的數據都有著較強的時效性;有著密度較低的高價值信息[ 2 ]。
2 大數據分析技術
2.1 機器學習和數據挖掘算法
大數據分析的基礎就是機器學習,要想從無模式、凌亂、復雜的大數據中挖掘出更多有價值的信息,就需計算機對人類學習的過程進行模擬。目前,使用較多的機器學習系統則為神經網絡(DNN),其也大大降低了語音識別的錯誤率。其包括大數據的分類、聚類、關聯分析、并行算法等。數據挖掘算法是以數據為依據創建數據挖掘模型的一種試探計算法。其主要是利用機器學習來實現對數據的分類,進而從其中找到有價值的信息。
2.2 預測性分析
這是一種重要的大數據分析方法,通過科學的建立一個模型,將已知的數據輸入,對未來進行預測,所得出的結果在本質上只是一個概率。其包括對數據的獲取、檢測、分析、預測建模等。
2.3 可視化分析
大數據的查詢和分析的實用性和有效性直接決定著人們對決策信息的獲取情況,而可視化的大數據分析技術就將數據的分析結果更加形象和直觀的展示了出來,進而找出蘊藏在其中的規律和特征,將有價值的信息挖掘出來[ 3 ]。此種大數據分析技術極其簡單,甚至一些非IT專業的人員也能夠通過實現對大數據的分析和應用,所以,此種技術不但是對大數據進行分析的關鍵技術,還是呈現對大數據分析結果的關鍵技術。
2.4 語義引擎
此種大數據分析技術就是從詞語表達大語義和層次上對用戶的檢索請求進行識別和處理,其被廣泛的應用在了對網絡數據的挖掘中。用戶利用此種技術,將需要的關鍵詞輸入到檢索系統中,從而找到需要的數據[4]。
2.5 知識計算
知識計算需要從大量的數據中搜索出高價值的知識,并將其構成能夠支持查詢、分析和計算的知識庫。
2.6 數據質量和數據管理
大數據分析中,最為關鍵的就是數據的質量和管理。其能夠更加科學的對大數據進行分析,從而將使分析出來的結果更有價值。
3 大數據分析技術在醫療領域中的應用
3.1 在基因生物學中的應用
有研究人員從1990年開始到2004年,歷經15年,完成了人類基因組的計劃,其對人類23對染色體基因組中的堿基對進行了測序和檢定。目前為止,已經發現20?500多個基因,其會在不同的微環境中表現出較大的差異,并且其所產生的不同的表達物中可以產生大量的數據。而大數據技術會通過互聯網,使數據庫被科研人員共享,從而促進數據的快速產生。
3.2 在致病因素分析中的應用
在醫療領域,病人各項信息都會被存儲在病案信息庫中,工作人員通過對病人的個人信息進行檢索,使用大數據分析技術(如聚類分析法)就可以對病人的相關信息進行關聯性的分析,從而找出疾病的發生與給一些外在因素之間潛在的關系,指導人民群眾提高警惕,遠離致病因素,將此種疾病的發生率降到最低。
3.3 在臨床診斷和治療中的應用
在對疾病的臨床診斷和治療中,大數據分析技術能夠有效提高準確率和治療效果。由于疾病的錯綜復雜,致病因素之間所存在的較大差異,導致同一種疾病在不同階段也會出現不同的癥狀,即便是不同的疾病,有時也會表現出高度相似的臨床特征[ 5 ]。采用大數據分析技術(如數據挖掘算法)能夠根據病人的病歷以及個人信息對造成疾病的相關因素進行分析,這對疾病的治療是非常重要的。
3.4 在疾病預測中的應用
大數據分析技術最為核心的內容就是預測,在醫療大數據中,其中包括大量病人的地區區域、飲食習慣等信息,這些信息為對某種疾病的發病史以地區分布性提供的線索。并且研究人員還可以通過對大數據的分析,對疾病的遺傳性和非遺傳性進行分析,為治療人員提供相應的防治措施,從而降低此種疾病的發病率[6]。另外,大數據分析技術還可以對某些疾病的發展趨勢進行預測,(如機器學習法)可以對部分疾病信息進行精確判讀,其還是對傳染性疾病進行預測和預警的利器。
3.5 在醫學影像中的應用
在醫學領域的影像(如CT、MRI)分析中,采用大數據分析技術能夠對所得出的影像結果進行分析,進而對病人的疾病做出正確的診斷。
3.6 在檢驗醫學中的應用
檢驗醫學的快速發展,如細胞免疫學、細胞學、酶學、分子生物學等,不但加快了對臨床基因的檢測速度,還在基因的診斷中,(如病毒、細菌等基因的快速檢測、遺傳性疾病的診斷)得到了廣泛的應用。免疫學的發展拓寬了其在檢測界的領域,還提高了檢測的靈敏度,對試驗過程步入自動化起到了促進的作用[7]。
3.7 在醫院管理中的應用
目前,各大醫院所應用的綜合信息管理系統、影像系統、OA系統、以電子病歷為中心的管理系統等,在一定程度上提高了醫院的管理水平、經濟效益以及診療水平。而隨著大數據技術的不斷發展,各個醫院的電子病歷系統會通過互聯網而實現醫療信息的共享[8]。
3.8 在新藥研發中的應用
目前,在醫療領域,藥物研發的重要工具就是網絡藥理學和分子對接技術,其也是大數據分析技術所應用的重點領域。比如,系統的完整性能夠保證生物個體內各個機制的正常運行,而各個節點之間進行一種相互作用后就又可以形成一個復雜的網絡體系,而一旦網絡體系被打亂,就說明生物機體出現了某種疾病。利用大數據分析技術,有效的利用網路數據和藥物網絡數據,將會在很大程度上提高對新藥研發的水平。
3.9 在藥物副作用分析中的應用
采用大數據分析技術,通過互聯網對各家醫院所出現的藥物不良反應進行挖掘,能夠幫助治療人員更加科學、全面的了解到藥物的副作用情況,使其在用藥時,會提高警惕,從而將藥物的副作用降到最低,保證病人合理用藥[9]。
4 結論
總之,科學技術的發展,大數據在醫療領域中的作用愈發重要。在這些醫學領域中,常常隱藏著很多的有價值的信息,通過對大數據科學有效的進行利用,能夠有效實現各大醫院對病例的共享、對流行性疾病發病情況的預測、藥物作用的預測以及個體化的精準醫療等,并且對提高臨床診斷水平,保證患者用藥的安全性和有效性等都有著重要的指導作用。
參考文獻
[1]潘長玲.大數據分析在健康管理領域中的應用及挑戰[J].現代醫學與健康研究電子雜志,2018,2(9):135-136.
[2]馬曉,孫瑞靖,宋小明.淺析醫療大數據對醫學研究領域的創新進展[J].內蒙古科技與經濟,2018(7):93,96.
[3]趙俊,孫亞丹.基于Hadoop的醫療健康非結構化大數據分析研究[J].科技視界,2017(36):1-2,74.
[4]徐志祥,王瑩.我國醫療行業大數據應用現狀及政策建議[J].中國衛生信息管理雜志,2017,14(6):822-825.
[5]趙浴光.淺議大數據分析技術在醫藥領域的應用[J].科技創新導報,2017,14(34):162-163.
[6]孫愛婷,張海平.大數據技術在醫療領域應用的發展前景[J].中國管理信息化,2017,20(19):193-195.
[7]張春麗,成彧.大數據分析技術及其在醫藥領域中的應用[J].標記免疫分析與臨床,2016,23(3):327-333.
[8]郭曉明,周明江.大數據分析在醫療行業的應用初探[J].中國數字醫學,2015,10(8):84-85,111.
[9]鄒北驥.大數據分析及其在醫療領域中的應用[J].計算機教育,2014(7):24-29.