李杰
摘 要:傳統循證醫學研究中,證據的稀缺、偏倚、不公、過時等缺陷使得循證醫學本身遭到了質疑。大數據時代,數據的巨量、高速、多樣、價值特性彌補了傳統循證醫學的這些不足。伴隨著大數據產生的云存儲、數據挖掘、深度學習等技術推動了循證醫學的發展。文章介紹了云存儲、數據挖掘、深度學習等信息技術,并探討了它們對循證醫學的影響。
關鍵詞:信息化 大數據 循證醫學
中圖分類號:R741 文獻標識碼:A 文章編號:1672-3791(2018)06(a)-0012-02
循證醫學是一門以數據說話的學科,證據是循證醫學的基礎。大數據時代,基于大數據的云存儲、非結構化數據抽取技術,有效解決了數據采集、存儲和轉化問題,數據挖掘和深度學習技術提高了證據提取和決策分析效率,這些信息化技術推動了循證醫學的變革和創新。
1 傳統循證醫學缺陷
傳統循證醫學在理論體系上具有先天性缺陷。研究中RCT要求的大規模樣本量,以及收集的證據必須是完全一致的實驗環境下產生的結果,這在實際中很難做到。Meta分析通過合并分析各研究結果得出結論,為循證醫學提供了捷徑,但納入的文獻質量良莠不齊,文獻研究自身的選擇性偏倚、實施偏倚、隨訪偏倚、測量偏倚和報告偏倚都將導致研究結果偏離真值,使得研究結果應用價值頗受爭議。傳統循證醫學證據的稀缺、偏倚、不公、過時,使循證醫學發展面臨困境,理論本身遭到了質疑。
2 大數據及其特征
大數據,又稱海量數據、巨量數據,是指無法在一定時間范圍內用常規軟件進行收集、存儲和處理的數據集合,其本身具有4V特性:Volume(巨量)、Velocity(高速)、Variety(多樣)、Value(價值)。
巨量,是指數據規模已經不能用過去的GB、TB為單位進行衡量,必須以PB、EB甚至ZB為單位進行計量。
高速,是指數據創建、移動和處理速度快,可從各種類型的數據中快速獲得高價值的信息,并返回給用戶。
多樣,是指數據種類和來源多樣化。包括結構化、半結構化和非結構化數據。
價值,是指價值密度低,要從巨量的數據集中挖掘高價值的信息。
大數據的這些特性彌補了傳統循證醫學研究的諸多缺陷。巨量和多樣化特性解決了傳統循證醫學證據稀缺和偏倚問題。基于高速特性的數據實時采集、快速傳輸和處理,有效解決了樣本量不足,樣本過時問題,并提高了證據提取和分析處理的效率。巨量數據讓循證醫學不再受小規模樣本量的限制,多樣化為研究結果驗證提供了便利,高速采集為研究提供了即時數據,這些特性都促進了循證醫學擺脫傳統方法的束縛,使循證醫學在技術創新中打開新局面。
下面介紹大數據技術中和循證醫學相關的云存儲、數據挖掘和深度學習技術。
3 云存儲技術
云存儲是一種新興的網絡存儲技術,它將網絡中大量各種不同類型的存儲設備通過應用軟件集合起來協同工作,共同對外提供數據存儲和業務訪問服務。實際應用中,云存儲將儲存資源放到云上供人存取,用戶可以在任何時間和地點,透過任何可連網的裝置連接到云上方便地存取數據。
云存儲主要包括存儲層、基礎管理層、應用接口層和訪問層。存儲層中的存儲設備數量龐大,分布廣泛,設備之間通過網絡連接?;A管理層實現存儲設備的協同工作,使它們能對外提供同一種服務。基礎管理層中使用的數據加密技術和數據容災備份技術為數據安全提供了保障,避免了數據非法訪問和丟失。應用接口層根據用戶需要,開發不同的應用服務接口,提供用戶所需的應用服務。用戶通過訪問層提供的公用應用接口訪問云存儲系統。
云存儲技術徹底變革了傳統循證醫學證據收集方式。伴隨云存儲技術產生的移動醫療,使用便攜式、可穿戴健康監測設備,如健康手環、智能血壓計,手機、平板電腦APP等,極大便利了院外隨訪數據收集,采集的非結構化數據通過信息抽取,結構化處理等技術,完成了從非結構化向結構化的轉變。而基于這些個體化的數據形成的即時更新的大數據樣本,使循證醫學研究證據更加及時準確可靠,在臨床治療中也更有針對性。此外,中醫藥研究本身周期長,難以長期、大量采集樣本的問題也得到了解決,云儲存技術將推動循證醫學在中醫領域的應用與發展。
4 數據挖掘
數據挖掘,一般是指從大量的數據中通過算法獲取隱藏于其中的信息的過程。
該過程主要包括以下步驟:⑴定義問題,明確數據挖掘目的;⑵數據準備,確定目標數據,從數據源中抽取與業務相關的數據集;⑶數據預處理,包括數據清洗、數據轉換、數據集成,形成數據倉庫;⑷選擇算法,構建模型,模型優化;⑸部署模型,確定模型參數和輸入變量,對數據進行挖掘;⑹結果分析。數據挖掘利用了統計分析和人工智能技術,將這些技術封裝起來,使人們不用掌握這些技術就能完成數據的挖掘,尋找數據間的關系,解決自己關注的業務問題。
數據挖掘技術幫助研究人員從大量的、不完全的、有噪聲的、模糊的、隨機的數據中提取隱含的有價值的信息知識,打破了研究人員面對海量的醫療大數據時,沒有方法和工具發現其應用價值的尷尬境遇,為循證醫學研究人員從醫療大數據中發現數據關系,尋找醫學規律創造了條件。
5 深度學習
深度學習的概念來自人工神經網絡,通過模擬人腦的機制來識別、解釋數據。人工神經網絡包含輸入層、隱藏層、輸出層三大層次,每層由許多神經元構成,每個神經元與下一層所有神經元連接。信息進入神經網絡后,經輸入層到隱藏層,在隱藏層處理、傳遞,直到輸出層。如果輸出和輸入一致,神經網絡就完成了對該信息的學習。
深度學習中,隱藏層的工作至關重要。隱藏層由若干堆疊的子層構成,構成了學習深度,神經網絡的每次學習,子層都記錄了該數據的特征值。經過大量學習后,隱藏層通過調整特征值的權重,最終準確還原了初始數據。隱藏層實現了對輸入的分級表達,通過組合低層特征形成更加抽象的高層表示。
深度學習能夠模擬人腦識別、篩選、提取數據。自動完成海量的高維醫療數據中,患者健康指標和環境數據的提取。深度學習與數據挖掘技術結合,將證據提取與決策分析結合起來,使循證醫學向人工智能邁出重要一步,大大提高了循證醫學研究人員的工作效率。
6 結語
循證醫學是一門重視醫學證據的學科,它實現了從傳統經驗醫學向證據醫學的轉變。但傳統循證醫學自身存在的證據稀缺、偏倚、過時、不公等缺陷,使其也面臨著重大挑戰。大數據時代,信息化高速發展,由此催生的云計算、云存儲、數據挖掘、深度學習等技術必將促進傳統循證醫學的重大變革和創新。運用云存儲技術,將實現海量醫療數據的實時采集和存儲;運用數據挖掘技術,將幫助研究人員從醫療大數據中發現與研究相關的高價值信息;基于神經網絡的深度學習,將實現醫療大數據中目標數據提取自動化,使研究人員擁有更高工作效率。大數據時代,信息化技術給循證醫學注入了強大活力,循證醫學必將借此翻開新的一頁。
參考文獻
[1] 劉建平.循證醫學進展述評[J].重慶醫學,2017,46(14):1873-1877.
[2] 呂玉紅,范維,程慶元.等.云技術與醫學信息化教育[J].現代生物醫學進展,2015(6):1126-1129.
[3] 馬光志,張曉祥,周彬,等.大數據時代的循證醫學[J].世界復合醫學,2015(2):120-124.