任珊珊

摘要:為了使患者對自身的情況更加了解,醫(yī)生可以更準確地對疾病進行診斷,目前已經(jīng)出現(xiàn)了一些將計算機技術(shù)用于醫(yī)療診斷的研究。但是目前存在的技術(shù)在處理疾病診斷的過程中存在電腦處理數(shù)據(jù)多,維度大,超負荷等缺點。基于這種情況,本文提出了將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)用于處理疾病數(shù)據(jù)的技術(shù),神經(jīng)網(wǎng)絡(luò)對于高維度的數(shù)據(jù)處理有著無可比擬的優(yōu)勢。CNN網(wǎng)絡(luò)可以降低數(shù)據(jù)過擬合現(xiàn)象的發(fā)生,可以極大地緩解目前技術(shù)存在的問題。這項技術(shù)對于患者和醫(yī)生都有著積極的意義。
Abstract: In order to enable patients to better understand their own conditions, and doctors to diagnose the disease more accurately, there have been some studies using computer technology for medical diagnosis. However, the existing technologies have the disadvantages of having more data processed by the computer, large dimensions, and overload in the process of disease diagnosis. Based on this situation, this paper proposes the technology of using Convolutional Neural Network (CNN) to process disease data. Neural networks have incomparable advantages for high-dimensional data processing. The CNN network can reduce the occurrence of data overfitting, which can greatly alleviate the problems of the current technology. This technology has positive implications for both patients and doctors.
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);卷積;疾病預(yù)測
Key words: neural network;convolution;disease prediction
中圖分類號:TP183? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)02-0248-02
0? 引言
目前人類遭受到不同疾病的侵襲。這種威脅來自于兩個方面,一方面由于病菌的變異,其耐藥能力逐漸變強,另一方面由于人類自身的生存環(huán)境面臨著變化,比如空氣質(zhì)量下降,如霧霾等。具體到我國,由于我國人口老齡化的問題日益嚴重,而老人由于人體機能的下降,所以更容易罹患各種疾病。空巢老人及病人無顧慮生活是社會穩(wěn)定和持續(xù)發(fā)展的重要因素,這也就促使患者親屬朋友或養(yǎng)老院更加高效地發(fā)展第三產(chǎn)業(yè)。此外,在保障人民健康生活貫徹落實社會主義核心價值觀的指導(dǎo)下,各地設(shè)有疾病預(yù)防控制中心,以及健康管理師通過老人院、醫(yī)院等途徑做定期檢查調(diào)整病人的飲食,作息,娛樂,按摩等人工服務(wù)私人醫(yī)生智能手機健康生化指標測定,如血脂,糖化血紅蛋白,尿酸,血壓,BMI HeHa Qi心率變異性健康測定國內(nèi)流行病與衛(wèi)生統(tǒng)計學MPH的研究通過給老人佩戴手環(huán)來記錄心跳指數(shù),位移量,速度等重要信息以便收集數(shù)據(jù)進行整理高頻危險疾病。這一類技術(shù)目前已經(jīng)比較成熟,比如①法國鷹眼,②QFS生物體微弱磁場測定,③TMI人體代謝熱層圖,④JY-NLS磁振掃描,⑤TTM熱斷層掃描成像系統(tǒng)。
1? 傳統(tǒng)研究方法
在獲取到病人身體狀況的諸多數(shù)據(jù)之后,需要對這些數(shù)據(jù)進行進一步的分析。以往這些數(shù)據(jù)都是由醫(yī)生來分析,但是數(shù)據(jù)的范圍很大,分析不同的數(shù)據(jù)也需要醫(yī)生掌握不同的專業(yè)知識,而醫(yī)生的精力也相對有限,所以這需要耗費醫(yī)生大量的精力,還會出現(xiàn)準確率比較低的情況。
采用計算機技術(shù)對疾病數(shù)據(jù)進行分析[1]的一個重要技術(shù)就是決策樹[2]。決策樹是一個預(yù)測事件的模型,它表示對象屬性與對象值之間的一種數(shù)學映射關(guān)系。局限在于對連續(xù)性的事件預(yù)測率低。對有時間維度的數(shù)據(jù),需要很多程序來處理。當類別太多時,錯誤率可能就會大大增加。所以一般用這種算法分類時只能用維度較低數(shù)據(jù)量不大的事件。
知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD)模型[3]可以通過挖掘數(shù)據(jù)中有效的,新型的,有用的信息來構(gòu)建一個模型。通過選擇性融合,回歸,相似性分析,和對數(shù)據(jù)的預(yù)處理,使其標準化和具有特征。數(shù)據(jù)主要分為三個部分包括訓練集,驗證集,測試集,九類訓練一類測試防止過擬合現(xiàn)象以及噪聲擬合來滿足支持向量機(Support Vector Machine,SVM)[4]分割最大化,但是也有不足之處,交叉驗證只能依據(jù)數(shù)據(jù)的變化來調(diào)整后期的結(jié)果。對于一些數(shù)據(jù)和測試交叉驗證還無法橫向比對,對比度單一。
上述的兩種方法在面臨高維度或者數(shù)據(jù)比較多的情況時,由于算法的約束,需要求解一個比較復(fù)雜的矩陣,這在現(xiàn)在的計算中無法完成。而深度學習作為一種利用梯度下降法進行優(yōu)化的算法,在數(shù)據(jù)量比較大的時候擁有無可比擬的優(yōu)勢。得益于目前計算機算力的增強,神經(jīng)網(wǎng)絡(luò)可以變得很深[5],這可以極大地提升精度。全連接網(wǎng)絡(luò)是把所有數(shù)據(jù)分享和外界連接起來的一個虛擬算法。它可以連接數(shù)據(jù)量較大的事件,其可靠性和安全性,延時性相當高。首先處理圖像時通過像素矩陣,使其轉(zhuǎn)化為一維向量,其次把每個像素點輸入到對應(yīng)的神經(jīng)元點上,讓一個像素對應(yīng)一個單位向量,向量中的每個元素又代表全連接中的神經(jīng)元。這樣每層形成列向量在和行向量相乘,相當于計算體積,所以會導(dǎo)致事件參數(shù)非常龐大,要處理的數(shù)據(jù)量增大,這種不加以與其他方法相結(jié)合的算法,會使效率和正確率就會急劇下降,不利于預(yù)測共享。
2? 基于CNN的疾病研究
卷積神經(jīng)網(wǎng)絡(luò),是一種可以處理大圖像的神經(jīng)網(wǎng)絡(luò),但是在語音,文字等各個領(lǐng)域也有廣泛的應(yīng)用[6]。卷積神經(jīng)網(wǎng)絡(luò)相對于全連接神經(jīng)網(wǎng)絡(luò)主要多了卷積層和池化層兩個部分。目前的卷積神經(jīng)網(wǎng)絡(luò)有一維,二維以及三維卷積神經(jīng)網(wǎng)絡(luò)。一維卷積神經(jīng)網(wǎng)絡(luò)用來處理序列類數(shù)據(jù);二維卷積神經(jīng)網(wǎng)絡(luò)可以應(yīng)用于圖像文本等識別;三維卷積神經(jīng)網(wǎng)絡(luò)主要應(yīng)用于視頻數(shù)據(jù)的一些處理或者是醫(yī)學圖片的提取和處理。所以如果應(yīng)用于醫(yī)學方面的文本數(shù)據(jù)提取可以在多方面維度進行研究。CNN有兩個基本構(gòu)層,其一是特征提取層,可以通過這層來提取信息放入到每個神經(jīng)元中,每一個神經(jīng)元都可以與和它有關(guān)系的神經(jīng)元的局部特征相呼應(yīng),在特征被提取之后,它們也有相應(yīng)的空間位置關(guān)系,這樣就可以在電腦中對病例和與他有關(guān)影響的疾病進行排查。另一個是特征映射層,網(wǎng)絡(luò)的一個平面代表一個層面,再由多個平面構(gòu)建一個映射物,使映射物上的神經(jīng)元按權(quán)重劃分重要程度,這具體要根據(jù)病發(fā)率,種類以及危險程度來判定。CNN還有一些自己獨特的優(yōu)點,比如在它的功能方面,可以通過池化層識別一些加工處理的圖片,使之在特征檢驗層隱式的從訓練數(shù)據(jù)中學習事件,在網(wǎng)絡(luò)上學習;在數(shù)據(jù)共享的方面,應(yīng)用了生物神經(jīng)網(wǎng)絡(luò)的相關(guān)技術(shù)來降低網(wǎng)絡(luò)原本的復(fù)雜程度,讓其更簡便,方便人們構(gòu)建有關(guān)數(shù)據(jù)文庫;還有一個就是輸入的神經(jīng)元可以共享,連接到網(wǎng)絡(luò)上,減少了一些不規(guī)律的參數(shù),可以降低運算量和緩和過擬合的問題,也可以通過兩次提取特征數(shù)據(jù)提高準確性。
2.1 卷積神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu)
將最原始的圖像等數(shù)據(jù)進行處理,有以下幾點:
①劃區(qū)域:把輸入的樣本,以如3×3化作一個矩陣,放入到一個坐標系中。
②得圖像:用固定的尺寸在輸入層做運算,得到有寬度長度深度的特征圖并進行卷積。
③降維:把維度降到最低,使其更好處理。
卷積神經(jīng)網(wǎng)絡(luò)在計算處理數(shù)據(jù)注意事項:1)每個神經(jīng)元看做一個濾波器;2)滑動窗口以一個步長為單位,進行滾動;3)由于每次滾動后都會和后面的窗口有交集,可以通過在外圍補零的方式來避免這類問題;4)在采納這些數(shù)據(jù)時尺寸要相同。
2.2 參數(shù)共享機制
首先要對卷積層的神經(jīng)元進行處理,因為每個神經(jīng)元就相當于我們在處理圖像時的一個濾波器,每個濾波器都會提取不同維度的特征像顏色,透明度,光影,粗糙光滑,邊緣弧度等,使之加起來可以完成整張圖像的特征提取。接下來是對卷積層的輸出,其結(jié)果是一種非線性映射,通過池化層和卷積層的合并來壓縮數(shù)據(jù)參數(shù)的量防止過擬合現(xiàn)象,這是一種常見的圖像特征提取尺度不變性的技術(shù),比如我們平常拍照,再找風景照的時候,許多人會更在意風景和人的融合度或者會使周邊環(huán)境糊化來提高人的辨識度即使這張照片被縮小或者風景繼續(xù)模糊,但我們還是可以判斷這是一個人。這就是上述圖像去除了一些無關(guān)緊要的東西而留下了最能表達圖像的特征,就是尺度不變性。另外,因為一張圖像的信息量比較大,特征也比較多,所以除去這些與我們調(diào)查無關(guān)的信息也減少了運算的量,這是池化層的一大功能。最后就是要把全連接層放在卷積神經(jīng)網(wǎng)絡(luò)的最后,前面則有神經(jīng)元的權(quán)重連接從輸入到輸出,其間有對應(yīng)的映射關(guān)系,再加之用固定的模式進行訓練,從網(wǎng)絡(luò)中輸出。CNN一個非常重要的特點就是頭重腳輕(越往輸入權(quán)值越小,越往輸出權(quán)值越多),呈現(xiàn)出一個倒三角的形態(tài),這就很好地避免了BP神經(jīng)網(wǎng)絡(luò)中反向傳播的時候梯度損失得太快。卷積神經(jīng)網(wǎng)絡(luò)CNN在用來識別一變化或者未變化的圖像時,我們可以利用特征檢驗層來進行數(shù)據(jù)的學習,因為運用了隱式的學習方法和同一映射層上面權(quán)重按比例的方法我們可以在網(wǎng)絡(luò)上一起學習,這也就是卷積神經(jīng)網(wǎng)絡(luò)更有序的原因。還有一點就是多維輸入向量的圖像可以直接輸進網(wǎng)絡(luò)里,避免了數(shù)據(jù)特征的分類和提取過程中復(fù)雜的重建過程。
2.3 技術(shù)路線
如圖1所示,由于深度學習的訓練需要用到大量的數(shù)據(jù),因此設(shè)計模型之前需要收集大量的數(shù)據(jù),在收集數(shù)據(jù)的過程中需要注意到患者的隱私問題,之后需要對這些數(shù)據(jù)進行人工的標注和預(yù)處理。根據(jù)已有的數(shù)據(jù)對模型進行設(shè)計,然后通過設(shè)計好的模型進行網(wǎng)絡(luò)的訓練,在訓練好的網(wǎng)絡(luò)上可以進行疾病的預(yù)測,根據(jù)預(yù)測結(jié)果與預(yù)期結(jié)果,可以對模型進行進一步的調(diào)整和優(yōu)化。
3? 總結(jié)與展望
健康是每個人追求生活的基礎(chǔ),老人是每個家庭港灣之所在,現(xiàn)代科技通過高新技術(shù)設(shè)計預(yù)測疾病和防護的方法,保障質(zhì)量,提高要求和標準,在建立與傳統(tǒng)方法有所提升的卷積神經(jīng)網(wǎng)絡(luò),運用與人們的生活之中,或者結(jié)合許多傳統(tǒng)方法的優(yōu)點,讓其多維化,準確化,擴大化數(shù)據(jù)處理量,眾志成城,形成一套完整的處理信息的方法應(yīng)用在事件中,但最大的還是實踐出真知,要通過不僅電腦測試還要人工親自試驗來驗證成果,也希望未來在疾病預(yù)測和人工智能方面中國有更大的突破。
參考文獻:
[1]李珊珊,田考聰.人群疾病預(yù)測模型及其應(yīng)用[J].現(xiàn)代預(yù)防醫(yī)學,2007,34(22):4277-4278.
[2]欒麗華,吉根林.決策樹分類技術(shù)研究[J].計算機工程,2004,30(9):94-96.
[3]裴韜,周成虎,駱劍承,等.空間數(shù)據(jù)知識發(fā)現(xiàn)研究進展評述[J].中國圖象圖形學報,2018,6(9):854-860.
[4]祁亨年.支持向量機及其應(yīng)用研究綜述[J].計算機工程,2004,30(10):6-9.
[5]朱大奇.人工神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀及其展望[J].江南大學學報,2004,3(1):103-110.
[6]常亮,鄧小明,周明全,等.圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J].自動化學報,2016,42(9):1300-1312.