張巧麗,遲學斌,趙 地
1(中國科學院 計算機網絡信息中心,北京 100190)
2(中國科學院大學,北京 100049)
帕金森疾病(Parkinson’s Disease,PD)又名震顫麻痹,老年人中樞神經系統第二大常見退行性疾病,其特點是黑質致密部多巴胺能神經元逐漸喪失,運動功能受損[1],并且表現為多巴胺能(DopAminergic,DA)神經元進行性喪失的特征[2].該病癥的平均發病年齡大概在60歲左右,40歲以下發病的青年帕金森病較少見.據統計,在全世界大約有七百萬到一千萬的老年人正在承受著該疾病的困擾.我國65歲以上人群PD的患病率大約是1.7%[3],大部分帕金森患者為散發病例,僅有不到10%的患者有家族史,所以到目前為止PD的病因和發病機制還未明確.
多系統萎縮癥(Multiple System Atrophy,MSA)是一種緩慢進行性的神經退行性疾病[4],其特征在于以帕金森綜合征為主的MSA-P亞型運動減退性障礙和以小腦性共濟失調(cerebellar ataxi)為主的MSA-C亞型肢體共濟失調.
核磁共振成像(Magnetic Resonance Imaging,MRI)是斷層成像的一種,它利用磁共振現象從人體中獲得電磁信號,并重建出人體信息.目前該方法已經被廣泛的應用于醫學成像.并且在核磁共振圖像中我們可以獲取物質的多種物理特性參數,如質子密度,自旋-晶格馳豫時間T1,自旋-自旋馳豫時間T2,擴散系數,磁化系數,化學位移等等.在本實驗中根據醫生建議采用磁共振擴散加權成像(Diffusion Weighted Imaging,DWI)、T2和冠狀面T2水抑制序列(CorT2)三種MRI圖像.
目前醫學科技發展迅速,但是對于帕金森疾病的診斷多數通過病人的臨床癥狀才能確診;然而,國內外專家通過大量臨床經驗及實驗證明,帕金森的主要病理改變是黑質紋狀細胞的進行性損失和細胞內路易斯小體的聚集,從黑質、紋狀體DA能神經元變性-丟失-出現臨床癥狀要經歷一個漫長的臨床前過程,潛伏期約5年,黑質DA能神經元丟失<50%的患者臨床癥狀不明顯.當患者出現PD臨床癥狀時,腦內DA能神經元丟失70%~80%[5].
在MR高分辨率T2WI加權像/磁敏感加權成像(SWI)上正常黑質核團-1軸位形似燕尾,稱為燕尾征.PD病理特點是存在于黑質中的多巴胺能神經元進行性缺失.先前研究發現黑質種存在5個黑質小體,且最大的黑質小體-1是主要影響PD病理改變的結構.黑質小體-1位于黑質后1/3,軸位SWI上表現為條狀或者逗號形的高信號,形似燕尾.黑質小體所表現的“燕尾”前方、側面和內側被SWI低信號圍繞,可見分叉.“燕尾征”消失用于診斷帕金森病準確率大約為90%,對于帕金森患者而言,黑質小體-1信號較低,表現為燕尾征消失[6],如圖1所示.

圖1 PD患者腦圖(中心標注“燕尾癥”區)
常規MRI檢查可見:1)腦萎縮:主要是錐體外系萎縮引起第三腦室增寬,彌漫性腦皮層萎縮所致的腦溝增寬.2)黑質致密帶萎縮:在T2加權像/質子密度加權像上,猶豫正常腦組織黑痣網狀帶和紅核中存在高濃度鐵,呈低信號;致密帶鐵濃度較低音器局部呈等信號.此外,還可見PD患者因黑質細胞變性壞死和鐵代謝已成引起的致密帶變窄、邊緣模糊等表現.通過觀察黑質致密帶形態、信號變化、測量黑質致密帶寬度以及黑質致密帶寬度與中腦的比值,為診斷PD和鑒別診斷PD與血管性帕金森綜合征提供客觀依據.3)由殼核后外側部鐵沉積引起T2加權像上紋狀體區呈低信號[7].
到目前為止,將深度學習方法和帕金森病癥診斷相結合的研究主要在以下方面.Al-Fatlawi和Jabardi等提出使用深度信念網絡(Deep Belief Network,DBN)[8]進行帕金森病癥診斷,其中分析的信息為病人的語音信號.該深度信念網絡由兩個受限玻爾茲曼機[9]和一個輸出層構成,第一個進行無監督學習,第二個是進行反向傳播微調的監督學習.在該研究中測試的準確度達到94%.Shamir和Dolber[10]等提出使用深度學習方法檢測病人的肢體遲緩程度,然后進行分類診斷.在比較傳統機器學習方法和基于卷積神經網絡的深度學習方法中,深度學習在準確率方面優于其他機器學習方法4.6個百分點.以上研究均是基于將深度學習方法和帕金森診斷相結合的.然而本實驗采用帕金森患者的腦圖作為病癥診斷依據在以上帕金森病癥病理診斷中已經做了充分調查研究,實際效果也體現了實驗可行性.這也是本實驗得創新之處.
本實驗采用對圖像識別有良好效果的深度學習(Deep Learning,DL)方法,通過深度神經網絡模型訓練大批量的MRI圖像,并學習圖像的特征,然后進行病癥的預測和診斷.實驗中采用的網絡是基于AlexNet網絡的優化網絡.AlexNet是2012年在ImageNet比賽中脫穎而出的網絡,其良好的分類效果斬獲了當年的比賽冠軍.GoogleNet是2014年ImageNet的比賽冠軍.本實驗采用的基礎對照模型為AlexNet和GoogleNet,然后基于AlexNet模型進行優化,優化后的模型在實驗中獲得優于原始模型的效果,并且也優于經典網絡GoogleNet.
2006年,深度學習以機器學習領域的一個分支呈現給人們,它采用多層復雜結構或者采用多重非線性變換構成的多個層進行數據處理[11].到目前為止,深度學習在自然語言處理、語音識別特別是計算機視覺方面取得了突破性進展[12].深度學習的優點在于應用分層的高效特征提取方法來代替手工獲取特征,這有效的解決了大批量的人工標注工作.深度神經網絡層次結構如圖2.

圖2 深度神經網絡多層結構
深度學習的基本思想是通過構建如上圖所示多層次神經網絡,從底層向高層逐步學習提取特征,最終通過大批量數據的訓練學習,構建對應的網絡模型,學習訓練對象的相關特征.
目前常見深度神經網絡主要包括:卷積層、池化層、激活層等.
1962年,Hubel和Wiesel通過研究貓眼的瞳孔區域和大腦皮層神經元,提出了感受野(receptive field)的概念[13].后來學者Fukushima又基于此概念提出神經認知機(neocognitron),這是感受野概念在人工神經網絡領域的第一次應用.
含有卷積層的神經網絡為多層神經網絡,該卷積層有多個二維矩陣構成,每個矩陣有多個獨立神經元構成.卷積層的核心在于通過感受野和權值共享的應用減少了深度神經網絡要訓練的參數個數.如圖3所示.

圖3 全連接和局部連接
權值共享為設每個神經元的參數相同,感受野即對應卷積核局部學習的概念,通過上圖參數對比可知該計算減少了4個數量級[14].
池化層包含兩種:一種是平均值池化,另一種是最大值池化.
池化操作是特征圖縮小操作,會在原特征圖中提取主要特征.
因為線性模型的表達能力不夠,所以引入了非線性模型.激活層實現的是對輸入數據的激活即非線性函數變換.常用的激活函數有Sigmoid,tanh,ReLU[15]等,可以根據模型效果選擇不同的激活,通過激活層可以實現數據的更好分類.

圖4 最大值池化

圖5 平均值池化
本實驗數據來自北京301醫院,其原始數據為DICOM(Digital Imaging and Communications in Medicine)圖像,通過RadiAntDICOMViewer軟件將病人信息刪除并導出img格式.其中詳細為:訓練集:13 571;驗證集:2396(占訓練集的15%);測試集:2237(占總數據的10%).
圖6分別為PD、MSA和Normal(正常人)腦圖.

圖6 PD,MSA和Normal的腦圖
由于深度神經網絡訓練需要批量數據學習特征,所以實驗時需要將原始數據進行擴充,本實驗采用以下兩種方式進行數據擴充.
3.2.1 圖像的旋轉
圖像旋轉是指圖像以某一點為中心旋轉一定的角度形成一幅新的圖像的過程,并且旋轉前后的點離中心的位置不變.假設點(x0,y0)距離原點的距離為r,點與原點之間的連線與x軸的夾角為b,旋轉的角度為a旋轉后的點為(x1,y1),那么:
原始點的位置:

旋轉后點的位置:

得到旋轉后的坐標,旋轉后的圖像的長和寬會發生變化,要重新計算新圖像的長和寬,計算方法如下:設原始圖像長為srcH,寬為srcW,以圖像中心為原點左上角,右上角,左下角和右下角的坐標用于計算旋轉后的圖像的高和寬,它們大小分別為:
旋轉之后的坐標分別設為pLTN,pRTN,pLBN,pRBN,大小分別為:

旋轉后的長和寬分別設為desHeight,desWidth,大小為:

原始圖和旋轉90°后的圖像如圖7所示.
3.2.2 圖像的鏡像處理
圖像的鏡像分為水平鏡像和垂直鏡像.設圖像的寬為width,長度為height,(x,y)為變換后的坐標,(x0,y0)為原圖像的坐標,
垂直鏡像變換:

其逆變換:

水平鏡像:

其逆變換:


圖7 原始圖(左)旋轉 90°后(右)
在本實驗中采用的是垂直鏡像,實現左右腦圖像的對稱交換.垂直鏡像圖像對比如圖8.

圖8 原始圖(左)鏡像處理后(右)
AlexNet神經網絡主要包括八個網絡層,5個卷積層,3個全連接,在每個卷積層內部有更加細致的層次劃分,如圖9所示.優化后網絡如圖10.
在第五層的池化層后,添加歸一層:



圖9 AlexNet神經網絡結構

圖10 優化的神經網絡結構
對比如上網絡結構可知在原有AlexNet神經網絡的第五層,本實驗添加了norm5網絡層結構.對于加norm5實現的是Batch Normalization操作,在訓練深度神經網絡的過程中,其復雜性在于隨著前幾層參數的變化,每層輸入的分布在訓練過程中也發生改變,所以導致了在訓練的過程中學習率(learning rate)要設置的非常小,減慢了訓練速度,該現象被稱為internal covariate shift[16],由于本實驗圖像的多樣性(腦部的不同位置截圖),所以通過在第五層連接全連接層的位置添加歸一化層,通過歸一化輸入全連接層的數據,將其規范化為模型架構的一部分,使得模型可以使用更高的學習率,加速收斂,并且提升了模型效果.算法實現如下.

以上算法實現了對x的小批量激活轉換.
2015年Ioffe和Szegedy,將該方法應用在Inception network[17]用來進行ImageNet classification分類,取得了第五名4.82%的錯誤率,超出了人類的準確率.
GoogleNet以其較深且復雜的網絡結構在2014年脫穎而出,其主要創新在于根據深度和寬度受限設計的,并且設計了兩個輔助loss,是當下比較成熟的深度神經網絡,所以以其作為對照實驗.
針對以上兩種模型進行了四組實驗,分別是PD vs Normal,PD vs MSA,MSA vs Normal 和PD vs MSA vs Normal.以上模型訓練的GPU設備配置了13塊NVIDIA Tesla K80,Intel(R)Xeon(R)CPU E5-2640 v4 6核處理器(2.40 GHz).四組實驗12個模型可以同時訓練,所有模型訓練完成不超過20 min.實驗結果如圖11至圖22.
4.2.1 PD vs Normal(PN)
對于PD和Normal即帕金森病癥和正常人進行分類實驗中(如圖11至圖13),在原有AlexNet實驗的基礎上準確率獲得了0.2%的提升,驗證集損失獲得了0.01的降低,訓練集損失獲得了0.04的降低.

圖11 優化網絡結果

圖12 原AlexNet網絡結果

圖13 GoogleNet網絡結果

圖14 優化網絡結果
4.2.2 PD vs MSA(PM)
對于PD和MSA即帕金森病癥和多系統萎縮進行分類實驗中(如圖14至圖16),在原有AlexNet實驗得基礎上準確率獲得了1%的提升,驗證集損失保持持平,訓練集損失獲得了0.01的降低.

圖15 原AlexNet網絡結果

圖16 GoogleNet網絡結果

圖17 原AlexNet網絡結果

圖18 優化網絡結果

圖19 GoogleNet網絡結果

圖20 優化網絡結果
4.2.3 MSA vs Normal(MN)
對于MSA和Normal即多系統萎縮病癥和正常人進行分類驗證的實驗中(如圖17至圖19),在原有AlexNet的實驗基礎上準確率獲得了0.3%的提升,驗證集損失獲得了0.01的降低,訓練集損失獲得了0.03的降低.

圖21 原AlexNet網絡結果

圖22 GoogleNet網絡結果
4.2.4 PD vs MSA vs Normal(PMN)
對于PD、MAS和Normal即帕金森病癥、多系統萎縮癥和正常病人三種圖像分類的實驗中(如圖20至圖22),在原有AlexNet的實驗基礎上準確率獲得了0.6%的提升,驗證集損失獲得了0.12的降低,訓練集損失與原實驗保持持平.
對照原AlexNet實驗結果和優化網絡的實驗結果以及GoogleNet實驗結果匯總如表1至表3.
由上表數據分析,優化的網絡結構除了比原AlexNet網絡結構較好之外,通過和GoogleNet的Acc和Loss的相關數據對比可知,優化的網絡依然優于GoogleNet.

表1 原AlexNet實驗指標匯總

表2 優化網絡實驗指標匯總

表3 GoogleNet實驗指標匯總
本實驗基于AlexNet神經網絡結構設計了優化版的神經網絡.通過對改進的AlexNet網絡和原始網絡分別在四組數據中的實驗結果進行分析,改進版的AlexNet展示出了較好的分類效果,并且優化版的神經網絡和GoogleNet實驗結果指標對比中依然占優勢.由于本實驗數據量有限,可能存在些許誤差,但本實驗為今后的網絡優化提供了參考因素,并且對于醫學圖像的分類實現了全自動化,避免了人工篩選造成的誤差.并且對PD的早期診斷和區別PD和MSA病癥提供了研究意義.
致謝
特別感謝北京301醫院提供的實驗數據以及相關指導.