滕升華,商勝楠△,王芳,趙增順,2
(1.山東科技大學電子通信與物理學院,青島 266590;2.山東大學控制科學與工程學院,濟南 250061)
對阿爾茨海默病(Alzheimer′s disease,AD)及其前期階段——輕度認知障礙(mild cognitive impairment,MCI)的計算機輔助診斷一直是神經影像分析領域的研究熱點,目的是利用計算機分析方法處理腦影像數據實現對患者的精確診斷。迄今為止,許多模式識別和機器學習方法被開發并應用于辨別AD、MCI和正常群體(normal control,NC)[1-3]。
在此類神經組織退化疾病的診斷中,常用到結構性腦影像數據如磁共振圖像[4]。由于腦影像數據通常維數非常高,因此,不宜直接在原始圖像域進行類別分析,而是通過特征提取和特征選擇,最終在低維空間實現分類。在眾多分類方法中,支持向量機因分類精度高且應用簡便而被廣為采用[5-6]。然而對于腦影像等高維、含噪數據支持向量機的分類性能則會顯著下降[7]。
近年來,基于稀疏表示的分類方法逐漸受到重視[8-10]:將各類別的訓練樣本混合起來組成字典,根據字典以稀疏表示的形式重建待識別樣本;在對待識別樣本的稀疏表示中,各類別的訓練樣本貢獻不同,識別結果判定為在稀疏表示中貢獻最大的類別。
基于稀疏表示的分類機理是尋找能夠最好地表示待識別樣本的類別,默認前提是樣本能且僅能被同類樣本精確地表示。但是如果訓練樣本構建的字典是非完備的,某些待識別樣本不能被訓練字典精確地表示,相應地可能會得到錯誤的分類結果。因此,稀疏表示分類器的識別能力受限于字典表示未知樣本的能力,對于特征維數高而訓練樣本數量相對較少的情形更是如此。
增強字典的表示能力是優化稀疏表示分類器的有效方法,由此產生了一些改進的稀疏表示分類器。有研究者提出引入類內差異構造增強型的字典[11],或者采用字典學習得到可分性更強的字典[12-13]。這些改進方法是計算機視覺領域中專為人臉識別而設計的,并不適用于數據維數相對更高而訓練樣本數量更少的AD診斷。
構造增強字典用到的類內差異[11]是指同類樣本之間的差別,被認為包含了一定成分的樣本細節信息。本研究首先對各類樣本進行聚類,得到若干子類中心,以這些子類中心而非原始樣本構建第一層字典;計算每個樣本與最近子類中心的差作為類內差異,構建補充性的第二層字典。兩層字典聯合起來對待識別樣本進行稀疏表示,實現一種基于復合稀疏表示的分類器,并通過實驗驗證該分類器用于診斷阿爾茨海默病的有效性。
常規的稀疏表示分類器首先將待識別樣本表示成包含所有類別訓練樣本的線性組合,通過計算在此聯合表示中每類訓練樣本對待識別樣本的表示結果,最終將待識別樣本判定為表示誤差最小的類別。改變字典結構或者利用不同的稀疏表示形式會產生不同的稀疏表示分類器。
類似于圖像分解,將圖像表示成主體結構和紋理信息之和,本研究利用混合稀疏表示將待識別樣本分解為兩層內容:與類別相關的主體結構和與類別無關的通用細節,根據各類別主體結構在聯合稀疏表示中的貢獻量實現分類。

(1)
依據上式的表示系數,分別計算獨立利用每類樣本表示待識別樣本y的誤差。
(2)
將y判定為表示誤差最小的類別。
Label(y)=arg miniri(y)
(3)
常規的稀疏表示分類器利用原始形式的訓練樣本構造字典,該方法在人臉識別中的應用表明:精心選擇訓練樣本而且每類的樣本數量都足夠多,稀疏表示分類器能夠實現較好的識別效果。然而對于實際的AD分類問題,相對于腦影像數據的高維度,訓練樣本數量明顯不足。因此,在常規的稀疏表示框架下,現有的訓練數據不足以精確地表示待識別樣本。
也正如人臉識別中同一個人的不同圖像之間可能存在明顯的表情、光照、妝扮等差異,而這些細節因素并非決定類別的關鍵,直接堆砌訓練樣本會降低稀疏表示的分類精度。在AD分類中即使同類的腦影像數據之間通常也會表現出顯著的個體差異,為對樣本進行篩選,本研究利用聚類方法得到各類的若干子類,進而挑選出每類的若干典型樣本構成基礎字典。
另一方面,挑選樣本會減小字典規模,進一步降低字典對未知樣本的表示能力。為此,利用樣本間的差異構成補充性字典,對基礎字典在表示待識別樣本時的誤差進行編碼,最終實現對待識別樣本的精確表示。文中采用基礎字典加補充性字典的雙層字典模式。


利用雙層字典D+V,待識別樣本y可以表示為
y=Dα+Vβ+e
(4)
其中α和β是系數向量,e是表示誤差。利用L1范數最小化計算稀疏表示系數(λ1、λ2是調節稀疏程度的參數):
(5)
采用增廣拉格朗日乘子法(Augmented Lagrange multiplier,簡稱ALM)[15]進行求解,得:
(6)


求解公式 (6)的ALM算法:輸入:D、V、y、λ1、λ2初始化:α=0,β=0,?=0, ξ=1,ξmax=104,ρ=1.5,ε=10(-4)While ‖y-Dα-Vβ‖22>εdo1.固定其他參數更新αα=arg minαξ2‖(y-Vβ+1ξ?)-Dα‖22+λ1‖α‖12.固定其他參數更新ββ=arg minβξ2‖(y-Dα+1ξ?)-Vβ‖22+λ2‖β‖13.更新拉格朗日乘子?=?+ξ(y-Dα-Vβ)4.更新參數 ξ=min(ξmax,ρξ)end輸出:α,β
在基于雙層字典的復合稀疏表示中,第一層字典存儲區分類別的主體結構信息,第二層字典提供補充性細節,以彌補僅用第一層字典表示待識別樣本的信息缺失。稀疏表示分類器根據各類別的表示誤差決定類別歸屬,因此計算表示誤差除利用對應類別的第一層字典元素之外、還可共用所有類別提供的類內差異。
表示誤差定義為:
(7)
同樣依據公式(3),類別標簽取最小的ri(y)對應的類別。
利用本研究提出的復合稀疏表示分類器(hybrid sparse representation based classifier,HSRC)針對取自ADNI(Alzheimer’s Disease Neuroimaging Initiative,ADNI)數據庫的磁共振影像進行分類實驗,并與支持向量機[5](support vector machine,SVM)、稀疏表示分類器[9](sparse representation based classifier,SRC)及基于多分類器集成的稀疏表示分類器[7](ensemble sparse representation based classifier,ESRC)進行比較。采用文獻中常用兩類別分類實驗,具體包括AD-NC分類、MCI-NC分類。
實驗中共采用了652個樣本,包括198個AD、225個MCI和229個NC。在大腦的磁共振影像中,相對于白質和腦脊液,灰質部分與AD的診斷相關性更強[7],因此,以驗證算法的有效性為目的,本研究僅使用灰質密度作為樣本特征。
灰質密度圖的維數是256×256×256,為減少數據量將其下采樣變為64×64×64。利用t-檢驗對全腦體素進行篩選以去除與分類任務相關性弱的體素,取P值大于0.005的體素構成最終的特征向量。公式(6)中調節兩層字典稀疏度的參數分別取λ1=0.1,λ2=0.001。這兩個參數的選擇借鑒了文獻[13]的處理思路,本研究中采用稀疏與稠密相結合的表示方式;本研究中λ1取值較大強化與類別相關的第一次字典在聯合表示中的稀疏性以利于分類,同時認為第二層字典不包含類別信息而使λ2取較小值以更精確地表示待識別樣本。實驗中發現只需遵循λ1取值相對較大、λ2取值小的設置,實驗結果對二者數值的變化并不敏感(比如λ2取0.001還是0.002幾乎不影響識別結果,這也體現了算法對參數選擇的魯棒性)。
實驗數據是198個AD樣本和229個NC樣本,利用10交叉驗證評估最終的識別結果。復合稀疏表示分類器HSRC與SVM、SRC、ESRC的識別結果見表1。與其他三種方法相比,HSRC表現出了更好的分類性能,準確率、靈敏度、ROC曲線下面積等指標數值最高;為了達到最佳的綜合性能,特異度指標稍低。圖1為幾種方法ROC曲線的對比,可以看出HSRC綜合性能最優。

表1 AD/NC分類的性能比較

圖1 AD/NC分類中四種方法的ROC曲線
該實驗比較不同方法對225個MCI樣本和229個NC樣本的分類性能,結果見表2。同AD-NC分類結果一致,本研究提出的方法對應的準確率、靈敏度、ROC曲線下面積等三個指標數值最高,綜合性能最優,ROC曲線見圖2。

表2 MCI/NC分類的性能比較
對于高維小樣本的識別問題,原始形式的訓練樣本不足以精確地表示待識樣本,從而造成常規稀疏表示分類器性能下降。將稀疏表示中的字典分解為功能不同的兩個層次:第一層由各類經聚類篩選出的典型樣本組成,以期在字典中排除離群樣本又保留類別間的可分性特征;第二層字典的元素是各類中普通樣本與典型樣本的差,這種類內差異體現了同類樣本內部的個體多樣性、而不攜帶顯著的類別區分性信息。

圖2 MCI/NC分類中四種方法的ROC曲線
基于兩層字典的協同工作,設計了一種復合稀疏表達形式,并構建分類器用于阿爾茨海默病的計算機輔助診斷。在ADNI數據庫上的分類實驗結果表明,與常規稀疏表示分類器及支持向量機相比,這種復合稀疏表示分類器的識別能力更強。
最后需要特別指出,本研究的主要貢獻是設計了適用于阿爾茨海默病診斷的復合稀疏表示分類器,為與其他分類器進行比較僅利用灰質密度作為樣本特征。后續工作中將該分類器推廣到多模態及縱向腦影像數據,并融合特征選擇、多分類器集成等策略能進一步提高相關疾病計算機輔助診斷的準確率和可靠性。