吳筱菁
(北京交通大學計算機與信息技術學院,北京 100044)
功能磁共振成像(fMRI)是近年來發展日益成熟的一種腦功能成像方式,其數據分析目標包括定位腦激活區域、確定腦功能網絡等,能為評估大腦如何處理認知信息提供有用的線索[1]。由于fMRI數據維度高,一般樣本量較小,特征常具有高度共線性[2],普通分析方法難以得到解釋性好的模型。正則化回歸能進行稀疏的特征選擇,可以較好地適用于fMRI數據,其中彈性網回歸[3]是性能比較穩定的一種,Carroll等人[4]的研究表明彈性網回歸方法分析fMRI數據能得到優良的預測模型,證明了其可靠性和穩定性。
本文將介紹彈性網回歸方法的基本原理,分析其應用在功能磁共振數據分析中的優勢,并整理近年其應用情況,最后提出總結和展望。
對于樣本量為N,特征維度為ρ的線性回歸模型

其中ε~N(0,σ2)為誤差項,βj為模型的回歸系數,i=1,2,…,N, j=1,2,…,р。使用帶有彈性網懲罰項的最小二乘法估計模型參數即估計回歸系數βj,βo,以使損失函數最小化:

其中,懲罰項為


彈性網回歸方法的懲罰項由lasso懲罰項(‖β‖1)和嶺回歸懲罰項(1/2‖β‖2)組成,式(2)中正則化參數 λ 能夠調節模型的稀疏程度,λ 值越大,模型稀疏度越大;式(3)中的正則化參數α調節嶺回歸懲罰項和lasso懲罰項之間的比例,取值范圍分別是,λ>0,α∈[0,1]。
彈性網回歸懲罰項中Lasso用于使許多參數收縮到零值,進而獲得稀疏預測模型,并選擇一些相互關聯的變量包含在模型中,并可應用于預測變量的數目遠大于被試數目的情形[5]。嶺回歸是專用于共線性數據分析的有偏估計回歸方法,通過放棄最小二乘法的無偏性,以損失部分信息、降低精度為代價獲得回歸系數的穩定的數值解,將相關預測因子的系數相互收縮,使相關變量的參數具有大致相同的值[6];
lasso回歸未考慮特征之間的關聯性,不適用于多重共線性變量;嶺回歸沒有實際系數為零的預測因子,不能進行模型選擇[7];彈性網回歸方法將二者結合,通過交叉驗證進行特征選擇時,可以得到理想的稀疏模型,并補償觀測變量之間的相關性帶來的影響。
疾病相關的fMRI研究涉及阿爾茲海默癥等多種神經系統病變性疾病。彈性網回歸用于選擇可靠的特征以區分健康人與疾病患者,有助于疾病的輔助診斷。針對阿爾茲海默癥,Schoutena等人[7]使用多模式結合方法,利用彈性網分類結合多種磁共振成像,得到阿爾茲海默癥患者與健康人的良好分類器。Bowman等人[8]進行了尋找帕金森病早期診斷的相關生物標記的研究,提出一種統計框架以確定可靠的特征區分帕金森患者與健康人。將彈性網懲罰法應用到邏輯斯蒂回歸,并引入附加標準,獲得了較高的分類準確率。
基于正常人的研究普遍驗證了彈性網方法的有效性,為了解人的大腦發育過程及大腦各區域相互作用模式提供了有價值的信息。Mohr等人[9]研究大腦功能定位的整合過程,選取健康成年人進行視覺刺激和響應的任務,基于任務態fMRI數據分別使用彈性網回歸、 GraphNet等方法進行稀疏分類任務,為大腦功能定位整合過程的解讀提供了新的視角。Tian等人[10]使用健康成年人的靜息態fMRI數據,通過彈性網回歸方法進行回歸預測及分類任務。研究發現人在成年早期至中期,大腦各區域功能相互作用發生了可見的改變,成年中期時大腦的功能已經開始退化。
彈性網回歸在不同情況下的應用效果一直也是研究者們關心的問題。Wehbe等人[11]通過閱讀任務相關的fMRI數據,結合空間平滑方法,比較了彈性網回歸等一系列正則化回歸方法的預測效果,發現正則化的密度對于識別與任務相關的大腦激活體素的重要作用,且不同正則化方法的使用效果相當,尋求更優分析方法還與建模的謹慎性有所關聯。Belilovsky等人[12]利用健康被試和可卡因成癮被試的任務態fMRI數據,比較了lasso、彈性網及k支持項三種方法的回歸預測效果、穩定性及結果可解釋性,發現k支持項的回歸方法較另兩種有更好的預測效果,同時具有優良的計算特性。此外與可卡因成癮相關的結果和前人的研究相吻合,進而證明了k支持項回歸方法的有效性。
除常規應用之外,研究者們近年來對彈性網回歸進行了各種方式的延伸和擴展,取得了不同程度的效果。Lorbert等人[13]基于任務態fMRI使用彈性網正則化的支持向量機進行自動特征選擇,證實了該方法在真實的fMRI數據中應用的有效性。Gkirtzou等人[14]針對常規fMRI分析中體素之間關系的編碼信息被忽略的問題進行了探究,考慮大腦內在的空間結構,嘗試提高功能磁共振圖像分析的預測效果。經真實數據的檢驗,該方法的性能優于嶺回歸及彈性網回歸,同時驗證了大腦體素之間的連接包含腦結構的補充信息這一假設。
作為一種收縮和選擇的方法,彈性網能夠產生稀疏的模型,并保證良好的預測準確率,同時鼓勵分組效應。已有的實際結果和模擬已廣泛的證明,彈性網優于lasso的優越性能,以及在神經影像科學研究中的有效性。分類算法中,彈性網的優良特性能夠得到更好地提現。未來彈性網作為一個重要的基礎,能得到更多廣泛的應用。
[1]Belilovsky E,Gkirtzou K,Misyrlis M,et al.Predictive sparse modeling of fMRI data for improved classi fi cation,regression,and visualization using the k-support norm[J].Computerized Medical Imaging & Graphics,2015,46 Pt 1(1):40.
[2]Bunea F,She Y,Ombao H,et al.Penalized least squares regression methods and applications to neuroimaging[J].Neuroimage,2011,55(4):1519-27.
[3]Zou H, Hastie T. Regularization and variable selection via the elastic net[J].Journal of the Royal Statistical Society:Series B (Statistical Methodolo gy),2005,67(2):301-320.
[4]Carroll M K,Cecchi G A,Rish I, et al. Prediction and interpretation of distributed neural activity with sparse models[J]. Neuroimage,2009,44(1):112.
[5]Bunea F, She Y, Ombao H, et al. Penalized least squares regression methods and applications to neuroimaging[J].NeuroImage,2011,55(4):1519-1527.
[6]Khundrakpam B S,Tohka J,Evans A C. Prediction of brain maturity based on cortical thickness at different spatial resolutions[J].Neuroimage,2015,111:350.
[7]Schouten T M,Koini M,De V F,et al.Combining anatomical,diffusion, and resting state functional magnetic resonance imaging for individual classi fi cation of mild and moderate Alzheimer's disease[J]. Neuroimage Clinical,2016,11:46.
[8]Bowman D B,Drake D F,Huddleston D E.Multimodal Imaging Signatures of Parkinson's Disease[J].Frontiers in Neuroscience,2016,10.
[9]Mohr H,Wolfensteller U,Frimmel S,et al.Sparse regularization techniques provide novel insights into outcome integration processes[J].Neuroimage,2015,104:163-176.
[10]Tian L, Ma L, Wang L. Alterations of functional connectivities from early to middle adulthood:Clues from multivariate pattern analysis of resting state fMRI data[J].Neuroimage,2016,129:389.
[11]Wehbe L, Ramdas A, Steorts R C,et al.Regularized brain reading with shrinkage and smoothing[J].2014,9(4).
[12]Kumawat G, Singh G, Gireesh C,et al.Predictive sparse modeling of fMRI data for improved classification,regression, and visualization using the k -support norm[J].Computerized Medical Imaging & Graphics the Official Journal of the Computerized Medical Imaging Society,2015,46 Pt 1(1):40.
[13]Lorbert A, RamadgePJ. The Pairwise Elastic Net support vector machine for automatic fMRI feature selection[C]//IEEE International Conference on Acoustics, Speech and Signal Processing. IEEE, 2013:1036-1040.
[14]Gkirtzou K,Honorio J,Samaras D,et al.fMRI Analysis with Sparse Weisfeiler-Lehman Graph Statistics[M]//Machine Learning in Medical Imaging.Springer International Publishing,2013:90-97.