



摘 要:針對LASSO方法構建腦功能超網絡模型缺乏組效應解釋能力和網絡有偏性問題,提出了兩種基于組變量選擇的近似無偏稀疏腦功能超網絡模型來改善超網絡的構建,分別為組最小最大凹懲罰方法和組平滑剪裁的絕對值偏差方法,并將其分別應用于抑郁癥的分類研究中。分類結果顯示,兩種方法的分類表現均優于傳統超網絡模型,且組最小最大凹懲罰方法的分類準確率最高,達到86.36%。結果表明若想構建有效的腦功能超網絡模型,不僅需要考慮腦區間組效應的解釋能力,還需考慮模型變量選擇的有偏性問題。而且在考慮到超網絡有偏性的基礎上,選取較為寬松的懲罰方式來選取目標變量,則可更精確地表征人腦的復雜高階多元交互信息。
關鍵詞:近似無偏稀疏模型; 超網絡; 組最小最大凹懲罰; 組平滑剪裁的絕對值偏差; 機器學習
中圖分類號:TP181 文獻標志碼:A
文章編號:1001-3695(2022)03-017-0744-07
doi:10.19734/j.issn.1001-3695.2021.08.0363
基金項目:國家自然基金資助項目(61672374,61876124,61472270,61741212,61976150,61873178);山西省重點研發計劃項目(201803D31043);山西省科技廳應用基礎研究項目青年面上項目(201801D121135,201803D31043);山西省研究生教育創新項目(2020BY131)
作者簡介:李瑤(1996-),女,山西運城人,博士研究生,主要研究方向為智能信息處理、腦影像學;周子淏(2000-),男,山西太原人,本科生,主要研究方向為人工智能;梁家瑞(2000-),男,山西運城人,本科生,主要研究方向為智能影像處理;Ibegbu Nnamdi Julian(1993-),男,尼日利亞人,碩士研究生,主要研究方向為腦影像學;郭浩(1981-),男(通信作者),山西太原人,教授,碩導,博士,主要研究方向為人工智能、腦影像學與醫療大數據研究(feiyu_guo@sina.com);陳俊杰(1956-),男,山西太原人,教授,博導,博士,主要研究方向為數據挖掘、人工智能與腦影像學.
Construction and classification research of approximately unbiased sparse
brain functional hypernetwork model based on group selection
Li Yaoa, Zhou Zihaob, Liang Jiaruic, Ibegbu Nnamdi Juliana, Guo Haoa?, Chen Junjiea
(a.College of Information amp; Computer, b.College of Mathematics, c.College of Software, Taiyuan University of Science amp; Technology, Jinzhong Shanxi 030600, China)
Abstract:Aiming at the problem of the lack of group effecting explanation ability and network bias in the brain functional hyper-network model based on the LASSO method, this paper proposed two approximate unbiased sparse brain function hypernetwork models based on group variable selection to improve the construction of hypernetworks, such as the group minimax con-cave penalty (gMCP) method and the group smoothly clipped absolute deviation method (gSCAD). Then it applied them to the classification research of depression. Classification results show that the classification performance of the two proposed methods are better than the traditional hyper network model, and the classification accuracy of gMCP is the highest, reaching 86.36%. These results indicate that in order to build an effective brain functional hypernetwork model, not only the group effecting should be considered, the bias in the selection of model variables should also be considered. Moreover, taking into account the bias of the hypernetwork, it can more accurately represent the complex and high-order multivariate interactive information of the human brain that choose a more relaxed punishment method for the selection the target variable.
Key words:approximate unbiased sparse model; hyper-network; group minimax concave penalty; group smoothly clipped absolute deviation; machine learning
0 引言
近些年來,功能磁共振技術已被廣泛用于腦網絡的研究中。靜息態功能磁共振影像(resting-state functional magnetic resonance imaging, rs-fMRI)技術利用血氧水平依賴(blood oxygen level-dependent,BOLD)信號來檢測內源性或自發性大腦神經元活動[1]。基于BOLD信號,可將人腦以網絡的形式表征從而探索腦精神疾病的病理機制。目前已被成功應用于腦精神疾病的診斷中[2, 3]。
在現有的腦功能網絡研究中,大多數研究人員均基于相關的方法來表征腦區間的功能關系[4]。然而,這些方法僅僅能夠捕獲成對的信息,不能有效反映多個腦區間充分且完整的多元信息交互[5]。研究發現,人腦中的一個腦區往往與神經系統中的多個腦區直接交互[6]。同時,最近的神經科學研究表明,在神經元的真實活動中存在重要的空間多元交互,例如在皮質動態、局部場電位以及神經元同位素示蹤中[7]。基于此,超網絡理論引入人腦網絡中[8],其超邊包含多個節點,可用于表征多個腦區間信息的交互。
目前,人腦功能超網絡模型主要通過星型擴展[9]和稀疏表示方法[8]兩種來構建。研究表明星型擴展缺乏數據自適應能力,同時對噪聲敏感[10]。而稀疏表示方法能夠克服星型擴展的局限性,具有數據自適應以及噪聲魯棒性的特性[11],因此已經得到研究人員的認可,被廣泛應用于基于腦功能超網絡模型的腦精神疾病診斷中。稀疏表示方法主要是通過引入不同的懲罰項求解線性回歸模型來實現。引入懲罰項不同,則求解線性回歸模型的方法不同。傳統基于稀疏表示構建超網絡的方法通常是引入LASSO方法[8, 12, 13]或對LASSO方法進行延伸求解線性回歸模型來創建腦功能超網絡,如彈性網方法[14]、功能加權LASSO方法[15]等。
雖然LASSO方法已成功用于腦精神疾病的分類診斷研究中,但仍然具有局限性。首先,LASSO方法在計算回歸系數(權重向量)時,對噪聲變量回歸系數(與選定腦區相互獨立的腦區,即不產生交互的腦區)壓縮的同時,一定程度上也對目標變量回歸系數(與選定腦區相互依賴的腦區,即產生交互的腦區)進行了相應的壓縮,導致了方法的有偏性[16];其次,若一組變量彼此間的成對相關比較高時,LASSO方法趨向于選擇一組高度相關中的一個變量且不關心組中的哪一個變量被選中[17],也就是不具備組效應的解釋能力。這些局限性將導致所構建的腦功能超網絡有可能失去一些重要的具有明顯神經學意義解釋的連接。
因此,考慮到以上問題,本文引入組最小最大凹懲罰(group minimax concave penalty,gMCP) [16, 18]和組平滑剪裁的絕對值偏差(group smoothly clipped absolute deviation,gSCAD)兩種方法[19, 20]從不同角度構建基于組選擇的近似無偏稀疏腦功能超網絡模型。在文中,將其分別定義為gMCP-HN和gSCAD-HN方法。gMCP-HN和gSCAD-HN方法是應用不同的懲罰函數進行變量選擇,兩種方法的優勢為:a)保證變量選擇連續性;b)減少懲罰函數對目標變量系數壓縮的問題,即通過減小壓縮程度以實現近似無偏性。同時考慮到腦區間組效應的解釋問題。
本文主要工作包括:a) 對數據集進行采集和預處理;b)利用gMCP和gSCAD方法進行超網絡的構建;c)計算超網絡的聚類系數(hypernetwork cluster coefficient, HCC)作為表征超網絡的拓撲屬性特征;d)通過非參數置換檢驗選擇差異特征,并采用支持向量機(support vector machine,SVM)進行差異特征的分類模型構建;e)此外,分析了文中所涉及到的參數對于最終分類性能的影響。
1 材料和方法
1.1 數據采集和預處理
本文共有66例被試參與,分為抑郁組和正常對照組。抑郁組由38例首發且沒有使用任何藥物的抑郁癥(major depressive disorder,MDD)患者組成,正常對照組(normal control,NC)由28例年齡性別匹配的健康右利志愿者組成。被試的詳細信息如表1所示。執行研究之前,依據山西醫學倫理委員會(參考編號:2012013)的標準,征得所有受試者及相關參與者(抑郁者的家屬)知情同意,受試者依據赫爾辛基(Helsinki)宣言簽署書面協議。
表1中的a值為經過雙值雙尾t檢驗計算的P值;b值為經過雙尾Pearson卡方檢驗計算的P值。山西醫科大學第一醫院完成數據采集任務,并且由精通磁共振技術的放射科醫師通過3T磁共振掃描儀(Siemens Trio 3-Tesla scanner,Siemens,Erlangen,Germany)完成掃描任務。被試在進行掃描時也有相應的要求,即被試需要在放松的狀態下不能入睡,閉眼不考慮任何事情。具體的掃描參數設置為:射頻重復時間為2 s,回波時間設為30 ms,層厚設為4 mm,成像視野設為192 mm×192 mm,存儲矩陣設為64 mm×64 mm,偏轉角度設為90°,連續的回波平面成像序列功能圖像設為248個。考慮到被試的適應性和初始數據信號的不穩定性,本文將前十個時間序列剔除。
接著利用SPM8(http://www.fil. ion.ucl.ac.uk/spm)對影像數據執行預處理。首先,對掃描的圖像進行時間層校正及頭動校正,校正規則為:丟棄頭動大于3 mm或轉動大于3°的受試者。其次,利用蒙特利爾神經病學研究所(Montreal Neurological Institute,MNI)的平面回波成像(echo planer imaging,EPI)模板,將校正后的圖像標準化,其體素大小設置為3 mm。最終執行線性降維和帶通濾波(0.01~0.10 Hz)處理,以減小低頻漂移和高頻生物噪聲信號。由于全局腦信號在神經影像學領域內仍存在爭論,所以本文預處理過程中并未對其進行處理。
預處理完成后,利用自動解剖標記(anatomical automatic labeling,AAL)[21]模板進行大腦劃分,這一模板已廣泛應用在同類研究中[22]。具體為,利用AAL模板將大腦劃分為左右半腦各45個感興趣區域(region of interest,RoI),總共90個感興趣解剖區域,表示網絡中的節點。多個時間點中節點所對應全部體素BOLD的算術平均值得到該節點的平均時間序列。
1.2 超網絡構建
現有的研究中通常利用LASSO方法以及對LASSO方法進行延伸來構建腦功能超網絡。但LASSO方法本身存在相應的局限性,即呈現有偏性[16]及無法表征腦區間存在的天然組結構能力[17]。這將導致人腦也許會丟失一些重要的具有明顯神經生物學意義的連接。因此本文提出gMCP和gSCAD方法完成基于組選擇的近似無偏稀疏腦功能超網絡的構建。
具體來說,基于功能磁共振的時間序列數據,利用gMCP和gSCAD方法進行基于組選擇的近似無偏稀疏超網絡的構建,即gMCP-HN和gSCAD-HN方法。通過以上兩種方法將選定腦區通過其余腦區的線性組合來表示,同時將不產生交互的與選定腦區相互獨立的大部分腦區懲罰為0,保留與之相互依賴的腦區,從而選定腦區與保留相互依賴的腦區生成一條超邊。所有超邊組成一個腦功能超網絡。
1.2.1 基于gMCP方法構建腦功能超網絡
gMCP是在組選擇的基礎上引入MCP罰函數,而MCP罰函數可以降低懲罰函數對于目標變量回歸系數的壓縮問題,即在有效壓縮噪聲變量回歸系數的前提下,充分保留目標變量的回歸系數,來減弱其壓縮變量時有偏估計的特點。換句話說,利用gMCP方法生成特定腦區的超邊時,MCP罰函數在與選定腦區相互獨立的腦區(即不產生交互的腦區)壓縮的基礎上,減少與選定腦區相互依賴腦區的懲罰,從而盡可能保留一些有用的腦區交互信息。所以gMCP是在組級的基礎上進行腦功能超網絡的構建,首先使用聚類算法基于所有腦區的時間序列對所有腦區進行聚類獲得每個腦區的分組信息。本文利用K-means++算法[23]將相關性較強的腦區歸為一組。接著利用gMCP方法[19]進行腦功能超網絡的構建。具體定義為
其中:θ=αpk;γgt;1表示調整參數。若γ→∞時,與組LASSO估計相同;若γ→1時,收斂至組硬閾值懲罰;λ≥0表示懲罰參數。具體的實現過程為,若|θ|≤γλ時,對噪聲變量的權重向量進行壓縮。相反,若|θ|gt;γλ時,則目標變量的權重向量保持原值,不再對其壓縮。由此可知,組MCP模型主要是降低權重變量的壓縮程度來達成模型的近似無偏性[16]。
基于gMCP方法腦功能超網絡構建具體如下:對于每一個被試,基于時間序列數據,將被試中的腦區作為超網絡的節點。基于超網絡中的每個腦區,在特定的γ值下,變化λ的值,生成一組權重向量αk。每個權重向量αk中的非零項生成一條超邊。所以一個腦區生成一組超邊。對于每一個腦區,重復以上步驟,生成對應的超邊。進而將所有超邊組成一個被試的腦功能超網絡,具體為90個節點和810條超邊。γ采用默認值3[24]。組MCP通過grpreg工具包來求解[24]。具體的構建流程框架如圖1所示。
1.2.2 基于gSCAD方法構建腦功能超網絡
gSCAD是在組選擇的基礎上引入SCAD罰函數。SCAD與MCP罰函數在定義和表現上均是比較類似的,即通過設置不同的閾值水平,來不同程度地降低或消除懲罰估計量的偏差,也就是減弱罰函數對于目標變量回歸系數(權重向量)的壓縮問題,從而盡可能改善LASSO方法及對其進行延伸方法的有偏性問題。在腦網絡中,利用gSCAD方法生成超邊時,SCAD罰函數將與選定腦區不產生交互的腦區懲罰為0的同時,減少或避免與選定腦區交互的腦區的懲罰,即構建近似無偏稀疏腦功能超網絡。
與基于gMCP方法構建腦功能超網絡類似,在利用gSCAD方法構建超網絡之前,首先利用K-means++算法[23]對腦區進行分組。接著使用gSCAD方法[19, 20]進行腦功能超網絡的構建。
gSCAD方法的定義與gMCP方法類似,如式(1)所示。xk,Ak,αk,αpk的含義與gMCP方法中類似,但φ(·)表示的為SCAD懲罰。具體表示為
其中:θ=αpk;γgt;2表示調整參數,該取值與gMCP方法不同,當γgt;2時,仍為軟閾值懲罰[25],λ≥0表示懲罰參數。當0≤|θ|≤λ時,得到組LASSO估計[20],即側重于將該范圍的權重向量全部壓縮為零;當λlt;|θ|lt;γλ時,|θ|越大,則壓縮程度降低;當|θ|≥γλ時,則權重向量保持原值,不再壓縮。此外,當λ→∞時,同樣與組LASSO相似。
構建方法如下:同樣,基于每個被試的時間序列數據,將被試中的腦區作為超網絡的節點,通過變化λ的值生成一組權重向量αk,每個αk中非零項生成超邊。每個腦區重復以上步驟,組成最終的腦功能超網絡。相似地,γ采用默認值4[24]。gSCAD通過grpreg工具包來求解[24]。具體的構建流程和算法參照gMCP方法,在此不作贅述。
1.3 特征提取
完成超網絡構建后,需要選取特征量化超網絡進行分類研究。本文采用廣泛用于超網絡的局部拓撲屬性,聚類系數(HCC)作為可量化指標表征腦功能超網絡的拓撲信息。主要包括三種不同的定義[26]。具體的計算公式為
式(4)表示第一類聚類系數,是不包含節點v的鄰居節點互為鄰居的比例,用HCC1表示。其中:u、t、v表示超網絡中的節點;N(v)表示所有包含節點v的超邊中含有其他節點的集合,用N(v)={u∈V:e∈ζ,u,v∈e}來表示;ζ指的是超邊集;e代表一條超邊。若ei∈ζ,當且僅當u,t∈ei,vei,則I(u,t,v)=1;否則當且僅當v,u,t∈ei時,I(u,t,v)=0,該定義的優勢是在這個集合中發現的任何交互都代表了鄰居節點間的真實連接,且不會存在由于與節點v交互引起的數據偽影[26]。
式(5)表示第二類聚類系數,用HCC2表示,是包含節點v的鄰居節點互為鄰居的比例。u、v、t、N(v)均與HCC1中參數含義相同;若ei∈ζ,當v,u,t∈ei,I′(u,t,v)=1;否則當u,t∈ei,且vei,I′(u,t,v)=0,該定義的優勢是更有可能發現節點v與鄰居節點間的真實連接。但通過這種方式發現的交互可能只是由于與節點v的共享交互而產生的數據偽影[26]。
式(6)表示第三類聚類系數,用HCC3表示,是節點v的鄰接超邊重疊的比例。v、e、N(v)同樣與HCC1中參數含義相同。其中:S(v)={ei∈ζ:v∈ei};v表示節點;e表示超邊;S(v)表示含有節點v的所有超邊。
這三種聚類系數從不同層面反映了超網絡的局部聚類屬性。基于三種不同聚類系數定義,分別從兩種方法構建的腦功能超網絡中提取作為對應的局部屬性特征。
1.4 特征選擇和分類
通過聚類系數提取的局部屬性特征也許會包含一些冗余的、不相關的特征,從而影響分類模型的有效性。因此,本文采用了廣泛用于腦網絡研究中的統計分析方法——Kolmogorov-Smirnov[27]非參數置換檢驗作為本文的特征選擇方法,依照統計學上的差異性分析去除無關或冗余的特征來獲得最具有判別性的組間差異特征,從而進行更有效的分類。具體來說,針對MDD患者和正常人,將計算聚類系數屬性產生的270個節點屬性進行組間KS非參數置換檢驗,并依據統計顯著性plt;0.05選取具有顯著組間差異的局部屬性參與分類模型構建,該結果已通過FDR校正(q=0.05)。
現有研究中已經提出多種分類器進行分類模型的構建,如SVM、決策樹、邏輯回歸、線性回歸、隨機森林、K近鄰等。其中,SVM最常用于腦精神疾病分類診斷研究中。其主要原因是該算法的計算復雜度取決于樣本數目而不是特征維度,這將使得該模型更適用于小樣本數據集和高維特征中[28, 29]。而在腦精神疾病研究中,無法避免的問題就是樣本數目較少。必須面對的就是數據采集困難,尤其對于患者來說,較難得到其完全的信息。因此,本文使用LibSVM(http://www.csie.ntu.edu.tw/~cjlin/libsvm)工具包中的徑向基核函數(radial basis function,RBF)進行SVM分類模型的構建。
留一交叉驗證(leave one out cross validation,LOOCV)評估分類性能。具體為,若存在S個樣本,則1個樣本作為測試集,其余S-1個樣本作為訓練集。接著訓練集利用K折交叉驗證(K-fold cross validation,K-CV)進行參數尋優(c,g),最后選取訓練集驗證分類準確率最高的參數組(c,g)參與模型的訓練[30]。在此基礎上建立S個不同的訓練模型,并分別使用其剩余測試集預測其模型的有效性。注意,分類模型構建前,需要標準化分類特征。
2 結果和分析
2.1 網絡拓撲屬性的回歸分析
首先,本文從網絡拓撲屬性角度驗證了兩種方法構建網絡拓撲的關聯程度。基于每個大腦區域,在每種不同方法的超網絡中,分別平均每組受試者的HCC值,并標準化該數值,接著基于兩種方法進行回歸分析。結果表明,gMCP和gSCAD方法所構建的網絡在存在差異的基礎上,關聯性較強,分別在正常組以及抑郁組被試中達到0.844和0.890,如圖2所示。其潛在的原因是兩種方法對于變量的相似懲罰度產生的,即不是對不存在交互的腦區以及存在交互的腦區同時進行壓縮,而是一定程度上均減少或避免對于產生交互的腦區的壓縮。
2.2 差異性腦區
基于gMCP和gSCAD方法,分別構建超網絡,并計算局部聚類系數提取網絡局部特征,利用非參數置換檢驗進行組間差異分析,選取具有顯著差異的腦區特征。兩種方法下,具體所得到的顯著差異腦區如表2所示。兩種方法重疊的腦區如圖3所示。結果表明,組MCP和組SCAD方法下的重疊腦區較多,分別是左側背外側額上回、左側內側額上回、右側腦島、左側海馬旁回、左側舌回、左側梭狀回、左側角回、左側中央旁小葉,以及左側顳極:顳中回。該結果同樣暗示了兩種方法所構建的腦功能超網絡拓撲較為相似。
此外,通過以下兩種方法所得到的分類表現層面來看,gMCP方法得出了最高的分類準確率。因此,本文重點將gMCP方法所得的異常腦區與之前抑郁癥腦網絡研究進行對比,結果表明所得腦區與其他文獻中出現的異常腦區一致,如表3所示。
2.3 分類表現
本文通過分類準確率、敏感性、特異性和平衡準確率(ba-lanced accuracy,BAC)來綜合評估gMCP-HN和gSCAD-HN方法的分類性能。BAC表示敏感性和特異性的均值,以避免不平衡數據集所導致的膨脹影響[41]。
首先本文分別評估了兩種所提方法的分類性能,其次與現有LASSO方法以及對其進行延伸的方法所得到的分類性能進行了相關對比,包括LASSO方法、組LASSO以及稀疏組LASSO方法。此外,為了增強本文實驗結果的可對比性,同樣引入MCP和SCAD方法構建腦功能超網絡,并進行分類性能的對比。以上兩種方法的求解通過ncvreg工具包[42]來實現。具體的比較結果如表4所示。
結果表明gMCP和gSCAD方法的分類結果均達85%以上,高于現有研究所提超網絡構建方法以及MCP和SCAD方法,而且gMCP方法的分類準確率最高,達到86.36%。分析其潛在原因,相比于傳統LASSO方法,本文兩種方法在組級層面上進行變量選擇,解決了組效應問題,同時考慮到了LASSO方法的有偏性問題。相比于MCP和SCAD方法,雖然有偏性問題得以一定程度上的解決,但組效應問題卻未考慮,因此同樣導致分類結果低于gMCP和gSACD方法。而組LASSO和稀疏組LASSO方法,雖然考慮到了腦區間所存在的組效應問題,但模型均為有偏性,使得對于權重向量的壓縮程度過于嚴格,也就是同時壓縮與選定腦區相互獨立的腦區以及產生交互的腦區,導致會失去一些重要的連接。這一結果暗示了若要構建更加有效的腦功能超網絡以更加精確地表征人腦復雜的交互信息,則不僅需體現人腦中固有的組結構,還需選擇合適的模型對權重向量進行適度的壓縮,實現網絡結構的無偏性。
此外,由于gMCP和gSCAD方法的分類表現稍有不同,需要進一步研究它們對分類的貢獻程度。使用Relief算法[44]對特征的有效性進行驗證。該方法會根據每個類別和功能相關性分配不同的權重,特征的分類能力越強,分配的權重越大(反之亦然)。結果表明,gMCP方法所得的分類權重高于gSCAD方法,如圖4所示。其潛在的原因可能是兩種方法對于無偏性的不同解釋程度造成的。在gSCAD方法中,當λlt;|αpk|lt;γλ時,目標變量的權重向量是隨著權重向量αpk的增大而不進行壓縮(懲罰),因此這暗示了一些目標變量的權重向量一定程度也許會被壓縮至0,相較于gMCP方法來說,壓縮較為嚴格,從而導致其所構建的腦功能超網絡仍不能完全保留目標變量的權重向量,也就是仍會丟失一些重要的具有神經學意義的連接,因此導致所提取的特征相較于gMCP方法來說,分類權重較低。
3 參數影響
在本文中,一些重要的參數選取也會對分類結果產生影響,主要包括,腦功能超網絡構建模型中分組參數p、SVM模型參數c和g,分別對每個參數展開詳細的討論。
3.1 分組參數p
兩種方法都在預定義組下進行超網絡構建,實驗中使用了K-means++[23]聚類算法,P表示分組大小,可以將數據預先分成p個組,是預定義分組的重要基礎。本實驗定義p∈[3,90],以3為步長,進行腦區間的分組。考慮到聚類算法中初始種子節點的隨機性,本文基于特定的p值,在兩種方法中,分別進行50次實驗并將平均50次實驗的分類結果作為最后的分類結果。圖5為兩種方法在不同p值下的正確率。結果顯示組MCP方法中組數p=24時,最高正確率達到86.36%;組SCAD方法中組數p=39時,表現出的最高正確率達到85.71%。
3.2 SVM模型參數(c,g)的影響
SVM分類器適用于高維特征以及小樣本數據集中,因此被廣泛用于腦疾病的研究中。在SVM分類模型中,包括多種核函數來進行分類模型的構建,但考慮到其余核函數的局限性,本文選取RBF核函數構建分類器。在基于RBF的SVM分類模型中,主要涉及懲罰因子c和核參數g兩個參數。c用來控制誤差的容忍度,以衡量結構風險和經驗風險。當c越大時,則易發生過擬合;當c越小時,易發生欠擬合。無論是過擬合還是欠擬合,均會影響分類器的泛化性能,而影響分類性能。g是徑向基核函數中的參數,即核參數,改變該參數,可使原始的特征數據映射至高維特征數據的分布不同。g越大,易發生過擬合;g越小,易發生欠擬合。因此,選取合適的(c,g)對于分類模型的構建是非常關鍵的。在本文中,固定(c,g)的區間范圍,基于網格搜索方法,將訓練集作為原始數據集,在特定的(c,g)中利用K折交叉驗證方法得到每組(c,g)下的分類準確率,最終選擇分類準確率最高的(c,g)作為最優參數參與訓練集分類模型的構建。本文設置(c,g)參數組在[2-8,28]內變化,步長為1。圖6表示參數(c,g)的尋優結果。結果顯示,分類準確率最高時的c、g參數的值分別為2和0.5,最高準確率是92.307 7%。
4 結束語
現有超網絡構建大多是基于稀疏表示方法,傳統基于LASSO的稀疏表示方法缺乏解釋腦區之間的組效應的能力,而且懲罰函數對目標變量權重向量有一定程度的壓縮,使得模型呈現有偏性。考慮到這些問題,本文提出近似無偏稀疏模型的超網絡構建方法有gMCP-HN和gSCAD-HN兩種方法。
研究結果表明,在拓撲層面,gMCP-HN和gSCAD-HN模型在存在差異的基礎上,網絡拓撲相關性較強。在分類結果層面,本文兩種網絡模型均優于傳統LASSO模型以及其擴展的超網絡模型。而在所提兩種方法中,gMCP-HN模型的分類結果優于gSCAD-HN模型。這表明若想改善腦功能超網絡模型,更為精確地表征人腦復雜的多元交互信息,不僅需考慮腦區間組結構的信息,還需考慮模型變量選擇間的有偏性問題。而在考慮超網絡有偏性的基礎上,則需選取較為寬松的懲罰方式對目標變量(與選定腦區產生交互的腦區)進行有效的選擇。
在目前的研究中,共存在兩個局限性:a)本文的功能超網絡構建方法主要從非重疊要素組上進行超網絡構建,然而在人腦的復雜交互中,同一腦區可以參與多種功能的實現,而且,也許在同一時間中,同一腦區便同時參與多種特定功能的實現,因此,未來的研究可以在此基礎上引入組間的重疊性以進一步完善超網絡的構建;b)本文的超網絡構建是在對腦區聚類完成后進行的超網絡構建,這便暗示了所構建的超網絡以及分類結果無法消除初始隨機種子點的影響。盡管本文通過選取不同的k值,以及基于特定的k值,執行多次實驗來防止其影響,因此之后的研究中可以采用更加穩定的聚類方法來生成穩定的超邊,以進一步改善超網絡。
參考文獻:
[1]Burrows K, Stewart J L, Kuplicki R, et al. Elevated peripheral inflammation is associated with attenuated striatal reward anticipation in major depressive disorder[J].Brain,Behavior,and Immunity,2021,93:214-225.
[2]Steardo L, Carbone E A, Filippis R D, et al. Application of support vector machine on fMRI data as biomarkers in schizophrenia diagnosis: a systematic review[J/OL].Frontiers in Psychiatry.(2020-07-23).https://doi.org/10.3389/fpsyt.2020.00588.
[3]Porta-Casteràs D, Cano M, Camprodon J A, et al. A multimetric systematic review of fMRI findings in patients with MDD receiving ECT[J].Progress in Neuro-Psychopharmacology and Biological Psychiatry,2021,108:110178.
[4]Qiao Lishan, Zhang Limei, Chen Songcan, et al. Data-driven graph construction and graph learning:a review[J].Neurocomputing,2018,312:336-351.
[5]Zhang Yu, Zhang Han, Chen Xiaobo, et al. Strength and similarity guided group-level brain functional network construction for mci diagnosis[J].Pattern Recognition,2019,88:421-430.
[6]張道強,朱旗,郝小可,等.腦影像智能分析[J].中國科學:信息科學,2018,48(5):109-122.(Zhang Daoqiang, Zhu Qi, Hao Xiaoke, et al. Intelligent analysis of brain images[J].Scientia Sinica:Informationis,2018,48(5):109-122.)
[7]Cayco-Gajic N, Joel Z, Eric S B. A moment-based maximum entropy model for fitting higher-order interactions in neural data[J].Entropy,2018,20(7):article No.489.
[8]Jie Biao, Wee C Y, Shen Dinggang, et al. Hyper-connectivity of functional networks for brain disease diagnosis[J].Medical Image Analysis,2016,32:84-100.
[9]Li Yang, Gao Xinqiang, Jie Biao, et al. Multimodal hyper-connectivity networks for MCI classification[C]//Proc of International Confe-rence on Medical Image Computing and Computer-Assisted Intervention.Berlin:Springer,2017:433-441.
[10]Zhang Zizhao, Lin Haojie, Gao Yue. Dynamic hypergraph structure learning[C]//Proc of the 27th International Joint Conference on Artificial Intelligence.2018:3162-3169.
[11]Liu Qingshan, Sun Yubao, Wang Cantian, et al. Elastic net hyper-graph learning for image clustering and semi-supervised classification[J].IEEE Trans on Image Processing,2016,26(1):452-463.
[12]Wang Meiling, Hao Xiaoke, Huang Jiashaung, et al. Discovering network phenotype between genetic risk factors and disease status via diagnosis-aligned multi-modality regression method in Alzheimer’s disease[J].Bioinformatics,2019,35(11):1948-1957.
[13]Xiao Li, Stephen J M, Wilson T W, et al. A hypergraph learning method for brain functional connectivity network construction from fMRI data[C]//Proc of Biomedical Applications in Molecular,Structural,and Functional Imaging Conference.2020.
[14]Guo Hao, Li Yao, Xu Yong, et al. Resting-state brain functional hyper-network construction based on elastic net and group LASSO methods[J].Frontiers in NeuroInformatics,2018,12:article No.25.
[15]Li Yang, Liu Jingyu, Gao Xinqiang, et al. Multimodal hyper-connectivity of functional networks using functionally-weighted LASSO for MCI classification[J].Medical Image Analysis,2019,52:80-96.
[16]Zhang Cunhui. Nearly unbiased variable selection under minimax concave penalty[J].The Annals of Statistics,2010,38(2):894-942.
[17]Zou Hui, Trevor H. Regularization and variable selection via the ela-stic net[J].Journal of the Royal Statistical Society,2005,67(2):301-320.
[18]Zhang Cuihui. Penalized linear unbiased selection,2007-003[R].New Brunswick,NJ:Rutgers University,2007.
[19]李鵬翔,葉萬洲.基于兩種非凸懲罰函數的稀疏組變量選擇[J].應用數學與計算數學學報,2018(3):437-446.(Li Pengxiang, Ye Wanzhou. Sparse group variable selection based on two non-convex penalty functions[J].Journal of Applied Mathematics and Computation,2018(3):437-446.)
[20]Fan Jiangqing, Li Runze. Variable selection via nonconcave penalized likelihood and its oracle properties[J].Journal of the American Statistical Association,2001,96(456):1348-1360.
[21]Chen Qiang, Ursini G, Romer A L, et al. Schizophrenia polygenic risk score predicts mnemonic hippocampal activity[J].Brain,2018,141(4):1218-1228.
[22]胡穎,王麗嘉,聶生東.靜息態功能磁共振成像的腦功能分區綜述[J].中國圖像圖形學報,2017,22(10):1325-1334.(Hu Ying, Wang Lijia, Nie Shengdong. Review on brain functional parcellation based on resting-state functional magnetic resonance imaging data[J].Journal of Image and Graphics,2017,22(10):1325-1334.)
[23]Arthur D, Vassilvitskii S. K-means++: the advantages of careful seeding[C]//Proc of the 18th ACM-SIAM Symposium on Discrete Algorithms.2006.
[24]Breheny P, Huang Jian. Group descent algorithms for nonconvex penalized linear and logistic regression models with grouped predictors[J].Statistics and Computing,2015,25(2):173-187.
[25]Huang Jian, Breheny P, Ma S. A selective review of group selection in high-dimensional models[J].Statistical Science: a Review Journal of the Institute of Mathematical Statistics,2012,27(4):481-499.
[26]Gallagher S R, Goldberg D S. Clustering coefficients in protein interaction hypernetworks[C]//Proc of International Conference on Bioinformatics, Computational Biology and Biomedical Informatics.2013:552-560.
[27]Zhang Binbin, Wang Liping, Wu Jun, et al. Spindle radial accuracy evaluation and fault diagnosis based on a normal distribution[C]//Proc of the 12th International Conference on Reliability,Maintainability,and Safety.Piscataway,NJ:IEEE Press,2018:307-311.
[28]Yu Wei, Liu Tiebin, Valdez R, et al. Application of support vector machine modeling for prediction of common diseases: the case of diabetes and pre-diabetes[J].BMC Medical Informatics and Decision Making,2010,10(1):1-7.
[29]Dasgupta S, Goldberg Y, Kosorok M. Feature elimination in kernel machines in moderately high dimensions[J].Annals of Statistics,2019,47:497-526.
[30]Mishra S K, Deepthi V H. Brain image classification by the combination of different wavelet transforms and support vector machine classification[J].Journal of Ambient Intelligence Humanized Computing,2020,12(6):6741-6749.
[31]李鵬,王長明,李峰,等.早發抑郁患者功能磁共振成像對下腦區靜息態自發活動與疾病嚴重程度的相關性研究[J].中國醫學裝備,2018,15(6):61-66.(Li Peng, Wang Changming, Li Feng, et al. Study on the correlation between the resting state of the lower brain area and the severity of the disease by functional magnetic resonance imaging in patients with early-onset depression[J].China Medical Equipment,2018,15(6):61-66.)
[32]Kandilarova S, Stoyanov D, Sirakov N, et al. Reduced grey matter volume in frontal and temporal areas in depression:contributions from voxel-based morphometry study[J].Acta Neuropsychiatrica,2019,31(5):252-257.
[33]康嘉慧,孔令韜.磁共振低頻振幅對青少年與成年抑郁癥患者靜息態功能變化的研究[J].中華全科醫學,2020,18(2):269-272.(Kang Jiahui, Kong Lingtao. The study of low-frequency magnetic resonance amplitude on resting state function changes in adolescents and adults with depression[J].Chinese General Practice,2020,18(2):269-272.)
[34]Cheng Bochao, Wang Xiuli, Zhou Yushan, et al. Regional cerebral activity abnormality in pregnant women with antenatal depression[J].Journal of Affective Disorders,2020,274:381-388.
[35]Lord A, Horn D, Breakspear M, et al. Changes in community structure of resting state functional connectivity in unipolar depression[J].PLoS One,2012,7(8):e41282.
[36]Suffel A, Nagels A, Steines M, et al. Feeling addressed! The neural processing of social communicative cues in patients with major depression[J].Human Brain Mapping,2020,41(13):3541-3554.
[37]李玉婷.首發未治療抑郁癥患者腦結構和功能連接改變研究[D].南京:南京師范大學,2019.(Li Yuting. Study on the changes of brain structure and functional connection in the first untreated depression patients[D].Nanjing:Nanjing Normal University,2019.)
[38]Chen Ben, Zhong Xiaomei, Zhang Min, et al. The additive effect of late-life depression and olfactory dysfunction on the risk of dementia was mediated by hypersynchronization of the hippocampus/fusiform gyrus[J].Translational Psychiatry,2021,11(1):1-12.
[39]鄔小平,劉春英,張宏,等.靜息態磁共振下重度抑郁癥帶狀蓋腦網絡功能連接的研究[J].臨床醫學研究與實踐,2018,3(12):5-7.(Wu Xiaoping, Liu Chunying, Zhang Hong, et al. Study on functional connection of the banded brain network in major depression under resting state MRI [J].Clinical Medical Research and Practice,2018,3(12):5-7.)
[40]Rolls E T, Cheng W, Gilson M, et al. Effective connectivity in depression[J].Biological Psychiatry: Cognitive Neuroscience and NeuroImaging,2018,3(2):187-197.
[41]Velez D R, White B C, Motsinger A A, et al. A balanced accuracy function for epistasis modeling in imbalanced datasets using multifa-ctor dimensionality reduction[J].Genetic Epidemiology,2007,31(4):306-315.
[42]Breheny P. NCVREG: regularization paths for SCAD and MCP penali-zed regression models[EB/OL].(2021-03-30).http://cran.pau.edu.tr/web/packages/ncvreg/index.html.
[43]李瑤,趙云芃,李欣蕓,等.基于sparse group LASSO方法的腦功能超網絡構建與特征融合分析[J].計算機應用,2020,40(1):62-70.(Li Yao, Zhao Yunpeng, Li Xinyun, et al. Construction of brain function hyper-network and feature fusion analysis based on sparse group LASSO method[J].Journal of Computer Applications,2020,40(1):62-70.)
[44]Palma-Mendoza R J, Rodriguez D, De-Marcos L. Distributed ReliefF based feature selection in spark[J].Knowledge and Information Systems,2018,57(1):1-20.