張豪 王昕璨 李瑤 郭冬喜 郭浩



摘 ?要: 已有研究經常忽略現實情況中年齡和性別對于大腦結構影像數據的影響,導致特征選取的有效性降低,最終造成分類準確率的降低。為此,提出基于線性混合效應模型的方法進行特征選擇,考慮到年齡和性別對影像指標的影響,通過相關顯著性的大小選取腦影像指標作為特征構建分類器,應用于不同人格特質的組內分類及識別中。分類結果顯示,基于線性混合效應模型的方法使得不同人格分類準確率有較明顯的提高。
關鍵詞: 腦結構影像; 線性混合效應模型; 特征選取; 大腦白質計算; 人格分類; 結果分析
中圖分類號: TN911.73?34; TP181 ? ? ? ? ? ? ?文獻標識碼: A ? ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)02?0145?04
Research on brain structure image based on linear mixed effect model
ZHANG Hao1, WANG Xincan2, LI Yao1, GUO Dongxi1, GUO Hao1
Abstract: The previous studies have often overlooked the influence of age and gender on brain structure image data in the real situation, which leads to the reduction in the effectiveness of feature selection and ultimately in the classification accuracy. On this basis, a method based on the linear mixed effect model is proposed for the feature selection. In consideration of the influences of age and gender on image indexes, the brain image indexes are selected based on the size of correlation significance as features to construct the classifier, which is applied to the intra?group classification and recognition for different personality traits. The classification results show that the method based on the linear mixed effect model can obvious improve the accuracy of different personality classification.
Keywords: brain structure image; linear mixed effect model; feature selection; white matter calculation; personality classification; result analysis
0 ?引 ?言
近年來隨著腦科學技術的發展,人類大腦的結構影像特征越來越受到關注。個體腦影像特征分析有助于促進對人類神經生物學基礎的認識并具有提供相關影像學標記的潛在價值[1]。彌散張量成像技術(Diffusion Tensor Imaging,DTI),是一種描述大腦結構的新方法,是目前唯一能無創繪制大腦白質神經纖維通路的方法。多數學者認為DTI技術能非常準確地顯示大腦中主要的白質纖維束,并且能夠通過若干特征性參數反應大腦神經系統。
已有研究表明年齡和性別是腦結構影像數據的重要影響因素,并且已被證明與人格相互作用。而在以往的關于腦影像學的研究中,多忽略年齡和性別可能會對實驗結果所產生的影響,如利用皮爾遜相關系數法、斯皮爾曼相關系數法[2]等。而為了便于考慮到年齡和性別因素,文獻[3?4]采用了基于一般線性模型的多元回歸分析方法。該方法可以同時將多個對觀察變量產生影響的因素進行分析,但傳統的線性模型對于反應變量還有三個假定要求:正態性、獨立性以及方差齊性。而人類腦影像數據由于性別和年齡段的不同可能存在一些群體特性,這就導致獨立性條件的不滿足,最終造成結果的偏差。為了兼顧年齡和性別這兩個影響因素,同時克服一般線性模型對于觀察變量必須具有的獨立性的要求,本文從個體的腦影像學特征出發,提出建立線性混合效應模型的方法。
線性混合效應模型[5]的方法對于神經影像學數據基于群體的推斷已經被證明是有效的,這在分析功能磁共振成像數據和結構磁共振成像數據的研究中已經得到了證明[6]。該方法將年齡和性別作為無興趣的協變量納入模型,而人格特質得分作為興趣變量納入模型,探索各個腦區腦影像指標與人格特質得分間的關系,研究不同腦區對正常被試不同人格特質的影響,并以此為依據實現不同人格被試的分類。
本文中主要工作包括:
1) 計算所有正常被試的腦影像指標;
2) 建立混合效應模型對不同腦區影像指標與人格特質得分間的相關性進行研究,根據相關顯著性大小進行特征選擇;
3) 以挑選出的腦區影像指標作為特征構建分類器,從而分別實現對外傾性人格特質與神經質人格特質的組內分類。
1 ?數據采集與預處理
1.1 ?被試者
本研究根據山西省醫學倫理委員會(參考編號:2012.13)的建議,在所有被試者書面知情同意的情況下進行。所有被試者均按照赫爾辛基宣言簽署書面知情同意書,由工作人員統一安排,記錄性別、年齡等人口學信息并進行編碼,采用艾森克人格問卷(EPQ)調查被試的人格特質,所有被試均在安靜舒適的心理評估室完成自評量表的填寫,問卷統一收回進行數據錄入。對于被試的分組,根據EPQ龔耀先教授修訂本的評分細則進行分組,由于艾森克量表的第三維度——精神質的定義及神經生理機智的不明確性,本文不對這一維度進行分組及研究。被試者基本信息如表1所示。
1.2 ?數據采集與預處理
本文研究使用西門子3T超導MRI掃描儀(Siemens Trio 3?Tesla Scanner,Siemens,Erlangen,Germany)對200名正常右利手被試進行彌散張量磁共振掃描。被試基本信息見表1。在掃描過程中,要求被試放松,閉眼,保持清醒狀態,盡量不做任何思考。掃描參數設置如下:45 axial slices,repetition time(TR)=6 000 ms,echo time(ET)=90 ms,thickness/skip=3/0 mm,field of view (FOV)=240 mm[×]240 mm,matrix=128 mm[×]128 mm,flip angle=90°。擴散敏感梯度方向為12,擴散敏感系數b=1 000 s/mm2。
彌散張量成像數據預處理使用Panda軟件進行。首先對數據集進行格式轉換(DICOM轉換為NifTI),然后提取b0值,進行腦提取去除非腦組織、渦流校正和頭動校正、空間標準化以及高斯平滑等。
2 ?方 ?法
基于線性混合效應模型的腦結構影像的分析及分類研究方法包括以下步驟:數據預處理;計算基于白質分區圖譜的大腦白質指標;建立線性混合效應模型對白質指標與人格特質得分的相關性進行分析,根據相關性分析的結果進行特征選擇,最后使用支持向量機的方法進行分類。
2.1 ?大腦白質指標的計算
本文采用現有的約翰霍普金斯大學的ICBM?DTI?81白質分區圖譜[7]進行大腦區域的劃分,共將大腦分為50個白質纖維束區域。本文共選擇四種DTI圖像特征參數,包括各向異性分數(Fractional Anisotropy,FA)、平均彌散率(Mean Diffusivity,MD)、徑向彌散系數(Radial Diffusivity,RD)以及軸向彌散系數(Axial Diffusivity, AD),用于描述體素特性。
各向異性分數(Fractional Anisotropy,FA)是分析各向異性最常用的參數,指彌散的各向異性部分占彌散張量總值的比例。計算公式如下:
[FA=32·(λ1-λ)2+(λ2-λ)2+(λ3-λ)2λ21+λ22+λ23] ?(1)
式中,[λ1,λ2,λ3]是彌散張量矩陣的三個特征值,分別表示沿三個正交方向上的彌散率;[λ=λ1+λ2+λ33]。
平均擴散率(Mean Diffusivity,MD)反映水分子整體的彌散水平,只表示水分子彌散的大小和程度,而與彌散方向無關。計算公式如下:
[MD=λ1+λ2+λ33] ? ? ? ? ? ?(2)
徑向彌散系數(Radial Diffusivity,RD)反映與軸突長軸成對角平面的水分子彌散水平。計算公式如下:
[RD=λ2+λ32] ? ? ? ? ? ? (3)
軸向彌散系數(Axial Diffusivity,AD)反映與軸突方向平行的水分子的彌散水平。計算公式如下:
[AD=λ1] ? ? ? ? ? ? ?(4)
2.2 ?線性混合效應模型
線性混合效應模型的一般形式結構為:
[y=Xβ+Uγ+ε] ? ? ? ? ?(5)
式中:[y]表示反應變量的測量值向量;[X]為固定效應自變量的設計矩陣;[β]是與[X]對應的固定效應參數向量;[U]為隨機效應變量構造的設計矩陣,其構成方式與[X]相同,[γ]為隨機效應參數向量;[ε]為隨機誤差向量[8]。
本文中通過計算大腦白質指標FA,MD,RD及AD等來描述體素特性。在建立模型之前,首先針對各指標特征,對其進行相應的對數轉化,使其呈近似正態分布,滿足模型建立的條件。然后建立混合效應模型,分別將所有被試者的不同腦白質指標作為反應變量的觀察值向量,以被試者的不同人格特質得分構造固定效應的設計矩陣,又將各個被試的年齡、性別作為隨機效應構造隨機效應的設計矩陣。
模型公式如下:
[y=β0+β1E+β2N+γ0+γ1AGE+γ2SEX] ?(6)
式中:y對應于所有被試的同一白質纖維束的同一白質指標值構成的向量;E和N分別是各個被試的外傾性人格特質得分和神經質人格特質得分;AGE和SEX分別是各個被試者的年齡和性別。
分析線性混合效應模型最終結果,以相關顯著性p<0.05為依據挑選與人格特質相關的白質纖維束。
2.3 ?分 ?類
本文在線性混合效應模型最終結果的基礎上,分別得到與外傾性和神經質人格特質相關的大腦白質纖維束,將相關的大腦白質纖維束指標作為分類特征。為了消除所選特征中可能存在的冗余情況,又對各特征間進行了兩兩冗余分析,得到最終與人格特質相關的關鍵特征集合。
為了自動鑒別不同人格特質數據,本文使用機器學習的方法來構建分類器。被廣泛使用的分類器有多種,其中包括決策樹、神經網絡、線性判別分析等。
每種分類算法都有其適用的場合和其特有的優缺點,而支持向量機(Support Vector Machine,SVM)分類算法比較適合對小樣本數據的處理。結合磁共振影像數據的特點,本文選取支持向量機分類算法進行分類。它是基于Matlab的LIBSVM工具包[9]進行分類,并采用10折交叉驗證(10?fold cross?validation)的方法來評估分類器的泛化性能。具體的過程是將所有的被試隨機分成10等分,逐一將其中的1等分作為測試集,剩余的9等分是訓練集,取10次結果的均值作為對分類器性能的評估。同時,為了得到更精確的結果,本實驗進行100次10折交叉驗證,最后對100次的結果求均值得到最終的結果。以最常用的分類器性能的量化指標正確率(Accuracy),敏感度(Sensitivity),特異度(Specificity)和AUC值作為評價標準。
3 ?結 ?果
3.1 ?特征選擇
在本文中,將相關顯著性閾值p設為0.05,發現與艾森克人格的外傾性維度E相關的纖維束主要出現在內側丘系,小腦上腳以及鉤束;而與艾森克人格的神經質維度相關的纖維束主要出現在矢狀層(包括下縱束以及額枕下束)、小腦中腳、內側丘系、膜狀層以及后丘腦輻射(包括視神經輻射),具體如表2所示。
本研究中得到的纖維束所涉及到的腦區可能對外傾性和神經質人格特質有一定的影響,與已有研究中得到的結論也大體一致。
例如,Wright 等人報道了大腦中內側前額葉區域與內外向存在關聯性;Wei 等人報道了與內外向相關的腦區發生在內側前額葉部分、小腦、扣帶回及腦島等部位,而與神經質相關的腦區位于左側額中回[10];Hahn 等人通過研究發現紋狀體及眶額葉部位與人格特質存在關聯性[11];Fischer等人報道了內外向與殼核,尾狀核等皮層下的結構相關聯;O′Gorman等人報道了內外向得分與丘腦及額下回等腦區相關聯;文獻[12]通過研究找到內外向與紋狀體、楔前葉及額上回等腦區相關,而神經質與額中回及楔前葉相關。
3.2 ?分類結果
本文將通過線性混合效應模型分析挑選出的大腦白質纖維束指標作為分類特征,分別進行外傾性和神經質人格特質的組內分類。同時,本文利用同樣的通過相關性分析方法進行特征選擇的思想,進行了皮爾遜相關系數和多元線性回歸的統計分析方法選取特征并進行分類的實驗。
分類結果如表3 所示。
由兩種人格特質組內分類結果可知,本文所提出的利用線性混合效應模型做相關的分析方法,不僅能夠綜合考慮年齡和性別影響因素,而且彌補了已有方法中的缺陷,從而提高了分類的準確率。
4 ?結 ?語
本文基于線性混合效應模型的腦結構影像的分析及分類研究在真實的人格數據集上得到了有效的驗證,所得相關性研究成果與現有研究結果大致相吻合,表明此方法可以用于對腦結構影像與人格特質的有關中,并且能夠實現對不同人格進行分類。本文所提方法能夠兼顧年齡和性別因素對于腦影像數據所產生的影響,并克服了傳統的一般線性模型的三個假定要求所帶來的問題。分類的結果顯示,基于線性混合效應模型的腦結構影像的分析及分類方法對不同人格特質的分類準確率均有所提高。
參考文獻
[1] NIXON N L, LIDDLE P F, NIXON E, et al. Biological vulnerability to depression: linked structural and functional brain network findings [J]. British journal of psychiatry the journal of mental science, 2013(4): 283?289.
[2] MALEKMOHAMMADI M, AUYONG N, RICKS?ODDIE J, et al. Pallidal deep brain stimulation modulates excessive cortical high ?? phase amplitude coupling in Parkinson disease [J]. Brain stimulation, 2018(6): 57?61.
[3] BENEDICT R H, SCHWARTZ C E, DUBERSTEIN P, et al. Influence of personality on the relationship between gray matter volume and neuropsychiatric symptoms in multiple sclerosis [J]. Psychosomatic medicine, 2013, 75: 253?261.
[4] GENTILI C, CRISTEA I A, RICCIARDI E, et al. Not in one metric: neuroticism modulates different resting state metrics within distinctive brain regions [J]. Behavioural brain research, 2017, 327: 34.
[5] FITZMAURICE G M, LAIRD N M, WARE J H, et al. Applied longitudinal analysis [M]. Hoboken: John Wiley & Sons, 2012.
[6] BOWMAN D B. Brain imaging analysis [J]. Annual review of stattistics and its application, 2014, 1: 61?85.
[7] MORI S, OISHI K, JIANG H, et al. Stereotaxic white matter atlas based on diffusion tensor imaging in an ICBM template [J]. Neuroimage, 2008, 40: 570?582.
[8] KRUGGEL F, MASAKI F, SOLODKIN A. Analysis of longitudinal diffusion?weighted images in healthy and pathological aging: an ADNI study [J]. Journal of neuroscience methods, 2017, 278: 101?115.
[9] CHANG C C, LIN C J. LIBSVM: A library for support vector machines [J]. ACM transactions on intelligent systems and technology, 2011, 2(27): 27.
[10] WEI L, DUAN X, YANG Y, et al. The synchronization of spontaneous BOLD activity predicts extraversion and neuroticism [J]. Brain research, 2011, 1419: 68?75.
[11] HAHN T, DRESLER T, EHLIS A C, et al. Randomness of resting?state brain oscillations encodes Gray\"s personality trait [J]. Neuroimage, 2012, 59(2): 1842?1845.
[12] ADELSTEIN J S, ZARRAR S, MAARTEN M, et al. Personality is reflected in the brain′s intrinsic functional architecture [J]. Plos one, 2011, 6: 27633.
作者簡介:張 ?豪(1994—),女,山西運城人,碩士研究生,主要研究方向為人工智能、智能信息處理、腦信息學。
郭 ?浩(1981—),男,山西太原人,博士,副教授,CCF會員,研究領域為人工智能、智能信息處理與腦影像學。