羅 渠,馮靜雯,賴虹宇,李 濤,鄧 偉,劉 凱,張軍鵬
1.四川大學(xué) 電氣工程學(xué)院,成都610065
2.四川大學(xué) 華西醫(yī)院心理健康中心,成都610065
精神類疾病給社會帶來了相當(dāng)大的經(jīng)濟負擔(dān),根據(jù)2015年的多國統(tǒng)計數(shù)據(jù),精神分裂癥病人每年的人均花費從泰國的5 818 美元到挪威的94 587 美元波動,其中在澳大利亞每個病人的終生花費可高達988 264 美元。根據(jù)2010 年的數(shù)據(jù),歐洲每年在抑郁癥治療上的花費也高達919 億歐元[1-2]。對于這兩種耗費大量社會資源的精神疾病,及時準(zhǔn)確的診斷將有助于它們的治療。
精神分裂癥是一組病因不明的重性精神疾病,臨床上往往表現(xiàn)為癥狀各異的綜合征,其涉及感知覺、思維、情感和行為等多方面的障礙以及精神活動的不協(xié)調(diào)[3]。多起病于青少年和成年早期,伴隨有陽性癥狀(如幻聽、妄想、思維紊亂、顯著緊張和異常行為等)和陰性癥狀(如意志消沉、情感淡漠等)[4]。個體之間癥狀差異較大,其診斷往往采用精神量表和醫(yī)學(xué)診斷手冊或通過影像學(xué)檢查[5]。抑郁癥是一種在青少年中發(fā)病率很高的心理疾病,其特征是情緒消沉,缺乏自信,對于任何歡愉活動缺乏興趣,自卑抑郁,甚至帶有厭世情緒[6]。具有高發(fā)病率、高復(fù)發(fā)率、高自殺率和高自殘率等特點,嚴(yán)重損壞患者的身心健康[7]。這兩種疾病的發(fā)病機制至今沒有明確的解釋,而且兩者常會有一些相似的臨床表現(xiàn),例如意志消沉、缺乏自信[8]。精神分裂癥患者中抑郁癥的患病率高達42.5%[9],在精神分裂癥的治療過程中,其預(yù)后效果不理想也與患者患抑郁癥有很大關(guān)系[10]。研究表明[11],精神分裂癥患者和抑郁癥患者的EEG 信號在節(jié)律,波幅以及功率等方面均與正常人存在差異,因此本文試圖通過采集兩類患者靜息態(tài)下的EEG 信號,通過深度學(xué)習(xí)的方法來對兩者進行區(qū)分。
腦電圖(EEG)是一種使用電生理指標(biāo)記錄大腦活動的方法,具有高時間分辨率,非侵入性,成本低的特點[12]。EEG數(shù)據(jù)的表示方法有很多,最主要的兩種特征表示方法是頻域特征和時域特征[13-14]。其分析方法也不盡相同,可以采用傳統(tǒng)的機器學(xué)習(xí)的方法進行特征提取與分類[15],也可以利用深度學(xué)習(xí)進行處理[16]。其中深度學(xué)習(xí)是一種特殊的機器學(xué)習(xí)算法,它能夠?qū)⑻卣魈崛『头诸愡M行結(jié)合,同時從數(shù)據(jù)中進行學(xué)習(xí)[17]。
近年來,深度學(xué)習(xí)在計算機視覺、自然語言處理等方面取得眾多前所未有的成果。從圖像分類[18]到目標(biāo)檢測[19],從語音識別[20]到語義分割[21]等均有較大突破。并且深度學(xué)習(xí)在醫(yī)療診斷中的應(yīng)用也日益廣泛[22-23],本文根據(jù)數(shù)據(jù)的轉(zhuǎn)換形式采用了深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)來對兩種疾病進行分類。卷積神經(jīng)網(wǎng)絡(luò)是計算機視覺領(lǐng)域中廣泛使用的一種深度學(xué)習(xí)模型。它對于自然信號(如圖像和音頻)的處理具有顯著的優(yōu)勢。通過多個卷積層的卷積和非線性組合,模型可以將高級的特征表示成更加抽象復(fù)雜的低級特征的組合,這使得模型可以學(xué)習(xí)到模式的空間層次結(jié)構(gòu)。通過池化層,模型可以學(xué)習(xí)輸入信號的局部模式,將輸入信號用較為粗糙的形式進行表示,這使得卷積神經(jīng)網(wǎng)絡(luò)學(xué)到的模式具有平移不變性。
考慮到精神分裂癥患者腦電的復(fù)雜性,以及進行手動提取特征時的多樣性,本文采用卷積神經(jīng)網(wǎng)絡(luò)來對腦電數(shù)據(jù)進行自動的特征提取和分類。為了對多個電極通道和頻段進行分析,還提出了一種EEG 數(shù)據(jù)表示方法。通過采集精神分裂癥和抑郁癥患者的EEG 信號,經(jīng)過數(shù)據(jù)預(yù)處理去除眼電、頭動、工頻干擾等偽跡。將轉(zhuǎn)換后的EEG 頻譜圖轉(zhuǎn)換為灰度圖的形式,利用卷積神經(jīng)網(wǎng)絡(luò)進行分類。
本次研究的數(shù)據(jù)來源于四川大學(xué)華西醫(yī)院第二門診部心理衛(wèi)生中心數(shù)據(jù)庫,和該中心簽署了合作協(xié)議和保密協(xié)議,已得到數(shù)據(jù)使用授權(quán)許可,且所有參與數(shù)據(jù)采集的患者均已簽署知情同意書。實驗收集了70例精神分裂癥患者(SCZ)和70例抑郁癥患者(DP)的腦電數(shù)據(jù),患者年齡均在32歲到51歲之間且服從正態(tài)分布,患者年齡和性別差異均無統(tǒng)計學(xué)意義(P>0.05)。數(shù)據(jù)采集設(shè)備使用動態(tài)腦電圖儀(NATION8128W,上海諾誠電氣有限公司,中國),采樣頻率為128 Hz。采集涉及16 通道的腦電圖帽(如圖1),傳感器按照10-20 電極放置標(biāo)準(zhǔn)[24]。

圖1 采集EEG信號的電極分布圖
實驗數(shù)據(jù)采集時,患者處于一個安靜封閉的室內(nèi)進行。患者需保持安靜、放松、清醒的狀態(tài)。實驗開始,患者閉眼并做深呼吸3 min,結(jié)束后睜眼給予被試10 s 緩沖時間。然后開始閉眼狀態(tài)保持7 s,睜眼狀態(tài)保持7 s,以此為一個閉眼睜眼數(shù)據(jù)采集周期,進行3個周期后結(jié)束數(shù)據(jù)采集。由于實際過程中存在操作誤差,所以真實記錄睜眼和閉眼狀態(tài)數(shù)據(jù)時長為5~10 s。
用EEGLAB 對數(shù)據(jù)進行必要的預(yù)處理。(https://sccn.ucsd.edu/eeglab/index.php)首先根據(jù)睜眼閉眼的時間節(jié)點導(dǎo)入原始采樣數(shù)據(jù),進行電極定位,其次對數(shù)據(jù)進行濾波操作。具體分兩次進行,采用1 408 階FIR(Finite Impulse Response)濾波器進行0.3 Hz 的高通濾波,采用38 階FIR 濾波器進行45 Hz 的低通濾波,最后設(shè)置50 Hz 陷波以減小工頻干擾。顯示波形后若發(fā)現(xiàn)壞導(dǎo)則去掉壞導(dǎo)并用周圍的通道平均值進行替代。
然后根據(jù)實際通道數(shù)利用ICA(Independent Component Analysis)計算出16 個獨立成分,進行眼電、頭動、工頻干擾等偽跡的去除。原始腦電數(shù)據(jù)一般是由各類偽跡與有效的腦電信號經(jīng)過線性或近似線性混合得到。由于混合系統(tǒng)未知,因此偽跡和有效腦電信號均可視為未知隱藏變量,這些變量相互獨立并且往往服從非高斯分布。利用ICA 可以找到各個獨立成分。ICA 的一般線性模型如式(1):

其中z為原始腦電信號,s為有效腦電信號,B為混合矩陣。ICA的目的就是在已知z的情況下,找到一個混合矩陣W使y的各個分量相互獨立(z=Wy),從而使y逼近于s,得到有效腦電信號。然后通過偽跡成分的特征就可以進行偽跡的剔除。
常見偽跡有眼動引起的眨眼、眼漂偽跡,頭動引起的偽跡以及工頻干擾產(chǎn)生偽跡。各個偽跡的特征可以根據(jù)地形圖、時域Trials 色譜圖、功率譜圖進行辨別,具體如圖2所示。

圖2 各偽跡成分特征描述
最后平均所有電極以作為電極重參考。經(jīng)過數(shù)據(jù)預(yù)處理后,每位患者得到3 段睜眼和3 段閉眼狀態(tài)下的數(shù)據(jù),每段數(shù)據(jù)時長為4~10 s,如圖3(a)和(c)。
通過分析篩選出處理后偽跡仍然較多的數(shù)據(jù),得到精神分裂癥閉眼狀態(tài)和睜眼狀態(tài)下的數(shù)據(jù)各200段,抑郁癥閉眼狀態(tài)和睜眼狀態(tài)下的數(shù)據(jù)各200段。
將上述EEGLAB 處理后的數(shù)據(jù)導(dǎo)入Brainstorm(https://neuroimage.usc.edu/brainstorm/),通過快速傅里葉變換,將時域下的每段數(shù)據(jù)(如圖3(a)和(c)轉(zhuǎn)換到頻域(如圖3(b)和(d)。以往也有將時域EEG數(shù)據(jù)直接輸入深度學(xué)習(xí)模型中進行分析的研究[25],但要求對數(shù)據(jù)進行等長的截取,因此會損失部分?jǐn)?shù)據(jù)信息。為了盡可能利用所采集的數(shù)據(jù),本文嘗試將4~10 s長度不一的時域數(shù)據(jù)轉(zhuǎn)換到頻域,將這些時長不同的EEG 數(shù)據(jù)轉(zhuǎn)換成功率譜密度的形式,試圖挖掘出數(shù)據(jù)中更多的潛在信息。通過人眼直觀的觀察,無論是在時域還是在頻域下均很難發(fā)現(xiàn)兩種疾病信號波形的明顯差異。由于信號在高頻部分衰減嚴(yán)重,因此在頻域下僅截取1~50 Hz的數(shù)據(jù),并導(dǎo)出為50行16列的功率矩陣(其中行數(shù)表示頻率,列數(shù)表示導(dǎo)聯(lián)數(shù)),以此作為后續(xù)分析的樣本。

圖3 患者閉眼狀態(tài)下的數(shù)據(jù)形式
利用CNN 對EEG 數(shù)據(jù)進行分析時,也有研究者對數(shù)據(jù)的形式進行了處理。如Tabar等人[16]采集人在想象左手和右手活動時,大腦C3、C4、CZ這3個通道的EEG信號。采用時頻分析,將EEG信號轉(zhuǎn)換成橫軸為時間,縱軸為頻率的圖片樣本,樣本僅利用了Alpha、Beta頻段的數(shù)據(jù)。這種方法所采用的電極和使用的數(shù)據(jù)頻段均較少,考慮到精神病患者腦電的復(fù)雜性,該種對于EEG樣本的表示方法可能不足以完全提取各個通道的特征。Emami等人[26]將整個時域下所有通道的EEG信號,用時間窗劃分為EEG 時域圖片,將整張圖片輸入到卷積神經(jīng)網(wǎng)絡(luò)中區(qū)分癲癇和非癲癇。但這種直接利用EEG的時域信息進行分析的方法,可能會引入過多噪聲數(shù)據(jù),并且可能由于圖片尺寸不統(tǒng)一的問題而使模型學(xué)習(xí)到更多不屬于信號本身的特征。
為了避免了分析時域數(shù)據(jù)時利用時間窗截取信號造成的部分?jǐn)?shù)據(jù)丟失,同時避免直接輸入數(shù)據(jù)截圖引入其他不屬于數(shù)據(jù)本身的信息。本文提出將時域下的EEG 數(shù)據(jù)轉(zhuǎn)換成頻譜圖,得到每個電極通道下1~50 Hz的功率值,從而將每個樣本轉(zhuǎn)換為功率矩陣的形式。再將每個通道的功率進行max-min 歸一化處理,如公式(2),然后轉(zhuǎn)換為灰度圖,如圖4所示。圖4中,10張灰度圖代表10個閉眼狀態(tài)下的樣本,每張灰度圖寬16,代表16個Channel,高為50,表示頻率為50 Hz。每張灰度圖下方的數(shù)字0和1為樣本標(biāo)簽。0表示精神分裂癥,1表示抑郁癥。

圖4 頻譜圖轉(zhuǎn)換成灰度圖的樣本形式

式子中pmax、pmin分別表示單個電極通道下的最大功率和最小功率,p為該通道下對應(yīng)頻率的功率,p′為歸一化后的值。為了將數(shù)組轉(zhuǎn)換為灰度圖像,需要在歸一化后乘以像素值255,式中i即為轉(zhuǎn)換后的像素值。通過頻域的轉(zhuǎn)換可以將長度不一的時域數(shù)據(jù)所包含的信息全部轉(zhuǎn)移到固定頻段信號中,同時進行腦電全通道和全頻段的分析。灰度圖的形式也適合數(shù)據(jù)增強的方法,更有利于使用CNN進行處理。
CNN 在許多領(lǐng)域發(fā)揮著強大的作用。如人臉識別[27]、x-ray醫(yī)學(xué)圖像分析[28]、視覺圖像重建[29]、磁共振圖像分析[30]、MEG 大腦狀態(tài)分析[31]等。CNN 能夠進行特征的自動提取和分類,由于樣本實質(zhì)為50×16 的數(shù)組,構(gòu)建一個8 層的淺層卷積神經(jīng)網(wǎng)絡(luò),具體結(jié)構(gòu)見表1。整個卷積網(wǎng)絡(luò)包含5 種不同類型的層,分別是卷積層(convolution layer)、池化層(pooling layer)、展開層(flatten layer),dropout層、全連接層(dense layer)。

表1 對模型進行評估的各項統(tǒng)計學(xué)指標(biāo) %
Convolution layer:由許多的隱藏單元(neurons)組成。每個隱藏單元是一個矩陣,可以對輸入的數(shù)據(jù)進行卷積,每次卷積的步長(stride)為1。每個隱藏單元卷積后產(chǎn)生一張?zhí)卣鲌D(feature map)。
Pooling layer:用于數(shù)據(jù)的下采樣,以減少卷積層輸出后的數(shù)據(jù)維度,可以有效減小計算量,防止過擬合。最大池化層(max-pooling layer)是在2×2的窗口中選擇最大的值輸入到下一層。
Flatten layer:可以將最后卷積層的輸出數(shù)據(jù)展成一列。
Dropout layer:可以在訓(xùn)練時暫時隱藏部分神經(jīng)元,以達到減小過擬合的目的。經(jīng)過多次實驗,本模型將dropout rate設(shè)置為0.5。
Dense layer:可以將之前提取的特征全部關(guān)聯(lián)起來,映射到輸出空間中。
模型使用了兩種激活函數(shù)(activation function),分別是Relu(Rectified linear unit)[32]和Sigmoid。Relu 可以增加模型的非線性,讓模型同時學(xué)習(xí)輸入數(shù)據(jù)的線性變換和非線性變換,使模型對于輸入數(shù)據(jù)的噪聲更加具有魯棒性。式(3)即為Relu函數(shù)。

式中x為輸入的數(shù)據(jù),f(x)為對應(yīng)的輸出。最后一層的激活函數(shù)選擇Sigmoid函數(shù)(式(4)),用于計算最后模型輸出某一類別的概率值。

其中yc表示模型最后一層對于類別c的輸出,pc表示輸出該類別c的概率。所以模型的最后一層用于預(yù)測輸入樣本的類別。構(gòu)建好模型的結(jié)構(gòu),開始對模型進行訓(xùn)練。本研究分別利用閉眼狀態(tài)和睜眼狀態(tài)下的數(shù)據(jù)進行訓(xùn)練和分類,最后對兩種狀態(tài)下的分類效果進行對比。首先將閉眼下的樣本80%用于訓(xùn)練,20%用于驗證,經(jīng)過多次實驗,模型訓(xùn)練時的參數(shù)設(shè)置如下:選擇優(yōu)化器為RMSProp[33],學(xué)習(xí)率設(shè)置為10?4,每次輸入模型的樣本批量為32,損失函數(shù)選擇binary cross entropy[34]。模型的具體訓(xùn)練過程如圖5 所示。圖5 中,像輸入模型后首先會經(jīng)過卷積層,每一層會輸出由多張?zhí)卣鲌D堆積而成的長方體。圖片上的紅色小方塊代表一個卷積核(隱藏單元),旁邊已標(biāo)出核的大小。箭頭上方的數(shù)字表示特征圖的數(shù)量,也即是卷積核的數(shù)量。經(jīng)過池化層,特征圖數(shù)量不變,但是特征圖的尺寸變小;經(jīng)過dropout層,特征圖尺寸不變,每一層的最下方已經(jīng)標(biāo)示出特征圖的尺寸。通過連續(xù)地卷積池化,原始圖像轉(zhuǎn)換為更高維的特征,再由全連接層將所有的特征關(guān)聯(lián)起來映射到輸出空間。

圖5 模型訓(xùn)練流程圖
對于模型的分類結(jié)果一般采用混淆矩陣(如圖6(c))來表示。混淆矩陣是一個m×m的數(shù)表,其中m表示類別數(shù),列表的行表示真實的樣本類別,列表示預(yù)測的樣本類別。例如對于一個二分類問題來說,其混淆矩陣則為2×2,通過這個矩陣可以得到其敏感度(sensitivity)、特異性(specificity)、查準(zhǔn)率(precision)、查全率(recall)等指標(biāo),而不是僅僅計算模型的精度。因為對于不均衡樣本來說,僅僅計算模型的精度并不能完整地衡量一個模型性能的好壞。例如對于樣本比例為3∶7的測試集,全部預(yù)測為其中多數(shù)類的樣本其精度便可以達到70%。因此常常利用sensitivity、specificity、F1_score、accuracy等指標(biāo)來綜合考量模型。具體的計算公式如下:


圖6 數(shù)據(jù)增強(樣本左右翻轉(zhuǎn))后模型的訓(xùn)練結(jié)果

公式中TP表示真陽性(預(yù)測和實際均為陽性),F(xiàn)P表示假陽性(預(yù)測為陽性,實際為陰性),TN 表示真陰性(預(yù)測和實際均為陰性),F(xiàn)N 表示假陰性(預(yù)測為陰性,實際為陽性)。具體可見圖6(c),其中1 視為陽性,0 視為陰性。
交叉驗證是提高模型可信度的有效方法。本文采用五折交叉驗證法無重復(fù)抽樣地劃分訓(xùn)練數(shù)據(jù)為訓(xùn)練集和驗證集,將訓(xùn)練數(shù)據(jù)分成五部分,每次拿四部分進行訓(xùn)練,剩下一部分用來驗證模型的精度;通過這種方法可以對模型進行五次獨立的訓(xùn)練,最后取五次測試模型的精度平均值作為模型最后的驗證精度。
由于學(xué)習(xí)樣本較少,容易造成模型過擬合,導(dǎo)致訓(xùn)練出來的模型其泛化能力不足。如果訓(xùn)練的樣本有很多,則過擬合問題就很容易解決。對于圖像的分類嘗試用數(shù)據(jù)增強進行處理,以此減小其過擬合。數(shù)據(jù)增強能夠從原有的訓(xùn)練樣本中生成更多的樣本,其方法則是通過旋轉(zhuǎn)、平移、翻轉(zhuǎn)、縮放等手段來生成更多可信圖像,以此讓模型學(xué)到更多訓(xùn)練樣本中的局部信息。對于每一種手段,實驗過程中均按批次生成訓(xùn)練樣本。具體操作為:對于旋轉(zhuǎn),計算機隨機生成順時針或逆時針旋轉(zhuǎn)不超過36度的圖像;平移分上下平移和左右平移,平移范圍不超過圖像移動方向尺寸的0.2 倍;翻轉(zhuǎn)則分為水平翻轉(zhuǎn)和縱向翻轉(zhuǎn),從而訓(xùn)練樣本量可擴大一倍;而縮放為隨機將圖片放大或縮小,其變化范圍不超過原來大小的0.2倍。
最后為了與文中方法進行比較,提取轉(zhuǎn)換后的灰度圖樣本中的HOG[35](方向梯度直方圖)特征,采用SVM(支持向量機)進行分類,并記錄各項統(tǒng)計學(xué)指標(biāo)。
利用快速傅里葉變換將時域信號轉(zhuǎn)換到頻域,導(dǎo)出功率矩陣后轉(zhuǎn)換為灰度圖(如圖4)。每張灰度圖即代表一個信號樣本。由于睜眼和閉眼下的數(shù)據(jù)分析方法相同,以下分類結(jié)果主要以閉眼狀態(tài)下的數(shù)據(jù)為例進行介紹。
將上述轉(zhuǎn)換后的樣本分為訓(xùn)練集和驗證集,其比例為4∶1,輸入卷積神經(jīng)網(wǎng)絡(luò)中進行訓(xùn)練和測試。模型最終訓(xùn)練了150個輪次(epochs),最后驗證精度為85%,損失值為0.32。對模型進一步評估,計算其各項統(tǒng)計學(xué)指標(biāo)(表1)(以下統(tǒng)計學(xué)指標(biāo)均以抑郁癥為陽性,精神分裂癥為陰性進行計算)。
為了進一步評估模型的性能,觀察模型的泛化能力是否良好,采用交叉驗證的方法對模型進行訓(xùn)練。每一折訓(xùn)練后計算模型的敏感度、特異性、查準(zhǔn)率、精度、F1_score 以及最后各個指標(biāo)的平均值,并繪制折線圖(圖7(a))。同時模型的平均訓(xùn)練損失和驗證損失的差值變得更大,最后該模型的平均敏感度、特異性和精度分別為78.66%、77.83%、78.50%。
考慮到模型的復(fù)雜度較低,原始樣本的區(qū)分度小,本文在進行數(shù)據(jù)增強時通過單一的變換手段對訓(xùn)練數(shù)據(jù)進行變換,并計算不同方式下模型的各項統(tǒng)計學(xué)指標(biāo)(圖7(a))。經(jīng)過一系列的實驗后發(fā)現(xiàn)僅對訓(xùn)練樣本進行左右翻轉(zhuǎn),最后訓(xùn)練得到的模型其精度更高。樣本左右翻轉(zhuǎn)后,模型訓(xùn)練過程中訓(xùn)練精度和驗證精度隨著訓(xùn)練輪次增加的變化情況如圖6(a),訓(xùn)練損失和驗證損失隨著訓(xùn)練輪次增加的變化情況如圖6(b),其中模型的訓(xùn)練損失和驗證損失相差越小表示模型的泛化能力越好,并繪制其混淆矩陣(圖6(c)),0 表示精神分裂癥,1表示抑郁癥,最右邊圖例表示顏色越淺其預(yù)測的結(jié)果準(zhǔn)確性越高。其敏感度、特異性和精度分別為84.09%、91.67%、87.50%。
采用同樣的方法對睜眼狀態(tài)下的數(shù)據(jù)進行處理。在相同的模型下對睜眼狀態(tài)的樣本進行訓(xùn)練和評估,通過五折交叉驗證和不同數(shù)據(jù)增強方式訓(xùn)練后得到的結(jié)果如圖7(b)所示。

圖7 五折交叉驗證和數(shù)據(jù)增強后的結(jié)果
為了驗證算法的有效性,提取了灰度圖樣本中的HOG 特征,并采用SVM 進行分類;同時與過去工作中的方法[36]進行比較,即提取EEG 頻譜圖中的功率譜熵(信息熵,樣本熵,近似熵)用SVM分類的方法進行了比較,不同方法下的精度見表2。

表2 不同方法下的分類精度%
本文采集了精神分裂癥和抑郁癥患者靜息態(tài)下的EEG信號,試圖通過這種非侵入性的診斷方式來對兩種疾病進行區(qū)分,跳過傳統(tǒng)模式識別的方法,不對樣本進行手動的特征選擇[16](如每個頻段的相對功率譜密度,每個通道下的峰值、均值、方差等)。不同于以往對于EEG 信號的表示,本文提出將時域下的EEG 信號通過一系列變換,轉(zhuǎn)換成灰度圖。這些灰度圖集成了每個信號樣本不同電極和不同頻率下的功率特征。從轉(zhuǎn)換后的灰度圖可看出多數(shù)樣本在10 Hz左右的亮度較高,即功率值較大,這也跟實際頻域下的波形圖相吻合。說明兩類患者的腦電Alpha 波的功率值均較高。從模型的初次分類結(jié)果看出,兩種樣本是具有可分性的,也說明這種數(shù)據(jù)表示方式是可行的。
模型訓(xùn)練過程中,影響訓(xùn)練效果的因素有很多。如在訓(xùn)練過程中將數(shù)據(jù)分為小批次的batch size 值,模型訓(xùn)練輪次的epochs 值,模型中每一層的隱藏單元數(shù),優(yōu)化器的種類,學(xué)習(xí)率等超參數(shù)。因此實驗中需要對模型的結(jié)構(gòu)和超參數(shù)不斷進行調(diào)試,以使模型的各參數(shù)達到更優(yōu)。由于本研究采用的數(shù)據(jù)樣本較少,對模型的評估可能還具有一定的偶然性。如果樣本在進行劃分訓(xùn)練集和測試集時,將質(zhì)量較差,較難區(qū)分的樣本集中分到一起時,得到的結(jié)果曲線可能會出現(xiàn)較大的差異。為了得到更可靠的模型,需要對模型進行進一步的訓(xùn)練和評估。交叉驗證是提高模型可信度的有效方法。經(jīng)過五折交叉驗證后模型的平均驗證精度為78.50%,低于初次訓(xùn)練時達到的85%,其敏感度和特異性也均有所降低。而且訓(xùn)練損失和驗證損失的差值變大,說明模型的泛化能力變差,還需采用其他手段進行優(yōu)化。
當(dāng)模型過訓(xùn)練,除了學(xué)習(xí)到樣本中的數(shù)據(jù)特征,還學(xué)習(xí)了數(shù)據(jù)中所包含的噪聲,從而造成過擬合的現(xiàn)象。而過擬合往往會導(dǎo)致模型在訓(xùn)練數(shù)據(jù)中表現(xiàn)很好的性能,而對于新的樣本卻沒有預(yù)計的精度。特別是針對于模型結(jié)構(gòu)復(fù)雜而樣本量較少的情況,過擬合現(xiàn)象更加明顯。為了解決這個問題,往往采用增加樣本的數(shù)量,減少模型的復(fù)雜度,添加正則項等方法。后兩種方法在模型的訓(xùn)練過程中已經(jīng)進行了調(diào)整,因此如何增加樣本量是需要考慮的問題。考慮到模型結(jié)構(gòu)簡單,過于復(fù)雜的變換反而導(dǎo)致模型的訓(xùn)練效果差強人意。因此文章采用單一的數(shù)據(jù)增強手段來訓(xùn)練模型,其結(jié)果說明,使用水平翻轉(zhuǎn)的方式來增加樣本量,得到的模型效果最好。模型的精度、敏感度、特異性分別達到了87.50%、84.09%、91.67%。其訓(xùn)練損失和驗證損失的差值變小,與未進行數(shù)據(jù)增強前的模型相比性能有了顯著提高。由此說明數(shù)據(jù)增強不僅可以應(yīng)用于現(xiàn)實中的實物圖像,也適用于生理信號的處理,這對于醫(yī)學(xué)圖像的處理是具有借鑒價值的。
對比睜眼狀態(tài)和閉眼狀態(tài)下的EEG 分類結(jié)果,在相同的模型下進行五折交叉驗證,發(fā)現(xiàn)睜眼狀態(tài)下的精度為70.75%,使用數(shù)據(jù)增強后的精度為72.50%,閉眼數(shù)據(jù)訓(xùn)練得到的模型的各項指標(biāo)均優(yōu)于睜眼狀態(tài)。并且睜眼數(shù)據(jù)訓(xùn)練曲線損失差值也較大,說明利用睜眼數(shù)據(jù)訓(xùn)練出的模型的泛化能力要低于閉眼狀態(tài)數(shù)據(jù)訓(xùn)練出的模型。這可能是由于睜眼狀態(tài)下,病人視覺上容易受到外界景物的干擾,從而采集的EEG 數(shù)據(jù)包含更多的噪聲,造成模型的分類效果不好。
最后為了驗證本文EEG 灰度圖表示的有效性,提取了閉眼數(shù)據(jù)灰度圖HOG 特征進行分類,精度達到了86.25%,略低于直接使用CNN 進行分類的精度。并且睜眼數(shù)據(jù)的分類精度仍然較低。與直接使用頻域數(shù)據(jù)提取功率譜熵的方法進行比較發(fā)現(xiàn),用CNN 分類閉眼數(shù)據(jù)的灰度圖精度更高。進一步證明文中提出的表示方法的有效性。
本文通過采集精神分裂癥和抑郁癥患者靜息態(tài)下的腦電信號,通過卷積神經(jīng)網(wǎng)絡(luò)模型來對兩種疾病進行分類。通過對EEG信號進行分析,提出將時域下的EEG信號轉(zhuǎn)換成灰度圖。利用深度卷積神經(jīng)網(wǎng)絡(luò)對兩種疾病進行分類并采用交叉驗證的方法對模型進行評估。文章通過對睜眼和閉眼下的數(shù)據(jù)分別進行訓(xùn)練分類,發(fā)現(xiàn)閉眼狀態(tài)的數(shù)據(jù)分類效果更好。為了進一步提高模型的性能,采用數(shù)據(jù)增強的方法使模型的分類精度、敏感度、特異性分別達到87.50%、84.09%、91.67%,與未進行數(shù)據(jù)增強前的模型相比有了顯著提高。
本文以靜息態(tài)腦電信號為基礎(chǔ),利用卷積神經(jīng)網(wǎng)絡(luò)進行特征的自動提取和分類,所提出的這種EEG 數(shù)據(jù)的轉(zhuǎn)換和分析方法是值的借鑒的。這些方法不僅適用于特定疾病的EEG 數(shù)據(jù),同時也能應(yīng)用于臨床上其他電生理信號的分析。因為它可以將雜亂的EEG信號轉(zhuǎn)換成卷積神經(jīng)網(wǎng)絡(luò)可以識別的圖像形式,同時也可以通過數(shù)據(jù)增強的方法來進一步改善模型的性能,證明該方法除了可以用于現(xiàn)實中的實物圖像分類,還適用于電生理信號的處理。但本文也存在著一些不足:深度學(xué)習(xí)需要大量的數(shù)據(jù)作為支撐,而本文所使用的數(shù)據(jù)是匱乏的,因此為了減小過擬合,本文嘗試了多種方法。如果要投入到臨床使用中,還需要盡可能擴大新的數(shù)據(jù)集,來訓(xùn)練更加可靠的模型。雖然EEG數(shù)據(jù)的圖像形式方便分析處理,但該形式可能會導(dǎo)致通道之間的聯(lián)系減弱,在分類時沒有提取到有關(guān)于電極通道之間關(guān)聯(lián)性的特征。因此,接下來如何探討電極之間的關(guān)聯(lián)性,實現(xiàn)腦網(wǎng)絡(luò)的分析也將是今后研究的一個重點。