田 程,胡 廷,曹 銳,相 潔
太原理工大學 信息與計算機學院,太原030024
精神分裂癥是一種病因未明的重性精神疾病,主要包括陽性癥狀,如妄想、幻覺;以及陰性癥狀,如認知障礙、思維紊亂等[1],給社會和家庭帶來嚴重的負擔??茖W研究表明:如果在患病早期能夠準確診斷,有效治療之后,大多數患者的病情可以得到控制,甚至康復。所以近年來該疾病受到社會和家庭越來越多的重視。
腦電圖(EEG)是一種非侵入式和非放射性的工具,可長期測量大腦功能,因此廣泛應用于臨床疾病診斷。腦電反映大腦的活動狀態,多用于輔助診斷大腦疾病,包括癲癇、阿爾茲海默癥、精神分裂癥等。同時,大腦是一個混沌系統,腦電信號具有非線性的復雜度特征,所以腦電信號的復雜性估計已經被廣泛應用于疾病研究中。之前的研究采用Lyapunov指數(L1),香濃熵(ShEn),近似熵(ApEn)和Lempel-Ziv復雜度(LZC)等非線性指標發現精神分裂癥患者與健康被試之間存在顯著的復雜性差異[2]。在復雜性分析方法中,基于熵的算法是用于評估EEG規律性或可預測性的有效且穩健的評估器。2007年,Chen等人[3]改進了樣本熵算法,引入模糊集后定義了一種新的測量時間序列復雜度的方法——模糊熵(FuzzyEn)。研究結果表明:腦電信號中的熵值測量可能更適合捕獲人腦中不可察覺的變化。
最近,深度神經網絡在圖像、視頻、語音和文本在內廣泛的識別任務中取得了巨大的成就[4-5]。而卷積神經網絡作為一種成熟的網絡結構,近年來廣泛應用于語音和圖像識別領域?;诰植扛惺芤昂蜋嘀倒蚕淼葍烖c,使得網絡結構的復雜性大大降低,并且在腦電信號的檢測中也得到了深入的研究應用[6-7]。
本文采用基于模糊熵和卷積神經網絡的精神分裂癥腦電信號分析方法,首先使用模糊熵對δ(0~3 Hz)、θ(4~7 Hz)和α(8~13 Hz)三種頻段的腦電信號進行特征提取,統計檢驗后,選擇存在顯著性差異的電極作為卷積神經網絡的輸入,并優化網絡的結構和參數,進一步從腦電數據中學習到更多的特征以提高分類精度。總體而言,所提出的方法旨在以熵和卷積神經網絡為基礎來揭示健康被試和患者EEG信號復雜性的差異,為精神分裂癥的臨床診斷提供科學有效的思路和途徑。
本實驗所用的數據為來自北京回龍觀醫院的61名精神分裂癥患者和與之年齡相匹配的55名健康被試,兩組被試在年齡與性別以及受教育程度上均沒有統計學差異。所有患者均符合美國精神障礙診斷統計手冊第4版(DSM-IV)中關于精神分裂癥的診斷標準[8],并且取得患者和家屬的同意。電極帽安放完畢后,被試靜坐于隔音實驗室中,頭部和身體各部位保持靜止,并盡量避免眼球運動。被試信息如表1所示。

表1 被試信息表
本研究按照國際心理生理學會提出的腦電信號記錄原則與標準要求進行,實驗室內隔音、安靜。使用BrainProducts公司的腦電記錄與分析系統,根據國際10/20系統記錄64導EEG信號。電極的安放位置如圖1所示。信號的采樣頻率為500 Hz,在安靜閉眼狀態下采集受試者的EEG信號。

圖1 國際10-20系統的電極位置
數據預處理通過Brain Vision Analyzer軟件執行,首先對記錄的原始EEG信號進行電極重參考,在事件相關電位(ERP)研究中不同的參考電極會產生不同的影響,因此選擇常用于ERP數據預處理的所有電極的平均值作為參考;其次采用大小為0.5~50 Hz的濾波器對腦電信號進行濾波;眼電(EOG)對EEG信號影響很大,因此需要對由眼球運動或眨眼造成的肌肉影響進行矯正,從EEG信號中減去受EOG影響的部分。首先尋找EOG的最大絕對值,將最大值的百分比(10%)定義為EOG偽跡,其次將超過EOG偽跡的電位識別為EOG脈沖,取平均后得到平均偽跡,并計算與其他電極之間的EEG傳遞系數,最后根據系數對造成影響的波段進行校正;之后使用獨立成分分析(ICA)方法進行偽跡去除,EEG信號包含由分離矩陣W混合而成的不同源信號,這些源信號包括自身活動、噪聲等眾多干擾源。首先為了簡化算法,將EEG信號進行去均值操作,其次通過重復的迭代計算尋找適當的分離矩陣wi,使得函數N(si)獲取極大值,便可得到一個獨立分量si,分離過程中,不斷調整分離矩陣,直到相鄰兩次的wi無變化或者變化較小時,結束對該獨立分量的提取。重復上述分離過程,從EEG信號中減去每一個提取的獨立分量,最終將所有獨立分量分離出去;并將每個被試的時域數據截取60個長度為1.4 s的時間片段;最后將數據以.eeg的形式導出。整個實驗流程圖如圖2所示。
在樣本熵和近似熵算法中,由二值函數確定向量之間的相似性:

圖2 實驗流程圖

給定一個輸入樣本,當符合一定條件時,根據二值函數將被判斷屬于其中一類,反之屬于另一類。通常情況下,對于給定的一個樣本,是很難判斷其屬于哪一類的,便引入了模糊集。模糊熵使用模糊隸屬函數來測量向量之間的相似度,而不是基于樣本熵算法的二值函數[3]。該函數為指數函數,由于指數函數是連續函數,保證函數值不會像二值函數一樣產生突變,計算結果是平滑且連續的;并且與其他熵相比,模糊熵對相空間維數m和相似容限r等參數具有較低的敏感度,所測值的魯棒性更高。該算法描述如下:
根據序列順序對u()i進行相空間重構,得到一組m維(m≤N-2)矢量,如下:

模糊隸屬函數如下:


n和r分別表示指數函數的梯度和寬度。定義函數φ(n,r):

并以相同的方式重復上述步驟,可以根據序列的順序重建一組(m+1)維向量,將其定義為最后,序列長度為N的時間序列的模糊熵可表示如下:

通常情況下,過大的相似性容限會導致時間序列中有用信息的丟失,過低的相似性容限又會增加噪聲的敏感度。在本研究中,通過進行參數調優,設置m=2,r=0.25×SD,其中SD為時間序列的標準偏差。
將預處理后的腦電數據分為δ(0~3 Hz)、θ(4~7 Hz)和α(8~13 Hz)三個頻段;將三個頻段的時間片段按照時間窗大小為400 ms,步長(窗移)為50%,截取6小段。選取400 ms是由于模糊熵適合于短數據集的處理,時間序列不適合選取太長,當使用300 ms、400 ms、500 ms的時間窗分別進行特征提取時,發現不同的長度對實驗是有影響的,在400 ms下健康被試和精神分裂癥患者的復雜度差異最大,所以最終選取400 ms作為時間窗大小。并嘗試了五種不同的步長,分別是重復30%、40%、50%、60%、70%,結果顯示,步長對實驗結果的影響比較小,總體來說在50%步長下的結果是略好于其他情況的,所以選擇了50%的步長;之后分別用模糊熵對每段400 ms的數據進行復雜度特征提取,分別計算出健康被試和精神分裂癥患者在三種頻段下連續的六個時間窗的熵值。用雙樣本T檢驗進行統計分析,從所有電極中選擇出差異性最顯著的32個電極(p<0.05)??紤]到電極位置的空間分布特征,位于同一腦區的電極共同反映同一腦部活動,所以將位于同一腦區的電極相鄰放置,進行排序;將每個電極三個頻段的熵值按照時間窗的前后順序進行排序,這樣每個樣本可以表示為32×18的矩陣。每個樣本對應一個標簽,患病為1,不患病為0。將其作為卷積神經網絡的輸入。如圖3所示為卷積神經網絡的輸入數據影像圖。
卷積神經網絡是一種用于生成特征層次結構的神經網絡,有兩大顯著特點:稀疏連接和權值共享[9]。稀疏連接用于提取圖像中不同區域的特征;權值共享則極大減少了網絡中訓練參數的個數和訓練時間,簡化網絡結構。卷積神經網絡的結構如圖4所示。

圖3 輸入數據影像圖

圖4 卷積神經網絡的結構
卷積層是網絡結構的第一層,也是核心層。使用卷積核進行掃描,將輸入神經元與網絡權重相連,得到特定權值向量的特征圖。卷積操作可以極大地減少網絡參數,從而降低運算量。利用激活函數進行特征映射。激活函數加入了非線性因素來最大可能地保留數據的特征,本文中使用更優的Relu函數作為激活函數,研究表明Relu函數使得運算速度和運算效果得到明顯提升。Relu函數表達式如下:

池化層的作用是將卷積運算得到的某一位置的輸出由鄰近值來取代,從而減少運算量。池化層中每個特征映射的平面上的神經元具有相等的權重,所以池化運算與卷積運算是類似的,通過激活函數得到采樣層的輸出。目前常見的池化方法包括最大池化(max pooling)和平均池化(mean pooling)。本實驗中由于特征之間的差異比較大,所以采用了最大池化方法。
全連接層的作用是整合卷積池化操作后得到的特征向量,也就是將輸入的二維特征向量轉化成一維向量。歸一化處理后,輸出到下一層作為分類器的輸入。本實驗將全連接層設置為兩層,用于提升網絡的學習效率,每層神經元數量設置為256個。
Softmax分類器是一種有監督的多分類器,是對邏輯回歸模型的改進,得到的結果是一個概率值,即若存在樣本數據x,通過Softmax便可計算其屬于某一類的概率p,最終得到歸一化的分類概率值。
卷積神經網絡的學習過程是一個不斷優化網絡中眾多參數的過程,包括前向傳播與后向傳播。前向傳播過程中首先對訓練數據進行批處理(Batch_size),通過卷積層、池化層以及激活函數的前向傳播后,得到輸入信號的實際輸出,此時完成了卷積神經網絡的第一階段的學習;在前向學習過程中,卷積核與偏置的值均為初始化值,所以實際輸出結果與真實結果之間存在一定的誤差,為了降低誤差,需要計算平均誤差代價函數來不斷地更新權重與偏置,該過程為卷積神經網絡第二階段的學習。最終得到最優的網絡學習模型。
本研究基于Theano框架評估了不同深度VGG風格的卷積神經網絡配置。如圖5所示,表中卷積層參數表示為Conv<接收域大?。荆純群藬担?,A模型只涉及到兩個疊加在一起的卷積層(Conv3-32);B模型在A模型基礎上添加了兩個卷積層(Conv3-64);C模型在B模型的基礎上,再添加一個卷積層(Conv3-128);模型D和模型C的不同之處在于第一個池化層前提供了四層卷積。最后在所有模型中添加兩層含有256個節點的完全連接層,并使用Softmax函數作為分類器。

圖5 不同CNN模型的配置信息
為了防止神經網絡在學習過程中出現過擬合,本研究將Dropout技術引入到全連接層中。該技術可提高參數的泛化能力,從而防止訓練參數對訓練數據集的重度依賴[10]。經過參數調優,將學習率設置為0.01,Dropout的值設置為0.5,卷積核的大小為3×3,設置的迭代次數為20次。本實驗采用了k-折交叉驗證,k選取為10。訓練集和驗證集比例為9∶1。訓練集用于訓練擬合模型;驗證集用于選擇訓練中得到的分類效果最優模型的參數,并進行參數調整;另外使用未參加過訓練和驗證過程的測試集來評價通過訓練集和驗證集得到的最優模型的性能與分類能力。最后將交叉驗證的分類結果進行平均。
如圖6所示為第一個時間窗(400 ms)的三種頻段中模糊熵特征的腦地形圖,從圖中可以看到,在三個頻段下,精神分裂癥患者的熵值普遍高于健康被試。并且全腦的差異性很大。模糊熵是一種測量腦電信號中出現新模式概率的非線性方法,生成新模式的概率與腦電信號的復雜度呈正相關。相比于健康被試,精神分裂癥患者由于自身大腦中的神經元處于興奮和活躍狀態,神經元做無序運動,所以患者大腦中產生新模式的概率較大,腦電信號的復雜性更高。統計檢驗的結果表明,兩組之間在很多腦區中存在顯著差異(t<-15.159,p<0.05)。而模糊熵具有更好的魯棒性以及連續性,因此認為模糊熵作為輸入特征進行分類能有效地區分健康被試和精神分裂癥患者。

圖6 模糊熵腦地形圖
本實驗中首先使用了三種該領域常用的機器學習分類算法,包括支持向量機(SVM)、樸素貝葉斯(NB)以及隨機森林(RF)。并且對分類器中的參數進行調優。SVM分類器的參數比較多,其中最重要的是懲罰參數c和核函數參數g兩個參數。首先使用RBF核函數,研究表明該核函數相對穩定,其次對于一組取定的c和g,利用十折交叉驗證的方法,選取準確率最高的那組c和g作為最佳參數,SVM分類器的參數為:c=1.0,g=0.125;NB分類器中主要選擇參數估計方法,有極大似然估計和貝葉斯估計。由于極大似然估計可能導致估計出的概率為0,會影響后驗概率的結果,所以NB分類器使用貝葉斯估計;RF分類器中有三個比較重要的參數,分別是最大特征數max_features、子樹數量n_estimators和最小樣本葉min_sample_leaf,使用交叉驗證的方法得到不同參數組合下的分類準確率,并選擇準確率最高的參數組合作為最佳參數,RF的參數為max_features=auto、n_estimators=60、min_sample_leaf=30。三種分類器的分類結果如表2所示。從表2中可以看到,三種分類器中分類效果最好的是SVM分類器,準確率達到了91.3%,而另外兩種分類器的分類準確率分別為89.7%和87.6%。但是這三種分類器無法獲取輸入數據更深層次的隱含信息,分類準確率無法達到理想的效果。

表2 傳統分類器的分類結果比較
通過多次實驗選擇了四種不同深度的卷積神經網絡框架。遵循VGG風格體系結構[11],在每一層中選擇合適的過濾器的數量,并且用較小接受域進行卷積操作。這四種模型的最終分類結果如表3所示,從表3中可以看到,不同深度的卷積神經網絡的分類結果之間存在一定的差異。首先C<2,2,1>模型的分類準確率最高,并且準確率遠高于傳統分類器,驗證集的準確率為99.23%,測試集的準確率為99.16%;D<4,2,1>與B<2,2,0>模型的準確率都低于上述模型;而A<2,0,0>模型的分類準確率最低,驗證集準確率只有89.09%。4種模型的準確率箱圖如圖7所示,從圖7中可以觀察到不管是驗證集還是測試集,C<2,2,1>模型的準確率分布情況均優于其他三種模型。以上結果表明神經網絡的深度太深或者太淺都不能使分類效果達到最優狀態,需要不斷調試。

表3 不同深度CNN的分類結果比較
如圖8所示為網絡結構為C<2,2,1>模型的準確率曲線圖和損失曲線圖。從圖中的分類準確率曲線可以看到,迭代次數不斷增加,驗證和測試準確率均呈現上升趨勢,并且當迭代次數達到15次時,準確率趨于穩定,達到了99%以上;與準確率曲線相反,訓練損失、驗證損失以及測試損失在逐步減小,并且當迭代次數達到15次的時候,損失都達到平穩狀態。訓練得到的模型性能在驗證集和測試集上效果都顯著是實現良好擬合的基礎,可以通過訓練損失和驗證損失同時下降并最終達到穩定狀態進行判斷,所以本實驗訓練得到的模型實現了良好擬合。

圖7 驗證集和測試集的箱圖

圖8 準確率和迭代損失曲線圖
本實驗中,卷積神經網絡融合了腦電信號的非線性特征、時域、空域以及頻域信息,經過模型優化,實驗結果證明了本文模型在訓練學習過程中的有效性。雖然該方法不是直接對原始EEG時間序列進行操作,但是通過從EEG中提取模糊熵作為非線性特征,能夠發現EEG中更加隱含的信息。
將本文的方法與其他關于精神分裂癥的分類研究進行比較。比較結果如表4所示。文獻[12]中通過記錄多通道腦磁圖(MEG)信號,并提取了最具識別性的δ、θ和α波段的功率譜值作為特征,使用SVM分類器進行分類,分類準確率為91.8%;文獻[13]中采用互信息技術進行通道選擇,該技術用于確定信息量更大的通道,從而獲取更好的識別能力,自相關(AR)系數、頻帶功率以及分形維數作為信號的特征,最后使用Adaboost分類器進行分類,結果為91.94%;文獻[14]中使用一種棧式自動編碼器對患者和健康被試的功能性磁共振成像(fMRI)數據進行分類,分類準確率為92.00%;文獻[15]中將離散小波變換(DWT)應用于EEG信號,提取的相對小波能量特征被傳遞到分類器用于分類,最后通過SVM、多層感知器以及K-最近鄰分類器實現98%的分類準確率。但是本研究相較于以上研究,分類準確率得到了明顯的提升。

表4 與其他分類結果的比較
模糊熵是一種基于復雜性的時間序列分析方法,模糊隸屬函數使得測量的結果連續且平穩,能夠使用較短的時間序列獲得穩健的測量值,并且魯棒性得到了很大提升。由于腦電信號的非線性特征,使用模糊熵可以提取出時間序列中更加隱含的信息。
本文提出了一種結合模糊熵和卷積神經網絡的腦電信號分類方法,將腦電信號進行分頻處理,之后將各個頻段的每段時間序列分別用模糊熵提取信號的復雜度特性,選擇存在顯著差異的電極,并將熵值按照先后順序排列構成影像圖,作為神經網絡的輸入,可以學習到信號中更深層次的信息。最后使用Softmax分類器進行分類。實驗結果表明,復雜度可以更好地提取健康被試和精神分裂癥患者中腦電信號的非線性特征,并能夠檢測到兩類被試間存在的顯著差異,通過對卷積神經網絡進行參數調優和性能優化,訓練出更優的模型,最后分類結果顯示,與傳統的分類算法相比,該方法下分類準確率得到明顯提升。該方法能夠更好地輔助精神分裂癥的臨床診斷,并可以應用到其他疾病診斷中,為臨床疾病診斷提供更加科學高效的措施。