田曉彬,鄧趙紅,王士同
江南大學數字媒體學院,江蘇無錫 214122
全球大約有1%~2%的人患有癲癇。盡管大多數患有癲癇的人在癲癇未發作期間和正常人無異,但癲癇突然發生時的不可預測性是其導致病人殘疾甚至死亡的主要原因,這種發作的不確定性嚴重影響病人的生活。EEG信號是一種記錄大腦神經元活動的重要信號,它通過使用電生理指標來記錄大腦活動時產生的大腦皮層的電波變化,是大腦神經元活動在大腦皮層的總體反映。在生物醫學研究方向的電信號研究中,癲癇發作時,由于大腦神經元的異常放電,導致此時的EEG信號和正常狀態下的EEG信號是不相同的,因此通過識別EEG信號來檢測癲癇是否發作是一種有效的癲癇檢測方法。
隨著機器學習的發展,越來越多的智能算法被運用到EEG信號的癲癇檢測,例如支持向量[1-2]、樸素貝葉斯[3]、神經網絡[4]和模糊邏輯系統[5-6]等分類方法,以及主成分分析(principal component analysis,PCA)[7]、小波包分解(wavelet packet decomposition,WPD)[1,8]、高階交叉(higher order crossings,HOC)[9]等特征提取方法。這些方法首先對原始特征進行特征提取,使用獲得的新特征訓練出一個分類模型,然后使用訓練好的模型進行預測,從而達到癲癇檢測的功能。雖然已有很多的特征提取和分類方法運用于EEG癲癇檢測中,但如何提取有效的含有豐富鑒別信息的特征用于后續的有效檢驗依然是一個重要的挑戰。
近年來,深度學習作為一種機器學習方法,在特征學習等方面受到了廣泛關注。深度學習通過期望的輸出來學習到每一層的權重,層次結構的每一層都對特征進行調整來獲得更可能得到期望輸出的特征,即每一層都對輸入特征進行了優化學習,從而獲得越來越有鑒別性的特征。近些年來,深度學習技術在EEG信號處理方面已得到有效應用,有研究[10-12]使用不同的特征提取方法得到EEG信號的特征,然后利用卷積神經網絡來對得到的特征進行癲癇檢測。
多視角學習技術是通過考慮不同視角之間的多樣性來從多視角數據中學習的方法[13-14],根據多視角學習技術之間的相似點和不同點,多視圖學習算法可以被分為三種:(1)協同訓練;(2)多核學習;(3)子空間學習。雖然三種方法存在顯著差異,但它們主要利用共識原則或互補原則來確保多視角學習的成功。多視角學習技術也被廣泛地應用到EEG信號的癲癇檢測中,通過多種特征提取方法獲得EEG信號的多視角數據,然后使用多視角學習技術來進行癲癇檢測[6,15]。
為了使用EEG信號構建出有效的特征用于癲癇檢測,本文利用深度學習和多視角學習技術,提出了融合深度和淺層特征的多視角分類算法。由于EEG信號具有多種不同的淺層特征,如頻域特征、時頻域特征、非線性特征等,因此對多個不同的淺層特征進行深度特征提取得到深度特征,并將深度特征和淺層特征一起構造出多視角數據集。進一步,使用多視角學習技術對多視角特征集進行分類,從而實現癲癇檢測的功能。
本文提出的算法可概括為如下三部分:
(1)EEG信號淺層特征的獲?。篍EG信號有很多構建淺層特征的方法,用不同方式構造出的淺層特征都具有一定的效果,也各有優缺點。為了將不同方法構造的淺層特征的優勢結合起來,獲取多個不同的淺層特征來進行癲癇的檢測。本文使用的淺層特征包括使用快速傅里葉變換(fast Fourier transform,FFT)和WPD獲取EEG信號的頻域淺層特征、時頻域淺層特征。
(2)EEG信號深度特征的獲?。簽榱颂岣逧EG信號淺層特征的有效性并且獲得更具有泛化能力的特征,本文使用卷積神經網絡(convolutional neural networks,CNN)對EEG信號的淺層特征進行深度特征學習來構造出深度特征。相對于淺層特征,EEG信號的深度特征具有更小的數據維度和更高的分類效果。
(3)分類器的構建和分類的決策:將EEG信號的淺層特征和深度特征看作一個多視角特征集。構造出多視角分類器,基于多視角分類器的輸出結果來進行是否發作癲癇的決策。
融合深度和淺層特征的多視角分類算法集合淺層特征和利用深度學習技術獲得的深度特征,再利用多視角學習技術進行決策。深度學習的深層次結構優化特征表示;淺層特征保留EEG信號的原始信息,減少信息損失;多視角技術有效地利用每個視角特征的獨立性和視角特征之間的相關性。將淺層特征、深度特征和多視角學習技術有效結合可以充分提取EEG信號中的有效信息,提高分類器的泛化能力。
本章將對本文所提方法的相關工作進行簡要介紹,包括使用EEG信號進行癲癇檢測的意義,以及將機器學習技術、深度學習技術以及多視角學習技術應用在EEG癲癇檢測方面的進展。
生物信息學、醫學圖像處理和生物信號處理等都是智能技術在生物醫學上面的應用。生物信息學研究蛋白質和基因信息;醫學圖像處理主要包括分析CT、NMR等;生物信號處理就是對EEG、ECG等電信號的研究。EEG信號是人體腦部神經元活動的表現,包含著很多人體生理活動的信息,EEG信號已被廣泛地應用于癲癇檢測領域。癲癇檢測通常表示使用自動算法對病人的生物信號進行分析來判斷癲癇病人是否正在發作癲癇或者已經發作癲癇。癲癇檢測的重要目標是如何盡可能快速地有效地執行此轉換。近年來,多種用于癲癇檢測的算法[5,16]已被提出,并達到了一定的效果。
近些年來有很多機器學習技術被用到EEG信號的自動癲癇檢測中。Wang等人[17]使用隨機森林(random forest,RF)、C4.5、支持向量機(support vector machine,SVM)+RF、SVM+C4.5四種方法進行EEG癲癇檢測,發現RF具有最好分類效果。Zhang等人[18]采用小波包分解提取的近似熵和樣本熵作為特征,然后利用支持向量機和極限學習機作為分類器進行EEG癲癇檢測。Yang等人[19]使用WPD和KPCA(kernel principal component analysis)進行特征降維,進一步使用TSK模糊邏輯系統作為分類器進行癲癇檢測。這些算法都在癲癇檢測方面取得了一定的效果。
隨著深度學習的發展,堆疊自動編碼器[20-22]、深度信念網絡[23-25]、卷積神經網絡[26-28]、循環神經網絡[29-32]等經典深度學習算法都被有效地運用到生物醫學中。近年來,已有一些工作嘗試使用卷積神經網絡來處理EEG信號,并且取得了不錯的效果。Antoniades等人[10]通過卷積神經網絡對原始EEG信號進行一維卷積來預測癲癇發作;Cecotti等人[11]通過對原始信號進行傅里葉變換來將EEG信號轉換到頻域,然后使用卷積神經網絡進行分類;Mirowski等人[12]使用特征處理將原始EEG信號編碼為像素顏色以形成二維模式,然后將編碼后的數據應用于癲癇預測。
多視角學習算法是針對擁有不同視角特征的數據集發展起來的機器學習算法。由于引入的多視角協作學習機制可以有效地利用每個視角的視角獨立性和學習過程中不同視角之間的相關性,因此可以獲得比原始單視角數據更好的建模效果。典型相關性分析(canonical correlation analysis,CCA)[33-34]、協同訓練co-training[35-36]、稀疏多視角SVM[37]等是常用的多視角算法,并且在不同多視角數據應用場景已取得了較單視角方法更好的效果。近些年來的一些工作將多視角技術應用在EEG信號的癲癇檢測中。Spyrou等人[15]通過對EEG多視角特征使用張量分解來得到新的特征進行癲癇檢測,相關研究結果表明提取得到的新的特征具有更好的分類效果;Jiang等人[6]提出了基于多視角學習框架和模糊系統結合的多視角EEG信號癲癇檢測的方法。
定義TSK模糊系統的模糊推理規則如下:


其中,xg是通過模糊規則將原始輸入x映射到新的特征空間的向量,pg為TSK模糊系統中的規則構建出來的模糊規則的后件參數。許多算法都可以用于求解TSK模糊系統的后件參數,Deng等人[1]使用了一種有效的優化算法。在這個算法中,TSK模糊系統的目標函數定義如下:

其中,第一項期望學習到最優的pg,j來對訓練樣本進行分類;第二項為正則化項,給TSK模糊系統進行一定的懲罰,提高TSK模糊系統的泛化能力,即在未知的測試集上也能達到很好的效果。λ為正則化參數,用來權衡正則化項懲罰的大小。
計算?(JMV_TSK_FS)/?(wk)=0時的解,來獲得最優的后件參數pg。pg的最優值可以通過以下公式計算得到:

本文通過對原始EEG信號使用FFT和PWD來獲取頻域淺層特征和時頻域淺層特征,然后對淺層特征進行深度特征提取,得到頻域深度特征和時頻域深度特征,最后對深度和淺層特征進行多視角模型學習。
本文提出的方法包含三個核心的部分:EEG信號淺層特征的獲??;EEG信號深度特征的獲??;多視角分類器的學習。圖1詳細描述了本文方法的基本框架。

Fig.1 Framework of proposed method圖1 本文方法框架
原始EEG信號為時序信號,由不同頻率的信號累加而成。雖然具有很好的時間特性,但是并不能很好地表現出信號的基本頻率特征。為了獲得信號的頻率特征,使用傅里葉變換將信號從時域轉換到頻率域。根據傅里葉變換可知,任何連續的周期信號都可以轉換到頻域,但傅里葉變換的基礎是信號為周期信號,EEG信號越長周期性就越小,得到的頻域特征越不準確。小波變換可以將信號轉換到時頻域中進行分析,獲得各個時間點的瞬時頻率,由此既保留信號的時間順序,又因為計算瞬時頻率時信號長度很短所以得到的頻率更為準確?;谏鲜龇治觯疚膹脑糆EG信號中抽取出頻域和時頻域兩個視角的淺層特征。
3.2.1 頻域淺層特征構建
EEG信號具有很大的復雜性,被看成是不同頻率信號疊加形成的。根據研究發現,EEG信號的頻率主要處于0 Hz到60 Hz之間,主要分為6個頻率區間:Delta-1(0~2 Hz)、Delta-2(2~4 Hz)、Theta(4~8 Hz)、Alpha(8~15 Hz)、Beta(15~30 Hz)、Gamma(30~60 Hz)。
為了在減少頻域淺層特征的維度的同時又可以較好地保留原始EEG信號的信息,本文設置離散傅里葉變換后的頻率采樣間隔為1 Hz,選取4 Hz到30 Hz之間的頻率來構建頻域淺層特征[38-39]。圖2即為原始EEG信號轉化得到的頻域淺層特征,其中橫軸代表頻率,縱軸代表振幅。

Fig.2 Frequency domain shallow features of EEG signals圖2 EEG信號的頻域淺層特征
3.2.2 時頻域淺層特征構建
信號的時頻特征能描述信號在各個時間點下的瞬時頻率,即在保留信號的時間特征之外有效計算出信號的頻域特征。小波分解是一種常用的將信號轉換到時頻域的方法。小波變換將傅里葉變換的三角函數基轉換成小波函數基,小波函數中有兩個變量:尺度a和平移量τ。尺度控制小波變換的伸縮即頻率,平移量控制小波變換的平移即時間。由這兩個變量控制的小波變換可以對信號逐步進行多尺度的細化,從而達到自適應時-頻信號分析的要求。
WPD是小波變換的一種常用方法[18,40]。本文使用WPD來獲得EEG信號的時頻域淺層特征,采用的小波基函數為Daubechies(dbN)。dbN小波具有較好的正則性,隨著階次的升高消失矩階數增大,光滑性就變得越好,頻域的局部化能力越強,頻帶的劃分效果就越好。但過大的消失矩階數會使得時域的支撐性減弱,計算量增大,即實時性變差。本文設置小波函數的階數N為4,同時因為轉換到時頻域的信號是三維的數據(通道×頻率×時間),為了減少轉換后特征的數量,減少計算時間,設置和頻域不同的采樣間隔2 Hz。設置小波變換的分解層數為6層。和頻域一樣,本文只考慮頻率范圍4 Hz到30 Hz之間的時頻特征。圖3為原始EEG信號轉化得到的時頻域淺層特征,其中橫軸代表時間,縱軸代表頻率,圖中不同的顏色表示在相應的時間和頻率下的能量的不同。能量的對照值在圖右方的彩色條中表明。

Fig.3 Time-frequency domain shallow features of EEG signals圖3 EEG信號的時頻域淺層特征
本文使用卷積神經網絡對EEG信號的頻域和時頻域淺層特征進行自動提取。針對兩個域的淺層特征,分別構建兩個不同的卷積神經網絡來對淺層特征進行深度自動提取,獲得相應的深度特征。
CNN網絡在訓練時采用最后一層輸出層的結果計算誤差并進行反向傳播,由此來進行網絡的學習。因為倒數第二層計算得到的特征向量到輸出層只經過一個全連接層,可以認為根據網絡輸出層訓練優化網絡結構的同時,對倒數第二層輸出特征向量的表達也進行了優化,即網絡在訓練的同時也學習到了更好的特征表達,因此選擇網絡倒數第二層的輸出作為網絡學習到的特征。通過卷積神經網絡的自動學習獲得的特征,具有比原始特征更小的維度,并且得到的特征是經過非線性組合的具有更好劃分能力的特征,可以使后續的分類模型具有更好的泛化效果。
圖4、圖5為頻域和時頻域深度特征提取所使用的CNN網絡架構圖。用k@m×n表示網絡各個層的特征圖,k表示該層特征圖的個數,m×n表示特征圖的大小。網絡的二維卷積核用k×m×n表示,k是卷積核的個數,m×n為卷積核的大??;三維卷積核用k×m×n×l表示,k是卷積核的個數,m×n×l為卷積核的大小。卷積核的步長默認為1。網絡的輸入為各個視角特征,輸出為一個向量,向量長度等于2(癲癇和非癲癇)。若樣本是癲癇樣本,則第一維等于0,第二維等于1;若樣本是非癲癇樣本,則第一維等于1,第二維等于0。

Fig.4 Deep feature extraction network with frequency domain圖4 頻域的深度特征提取網絡
3.3.1 頻域深度特征提取網絡
圖4為頻域深度特征提取使用的CNN網絡架構圖,總共包括2個卷積層和3個全連接層。多通道的EEG頻域視角特征是一個通道數×頻率的二維矩陣,因此網絡的輸入為23×27的二維矩陣。網絡第一層卷積層為20個4×4的卷積核,步長為1,得到20個20×24的特征圖;第二層卷積層是10個8×8的卷積核,步長為1,得到10個13×17的特征圖。網絡接下來有3個全連接層,這3個全連接層首先將特征圖轉換成1×512的特征向量,再轉換成1×100的特征向量,最后得到一個二分類的結果。
3.3.2 時頻域深度特征提取網絡
圖5為時頻域深度特征提取使用的CNN網絡架構圖,總共包括4個三維卷積層和3個全連接層。多通道的EEG時頻域特征是一個時間×通道數×頻率的三維矩陣,因此網絡的輸入為128×23×14的三維矩陣。網絡各個層的詳細操作和頻域深度特征提取網絡相同。因為輸入為三維矩陣,卷積核采用三維卷積核,三維卷積操作是二維卷積操作在三維空間的擴展,基本原理和二維卷積操作相同。
兩個網絡統一選取tanh函數作為激活函數來引入非線性變換,因為tanh(x)∈[-1,1],且tanh函數的均值為0,所以在實際應用中具有比sigmoid更好的效果。tanh函數的表達如下:

網絡采用softmax交叉熵損失函數,該函數的定義如下:


Fig.5 Deep feature extraction network with time-frequency domain圖5 時頻域的深度特征提取網絡
softmax函數計算第j個樣本屬于第i類的概率aji,zji為第j個樣本在第i個輸出節點的輸出。yj={yji|i=1,2,…,C}為第j個樣本的真實標簽,C是總的類別數,N是樣本的總個數,L為N個樣本的總平均交叉熵損失。
使用淺層特征和深度特征構建成的多視角特征具有很好的表達能力和較少的信息損失,但如何高效地將這些特征用于癲癇檢測是很重要的。近些年來的研究中,許多基于多視角學習的智能模型[15,36-37]已被用于癲癇EEG識別,但它們中的大多數缺乏在疾病診斷等現實應用中至關重要的可解釋性。因此,在基于多視角學習的癲癇EEG檢測技術的發展過程中,需要具有更高可解釋性的模型。
TSK模糊系統是基于規則系統的智能模型,具有很高的可解釋性。本文以TSK模糊系統為基礎,構建出具有可解釋性的多視角分類器用于EEG信號的癲癇檢測。
3.4.1 多視角TSK模糊系統的加權機制

通過最小化式(8),可以獲得每個視角的權重值wk。通過計算每個視角的權重,可以了解不同視角的重要程度,進而權衡不同視角之間的關系。
3.4.2 多視角TSK模糊系統的多視角協同學習機制
給定一個多視角癲癇數據集,多視角TSK模糊系統的多視角協同學習機制可以被定義為如下形式:

3.4.3 多視角TSK模糊系統的目標函數
基于多視角模糊系統的加權機制和多視角協同學習機制,構建出多視角TSK模糊系統的目標函數如下所示:

該目標函數共有3項組成,第一項為改進過后的多視角加權機制,wk為第k個視角的權重,m表示權重wk的模糊指數。通過引入視角權重的指數,可以在優化多視角模型中研究權重的更新規則,該模糊指數已經被深入研究并在許多機器學習算法中達到了很好的效果,例如著名的模糊C均值聚類(fuzzy C-means,FCM)等[41-42]。第二項為正則化項,對不同視角的后件參數進行約束,防止多視角的模型產生過擬合現象。λ1為正則化項的系數,用來改變正則化項對模型的懲罰大小。第三項為多視角協同學習項,該項期望各個視角獲得相同的決策值。限制條件控制各個視角的權重和為1。
3.4.4 目標函數的求解
方程(10)是一個不能直接解決的非凸優化問題。為了去求解這個優化問題,本文采用一種交叉迭代的方法,這個方法還用于模糊C均值(FCM)算法中。這個迭代過程主要分為兩步,更新各個視角的后件參數和各個視角的權重wk。

本文提出的多視角TSK模糊系統的具體細節在下面的算法流程中給出。
算法1基于視角加權的多視角TSK模糊系統
初始化:設置模糊規則數K,正則化參數λ1和λ2,算法收斂閾值ε以及最大的迭代次數T。每個視角的初始化權重wk設為,迭代次數l=1。
步驟1使用模糊聚類算法FCM或者其他聚類算法獲得訓練集中每個視角的前件參數。
步驟2使用式(4a)~式(4c)將訓練集和測試集每個視角的特征映射到模糊空間,獲得新特征集。
步驟3使用式(6)得到每個視角的先驗后件參數。
步驟4使用式(11)更新每個視角的后件參數
步驟5使用式(12)更新每個視角的權重
步驟6如果|Jl+1-Jl|>ε或者l<T時,l=l+1并且返回步驟4;否則進入步驟7。
步驟7使用式(13)做出用于癲癇檢測的多視角TSK模糊系統決策。
本文采用CHB_MIT數據集進行實驗研究。該數據集采集了波士頓兒童醫院23個患者的EEG信號,這些來自23位患者的記錄被分成24個組(其中第21組為第1個病人在幾年后重新采樣后添加進去的數據),每一組都包含一個患者的連續十幾個小時的EEG信號記錄。這些連續的信號通過256 Hz的頻率采樣,即一秒的信號有256的采樣點。每個患者的EEG信號通過對18個點進行采集構成單通道數據集,后續處理成為23個通道的多通道數據。圖6是一段時間的CHB_MIT數據集的原始數據,總共包含23個連續多通道信號。
由于數據高度不平衡,即癲癇樣本數量與非癲癇樣本數量之比為1∶100,如果直接使用所有數據,算法的效果會面臨嚴重的過擬合問題。針對這個問題,本文舍棄了一部分未發作癲癇的EEG信號數據,并且對發作癲癇的EEG信號數據應用了過采樣技術。使用滑動窗口將連續的EEG信號分成多個長度為一秒的信號段(根據采樣頻率可知1 s信號有256個采樣點),通過允許兩個窗口之間存在重疊的方法對發作癲癇的EEG信號進行過采樣。
k折交叉驗證在確保一致的數據分布的基礎上將數據劃分為相同大小的k個子集。每次將其中一個子集作為測試集,其他子集用作訓練集。獲得k個測試結果的平均值作為最終結果。這種驗證方法有效地避免了實驗樣品的取樣偏差,從而獲得了更有說服力的實驗結果。為了驗證本文提出的癲癇診斷算法,將每一個患者的EEG信號數據都進行5折交叉驗證。
為了進行有效的評估,采用如下3個廣泛應用的評價標準來進行實驗分析[43-44],Accuracy、Sensitivity和Specificity定義如下:


Fig.6 Original multi-channel EEG signals圖6 原始多通道EEG信號
式中,TP是將癲癇片段正確預測的個數;FN是將癲癇片段預測為非癲癇片段的個數;FP是將非癲癇片段預測為癲癇的個數;TN是將非癲癇片段預測為非癲癇的個數。Accuracy表示分類器正確分類的比例,越高代表分類器的分類效果越好;Sensitivity表示將所有的癲癇片段正確分類的比例,越高代表分類器對于癲癇片段的預測準確率越高;Specificity表示將所有非癲癇片段正確分類的比例,越高代表分類器對非癲癇片段的預測準確率越高。
本文方法得到的平均效果在表1中列出,由表可以看出所有組的平均Accuracy、Sensitivity和Specificity分別為99.08%、98.59%和99.32%。可以看出算法在準確度、敏感性和特異性上均取得較好的結果。
為了進一步分析本文提出的方法,將最近使用CHB-MIT數據集進行癲癇檢測的方法[45-52]與本文提出的方法進行比較。表1列出了特征提取方法、實驗設置和實驗效果(NR代表文中并未提及該效果)。值得注意的是,Rafiuddin等人[45-47]并未采用交叉驗證,這無法有力地證明在癲癇檢測方面的性能。未采用交叉驗證的原因可能是因為數據集的癲癇樣本較少,采用交叉驗證會使得驗證集中癲癇樣本過少,導致得到的效果和真實效果差距過大,Kiranyaz等人[47-49]為了避免驗證集癲癇樣本過少只采用25%的樣本用于訓練。在Yao等人[50-52]的研究中,使用了不同的過采樣的方法來增加癲癇樣本的數量。由于數據不平衡,大多數算法的準確度和敏感性都比較低,但是本文提出的方法在保持相同特異性的情況下,表現出了更好的準確度和敏感性,如表1所示。

Table 1 Performance of different methods on CHB-MIT dataset表1 不同方法在CHB_MIT數據集上的效果
為了確定各個視角的貢獻度,本文在實驗中統計了各個視角的權重。以第一個患者數據為例,4個深度和淺層特征的權重分別為0.072、0.075、0.760和0.092。其他所有患者數據的視角權重也都類似,并未出現某一視角權重過小,貢獻度過小的情況。
為了驗證本文所提方法的深度特征和淺層特征的有效性,采用不同的特征提取方法獲得不同的特征,然后使用SVM、KNN、NB、DT和TSK-FLS進行建模,最后計算出各種特征的效果,繪制成表2~表4。頻域和時頻域的深度特征在各個分類器上的平均Accuracy、Sensitivity和Specificity效果均達到了最好;頻域和時頻域的淺層特征在各個分類器的平均Accuracy、Sensitivity和Specificity效果也僅次于深度特征??梢钥闯鰧υ碱l域和時頻特征使用深度特征自動提取方法達到的深度特征都得到了較好的特征表達,獲得了較好的分類效果。
表5比較了4個視角的特征分別使用不同的單視角分類器和本文提出的多視角TSK模糊系統的效果,發現本文提出的算法在Accuracy、Sensitivity和Specificity都取得了最好的效果。
為了驗證多視角TSK模糊系統的有效性,本文使用SVM、KNN、NB和DT算法構造基于視角加權的多視角分類器,得到實驗效果如表6所示。
由以上結果可以看出,本文提出的基于TSK模糊系統的多視角分類器在癲癇檢測中達到了較好的效果。
本文對2個用于提取深度特征的CNN網絡進行訓練,為了確定網絡的效果,遞增地設置網絡的迭代次數,發現2個CNN網絡的效果均在一定迭代次數后達到穩定狀態。將網絡達到穩定狀態時的迭代次數設置為最終的迭代次數,由此即可以在較少的訓練時間里得到較好的分類效果。圖7、圖8僅僅展示第一個患者數據的網絡迭代次數和最終效果的關系,其他各組和第一組大致相同。

Table 3 Sensitivity of different feature extraction methods表3 不同特征提取方法的Sensitivity效果比較 %

Table 4 Specificity of different feature extraction methods表4 不同特征提取方法的Specificity效果比較 %

Table 5 Effect of combined features on classifiers表5 融合特征在分類器上的效果 %

Table 6 Effect on multi-view classifiers表6 不同多視角分類器的效果 %

Fig.7 Performance of frequency domain network圖7 頻域網絡的效果

Fig.8 Performance of time-frequency domain network圖8 時頻域網絡的效果
根據實驗發現頻域特征在訓練2 000次后趨于穩定,因此設定頻域網絡的訓練次數為2 000。而時頻域特征雖然效果隨著訓練的次數在上升,但是有較大的波動,考慮特征的效果和波動,將時頻域特征提取網絡的訓練次數設置為5 000次。
多視角TSK模糊系統的診斷為各個視角TSK模糊系統的加權組合,模糊規則的利用方面和TSK模糊系統完全相同,因此可以通過分析簡單的TSK模糊系統的可解釋性,來理解多視角TSK模糊系統的可解釋性。為了驗證本文提出的基于視角加權的多視角TSK模糊系統的可解釋性,本節對第一個患者的頻域深度特征構建的TSK模糊系統進行分析,并將具體數據展示在表7中。為了分析方便,只列出規則數為5時前6維特征的數據。
通過表7的數據,可以確定每一條規則的模糊語言描述,例如:“EEG信號某一維特征的值為低、中、高”。以第一維特征為例,不同規則的前件參數分別為(0.447,0.117),(0.452,0.175),(0.545,0.181),(0.548,0.277),(0.459,0.205)??梢源_定規則數對應的模糊語言描述分別為低、較低、較高、高和中。上述的模糊語言描述只是模糊規則的If部分的可能解釋,因為不同的專家可能對同一規則使用不同的語言描述。為了進一步解釋模糊規則的用法和重要性,圖9列出一個例子的描述,該例子為一名患者的頻域深度特征使用TSK模糊系統進行診斷。

Table 7 Description of fuzzy rules表7 模糊規則描述

Fig.9 Use of fuzzy rules圖9 模糊規則的使用
上述分析表明,多視角TSK模糊系統是使用生成的模糊規則識別癲癇患者的可解釋模型。
本研究提出融合深度和淺層特征的多視角分類算法來對癲癇EEG信號進行檢測,通過實驗數據可以發現,本研究提出的融合特征比傳統的特征提取方法獲得了更好的效果,并且使用基于TSK模糊系統的多視角分類器對融合特征進行學習,進一步提高了算法的效果??梢园l現深度和淺層特征的提取方法以及多視角TSK模糊系統的引入對癲癇EEG信號的檢測很有價值。
雖然研究的效果得到了提升,但是該研究還有一些不足和值得進一步深入研究的地方。比如引入的淺層特征是分布在頻域和時頻域的,但是EEG信號還有很多有用的特征比如統計學特征和非線性特征,如何有效利用這些特征很有意義;在多視角算法方面,多視角TSK模糊系統雖然達到了比單視角更好的效果,但是還有改進的空間。將來的工作中將對上述方向進行深入研究。