謝麗瀟,鄧趙紅,史熒中,王士同
江南大學 數字媒體技術學院,江蘇 無錫 214122
面向癲癇EEG自適應識別的遷移徑向基神經網絡*
謝麗瀟,鄧趙紅+,史熒中,王士同
江南大學 數字媒體技術學院,江蘇 無錫 214122
XIE Lixiao,DENG Zhaohong,SHI Yingzhong,et al.Transfer radial basis function neural network for adaptive recognition of epileptic EEG signals.Journal of Frontiers of Computer Science and Technology,2016,10 (12):1729-1736.
腦電圖(EEG);徑向基神經網絡;直推式遷移學習
癲癇是由腦部損傷引起的短暫大腦功能障礙,是人類大腦中最常見的疾病之一,對人類健康危害極大[1]。癲癇患者的腦電圖(electroencephalogram,EEG)信號中包含了腦內大量的生理和病理信息,因此EEG智能識別對于癲癇檢測有著十分重要的意義。目前,多種智能識別方法都被應用于癲癇腦電信號的識別中。其中代表性的方法有以下幾種:神經網絡方法[2]、決策樹算法(decision tree,DT)[3]、樸素貝葉斯法(na?ve Bayes,NB)[4]、K近鄰算法(K-nearest neighbor,KNN)[5]等。在目前主要的智能識別方法中,徑向基神經網絡(radial basis function neural network,RBFNN)由于具有良好的容錯能力、分類能力、并行處理能力和自學習能力,在實際應用中能夠顯示出更好的綜合分類效果[2]。本文重點探討基于徑向基神經網絡的癲癇腦電信號識別。
雖然徑向基神經網絡和已有的這些基于機器學習技術的智能識別方法都取得一定的效果,但均面臨著一個共同的挑戰:這些方法獲得的分類器的性能都依靠一個前提假設條件,即模型的訓練數據和測試數據具有相同的分布,但此假設在實際應用中的許多場景下是無法滿足的。例如,在用于訓練和測試的癲癇EEG信號中,可能存在不完全相同的分布,這就造成了傳統智能方法在此類場景下有效性的明顯降低。
在癲癇病識別中,由于病人狀態、藥物作用、測試時間等多重因素的干擾,使得EEG信號存在著多種不同的數據分布特征,大致可以歸納為如下3種:(1)健康者正常狀態下的EEG信號;(2)癲癇病人發病期狀態下的EEG信號;(3)癲癇病人發病間歇期的信號[6]。這3種信號的數據分布特征均各自獨立,且相互之間存在一定的差異。一般在模型訓練時,研究者大多使用大量已知類別的(1)和(2)狀態下的信號數據進行分類構建。這樣構建得到的分類器在面對(3)信號為測試集的分類任務時[7],分類器的性能必將下降,以訓練數據和測試數據具有相同分布為前提的傳統智能建模技術將可能不再適用。因而提出具有更好適應性的癲癇腦電信號識別方法非常有意義。
針對上述挑戰,本文從遷移學習的角度提出了具有遷移學習能力的基于徑向基神經網絡的癲癇病腦電信號識別方法。為了使得探討的癲癇EEG識別方法對目標域的數據具有較松的限制,即不要求給定標記信息,本文具體選擇的是直推式遷移學習。進一步將直推式遷移學習與RBFNN模型相結合,提出了具有直推式遷移學習能力的徑向基神經網絡TRBFNN(transductive RBFNN)。提出的新方法因具備了遷移學習能力而不再局限于訓練域和測試域數據分布一致的假設,允許兩者之間存在一定的差異性,因而具有較好的場景適應性[8]。
徑向基神經網絡是Powell在1985年為解決實多變量插值問題時首次提出的,1988年,Broomhead和Lowe繼而將徑向基函數(radial basis function,RBF)應用于神經網絡設計[9],即RBF神經網絡,屬于前饋型神經網絡,它能夠以任意精度逼近任意連續函數,比較適合于解決分類問題。并且遷移學習的引入,更加放寬了對數據分布的要求,使得適用場景更為廣泛。本文具體選用的是直推式遷移學習。
2.1 徑向基神經網絡
RBFNN是一個三層的神經網絡,它的神經元結構如圖1所示[10]。第一層是輸入層,由一些源節點(即感知節點)組成,它們的作用是將網絡與外界環境連接起來;第二層是隱層,由隱單元組成,它的作用是從輸入空間到隱含特征空間之間進行非線性變換;第三層是輸出層,它是為提供網絡的響應而專門設計的,該響應提供給應用于輸入層的激活模式,從隱含層空間到輸出層空間的變換是線性的[9]。

Fig.1 Basic structure for RBFNN圖1 徑向基神經網絡基本結構

這里,x∈Rd為輸入向量;wj表示隱含層到輸出層的連接權值;cj∈Rd,j=1,2,…,M為隱含層的第j個節點的中心;‖?‖表示歐幾里得范數;Φ表示徑向基函數,在徑向基神經網絡中常用的徑向基函數是高斯函數(Gaussian),因為高斯函數具有表示形式簡單,光滑性好以及解析性好等優點[11],便于理論性分析,表示形式為:
圖1中,輸入層包含n個單元,隱含層m個隱單元,輸出層包含一個輸出層單元。徑向基函數的定義如下:

其中δj為寬度值。
隱含層空間到輸出空間的映射是線性的,即網絡的輸出是隱單元輸出的線性加權和。此處的權值wj為可調參數。由此可見,從總體上看,網絡由輸入到輸出的映射是非線性的,而網絡輸出對可調參數而言卻又是線性的。這樣網絡的權值就可由線性方程直接解出,從而大大加快學習速度并避免局部極小問題[12]。
徑向基神經網絡的優點在于能夠逼近任意的非線性函數,可以處理系統內難以解析的規律性,具有良好的泛化能力,并有很快的學習收斂速度,已成功應用于非線性函數逼近、數據分類、模式識別、圖像處理等方面[13]。它需要調節的參數只有3個,即隱含層中心點cj、寬度值δj和連接權值wj,學習過程也較為簡單。
徑向基神經網絡也是前饋神經網絡的一種,數據x從輸入到輸出經過了某種映射Φ,最后得到一個輸出y,這種映射關系可以簡化為:

這里,pg即式(1)中的連接權值wj表示的向量;xg表示輸入向量x經過映射函數Φ映射過后的值。
2.2 直推式遷移學習
近年來,遷移學習引起了廣泛的關注和研究,它是運用已有的知識對不同但相關的領域問題進行求解的一種新的機器學習方法。它旨在從一個或多個源任務中提取知識,并將這些知識運用到目標任務中[14]。根據源領域和目標領域樣本有無標簽以及任務是否相同,可以將遷移學習分為歸納式遷移學習、直推式遷移學習和無監督遷移學習等。直推式遷移學習(transductive transfer learning)最早是由Vapnik提出的[15],它的源領域中有一定量的標注信息,而目標域中只有非常少甚至沒有標注信息。它的適用情況為:源領域和目標領域不一致但相關,源任務與目標任務相同[15]。
本文引入直推式遷移學習探討直推式遷移學習徑向基神經網絡的構建。具體地,基于2.1節徑向基神經網絡學習方法,引入直推式遷移學習策略,提出直推式遷移學習徑向基神經網絡訓練新的優化目標函數,從而得到具體的直推式遷移學習徑向基神經網絡學習算法。
3.1 最大均值距離和投影最大均值距離
最大均值距離和投影最大均值距離在直推式遷移學習中顯示出了獨特的有效性[6]。對于來自不同分布的數據集 Ds={x1,x2,…,xN}和 Dt={z1,z2,…,zM},兩個分布之間的距離度量可表示為如下的最大均值距離(maximum mean distance,MMD):

這里,φ(xj)是一個映射函數。根據式(1),將訓練域X和測試域Z的輸入數據Ds={x1,x2,…,xN}和Dt={z1, z2,…,zM}映射到如下的特征空間。

這里xgi和zgi由式(2)獲得,表示原始空間數據在徑向基神經網絡映射后的空間對應的數據。進一步地,給定投影向量Pg,則Pg映射下的投影最大均值距離(projected maximum mean distance,PMMD)可表示為:

在遷移學習算法中,上述度量通常用來估計兩個不同分布的差異。例如,在經典的最大化間隔投影遷移學習方法中,投影最大化均值度量用于實現核方法的遷移學習[14]。
根據徑向基神經網絡的特點,本文定義如下的投影均值距離來度量不同分布的差異,即徑向基神經網絡對應的不同分布的差異表示為:


基于徑向基神經網絡投影最大均值距離,本文將其用來實現該空間的分布差異的度量,從而進一步實現相應的遷移學習。
3.2 直推式遷移學習徑向基神經網絡的優化目標和參數學習


3.3 直推式遷移學習徑向基神經網絡學習算法
基于上文提出的直推式遷移學習徑向基神經網絡的原理和優化過程,下面給出詳細的算法描述。
算法1直推式遷移學習徑向基神經網絡遷移學習算法
階段1數據處理階段。
設置神經網絡層數M和正則參數τ;利用模糊C均值聚類法求得中心點cj,寬度值δj;針對高斯核函數來構造新特征空間的數據集D?s={x1,x2,…,xN}和D?t={z1,z2,…,zM}。
階段2遷移學習階段。
設置遷移學習參數λ,利用交叉驗證法得到當前遷移學習系統的測試數據集;
分別利用式(13)與(14)計算出β,利用式(9)計算得到pg。
階段3徑向基神經網絡模型生成階段。
根據學習得到的xg和pg得到最終模型,算法終止。
為了評價本文算法的性能,在EEG信號識別中進行了大量的實驗,本文將從兩個方面進行實驗比較:(1)本文方法與經典的支持向量機(support vector machine,SVM)[16]、TSK模糊系統[17]、徑向基神經網絡進行性能比較;(2)本文方法與相關的具有遷移能力的回歸方法:遷移支持向量機(TSVM)、大間隔直推式遷移學習(LMPROJ)以及文獻[15]中基于圖論的兩個協同正則化遷移算法,進行性能比較。
4.1 數據集
本文采用的EEG數據來源于德國波恩大學,EEG信號測量方式及其完整說明參見文獻[16-17(]http: //epileptologie-bonn.de/cms/front_content.php?idcat=193 &lang=3&changelang=3)。EEG信號數據集里有5組數據(分別命名為A到E組),每組數據包含100個樣本。A組和B組信號是5個健康志愿者的EEG信號,數組A是志愿者保持睜眼狀態下所測得的信號;數組B則是閉眼時的信號。C~E組則是癲癇病患者測量得到的EEG信號,C組是在其發作間歇期測得大腦的海馬結構處的EEG信號;數組D則是發病間歇期的大腦致癇區內的EEG信號;E組是癲癇患者發作期間內測得的信號[18-19]。表1給出了5組數據的具體描述。

Table 1 Description of datasets表1 數據集描述
4.2 實驗設置
本文構造了4組訓練和測試數據分布具有一定差異性的實驗集和兩組分布無差異的實驗集,這6組實驗數據集的訓練集和測試集分別由伯恩大學的5組EEG信號數據中抽取的部分數據構成。數據集1、2的訓練數據集和測試數據集來源于相同的分布,但是抽取的樣本不同。實驗數據集3~6的訓練集和測試集則具有不同的分布。另外每個實驗數據集的訓練和測試數據集均不含相同樣本,互相獨立。具體設置如表2所示。本文實驗中設計多個對比算法,所有參數設置見表3。

Table 2 Structure of experimental datasets表2 實驗數據集的構成

Table 3 Parameter settings表3 參數的設置
4.3 實驗結果與分析
本文方法與經典非遷移智能算法以及遷移學習方法的比較結果如表4所示。從表4中可以看出:

Table 4 Results of experiments表4 實驗結果
(1)在訓練數據集和測試數據集分布相同的情況下,非遷移學習方法和遷移學習方法的效果相差不多,而對于分布具有一定差異性的實驗數據集3~6,非遷移學習方法的檢測效果之間差別較大,遷移學習方法在總體上要優于非遷移學習方法。
(2)在訓練數據集和測試數據集分布具有一定差異的情況下,基于RBFNN構建的分類器識別精度相較于其他非遷移方法有顯著的提高,傳統非遷移方法的分類效果較差,而具有遷移學習能力的基于RBFNN構建的分類器效果較好,分類精度都達到了90%以上。
(3)基于RBFNN構建的分類器識別精度相較于其他遷移方法沒有顯著變化,只是略有波動。由于RBFNN需要調節的參數少,比較容易使用,穩定性和容錯性也要強于LMPROJ等遷移學習算法。
綜上所述,本文提出的基于RBFNN構建的具有遷移學習能力的智能模型在分類精度上,要優越于傳統的非遷移學習方法,在多類分類上顯示出一定的通用性。并且RBFNN智能模型易學習和訓練,穩定性高,相比其他智能算法顯示出一定的優越性。
本文針對癲癇檢測中的EEG信號進行分析,在所用的訓練集和測試集分布不同的情況下,利用RBFNN模型強大的非線性分類能力,并且引入遷移學習方法來應對分布不同帶來的差異性,給出了具體的基于遷移學習理論的徑向基神經網絡EEG信號識別的工作框架。具體地,選用了直推式的遷移學習分類方法,更符合本文的數據要求。然而遷移分類效果的好壞也與TRBFNN算法中參數的選擇有關,參數選擇的好壞將直接影響到最后的檢測精度。因此,本文利用五倍交叉驗證來尋找最佳參數,以期達到最好的分類效果。
雖然本文算法顯示出了獨特的優勢,但是依然有一些問題需要進一步研究。例如,目前RBFNN屬于前饋神經網絡的一種,人工神經網絡由于拓撲結構的不同有許多分類,如何提出更加具有普適性的算法,值得進一步深入研究。
[1]Jiang Yizhang,Deng Zhaohong,Wang Shitong,et al.0-order-L2-norm-Takagi-Sugeno-Kang type transfer learning[J].Acta Electronic Sinica,2013,41(5):897-904.
[2]Huang G B,Saratchandran P,Sundararajan N.A generalized growing and pruning RBF(GGAP-RBF)neural network for function approximation[J].IEEE Transactions on Neural Networks,2005,16(1):57-67.
[3]Goker I,Osman I,Ozekes S,et al.Classification of Juvenile myoclonic epilepsy data acquired through scanning electromyography with machine learning algorithms[J].Journal of Medical Systems,2012,36(5):2705-2711.
[4]Quinlan J R.C4.5:programs for machine learning[M].San Mateo,USA:Morgan Kaufmann,1993.
[5]Peterson L.K-nearest neighbor[J].Scholarpedia,2009,4 (2):1883.
[6]Yang Changjian,Deng Zhaohong,Jiang Yizhang,et al. Adaptive recognition of epileptic EEG signals based on 0-order TSK type transfer fuzzy system[J].Application Research of Computers,2015,32(8):2276-2280.
[7]Bruhn J,R?pcke H,Rehberg B,et al.Electroencephalogram approximate entropy correctly classifies the occurrence of burst suppression pattern as increasing anesthetic drug effect[J].Anesthesiology,2000,93(4):981-985.
[8]Pan S J,Yang Q.A survey on transfer learning[J].IEEE Transactions on Knowledge&Data Engineering,2010,22 (10):1345-1359.
[9]Debener S,Ullsperger M,Siegel M,et al.Trial-by-trial coupling of concurrent electroencephalogram and functional magnetic resonance imaging identifies the dynamics of performance monitoring[J].The Journal of Neuroscience,2005, 25(50):11730-11737.
[10]Lockley S W,Evans E E,Scheer F,et al.Short-wavelength sensitivity for the direct effects of light on alertness,vigilance,and the waking electroencephalogram in humans[J]. Sleep,2006,29(2):161-168.
[11]Zhang Yun,Zhou Quan,Sun Caixin,et al.RBF neural network and ANFIS-based short-term load forecasting approach in real-time price environment[J].IEEE Transactions on Power Systems,2008,23(3):853-858.
[12]Li Yahui,Qiang Sheng,Zhuang Xianyi,et al.Robust and adaptive backstepping control for nonlinear systems using RBF neural networks[J].IEEE Transactions on Neural Networks,2004,15(3):693-701.
[13]Lin C L,Wang J F,Chen C Y,et al.Improving the generalization performance of RBF neural networks using a linear regression technique[J].Expert Systems with Applications, 2009,36(10):12049-12053.
[14]Yang Changjian,Deng Zhaohong,Jiang Yizhang,et al. Adaptive recognition of epileptic EEG signals based on transfer learning[J].Journal of Frontiers of Computer Science and Technology,2014,8(3):329-337.
[15]Ren Chuanxian,Dai Daoqing,Huang Kekun,et al.Transfer learning of structured representation for face recognition[J].IEEE Transactions on Image Processing,2014,23(12):5440-5454.
[16]Shalev-Shwartz S,Singer Y,Srebro N,et al.Pegasos:primal estimated sub-gradient solver for SVM[J].Mathematical Programming,2011,127(1):3-30.
[17]Almaraashi M,John R,Coupland S,et al.Time series forecasting using a TSK fuzzy system tuned with simulated annealing[C]//Proceedings of the 2010 IEEE International Conference on Fuzzy Systems,Barcelona,Jul 18-23,2010. Piscataway,USA:IEEE,2010.
[18]Polat K,Günes S,Classification of epileptic form EEG using a hybrid system based on decision tree classifier and fast Fourier transform[J].Applied Mathematics and Computation,2007,187:1017-1026.
[19]Tanaka K,Matsunaga K,Wang H O.Electroencephalogrambased control of an electric wheelchair[J].IEEE Transactions on Robotics,2005,21(4):762-766.
附中文參考文獻:
[1]蔣亦樟,鄧趙紅,王士同.0階L2型TSK遷移學習模糊系統[J].電子學報,2013,41(5):897-904.
[6]楊昌健,鄧趙紅,蔣亦樟,等.基于0階TSK型遷移模糊系統的EEG信號自適應識別[J].計算機應用研究,2015,32 (8):2276-2280.
[14]楊昌健,鄧趙紅,蔣亦樟,等.基于遷移學習的癲癇EEG信號自適應識別[J].計算機科學與探索,2014,8(3):329-337.

XIE Lixiao was born in 1992.She is an M.S.candidate at School of Digital Media,Jiangnan University.Her research interests include intelligent modeling methods and their applications.
謝麗瀟(1992—),女,江蘇溧陽人,江南大學數字媒體學院碩士研究生,主要研究領域為智能建模及其應用。

DENG Zhaohong was born in 1982.He is an associate professor at School of Digital Media,Jiangnan University. His research interests include fuzzy modeling and intelligent computation.
鄧趙紅(1982—),男,安徽蒙城人,江南大學數字媒體學院副教授,主要研究領域為模糊建模,智能計算。

SHI Yingzhong was born in 1970.He is a Ph.D.candidate at School of Digital Media,Jiangnan University.His research interests include intelligent modeling methods and their applications.
史熒中(1970—),男,江南大學數字媒體學院博士研究生,主要研究領域為智能建模及其應用。

WANG Shitong was born in 1964.He is a professor at School of Digital Media,Jiangnan University.His research interests include artificial intelligence,pattern recognition and bioinformatics.
王士同(1964—),男,江蘇揚州人,江南大學數字媒體學院教授,主要研究領域為人工智能,模式識別,生物信息。
Transfer Radial Basis Function Neural Network for Adaptive Recognition of Epileptic EEG Signals*
XIE Lixiao,DENG Zhaohong+,SHI Yingzhong,WANG Shitong
School of Digital Media,Jiangnan University,Wuxi,Jiangsu 214122,China
+Corresponding author:E-mail:dengzhaohong@jiangnan.edu.cn
In epileptic electroencephalogram(EEG)signal recognition,traditional intelligent modeling method requires that the training data set and test data sets are subject to the same distribution.But in practical applications,some cases cannot meet this condition,which results in a sharp degeneration in the performance of traditional methods.In order to overcome the above challenge,by the introduction of transfer learning strategies,this paper proposes a transductive radial basis function neural network(TRBFNN)in order to cater for the migration environment of data distribution. The experimental results in epileptic EEG signals recognition show that the proposed TRBFNN has better adaptability for migration scenarios of data distribution and the recognition performance will not be sharp deterioration when there are differences between the distributions of the training data and test data.
electroencephalogram(EEG);radial basis function neural network;transductive transfer learning
10.3778/j.issn.1673-9418.1601059
A
TP391
*The National Natural Science Foundation of China under Grant No.61170122(國家自然科學基金面上項目);the Outstanding Youth Foundation of Jiangsu Province under Grant No.BK20140001(江蘇省杰出青年基金項目);the New Century Excellent Talent Foundation from Ministry of Education of China under Grant No.NCET-120882(新世紀優秀人才支持計劃項目).
Received 2016-01,Accepted 2016-04.
CNKI網絡優先出版:2016-04-19,http://www.cnki.net/kcms/detail/11.5602.TP.20160419.1144.012.html
摘 要:在癲癇腦電圖(electroencephalogram,EEG)信號識別中,傳統的智能建模方法要求訓練數據集和測試數據集均服從相同的分布。但在實際應用中,某些情況并不能滿足此條件,進而導致傳統方法性能急劇下降。針對上述情況,引入遷移學習策略,提出了適用于數據分布遷移環境的直推式徑向基神經網絡(transductive radial basis function neural network,TRBFNN)。該方法在癲癇EEG信號識別中的實驗結果表明:直推式徑向基神經網絡具有較好的場景遷移適應性,對訓練數據和測試數據存在差異時,識別性能不會出現急劇惡化的現象。