999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機(jī)器學(xué)習(xí)的跨患者癲癇自動檢測算法

2021-01-18 08:04:16楊舒涵周豐豐
關(guān)鍵詞:特征提取癲癇分類

楊舒涵, 李 博, 周豐豐

(1. 吉林大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 長春 130012;2. 吉林大學(xué) 符號計(jì)算與知識工程教育部重點(diǎn)實(shí)驗(yàn)室, 長春 130012;3. 吉林大學(xué) 軟件學(xué)院, 長春 130012)

癲癇是一種神經(jīng)系統(tǒng)的疾病[1], 嚴(yán)重危害患者的生命安全. 癲癇檢測可幫助醫(yī)生更好地了解患者的發(fā)病信息, 并根據(jù)檢測結(jié)果結(jié)合其他檢測工具, 實(shí)現(xiàn)病灶定位. 傳統(tǒng)檢測方法是通過詢問患者家屬關(guān)于患者的以往發(fā)病史, 并觀察患者的腦電數(shù)據(jù), 得出結(jié)論. 腦電數(shù)據(jù), 即腦電圖(electroencephalo-graphy, EEG), 是一組隨時間變化連續(xù)的一維數(shù)據(jù), 可記錄大腦活動時的電信號. 癲癇發(fā)作時, 通常會伴有大腦神經(jīng)元的異常放電, 因此腦電數(shù)據(jù)對癲癇的檢測有很大幫助. 癲癇檢測被視為一個二分類問題, 分為發(fā)作期和發(fā)作間期, 發(fā)作間期指兩次發(fā)作期之間的時刻. 目前對癲癇自動檢測的研究多集中于專人專治, 即為每個患者建立自身的檢測模型. Vidyaratne等[2]先使用快速小波分解和分形維數(shù)方法對腦電數(shù)據(jù)進(jìn)行特征提取, 再使用相關(guān)支持向量機(jī)模型進(jìn)行分類, 實(shí)現(xiàn)了模型與患者相關(guān)的癲癇檢測. 該方法分類結(jié)果較好, 但是也存在以下問題: 首先, 模型的建立需要患者的以往發(fā)病記錄, 而當(dāng)患者無發(fā)病記錄時, 即無法為該患者進(jìn)行檢測; 其次, 該模型不具有泛化性, 即一個患者的模型無法適用于其他患者.

針對上述問題, 本文提出一種使用機(jī)器學(xué)習(xí)的跨患者癲癇自動檢測算法. 該算法首先使用濾波器對原始腦電數(shù)據(jù)進(jìn)行固定頻率范圍的數(shù)據(jù)過濾, 達(dá)到去除噪聲的目的; 然后從時域角度和非線性角度對濾波后的數(shù)據(jù)進(jìn)行特征提取; 再使用遞歸特征消除(recursive feature elimination, RFE)和序列后向選擇(sequential backward selection, SBS)算法對提取到的特征做進(jìn)一步篩選, 被選擇特征作為分類模型的輸入數(shù)據(jù); 最后用XGBoost(eXtreme gradient Boosting)模型分類, 實(shí)現(xiàn)癲癇的自動檢測. 本文檢測算法在特征提取后增加了基于XGBoost模型的特征選擇算法, 能選擇出更具有代表性和泛化性的特征, 并使用XGBoost模型進(jìn)行分類. 實(shí)驗(yàn)結(jié)果表明, 該方法不僅減少了特征數(shù)量, 簡化了模型的復(fù)雜度, 且提升了模型的分類性能.

1 跨患者的癲癇自動檢測模型

本文癲癇自動檢測算法基于采集到的腦電數(shù)據(jù), 通過一系列機(jī)器學(xué)習(xí)算法得到最具代表性的特征矩陣, 然后輸入到分類模型中, 得到最終的分類結(jié)果. 實(shí)驗(yàn)流程如圖1所示.

圖1 癲癇自動檢測實(shí)驗(yàn)流程Fig.1 Experimental process of automatic epileptic seizure detection

1.1 數(shù)據(jù)預(yù)處理

常用的腦電數(shù)據(jù)是通過將電極放置在患者頭皮上采集得到的, 這種采集方式對人體無傷害, 成本較低, 患者易接受, 但因?yàn)槭峭庵秒姌O, 所以很可能受外界干擾, 導(dǎo)致數(shù)據(jù)中摻雜一些噪聲, 影響最后的分類結(jié)果. 濾波算法是一種常見的去除腦電信號中噪聲的方法, 本文使用帶通濾波器, 其可使一個特定頻段的數(shù)據(jù)通過濾波器, 而抑制或削弱其他頻段的數(shù)據(jù). 常用于癲癇病診斷的頻段為0.01~32 Hz[2], 在該范圍內(nèi)的頻段又分為4種不同的腦波, 分別為δ波(1~3 Hz)、θ波(4~7 Hz)、α波(8~13 Hz)和β波(14~30 Hz)[3]. 因此, 本文分別使用四階Butterworth濾波器、 Chebyshev濾波器、 Bézier濾波器和橢圓濾波器對原始的腦電數(shù)據(jù)進(jìn)行0.01~32 Hz的濾波, 并研究不同類型腦電波的特征.

1.2 特征提取

原始的腦電信號數(shù)據(jù)量較大, 數(shù)據(jù)不具有代表性, 使用特征提取方法可提煉出更有意義的數(shù)據(jù)建立模型. 本文主要從時域角度和非線性角度對腦電數(shù)據(jù)進(jìn)行特征提取.

設(shè)T為腦電數(shù)據(jù). 對于時域特征提取, 本文從一段腦電數(shù)據(jù)T中主要提取了21種特征, 其中前11種包括數(shù)據(jù)的最大值(maxT)、 最小值(minT)、 平均值(meanT)、 標(biāo)準(zhǔn)差(stdT)、 方差(varT)、 總體變化量(totalT)、 偏斜度(Skewness)、 峰度(Kurtosis)、 平均能量比(APR)、 峰值(Peak)和均峰比(PAR). 定義一段時長的腦電數(shù)據(jù)T=(T1,T2,…,Tn), 其中n為數(shù)據(jù)點(diǎn)個數(shù). 則總體變化量計(jì)算公式為

(1)

偏斜度計(jì)算公式為

(2)

其中E表示對括號中值求期望; 峰度計(jì)算公式為

(3)

平均能量比計(jì)算公式為

(4)

峰值計(jì)算公式為

Peak=max{|maxT|,|minT|};

(5)

均峰比計(jì)算公式為

(6)

后10種特征是根據(jù)腦電數(shù)據(jù)波動情況得到的一種百分?jǐn)?shù), 計(jì)算步驟如下:

1) 創(chuàng)建數(shù)組L=(L1,L2,…,Lk), 用于保存一段時長腦電信號T中相鄰波峰(相鄰數(shù)據(jù)點(diǎn)的值均小于當(dāng)前數(shù)據(jù)點(diǎn)的值)和波谷(相鄰數(shù)據(jù)點(diǎn)的值均大于當(dāng)前數(shù)據(jù)點(diǎn)的值)差值的絕對值.

2) 定義L_min=min{L},L_max=max{L}, winNum=10, feet=(L_max-L_min)/winNum, 其中:L_min為L中的最小值, 作為直方圖橫軸的左側(cè)起始點(diǎn);L_max為L中的最大值, 作為直方圖橫軸的右側(cè)終止點(diǎn); feet作為直方圖的組距寬度. 即直方圖的橫軸被分為10組, 每組取值分別為[L_min,L_min+feet),(L_min+feet,L_min+2feet),…,(L_min+9feet,L_max].

3) 統(tǒng)計(jì)L中數(shù)據(jù)落在直方圖中每個組內(nèi)的個數(shù), 并除以數(shù)組L的長度k進(jìn)行歸一化, 結(jié)果定義為Bin1,Bin2,…,Bin10, 該結(jié)果即為后10個時域特征.

對于非線性特征提取, 本文提取了8種特征, 分別為小波熵(WaveletEn)[4-5]、 信息熵(SampEn)[6]、 排列熵(PeEn)[7]、 去趨勢波動分析方法(DFA)[8]得到的實(shí)驗(yàn)結(jié)果、 分形維數(shù)值(PFD)、 RS法計(jì)算得到的Hurst指數(shù)以及使用Hjorth參數(shù)計(jì)算得到的移動性值(mobility, HM)和復(fù)雜性值(complexity, HC)[9]. 實(shí)驗(yàn)采用的所有特征提取方法已整理為python代碼上傳至https://github.com/yangsh827/Seizure_FE. 本文特征提取階段獲得的特征列于表1.

表1 根據(jù)腦電數(shù)據(jù)提取的特征Table 1 Features extracted by EEG data

1.3 特征選擇

本文結(jié)合計(jì)算機(jī)領(lǐng)域與生物醫(yī)學(xué)領(lǐng)域的相關(guān)知識, 使用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)跨患者的癲癇自動檢測. 生物醫(yī)學(xué)領(lǐng)域的數(shù)據(jù)具有樣本少、 特征多的特點(diǎn), 當(dāng)輸入分類模型的特征接近或大于樣本數(shù)時, 會增加分類模型的復(fù)雜度, 模型很可能出現(xiàn)過擬合的情形, 使其不具有泛化性, 同時還會增加模型的訓(xùn)練時間. 因此, 需要對特征矩陣進(jìn)行特征選擇. 目前在機(jī)器學(xué)習(xí)中, 特征選擇通常分為3種類型: 過濾式、 包裝式和嵌入式, 如圖2所示.

圖2 特征選擇的分類Fig.2 Classification of feature selection

本文主要使用包裝式中的兩種特征選擇算法, 一種是遞歸特征消除法RFE, 另一種是基于貪心算法的SBS. 首先將特征提取后的特征矩陣進(jìn)行RFE特征選擇. RFE是一種常用的特征選擇算法, 其主要思想是先在原始的特征矩陣中遞歸地刪除特征, 然后用剩余的特征構(gòu)建模型. 通過模型的評價指標(biāo)判斷哪些特征(或特征組合)對預(yù)測結(jié)果貢獻(xiàn)較小, 從而對其進(jìn)行剔除. 該算法的時間復(fù)雜度為O(n), 算法步驟如下:

1) 歸一化處理特征提取后的特征矩陣, 將其結(jié)果作為RFE算法的輸入數(shù)據(jù);

2) 選擇一種可得到各特征權(quán)重的模型作為基分類器, 設(shè)每輪訓(xùn)練減少的特征數(shù)為n, 最終要保留的特征數(shù)為k, 選擇模型的評價指標(biāo);

3) 對輸入數(shù)據(jù)集進(jìn)行訓(xùn)練, 得到各特征的權(quán)重, 并用五折交叉驗(yàn)證得到該模型各評價指標(biāo)值;

4) 將特征的權(quán)重從大到小排列, 從數(shù)據(jù)集中移除n個擁有最小絕對值權(quán)重的特征, 得到下一輪輸入的數(shù)據(jù)集;

5) 重復(fù)步驟3),4), 當(dāng)剩余特征數(shù)為k時, 算法停止.

實(shí)驗(yàn)中, 設(shè)參數(shù)n=1,k=1, 即每次去除一個特征, 在特征數(shù)減少到1時RFE算法停止. 通過步驟3), 可得每輪交叉驗(yàn)證的結(jié)果, 選擇具有最好性能模型對應(yīng)的特征數(shù), 作為本文實(shí)驗(yàn)RFE算法最終選擇出的特征數(shù).

經(jīng)過RFE特征選擇后, 使用SBS算法對特征進(jìn)行進(jìn)一步篩選. SBS算法是一種啟發(fā)式搜索算法, 使用貪心算法的思想. 該方法選擇一個模型作為基分類器, 每次從特征矩陣中移除一個特征, 使特征矩陣在移除該特征后得到的評價指標(biāo)相對于移除其他特征是最優(yōu)的. SBS算法由于在每次移除特征時, 都要對剩余的所有特征模型進(jìn)行訓(xùn)練, 因此該算法的時間復(fù)雜度為O(n2), 故將其作為RFE特征選擇后的進(jìn)一步篩選.

1.4 分類模型

本文使用的分類器以及在RFE和SBS算法中使用的基分類器均為XGBoost模型, 其為一種集成的機(jī)器學(xué)習(xí)模型, 該模型在各項(xiàng)算法競賽中均表現(xiàn)良好, 因此本文使用XGBoost作為分類模型.

2 數(shù)據(jù)集與評價指標(biāo)

2.1 數(shù)據(jù)集

實(shí)驗(yàn)采用CHB-MIT頭皮腦電信號公開數(shù)據(jù)集. 該數(shù)據(jù)集采集于美國波士頓一家兒童醫(yī)院, 共記錄了23名癲癇患者的腦電數(shù)據(jù), 采樣頻率為256 Hz, 共包含157次癲癇發(fā)作. 數(shù)據(jù)采集時, 電極在患者頭皮的放置位置遵循國際標(biāo)準(zhǔn)10-20系統(tǒng). 該數(shù)據(jù)集中大部分樣本均包含22個通道(FP1-F7,F7-T7,T7-P7,P7-O1,FP1-F3,F3-C3,C3-P3,P3-O1,FZ-CZ,CZ-PZ,FP2-F4,F4-C4,C4-P4,P4-O2,FP2-F8,F8-T8,T8-P8,P8-O2,P7-T7,T7-FT9,FT9-FT10,FT10-T8)的數(shù)據(jù), 因此本文僅使用包含上述22個通道的樣本. 同時, 因?yàn)閏hb12患者的發(fā)作間期持續(xù)時間較短(平均415 s), chb16患者的發(fā)作期持續(xù)時間較短(平均8.6 s), 因此未采用這兩位患者的數(shù)據(jù).

實(shí)現(xiàn)癲癇的自動檢測, 使用的檢測數(shù)據(jù)時長不應(yīng)過長, 因此, 本文將檢測時長設(shè)為6 s, 即將發(fā)作期的數(shù)據(jù)以6 s為一個窗口進(jìn)行無重疊滑動, 不足6 s的數(shù)據(jù)將被舍棄, 得到正樣本集合. 發(fā)作間期的數(shù)據(jù)也以6 s為一個窗口進(jìn)行滑動, 得到負(fù)樣本集合. 因?yàn)榘l(fā)作間期時長遠(yuǎn)大于發(fā)作期時長, 為避免由正負(fù)樣本數(shù)據(jù)量不平衡而導(dǎo)致模型偏向某類樣本, 因此本文實(shí)驗(yàn)在負(fù)樣本中進(jìn)行隨機(jī)采樣, 最終使正負(fù)樣本數(shù)據(jù)量相同, 得到正負(fù)樣本各1 260個.

2.2 評價指標(biāo)

使用準(zhǔn)確率(accuracy, Acc)、 敏感性值(sensitivity, Sn)和特異性值(specificity, Sp)測試算法的性能. 準(zhǔn)確率Acc定義為分類正確的樣本占所有樣本的比例, 計(jì)算公式為

(7)

敏感性值Sn定義為分類正確的正樣本占所有正樣本的比例, 即正確判斷為患病的比例, 計(jì)算公式為

(8)

特異性值Sp定義為分類正確的負(fù)樣本占所有負(fù)樣本的比例, 即正確判斷為非患病的比例, 計(jì)算公式為

(9)

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)環(huán)境

本文用Python 3.6.4作為開發(fā)環(huán)境, 所用sklearn數(shù)據(jù)庫版本為0.19.1, numpy數(shù)據(jù)庫版本為1.16.3, pandas數(shù)據(jù)庫版本為0.22.0, scipy數(shù)據(jù)庫版本為1.0.0, XGBoost版本為0.71. 實(shí)驗(yàn)環(huán)境需要安裝nolds數(shù)據(jù)庫(https://pypi.org/project/nolds/)和PyWavelet數(shù)據(jù)庫(https://pywavelets.readthedocs.io/en/latest/install.html). 實(shí)驗(yàn)中各種算法的參數(shù)設(shè)置均使用函數(shù)默認(rèn)參數(shù).

3.2 結(jié)果分析

先分別使用Butterworth濾波器、 Chebysher濾波器、 Bézier濾波器和橢圓濾波器對原始腦電數(shù)據(jù)進(jìn)行0.01~32 Hz的帶通濾波, 然后對濾波后的數(shù)據(jù)特征提取, 經(jīng)過五折交叉驗(yàn)證, 所得實(shí)驗(yàn)結(jié)果列于表2. 由表2可見, 先用Butterworth濾波器對原始腦電數(shù)據(jù)進(jìn)行濾波, 然后再進(jìn)行特征提取, 得到的準(zhǔn)確率Acc、 敏感性值Sn和特異性值Sp均高于其他3種濾波器, 說明Butterworth濾波器更適合本文癲癇檢測方法.

表2 4種濾波器的分類結(jié)果Table 2 Classification results of four filters

下面用Butterworth濾波器進(jìn)一步分析不同頻率范圍的4種腦波(δ波、θ波、α波和β波)與癲癇檢測的關(guān)系. 用Butterworth濾波器先分別對腦電數(shù)據(jù)進(jìn)行4種腦波對應(yīng)頻率范圍的帶通濾波, 然后對濾波后的腦電數(shù)據(jù)特征提取, 經(jīng)過五折交叉驗(yàn)證, 所得實(shí)驗(yàn)結(jié)果列于表3. 由表3可見, 對于綜合準(zhǔn)確率Acc、 敏感性值Sn和特異性值Sp,β波(14~30 Hz)的分類結(jié)果比0.01~32 Hz頻率范圍和其他腦波的分類結(jié)果更優(yōu). 而β波是一種人在緊張情形下釋放的腦波, 實(shí)驗(yàn)結(jié)果表明, 14~30 Hz頻率范圍的β波腦電數(shù)據(jù)更適合于本文檢測方法.

表3 在4種腦波上的癲癇分類結(jié)果Table 3 Classification results of epileptic seizure of four brain waves

用Butterworth濾波器對原始腦電數(shù)據(jù)進(jìn)行β波(14~30 Hz)濾波去噪, 再進(jìn)行特征提取, 共得到638個特征. 對這638個特征進(jìn)行RFE特征選擇, 再對選擇后的特征矩陣使用SBS算法做進(jìn)一步篩選, 經(jīng)過五折交叉驗(yàn)證, 每種特征選擇算法所得分類結(jié)果列于表4. 表4中特征數(shù)(features numbers, FNums)表示使用兩種特征選擇算法得到的最好分類準(zhǔn)確率對應(yīng)的特征數(shù). 由表4可見: RFE算法將原始特征數(shù)由638個減少到66個, 分類準(zhǔn)確率提升了2.5%; SBS算法將RFE選擇后的特征數(shù)由66個減少到44個, 分類準(zhǔn)確率提升了1.63%. 表明機(jī)器學(xué)習(xí)中的特征選擇算法不僅提高了分類性能, 同時減少了特征數(shù)量. 因此, 針對經(jīng)過特征提取的數(shù)據(jù), 用本文的特征選擇算法可極大提高分類性能. 本文算法、 神經(jīng)網(wǎng)絡(luò)算法[10]和隨機(jī)森林算法[11]的敏感性分別為0.854 8,0.850 0,0.808 7, 表明本文算法在敏感性值上優(yōu)于另外兩種對比算法, 說明本文算法效果更佳.

表4 特征選擇算法RFE和SBS的分類結(jié)果Table 4 Classification results of feature selection algorithms of RFE and SBS

綜上所述, 本文提出了一種基于機(jī)器學(xué)習(xí)算法的跨患者癲癇自動檢測算法. 首先對原始腦電數(shù)據(jù)用濾波器去除噪聲, 從時域和非線性角度對去除噪聲后的腦電數(shù)據(jù)進(jìn)行特征提取, 并在4種濾波器和5種頻率范圍的腦波中找出了更適合跨患者癲癇檢測的Butterworth濾波器和β腦波; 然后用基于XGBoost基學(xué)習(xí)器的特征選擇算法RFE和SBS對特征矩陣實(shí)現(xiàn)進(jìn)一步的特征篩選; 最后在638個特征中保留了44個特征. 實(shí)驗(yàn)結(jié)果表明, 本文使用機(jī)器學(xué)習(xí)算法, 在更少特征的情形下實(shí)現(xiàn)了更高的分類性能, 分類準(zhǔn)確率Acc為0.877 4, 敏感性值Sn為0.854 8, 特異性值為0.9. 該結(jié)果在準(zhǔn)確率上比特征選擇前提升了4.13%, 且在跨患者癲癇檢測模型中表現(xiàn)出更優(yōu)的性能, 表明本文算法檢測性能更高、 效果更好.

猜你喜歡
特征提取癲癇分類
癲癇中醫(yī)辨證存在的問題及對策
分類算一算
基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
玩電腦游戲易引發(fā)癲癇嗎?
一種基于LBP 特征提取和稀疏表示的肝病識別算法
左氧氟沙星致癲癇持續(xù)狀態(tài)1例
基于MED和循環(huán)域解調(diào)的多故障特征提取
主站蜘蛛池模板: 欧美日韩亚洲国产| 一级毛片在线免费看| 朝桐光一区二区| 波多野结衣一区二区三区四区视频 | 欧美日一级片| 精品91自产拍在线| 美女免费精品高清毛片在线视| 午夜福利视频一区| 狠狠综合久久久久综| 香蕉久久国产精品免| 国产色伊人| 免费观看男人免费桶女人视频| 亚洲欧美日韩动漫| 国产日本欧美在线观看| 一区二区午夜| 久久国产成人精品国产成人亚洲| 成人在线亚洲| 国产精品亚洲日韩AⅤ在线观看| 好吊色妇女免费视频免费| 91日本在线观看亚洲精品| 亚洲天堂区| 国产欧美视频综合二区| 久草视频精品| 欧美视频二区| 五月天在线网站| 亚洲欧美日韩成人在线| 久久天天躁狠狠躁夜夜躁| 91久久夜色精品国产网站| 在线观看国产精美视频| 亚洲大尺度在线| 欧美成人在线免费| 免费a在线观看播放| 国产美女精品在线| 老司机午夜精品网站在线观看| 亚洲精品手机在线| 欧美精品黑人粗大| 亚洲91精品视频| a级毛片网| 有专无码视频| 欧洲av毛片| 久久影院一区二区h| 欧日韩在线不卡视频| 亚洲男人的天堂网| 91成人在线免费视频| 亚洲中文制服丝袜欧美精品| 毛片a级毛片免费观看免下载| 亚洲日韩AV无码一区二区三区人| 亚洲美女一区| 狠狠色丁香婷婷综合| 国产激爽大片在线播放| 亚洲无码高清一区二区| 国产特一级毛片| 久久精品国产在热久久2019 | 沈阳少妇高潮在线| 亚洲成人免费看| 久久久亚洲色| 丁香六月激情综合| 怡春院欧美一区二区三区免费| 国产免费久久精品99re丫丫一| 国产黄色视频综合| 日韩无码真实干出血视频| 99re视频在线| 久久免费成人| 国产成人区在线观看视频| 成年免费在线观看| 91美女视频在线| 伊人久热这里只有精品视频99| 国内黄色精品| 亚洲天堂视频在线观看免费| 伊人中文网| 视频在线观看一区二区| 99re热精品视频国产免费| 亚洲精品成人7777在线观看| 成人福利一区二区视频在线| 国产女人在线| 99国产在线视频| 亚洲精品国偷自产在线91正片| 国产最新无码专区在线| 九色在线观看视频| 亚洲综合片| 亚洲AV无码一区二区三区牲色| 欧美另类视频一区二区三区|