999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于腦電信號(hào)的癲癇發(fā)作預(yù)測(cè)

2022-03-25 04:45:00魏海坤張侃健
軟件導(dǎo)刊 2022年3期
關(guān)鍵詞:特征提取癲癇特征

朱 檸,魏海坤,張侃健

(東南大學(xué) 自動(dòng)化學(xué)院,江蘇南京 210096)

0 引言

癲癇是一種慢性非傳染性腦病[1],被定義為一種持久性產(chǎn)生大腦紊亂的疾病,會(huì)導(dǎo)致嚴(yán)重的機(jī)體、認(rèn)知、心理障礙和社會(huì)后果[2-3]。癲癇發(fā)作是由大腦中異常、過(guò)度的神經(jīng)元活動(dòng)導(dǎo)致的短暫癥狀[4]。癲癇的平均發(fā)病率為23~190/10 萬(wàn),兒童的發(fā)病率可達(dá)25~840/10 萬(wàn)[5],且發(fā)展中國(guó)家的癲癇發(fā)病率明顯高于發(fā)達(dá)國(guó)家[6]。傳統(tǒng)的流行病學(xué)和衛(wèi)生統(tǒng)計(jì)方法只考慮疾病死亡率而不考慮殘疾率,導(dǎo)致神經(jīng)系統(tǒng)疾病對(duì)人類健康的影響被嚴(yán)重低估。全球范圍內(nèi)應(yīng)對(duì)神經(jīng)系統(tǒng)疾病的資源分配不足,迫使人們尋求更有效的解決方案。

1 相關(guān)研究

癲癇發(fā)作時(shí)如果得不到及時(shí)救治,可能會(huì)對(duì)患者生命安全產(chǎn)生極大傷害,預(yù)測(cè)癲癇發(fā)作可有效規(guī)避健康風(fēng)險(xiǎn)。有臨床經(jīng)驗(yàn)的醫(yī)生可通過(guò)患者的腦電波圖像對(duì)其病情有大致了解,但可能會(huì)忽視細(xì)小波動(dòng),而采用機(jī)器預(yù)測(cè)癲癇發(fā)作往往需要處理海量數(shù)據(jù)。近年來(lái),人工智能(Artificial Intelligence)和機(jī)器學(xué)習(xí)(Machine Learning)技術(shù)由于其強(qiáng)大的數(shù)據(jù)處理能力,在癲癇發(fā)作的預(yù)測(cè)中發(fā)揮了一定作用[7-8]。目前,研究人員已經(jīng)建立了一套解決癲癇預(yù)測(cè)問(wèn)題的框架,主要包括4 個(gè)步驟[9],具體為:

(1)原始腦電數(shù)據(jù)的采集與轉(zhuǎn)換。獲取數(shù)據(jù)的方法主要有侵入式腦電和非侵入式腦電(頭皮腦電)兩種。為實(shí)時(shí)獲取數(shù)據(jù),需要將患者腦電信息通過(guò)電極連線傳輸?shù)皆O(shè)備中。

(2)數(shù)據(jù)預(yù)處理和特征提取。原始腦電數(shù)據(jù)的信噪比過(guò)低,且電極相鄰?fù)ǖ篱g具有強(qiáng)統(tǒng)計(jì)學(xué)相關(guān)性(皮爾森相關(guān)系數(shù)高于80%),因此從原始數(shù)據(jù)中提取有效信息十分關(guān)鍵,一般選擇在一個(gè)確定的時(shí)間窗口內(nèi)對(duì)數(shù)據(jù)特征進(jìn)行提取。綜合現(xiàn)有研究結(jié)果,數(shù)據(jù)特征可分為時(shí)域特征、頻域特征、時(shí)域—頻域特征線長(zhǎng)度、離散小波變換特征、連續(xù)小波變換特征和傅里葉變換特征。例如,王雅靜等[10]采用預(yù)發(fā)作數(shù)據(jù)段選取方法,在MIT 公共頭皮腦電數(shù)據(jù)庫(kù)和宣武醫(yī)院收集的數(shù)據(jù)集上進(jìn)行測(cè)試,召回率分別為95.76%和97.80%。

(3)運(yùn)用機(jī)器學(xué)習(xí)相應(yīng)的分類器。常用的分類器,如支持向量機(jī)(SVM)、隨機(jī)森林(RF)和神經(jīng)網(wǎng)絡(luò)(BP、CNN、RNN)被廣泛用于癲癇發(fā)作模式的識(shí)別。例如,Cho 等[11]將神經(jīng)信號(hào)的鎖相值作為SVM 分類器的輸入特征,得到召回率為82.44%的分類結(jié)果;Ahmad 等[12]將傅里葉變換后的數(shù)據(jù)作為特征,召回率達(dá)到94.8%;Zhang 等[13]將信號(hào)的絕對(duì)/相對(duì)功率譜作為SVM 分類器的輸入,模型性能極大提升,召回率達(dá)到98.68%。RF 模型的擬合能力強(qiáng)于SVM,在癲癇預(yù)測(cè)模型上的分類結(jié)果更優(yōu)。例如,Truong 等[14]選擇時(shí)域特征,Tzimourta 等[15]選擇傅里葉變換后的頻域特征,Sharma 等[16]選擇經(jīng)驗(yàn)?zāi)B(tài)變換后的數(shù)據(jù)作為RF 輸入,得到模型的召回率分別為96.94%、99.74%、98.6%。在神經(jīng)網(wǎng)絡(luò)方面,劉亞朋[17]、O’shea 等[18]和Zhou 等[19]采用的1DCNN模型召回率分別為93.53%、95.9%、95.7%;Cao 等[20]采用的2DCNN 模型召回率為96.2%;Tsiouris 等[21]將時(shí)域和頻域特征作為簡(jiǎn)單3 層長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)模型LSTM的輸入,得到的召回率為99.28%。現(xiàn)有神經(jīng)網(wǎng)絡(luò)模型的召回率略低于RF,但其誤報(bào)率一般在0.1/h 內(nèi),而RF的誤報(bào)率一般為0.21~0.77/h。在實(shí)際應(yīng)用中,往往需要根據(jù)具體情況選擇輸入特征和分類器。

(4)模型評(píng)價(jià)。通常采用精確率(Precision)、召回率(Recall)和誤報(bào)率(False Discovery Rate)評(píng)價(jià)模型性能優(yōu)劣。

本文基于南京某醫(yī)院癲癇數(shù)據(jù)集,為醫(yī)患提供較為先進(jìn)的癲癇監(jiān)測(cè)方案,一方面幫助醫(yī)生全面了解患者病情,另一方面使患者對(duì)癲癇發(fā)作產(chǎn)生預(yù)警,以便及時(shí)采取醫(yī)療措施。本文的研究意義在于解決醫(yī)院現(xiàn)有數(shù)據(jù)集的癲癇預(yù)測(cè)問(wèn)題,是機(jī)器學(xué)習(xí)相關(guān)技術(shù)應(yīng)用于國(guó)內(nèi)癲癇預(yù)測(cè)的實(shí)例;亮點(diǎn)在于該數(shù)據(jù)集與現(xiàn)有公開(kāi)數(shù)據(jù)集差異較大,主要體現(xiàn)在數(shù)據(jù)量和數(shù)據(jù)處理方式上,同時(shí)本文方法集成了現(xiàn)有框架的優(yōu)勢(shì),具有一定泛用性。

2 數(shù)據(jù)采集與預(yù)處理

2.1 數(shù)據(jù)集

采用南京某醫(yī)院收錄的采用立體定向腦波技術(shù)(SEEG)診斷與治療的癲癇患者腦電信號(hào)數(shù)據(jù),該數(shù)據(jù)集尚未公開(kāi)。SEEG 是一種侵入式癲癇診斷與治療技術(shù),其通過(guò)微創(chuàng)外科手術(shù)將直徑為0.8mm的電極置入腦內(nèi)以實(shí)時(shí)監(jiān)測(cè)癲癇患者的腦電信號(hào),確定發(fā)病腦部區(qū)域。患者通過(guò)SEEG 植入腦部電極后,需要住院24h 實(shí)時(shí)監(jiān)測(cè)腦電信號(hào),癲癇發(fā)作時(shí),射頻熱凝發(fā)生器會(huì)與目標(biāo)電極點(diǎn)接觸,即可對(duì)腦部相應(yīng)區(qū)域?qū)嵤崮讨委煟话阈枰委?~6 次。基于人道主義原則,醫(yī)院一般不會(huì)要求患者為醫(yī)學(xué)研究提供額外的癲癇發(fā)作數(shù)據(jù),因此該數(shù)據(jù)集是本文的核心內(nèi)容。提取其中5 位患者的癲癇發(fā)作數(shù)據(jù),采樣頻率為2kHz,患者間植入電極數(shù)及其分布情況差異較大。除SEEG 信號(hào)數(shù)據(jù)外,臨床上通常輔以肌電圖診斷癲癇,這些數(shù)據(jù)也被記錄在文件中。5 位患者植入的電極數(shù)分別為117、127、84、81、110,電極空間分布為A~J 區(qū),每位患者相同區(qū)域的采集信號(hào)通道數(shù)有一定差異,這是由醫(yī)院硬件設(shè)備連接不穩(wěn)定造成的。數(shù)據(jù)集中記錄的癲癇發(fā)作次數(shù)分別為4 次、6 次、3 次、3 次、6 次。

2.2 數(shù)據(jù)預(yù)處理

信道采集的無(wú)效數(shù)據(jù)包括3 種情況:第一種是信道已被使用,但由于連接不穩(wěn)定或硬件設(shè)備損壞而產(chǎn)生無(wú)效數(shù)據(jù),該種數(shù)據(jù)的特征是在維持一段有效信息后振幅突然激增,并保持較長(zhǎng)時(shí)間,具體如圖1 所示;第二種是信道未在臨床中被使用,該種數(shù)據(jù)有高振幅、周期性波動(dòng)類型,也有高振幅、信號(hào)不連續(xù)類型,具體如圖2 所示;第三種是臨床用于輔助診斷的肌電信號(hào)數(shù)據(jù),與腦電數(shù)據(jù)不同的是,肌電數(shù)據(jù)往往是通過(guò)振幅體現(xiàn)肌電信號(hào)變化,且周期遠(yuǎn)小于正常腦電數(shù)據(jù),具體如圖3 所示。在正式處理數(shù)據(jù)之前,需要將這3 類數(shù)據(jù)剔除,降低有效數(shù)據(jù)的提取難度。

Fig.1 Invalid data caused by unstable channel connection圖1 信道連接不穩(wěn)定造成的無(wú)效數(shù)據(jù)

Fig.2 Invalid data caused by the channel not being used in the clinic圖2 信道未在臨床中使用造成的無(wú)效數(shù)據(jù)

Fig.3 Invalid data caused by EMG data for auxiliary diagnosis圖3 輔助診斷的肌電數(shù)據(jù)造成的無(wú)效數(shù)據(jù)

3 特征提取

3.1 同區(qū)域通道間數(shù)據(jù)相關(guān)性

統(tǒng)計(jì)學(xué)三大相關(guān)系數(shù)分別為Pearson、Spearman 和Kendall,反映的都是兩個(gè)變量之間變化趨勢(shì)的程度及方向,數(shù)值范圍為-1~1,0 表示兩個(gè)變量不相關(guān),正值表示正相關(guān),負(fù)值表示負(fù)相關(guān),值越大表示相關(guān)性越強(qiáng)。

Pearson 相關(guān)系數(shù)有兩個(gè)假設(shè),一是兩個(gè)變量服從正態(tài)分布,通常采用t檢驗(yàn)確定相關(guān)系數(shù)的顯著性,二是兩個(gè)變量的標(biāo)準(zhǔn)差不為0。Pearson 相關(guān)系數(shù)的計(jì)算公式為:

式中,cov(X,Y)表示X、Y的協(xié)方差,σX σY表示X、Y標(biāo)準(zhǔn)差的乘積。

Spearman 和Kendall 相關(guān)系數(shù)適用于數(shù)據(jù)秩序相關(guān)的情況,本文研究的是相鄰?fù)ǖ篱g數(shù)據(jù)的相關(guān)性分布,更適合使用判斷兩個(gè)變量是否線性相關(guān)的Pearson 相關(guān)系數(shù)。將原始數(shù)據(jù)通道間的Pearson 系數(shù)值轉(zhuǎn)換成熱力學(xué)圖(heatmap),可以更加明顯地觀察到相鄰?fù)ǖ篱g具有統(tǒng)計(jì)學(xué)強(qiáng)相關(guān)性,具體如圖4(彩圖掃OSID 碼可見(jiàn))所示。由于數(shù)據(jù)集的采樣頻率為2kHz,通道數(shù)均值為103.8,需要處理的數(shù)據(jù)量遠(yuǎn)高于現(xiàn)有公開(kāi)數(shù)據(jù)集。為降低模型后續(xù)計(jì)算量,可將具有統(tǒng)計(jì)學(xué)強(qiáng)相關(guān)性的通道數(shù)據(jù)融合。此外,相關(guān)性的驗(yàn)證對(duì)于患者腦部電極接入位置和數(shù)量的確定具有一定參考價(jià)值。

Fig.4 Heatmap of Pearson coefficient between channels圖4 通道間Pearson 系數(shù)熱力學(xué)圖

3.2 時(shí)域與頻域特征提取

特征提取的目的是從海量數(shù)據(jù)中提取有效信息,減少模型對(duì)無(wú)效信息的擬合,降低模型結(jié)構(gòu)維度,提升模型擬合速度,使醫(yī)院的硬件設(shè)備能夠滿足模型運(yùn)行需要。現(xiàn)有特征提取方法多基于信道中一段時(shí)間的數(shù)據(jù)進(jìn)行,稱為時(shí)間窗口,通常為5s,移動(dòng)步長(zhǎng)為1s,以提前15min 預(yù)測(cè)癲癇發(fā)作為目標(biāo),也即本文采用的時(shí)間窗口和移動(dòng)步長(zhǎng)大小。這兩個(gè)值實(shí)際上基于癲癇預(yù)測(cè)的準(zhǔn)確性和實(shí)時(shí)性作出的平衡性選擇,并不一定是最優(yōu)解。常用特征提取方法及相關(guān)特征如表1 所示。

Table 1 Time domain and frequency domain feature extraction methods and their characteristics表1 時(shí)域、頻域特征提取方法及其特征

3.3 樣本正負(fù)樣本比例

二分類模型的損失函數(shù)一般選擇交叉熵?fù)p失函數(shù)(binary_crossentropy),計(jì)算公式為:

由上式可知,如果樣本類型不平衡,如正樣本數(shù)過(guò)少,模型便會(huì)默認(rèn)將所有樣本識(shí)別為負(fù)樣本,擬合結(jié)果的loss值就會(huì)很低,這樣顯然不符合實(shí)際應(yīng)用需求。因此,在對(duì)樣本進(jìn)行分類時(shí)需將正負(fù)樣本的比例設(shè)置為1,最大程度地發(fā)揮模型的擬合性能。癲癇發(fā)作是一個(gè)短暫過(guò)程,一般患者住院7 天能監(jiān)測(cè)到的癲癇發(fā)作次數(shù)為3~6 次,每次發(fā)作時(shí)間為30~75s,樣本數(shù)極低。因此,本文采用欠采樣的方式,以保證正樣本/負(fù)樣本=10。這個(gè)比值是綜合考慮模型性能得出的一個(gè)較優(yōu)解,該值過(guò)大可能會(huì)導(dǎo)致模型擬合失敗,過(guò)小會(huì)導(dǎo)致擬合程度不夠。

4 LightGBM 分類器及其結(jié)果評(píng)估

4.1 XGBoost 與LightGBM

XGBoost 采用泰勒二階展開(kāi)近似代價(jià)函數(shù),使其能夠自定義損失函數(shù),擬合能力更強(qiáng),其還采用L2 范式和列采樣抑制過(guò)擬合。LightGBM 相較于XGBoost 具有訓(xùn)練速度快、內(nèi)存占用率低的特點(diǎn),可視為XGBoost的優(yōu)化解,優(yōu)化了模型運(yùn)算量、內(nèi)存消耗等,這是由于LightGBM 采用了直方圖算法和帶深度限制的Leaf-wise的葉子生長(zhǎng)策略。然而,內(nèi)存消耗的降低和計(jì)算效率的提升帶來(lái)了一定程度的準(zhǔn)確率降低,這是由于特征被離散化,但在梯度提升(Gradient Boosting)的框架下沒(méi)有太大影響。

XGBoost 和LightGBM 是目前機(jī)器學(xué)習(xí)領(lǐng)域泛用性最強(qiáng)、應(yīng)用最多、效果最好的分類器。癲癇數(shù)據(jù)集的數(shù)據(jù)量較大,因此選擇LightGBM 作為分類器。

4.2 算法流程

本文建立的算法流程如圖5 所示,分為數(shù)據(jù)處理、模型訓(xùn)練和預(yù)測(cè)結(jié)果輸出3 個(gè)階段。數(shù)據(jù)處理階段將無(wú)效信息篩出,通過(guò)特征提取提升樣本有效信息比例,減少計(jì)算量并對(duì)正負(fù)樣本比進(jìn)行平衡;模型訓(xùn)練采用五折交叉驗(yàn)證法,最后采用投票法輸出模型預(yù)測(cè)結(jié)果。

Fig.5 LightGBM five-fold cross-validation algorithm flow圖5 LightGBM 五折交叉驗(yàn)證算法流程

4.3 分類結(jié)果評(píng)估

對(duì)每位患者的數(shù)據(jù)單獨(dú)進(jìn)行五折交叉訓(xùn)練,得到基模型的準(zhǔn)確率如表2 所示。投票法結(jié)果表明,5 位患者的數(shù)據(jù)均達(dá)到召回率100%,誤報(bào)率為0h-1的效果。測(cè)試集的選取是在單獨(dú)某次發(fā)作或樣本數(shù)量不足的情況下,加入某段相對(duì)獨(dú)立的發(fā)作信息而來(lái),即測(cè)試集的樣本即使和某次發(fā)作出自同一時(shí)間段,樣本內(nèi)所含時(shí)間步長(zhǎng)也未經(jīng)過(guò)模型訓(xùn)練。

Table 2 Accuracy of LightGBM-based model training set表2 LightGBM 基模型訓(xùn)練集準(zhǔn)確率 單位:%

模型在測(cè)試集得到的結(jié)果如表3 所示,測(cè)試集的平均召回率為84.18%,誤報(bào)率為0.57/h。以上結(jié)果是基于每秒進(jìn)行一次模型輸出得出,在實(shí)際應(yīng)用中,往往可以通過(guò)一定時(shí)間段內(nèi)的模型輸出結(jié)果綜合確定癲癇是否發(fā)作。模型的誤報(bào)主要集中在發(fā)作前15~25min 內(nèi),可能是由于類別間的劃分間隙不夠明確,位于類別邊緣的點(diǎn)容易造成分類的誤報(bào)和漏報(bào),可通過(guò)更加準(zhǔn)確地選取分類標(biāo)簽來(lái)改善。

Table 3 LightGBM test set results表3 LightGBM 測(cè)試集結(jié)果

5 結(jié)語(yǔ)

結(jié)合現(xiàn)有癲癇發(fā)作預(yù)測(cè)的研究成果,本文選擇癲癇數(shù)據(jù)集的時(shí)域和頻域特征,融合強(qiáng)統(tǒng)計(jì)學(xué)相關(guān)的通道間數(shù)據(jù),以LightGBM 作為分類器,得到測(cè)試集的平均召回率為84.18%,誤報(bào)率為0.57/h,說(shuō)明本文方法能較好地解決現(xiàn)有癲癇數(shù)據(jù)集的分類問(wèn)題。然而,本文僅針對(duì)每個(gè)患者單獨(dú)進(jìn)行建模且要求其至少有1~2 次有記錄的癲癇發(fā)作,距離醫(yī)院實(shí)際應(yīng)用,即找到患者統(tǒng)一的癲癇發(fā)作模式仍有許多工作要做。

猜你喜歡
特征提取癲癇特征
癲癇中醫(yī)辨證存在的問(wèn)題及對(duì)策
如何表達(dá)“特征”
基于Gazebo仿真環(huán)境的ORB特征提取與比對(duì)的研究
電子制作(2019年15期)2019-08-27 01:12:00
不忠誠(chéng)的四個(gè)特征
抓住特征巧觀察
玩電腦游戲易引發(fā)癲癇嗎?
一種基于LBP 特征提取和稀疏表示的肝病識(shí)別算法
左氧氟沙星致癲癇持續(xù)狀態(tài)1例
基于MED和循環(huán)域解調(diào)的多故障特征提取
中醫(yī)針?biāo)幹委熌X卒中后癲癇臨床觀察
主站蜘蛛池模板: 欧美日韩一区二区在线播放| 中文一区二区视频| 国产精品无码AⅤ在线观看播放| 精品国产99久久| 99久久精品免费看国产免费软件| 亚洲AⅤ综合在线欧美一区| 亚洲一区二区约美女探花| 婷婷综合缴情亚洲五月伊| 熟妇丰满人妻av无码区| 国产精品色婷婷在线观看| 四虎成人精品| 亚洲精品成人片在线播放| P尤物久久99国产综合精品| 亚洲美女久久| 免费看一级毛片波多结衣| 久久久成年黄色视频| 欧美成在线视频| 国产色婷婷| 91美女视频在线| 欧美在线一级片| 在线看片中文字幕| 亚洲欧洲综合| 欧美一级专区免费大片| 久久香蕉国产线看观看亚洲片| 成人福利在线免费观看| 国产综合网站| 精品视频在线一区| 日本成人福利视频| 日本欧美中文字幕精品亚洲| 色偷偷av男人的天堂不卡| 麻豆精品在线播放| 午夜国产理论| 一级一级一片免费| 亚洲午夜国产精品无卡| 欧美亚洲欧美| 亚洲最新在线| 国产不卡网| 91精品啪在线观看国产60岁| 蝴蝶伊人久久中文娱乐网| 亚洲精品动漫| 97se亚洲综合不卡| 呦系列视频一区二区三区| 日本在线亚洲| 亚洲综合久久成人AV| 亚洲男人在线天堂| 色综合久久88色综合天天提莫 | 天堂av综合网| 国产精品吹潮在线观看中文| 潮喷在线无码白浆| 久久中文字幕不卡一二区| 亚洲免费毛片| 色婷婷久久| 亚洲男人的天堂在线观看| 91在线精品免费免费播放| 亚洲精品国偷自产在线91正片| 国产微拍一区二区三区四区| 动漫精品中文字幕无码| 伊人久久婷婷| 久久人午夜亚洲精品无码区| AV片亚洲国产男人的天堂| a色毛片免费视频| 国产无码精品在线| 亚洲成a人片7777| 亚洲首页国产精品丝袜| 在线精品亚洲一区二区古装| av无码一区二区三区在线| 亚洲swag精品自拍一区| a级毛片在线免费观看| 亚洲欧州色色免费AV| 日韩欧美中文字幕在线精品| 无码人妻热线精品视频| 91亚洲精品第一| 岛国精品一区免费视频在线观看 | 小说区 亚洲 自拍 另类| 精品国产女同疯狂摩擦2| 青青青视频蜜桃一区二区| 蜜桃视频一区二区| 最新亚洲人成无码网站欣赏网| 国产精品自拍露脸视频| 日韩第九页| 欧美激情首页| 亚洲国产系列|