韓 偉 李 艷 周聲毅 卓雁文 湯 池 劉 娟 鄭澤宇 謝康寧*
從生物信號區分不同的生理或病理狀態具有重要的研究意義和應用價值,如臨床上通過心電可以診斷心肌缺血和心律失常等疾病;通過腦電可以監測人體睡眠狀態和麻醉深度。人體心電、腦電等生理信號由跨多個時空尺度的相互作用機制共同調控,并受多種因素影響,是典型的非線性復雜時間序列信號。復雜度是一種非線性信號分析方法,近年來得到了廣泛的研究,雖然復雜度的概念還未準確定義,但研究者認為其與信號“有意義的結構豐富度”有著直觀的聯系[1]。在生物系統的復雜度理論中,健康系統具有最強的調控能力和環境適應性,在多個時空尺度上呈現出復雜變化和長程相關性,因此具有最高的復雜度。而病理、衰老等系統,由于調控和適應能力受到損害或減弱,其系統復雜度將降低[2]。最大隨機系統和完全有序系統被認為具有最低的復雜度,因為其不具備“有意義的結構豐富度”[3]。Silva[4]等研究認為,生理信號中包含的隨機成分和周期成分越多,其復雜度將越低。
多尺度熵(multiscale entropy,MSE)是非線性動力學理論中度量時間序列復雜度的一種算法,相比傳統的近似熵、樣本熵,MSE可以考慮到信號在多個時間尺度上的動態特性和長程相關性信息,從而全面地度量信號的復雜度,十分適合復雜時間序列信號分析[5-6]。目前,MSE已經被用于生物醫學、交通、金融及工業等領域的研究[7-11]。然而,MSE自身也存在一些缺陷和不足,如MSE給混雜了白噪聲的生理信號賦予了比原始信號更高的復雜度值,這顯然是錯誤的,因為白噪聲屬于完全隨機信號,會對原始生理信號的結構和自相關性造成污染,因此會使混合信號變得不那么復雜。此外,MSE在不同尺度上熵值比較結果不盡相同的時候難以給出確定性結論。Costa[5]等研究認為,若一個時間序列的熵值在絕大部分尺度上大于另一個時間序列,則前者比后者更復雜;同時研究還指出,為了更好地分析生理過程,除了考慮MSE的系列值,還需要考慮MSE曲線的變化趨勢。這種分析方法不夠直觀,需要一定經驗,且在某些特定情況下容易出錯。為此,本研究提出了一種改進的MSE,稱為冪律調制多尺度熵(power-law modulated multiscale entropy,pMSE),并通過仿真、心電和腦電3種信號分別對其進行了測試和驗證。
MSE由在不同的時間尺度上計算樣本熵(sample entropy,SE)而得到,其核心思想是“粗粒化”過程[12]。設一個有限長離散時間序列{xi}表示為x1,x2,x3,…,xL,共L個點,其MSE計算有以下兩個步驟。
(1)對原始序列進行粗粒化變換,生成不同尺度對應的新序列,其計算為公式1:


圖1 尺度2和尺度3的粗粒化序列生成過程
(2)計算每個尺度對應序列的SE值,從而得到MSE,其計算為公式2:

式中m為嵌入維數,r為相似容限。一般情況下,m取2,r取0.15σ(σ為序列{xi}的標準差),s取1~20。s范圍越大,越能觀察到信號在不同尺度上的動態變化特性,但需要的數據點隨之增多,計算成本也隨之增高。
另一種度量信號復雜度的方法是分形,通過分析信號的自相似性來研究其復雜度[13]。其中Hurst指數是提出最早使用最廣泛的信號分形研究指數。生理信號的功率譜包含一個1/f分量,即信號的功率隨頻率的增加呈冪律函數遞減,用公式可以表示為:P∝1/fβ,其中P是功率,f是頻率,β是冪律指數(Power-law)[14]。當β=0時,信號即為白噪聲;當β=1時,信號即常見的1/f噪聲,也稱閃爍噪聲。Eke等[15]通過研究發現,β與Hurst指數存在如下關系:

因此,β也是研究信號自相似性的重要指標,并與信號的復雜度存在一定關聯。結合MSE和β,通過多次嘗試及仿真驗證提出了pMSE,其計算為公式3:

單分形信號的β容易求得,然而真實的生理信號絕大多數為多分形信號,從整體上看并無一個單一的冪律指數,但以微分思想在局部每個尺度附近可以求得一個近似的β,記為βs。結合Costa對MSE解析表達式[5]的分析推導,以及相關數學公式推算,發現當以對數尺度作為橫軸時,MSE的值與lns成正比,二者的關系為表達式:

表達式中k為MSE曲線的斜率,當以對數尺度作為橫軸時,計算出MSE在每個尺度處的曲線斜率ks便可以求得局部的近似βs。為此,首先對MSE的系列熵值做四階多項式擬合,通過平滑來減小局部波動帶來的干擾,然后對擬合曲線求導得到每個尺度處的曲線斜率,進而得出βs,最后便可以計算出pMSE。
對比pMSE和MSE對混合了不同程度白噪聲的生理信號的區分情況。在麻省理工學院的開源數據庫Physiobank[16]中隨機選取一例正常竇性心律人體的心跳間期信號,編號nsr16273,作為基準生理信號。白噪聲由MATLAB 2017b生成,先將標準差等比放大至和生理信號同樣大小,然后按照0.2倍、0.4倍和0.6倍幅值大小分別疊加在該基準信號上。
對比pMSE和MSE對健康、充血性心力衰竭和心房顫動患者的心跳間期信號的區分情況。Physiobank中的心律失常數據庫被許多學者用來進行生理信號復雜度相關研究,為便于比較,遵循隨機原則,從Physiobank數據庫中選取45例數據,分別為健康數據15例,充血性心力衰竭數據14例,以及心房顫動數據16例。
對比pMSE和MSE對清醒和疲勞兩種狀態腦電信號的區分情況。招募在校大學生16名,年齡范圍(25.63±3.26)歲,均為右利手,身體和精神狀態良好,近期未服用任何藥物。采用連續2 h的英文閱讀模擬持續認知負荷任務,誘發受試者的腦疲勞狀態。疲勞模型評估使用美國航空航天局任務負荷指數(NASA-Task Load Index,NASA-TLX)量表和卡羅林斯卡嗜睡量表(Karolinska sleeping scale,KSS)。在前額葉Fpz位置記錄清醒時和疲勞時的腦電信號各8 min,共12×10^4個數據點。由于清醒和疲勞是生理狀態而非病理狀態,數據分析結果發現pMSE和MSE在疲勞前后的變化均較小,從繪制的曲線上僅能看出疲勞后的值略有降低,難以直觀比較。此外,由于個體的大腦狀態差異較大,因而采用支持向量機(support vector machine,SVM)算法比較pMSE和MSE對腦疲勞的分類效果。具體數據處理及分析步驟如下。
(1)對16名受試者腦電數據進行1~40 Hz帶通濾波,然后采用滑動窗方法將每個信號分割,滑動過程見圖2。

圖2 滑動過程示意圖
(2)計算每組數據的pMSE和MSE。最終每名受試者在清醒和疲勞兩種狀態下,分別有使用兩種算法計算得到的一個226×20的二維數組。
(3)分別以pMSE和MSE值作為特征,以清醒和疲勞作為監督學習標簽,將每名受試者兩種狀態下的二維數組合并,分別形成一個452×20的數據集。然后采用SVM對每個數據集進行分類,得到對清醒和疲勞腦電的分類準確率。為保證分類結果的魯棒性,使用分層5倍折疊交叉驗證法確定訓練集和測試集。
使用SPSS20.0統計軟件對量表和分類準確率數據做配對t檢驗,所有數據均以均數±標準差()表示,顯著性水準以P<0.05為差異有統計學意義。
生理信號混合不同程度白噪聲后,MSE和pMSE計算出的復雜度變化見圖3。
圖3(a)顯示,MSE給基準生理信號賦予了最低的復雜度,隨著混合的噪聲量增加,MSE的整體值逐漸增大,代表其復雜度逐漸增大,這一結果與現有復雜度理論不相符。相反,從圖3(b)可以看出,pMSE對混合了白噪聲的生理信號呈現出了正確的區分效果,隨著混合噪聲的增多,pMSE值逐漸降低,且邊界十分清晰。

圖3 生理信號混合白噪聲后的MSE和pMSE變化
健康人、充血性心力衰竭和心房顫動患者心跳間期信號的MSE和pMSE結果見圖4。

圖4 健康者及心衰和房顫患者心跳間期信號的MSE和pMSE結果
圖4(a)的結果與Costa等[6]的研究結果相一致,由于心房顫動患者的信號具有類似白噪聲的趨勢,二者的MSE曲線均具有先高后低逐漸下降的特點,因此被認為具有最低的復雜度,由此三種信號的復雜度從高到低依次為健康、心力衰竭和心房顫動。圖4(b)顯示,pMSE在不需要考慮MSE曲線趨勢的情況下,便可以對3種信號的復雜度作出正確區分,從高到低依次為健康、心力衰竭和心房顫動。從多數尺度的整體角度來看,pMSE的效果要顯著優于MSE。
對16名受試者進行持續認知負荷任務前與任務后NASA-TLX和KSS量表結果進行比較,其差異均有統計學意義(t=15.20,t=7.96;P<0.01),見表1。
表1 16名受試者腦力負荷任務前后NASA-TLX和KSS量表評估結果()

表1 16名受試者腦力負荷任務前后NASA-TLX和KSS量表評估結果()
注:表中NASA-TLX為美國航空航天局任務負荷指數量表;KSS為卡羅林斯卡嗜睡量表
表1顯示,在經過2 h的連續英文閱讀任務后,16名受試者的工作負荷指數和嗜睡程度明顯上升,該結果表明受試者的腦力負荷較大,完成任務后其疲勞程度顯著增加,因此實驗建立的腦疲勞模型是有效的,清醒和疲勞可以作為SVM的監督學習標簽使用。
以清醒和疲勞兩種狀態腦電信號的MSE和pMSE結果分別作為特征,使用SVM進行分類,最終的分類準確率結果顯示,pMSE的平均分類準確率高于MSE,二者差異具有統計學意義(t=2.30,P<0.05),見表2。結果表明以pMSE作為清醒和疲勞腦電信號的敏感特征比MSE取得了更好的分類效果。
表2 SVM對清醒和疲勞腦電信號的分類準確率()

表2 SVM對清醒和疲勞腦電信號的分類準確率()
注:表中MSE為多尺度熵;pMSE為冪律調制多尺度熵
生物系統的復雜度反映了其在不斷變化的環境中適應和發揮作用的能力,疾病和衰老等狀態會降低生物體的適應能力,從而降低輸出變量所攜帶的信息[5]。生物系統需要在多個時空尺度上運行,因此其復雜度也是多尺度的。Costa等[6]定義的MSE目的正是量化生物系統在多個尺度上由生理動力學表達的信息,通過MSE可以區分來自不同系統或由不同條件下的相同系統生成的生理時間序列信號。基于這一用途,MSE已在多個領域被證明具有十分巨大的應用價值[17]。然而MSE的本質仍然是熵,熵的增加通常但并不總是與復雜性的增加相關聯,通過基于熵的各種度量來衡量的復雜度并不能直接和完全反映生物系統真正的復雜度[5]。因此,MSE的這一缺陷必然導致其在分析生物系統信號時出現一些不足。
為改進和解決MSE的不足,本研究首先基于另一種研究復雜度的方法,即分形和自相似,提出了一種新算法pMSE。進而通過仿真噪聲信號、心電信號和腦電信號分別對兩種算法進行了分析和對比,其結果發現pMSE可以更加直觀、準確的度量生物信號復雜度。在仿真噪聲信號測試中,MSE即便考慮到曲線變化趨勢,即熵值是否呈現出逐漸遞減而類似白噪聲MSE的趨勢,也難以準確判斷混合了白噪聲的生理信號和原始信號誰的復雜度更高,尤其是在白噪聲成分較少時,即MSE更容易受白噪聲干擾,容易得到錯誤結論。在心電信號分析中,在小尺度上心力衰竭和心房顫動患者的pMSE存在交叉且方差較大,在一定程度上影響了對結果的直觀判斷,這可能是由信號中的高頻干擾而引起,因為在小尺度上熵值主要反映的是信號高頻部分的信息,從而導致在小尺度上曲線擬合求取時出現了較大誤差[18]。在腦電信號分析中,本研究利用SVM可以對高維數據進行分類及特征差異越大分類越準確的優勢,全面而均衡地考慮到了每種算法在所有尺度上的值,其最終結果表明pMSE比MSE更適合用來區分清醒和疲勞。
本研究對比pMSE和MSE對不同生物信號的分析結果發現,pMSE可以更加準確地度量生物信號復雜度,更加直觀地反映不同信號之間復雜度的大小關系。因此,pMSE可以作為一種改進的MSE算法,用于生物信號復雜度的度量研究。在臨床應用中,pMSE對構建檢測生理信號復雜性的敏感指標,進而開發用于相關疾病診斷和康復的醫療設備具有一定的實用價值和應用前景。未來將探索pMSE在更多種類生物信號分析中的應用效果,如麻醉深度、睡眠分期、運動步態及動物行為等。