陳偉偉 大連理工大學信息與通信工程學院 116024
基于K均值的阻塞性睡眠呼吸暫停低通氣綜合癥診斷
陳偉偉 大連理工大學信息與通信工程學院 116024
阻塞性睡眠呼吸暫停低通氣綜合癥[1](Obstructive Sleep Apnea Hypopnea Syndrome, OSAHS)是一種具有嚴重危害及潛在危險的高發性疾病,由于睡眠時發生低氧及高碳酸血癥,最終引起全身多系統、多器官的漸進性危害。OSAHS最顯著地臨床表現就是睡眠打鼾,表現為鼾聲時高時低,并可以完全中斷,嚴重患者可以憋醒。多導睡眠圖(Polysomnography, PSG)是公認的監測OSAHS的金標準。通過監測患者在安靜入睡的狀態下的連續6~8小時的腦電圖、心電圖、肌電圖、血氧飽和度、鼾聲、呼吸動度、腿動等十多項指標的改變診斷OSAHS, PSG[2]以AHI為標準對OSAHS病情程度評判。呼吸暫停指數(Apnea Hypopnea Index ,AHI)指數,也稱為呼吸紊亂指數,是指每小時呼吸暫停加上低通氣的次數。呼吸暫停是指睡眠過程中口鼻呼吸氣流完全停止10秒以上;低通氣是指睡眠過程中呼吸氣流強度(幅度)較基礎水平降低50%以上,并伴有血氧飽和度較基礎水平下降大于等于4%。因為PSG監測價錢偏高而且需要檢測者在醫院的檢查室中進行整晚大約8個小時的監測。調查顯示,大約93%的女性和82%的男性患者沒有得到診斷,原因就在于目前尚未找到一種簡捷,方便,低費用的檢測方法來實現OSAHS的篩查。
鼾聲檢測主要針對患者的鼾聲特性進行研究與判斷,鼾聲的獲取只需一組無接觸式的麥克風和數據記錄裝置。目前多數研究者主要從鼾聲的時域和頻域參數著手。時域參數多數以單位時間內的鼾聲數,鼾聲持續時間和間隔,間斷鼾聲數,最后以鼾聲數和間斷鼾聲數為指標進行判斷[3]?;邝暀z測的OSAHS診斷研究在國內外均尚屬起步階段。而且研究涉及廣大人民的身體健康問題,研究意義重大。本文主要應用端點檢測的方法模擬呼吸暫停低通氣指數,并基于K均值分類的方法實現OSAHS的診斷。
鼾聲實際上也是一種聲音。通過鼾聲檢測患者有病無病,可以廣義的看作為語音檢測、識別問題。不過,相對于常見的語音識別問題,鼾聲檢測從某種意義來說更簡單。因為它只需要檢測兩個狀態,即患者“有”或者“沒有”患病。因此語音信號處理中的理論、方法是研究該問題的主要研究方法。
現階段實驗用的鼾聲數據多數是與PSG檢測同時錄制的。由麥克風采集到的鼾聲經低通濾波和A/D轉換后得到鼾聲數字信號。鼾聲數據一般較長,基于音頻信號的短時性分析技術首先將鼾聲信號分幀和預加重。端點檢測[4]的目的就是區分鼾聲段和靜音段,有效地計算鼾聲片段的時間間隔,并可以將真正的鼾聲數據分離出進行后續的處理。因為背景噪聲的不穩定性依據固定閾值進行端點檢測的正確率往往受限制,本文采用基于短時能量的自適應端點檢測,并將鼾聲最短持續時間作為判斷條件加入來提高正確率。
將鼾聲信號分幀處理,因為鼾聲的時變性相對于語音信號的時變性較弱,本文取分幀幀長為128ms,幀移取64ms。應用COOLEDIT軟件觀察鼾聲數據發現鼾聲的持續時間一般大于0.6s,故在端點檢測時將鼾聲的最短持續時間大于0.6s作為區分鼾聲的初始條件。這樣可以把持續時間稍長的噪音片段隔離掉,保證有效地提取真正的鼾聲數據。
第i幀的短時能量表示為:

其中len表示幀長。因為鼾聲數據的開端往往是以靜音開始的,本文將預讀入的5幀鼾聲數據的平均能量值為參考設置初始的閾值,自適應的過程表示為:

其中LT和HT為經驗數據,EL為低閾值,EH為高閾值,E為每幀能量值。自適應的端點檢測算法能夠根據實時的噪聲變化調整門限。
經過端點檢測后得到每個鼾聲的開始時間和結束時間。鼾聲的持續時間定義為一次鼾聲的開始時間到結束時間,間隔時間定義為本次鼾聲的結束時間到下次鼾聲的開始時間。
觀察所有鼾聲的得出如下結論:98. 5%正常鼾聲的間隔時間的分布在1.4s到4.0s。而有的鼾聲因為個人呼吸頻率的不同,往往吸氣和呼氣的間隔時間相對他人的時間較長,一個完整鼾聲的中間就會出現小間隔。而這個間隔時間往往較小,所以我們對端點檢測后的數據做以下處理:將間隔時間小于0.1s的兩個鼾聲歸并成一個鼾聲,完成鼾聲事件的整合。臨床上的呼吸暫停是指睡眠過程中口鼻呼吸氣流完全停止10s以上,又因為打鼾者打鼾有時并不是連續的而是存在間斷時間,所以我們將間隔時間大于10s小于60s的鼾聲事件定義為呼吸暫停。
臨床上規定每晚7小時睡眠中,呼吸暫停反復發作30次以上或AHI大于等于5次/小時以上為患有OSAHS。根據AHI指數的定義將整晚發生呼吸暫停的次數取平均數并以一定的閾值做判斷的方法沒有考慮到個體差異帶來的影響。因為人與人的呼吸道是不同的,打鼾的頻率也往往會有差異,有的人本身打鼾的頻率就比較低,間隔時間也就比較長,對診斷的結果就會產生影響。為了減小因個體差異帶來的影響首先應用K均值分類的方法對鼾聲間隔時間分為兩類,并以兩類中心點的差值和發生暫停的次數為診斷依據。
K均值聚類算法[5]是將給定的數據集合分成確定的若干組。定義k個中心點,每組一個,由于不同的初始中心位置產生不同的聚類結果,所以選取適當中心點是聚類的關鍵。 通過使它們之間的距離盡可能大,使給定的所有數據點結合到離它最近的中心點的聚類中。 當所有的數據點都分配到中心點的范圍內后,初始的聚類形成。通過先前階段的聚類中心重新計算k個新中心點,再將給定的數據重新分配到離它最近的新中心點。不斷進行循環,由循環的結果得知, k個中心點逐步地改變直到它們的位置不再變化為止,即聚類中心不再移動.則標準函數的最小值函數的定義為:

式中:為聚類組的數量,為第i個聚類的均值向量;z為得分向量;為聚類中的第i個聚類。K均值算法的具體步驟是:
1)為每個聚類確定一個初始的聚類中心,這樣k個聚類存在k個聚類中心;
2)將樣本集中的每一個樣本按照最小距離原則分配到k個聚類中某一個;
3)使用每個聚類中的所有樣本的均值作為新的聚類中心;
4)如果聚類中心有變化則重復2),3)步直到聚類中心不再變化為止;
5)最后得到的k個聚類中心就是聚類的結果。
本文對鼾聲中存在的兩類間隔時間的定義如下:第一類,若間隔時間小于10s定義為正常的鼾聲間隔時間;第二類,若間隔時間大于10s小于60s定義為發生呼吸暫停的鼾聲間隔時間。首先確定K均值分類方法的初始中心點的取值,分別統計第一類間隔時間和第二類間隔時間的平均值作為初始中心點。
OSAHS診斷的依據:
1)當只存在第一類的鼾聲間隔時間:即沒有發生呼吸暫停的,診斷未患OSAHS。
2)當間隔時間中既包含第一類鼾聲間隔時間又包含第二類鼾聲間隔時間:若兩中心點的距離小于10s,則診斷為未患有OSAHS;若中心點的距離大于30s,則診斷為患有OSAHS,而且可以確定為比較嚴重的阻塞暫停;若中心點的距離大于10s小于30s則計算第二類間隔時間每小時的平均發生次數。
本文實驗用的鼾聲數據是由大連醫科大學提供。表1是對端點檢測方法的評估。截取不同人的大約12~28分鐘的數據段統計鼾聲總數,并與兩個不同人耳聽到的鼾聲總數做對比,正確率在86%以上。不同的人耳聽到的鼾聲個數也會存在一定的誤差。

表2 K均值分類方法的評估Tab2. Evaluation of the K means

表3 預測AHI指數Tab3. Predicted AHI

表1 端點檢測方法的評估Tab1. Evaluation of the endpoint detection
表2中編號為5和7的鼾聲分別取于同一OSAHS患者的患病段和不患病段,對比發現患者患病時和不患病時的間隔時間存在很大的差異。2號數據是明顯的打鼾頻率較慢,若只采用暫停次數做判斷就會誤判為OSAHS,基于新算法正確判斷為正常的鼾聲。
表3中數據不同于表1和表2的數據,為整晚約7個小時的鼾聲。AHI指數范圍從2.6~72不等,包含了未患病的,中輕度OSAHS患者和重度OSAHS患者,預測AHI和實際AHI存在一定的差值。差值的存在可能是因為背景噪聲的影響,但不影響OSAHS的篩查。
通過仿真實驗得到以下結論:分析鼾聲的間隔時間來診斷OSAHS確實是行之有效的方法,而基于K均值的鼾聲間隔時間分類減小了因不同人的打鼾的頻率造成的分析誤差。預測AHI指數基本能夠體現患病的程度,實現OSAHS的篩查。
[1]殷善開, 易紅良, 曹振宇. 阻塞性睡眠呼吸暫停低通氣綜合癥[M]. 北京: 科學技術文獻出版社.2006.
[2]齊志勇, 張治平, 呼和牧仁等.多導睡眠儀(PSG)在阻塞性睡眠呼吸暫停低通氣綜合征中的臨床應用價值[J]. 當代醫學. 2007(118).
[3]Yeh Liang Hsu, Ming Chou Chen, Chih Ming Cheng, et al. Development of a portable device for home monitoring of snoring[C].2005 IEEE International Conference on Systems, Man and Cybernetics, Hilton Waikoloa Village, Hawaii, USA , October, 2005.
[4]鮑長春. 數字語音編碼原理[M]. 西安:西安電子科技大學出版社. 2007.
[5]邊肇慶, 張學工. 模式識別[M]. 北京:清華大學出版社. 2000.
Snore Detection for Obstructive Sleep Apnea Hypopnea Syndrome Diagnosis
Chen Weiwei School of Information and Communication Engineering, Dalian University of Technology, Dalian 116024,China
阻塞性睡眠呼吸暫停低通氣綜合癥最常見的癥狀是睡眠打鼾,本文依據語音信號處理的方法對鼾聲信號分析,實現對阻塞性睡眠低通氣綜合癥的篩查,以減小多導睡眠監測的檢查負荷。基于短時能量的自適應端點檢測記錄鼾聲的間隔時間,并以K均值的方法對鼾聲間隔時間分兩類,以兩類中心點的距離和發生暫停的次數為依據實現OSAHS的診斷。本文算法旨在減小個體差異對判斷結果的影響。
呼吸暫停;低通氣;多導睡眠圖;鼾聲;K均值
Snore is the typical symptom of the obstructive sleep apnea hypopnea syndrome. Based on the method of speech signal process realized the cheap and portable method of screening OSAHS, where reduce the load of PSG. Based on the adaptive short-time energy endpoint detection record the time of interval of snores, and the method of K mean classified the time of internal to two types, the distance between the center and the occurrence of sleep apnea to diagnosis OSAHS. The new method is designed to reduce the individual differences in judging the results.
OSAHS; AHI; PSG; snore; K means
TN912 文獻標識碼:A
10.3969/j.issn.1001-8972.2010.22.092
陳偉偉(1986-)女,山東泰安人,大連理工大學信息與通信工程院碩士研究生,研究方向為語言信號處理。·