











摘要:針對帕金森病(PD)嚴重程度評估依賴醫生主觀判斷的局限性,本文設計并實現了一種客觀的震顫監測與評級系統。該系統主要包括可穿戴設備、App、云平臺及評估模型4個部分。可穿戴設備負責采集震顫數據,并將數據傳輸至App和云平臺進行存儲,同時支持模型訓練。系統采用帶限多重加權傅立葉線性組合算法(BMWFLC)對數據進行預處理,并提取時域和頻域共計26個特征。隨后,通過機器學習對數據進行多分類分析。實驗結果顯示,該系統達到了97.0%的加權精度、94.0%的加權召回率、93.9%的加權靈敏度、99.6%的加權特異度及94.5%的加權F1值。以上結果表明,該系統能夠客觀且準確地反映患者帕金森震顫的嚴重程度。
關鍵詞:帕金森震顫;物聯網;BMWFLC;希爾伯特黃變化;機器學習
中圖分類號:TP391 文獻標志碼:A
0 引言(Introduction)
帕金森病是一種常見于中老年人的神經退行性疾病,其中震顫是其最突出的癥狀[1]。靜息性震顫表現為身體部位在靜止狀態下出現不自主激活的節律性和不自主振動,其頻率通常在3~12Hz[2]。靜息性震顫不僅會導致患者感到疲勞,而且還會嚴重降低其生活質量和影響日常生活。目前,評估PD(Parkinson'sDisease)嚴重程度的主要工具是運動障礙學會(Movement Disorder Society,MDS)修訂的帕金森病評級量表(Movement Disorder Society-Unified Parkinson's" Disease Rating Scale,MDP-UPDRS)[3],但該量表主要依賴患者的自我報告和醫生的臨床觀察,難以全面反映患者的日常狀態[4]。因此,利用可穿戴設備結合人工智能技術對帕金森震顫進行客觀的診斷,已成為未來的發展趨勢[5]。THORP等[6]提出了將運動和肌肉傳感器與機器學習算法相結合的方法分類帕金森震顫癥狀,而DELIMA等[7]證實了慣性傳感器在量化震顫嚴重程度方面的有效性。此外,其他研究[8-12]也探索了不同的傳感器位置和分類算法在帕金森震顫監測中的應用。
為了方便醫生對患者病情的準確判斷以及支持患者在家中進行長期自我監測,本文提出一種小型化帕金森震顫監測系統。該系統可以為患者提供長期、更全面、更精確、更高效的疾病監測服務。
1 系統設計(System design)
作為一種小型化的帕金森震顫監測系統,該系統集成了多參數監測功能,并采用了輕巧緊湊的外形設計,以腕戴式的可穿戴模式方便患者長時間佩戴。該系統具備長時間監測和高性價比的特點,對用戶極具吸引力[13]。因此,在架構設計上,研究人員充分考慮了監測時長的需求、通信協議的高效性、設備的連通性,以及重量、體積等因素[14]。為了實現系統的低功耗和用戶使用的便利性,本研究采用了小型低能耗的傳感器,并且對電池和設備的尺寸進行了最小化設計。在與醫生的溝通中研究人員了解到,患者手指上的震顫特征尤為明顯,能更清晰地反映其病情。因此,本文將主控芯片與傳感器分離,將傳感器單獨放置在患者的手指上。
本文設計的震顫數據采集設備主要由數據采集終端、App 終端及云平臺終端組成,震顫數據采集系統架構如圖1所示。物聯網設備通過藍牙與手機App連接。App負責采集數據并展示給用戶,而醫生將數據上傳至云平臺,云端數據將會用于處理、訓練、分析和預測。
1.1 數據采集設備
為了滿足臨床震顫監測的需求,研究人員設計了一款小巧輕便的采集裝置,確保患者在運動過程中不受影響,同時保證足夠的監測時長。該采集設備集成了鋰電池、穩壓供電電路、傳感器電路、單片機控制電路、藍牙模塊。其中,ADXL345是一款小型、薄型、超低功耗的加速度計,具有13位分辨率和±16g 的測量范圍,功耗僅為3.3V/90mA。MCU(Microcontroller Unit)采用32位微處理器STM32L010F4P6。傳感器通過I2C協議與MCU通信,MCU再通過串口將傳感數據發送到藍牙模塊。傳感器模塊的尺寸為11mm×11mm×0.8mm,其他模塊的總尺寸為26mm×28mm×1.6mm;該設備配備了一塊300mAh的鋰電池,可使設備連續工作約10h。根據采樣定律,設定加速度采樣率為160Hz。采集裝置硬件結構如圖2所示。設備采用分離式結構設計,將傳感器電路與其他電路分開布置。傳感器電路被集成在一個小巧的戒指模塊中,其他電路則集成在腕帶模塊中,以減少對被測者手部運動的干擾。通過3D打印技術對設備進行封裝,使得設備總重量不超過100g,不會對被測者造成佩戴負擔。采集設備的工作狀態如圖3所示。
1.2 APP及云端平臺
鑒于硬件上增加屏幕不切實際,研究人員計劃設計一款APP用于可視化患者的震顫幅度并收集相關病情信息,以便患者和醫生了解病情。震顫監測App的功能框圖如圖4所示。
為了實現患者在家中的病情監測,并促進醫患之間的長期溝通與跟蹤,本文建立了一個與App緊密連接的云平臺系統。App通過藍牙與數據采集模塊建立連接,設備與手機連接完成后,數據就能從采集模塊傳輸到手機。手機端對獲取的數據進行插值和擬合,實現數據的平滑和可視化,且實時更新并顯示在屏幕上。醫生根據患者病情的嚴重程度進行分級,原始數據和分級結果以XML文件格式存儲在手機上。信息保存后,用戶只需點擊上傳按鈕,即將數據上傳至用戶平臺,數據從平臺導出后,可進行后續的數據處理和模型訓練。App和平臺的工作狀態如圖5所示。
2 實驗對象與方法(Experimental subjects and methods)
2.1 實驗對象
參與實驗的受試者來自浙江省康復醫學中心,均為帕金森病患者,且在充分了解實驗內容的情況下自愿參與本研究。醫生使用MDS-UPDRS對患者進行了評估。
2.2 實驗方法
在實驗開始前,將可穿戴設備佩戴在帕金森病患者的手臂上。實驗過程中,要求患者盡可能保持靜止,并記錄震顫的數據。每次測量的時間不小于2min。實驗結束后,將數據上傳至平臺,隨后導出數據進行后續處理和建模分析。
2.3 數據情況
本文共收集了12名志愿者的108組數據(包括2位正常人和10位60歲以上的患者),由其醫生評估的志愿者MDSUPDRS等級數據統計結果如表1所示。
3 帕金森震顫評級模型(Parkinson's tremor rating model)
3.1 數據預處理
為了有效抑制震顫信號,通常采用基于傅里葉線性組合器(Fourier Linear Combiner,FLC)[15]的線性濾波器進行降噪。針對以往算法學習率參數需要微調且對輸入信號幅度敏感的缺點,SUNDE[16]提出了一種結合加權頻率傅里葉線性組合器(Weighted Frequency Fourier Linear Combiner,WFLC)和增強型帶限多重傅立葉線性組合器(Enhanced Band-Limited Multiple Fourier Linear Combiner,E-BMFLC)的BMWFLC算法。該算法能夠根據實時信號調整每個頻帶內的頻率,通過測量每個WFLC的傅里葉系數的大小來實現。在這些WFLC中,最顯著幅度的WFLC包含了估計信號中的主頻率。因此,該算法可以測量估計信號中存在的所有頻率以及它們之間相互關系的強度。BMWFLC包含多個WFLC,每個WFLC都有自己的頻率和學習率以適應信號。BMWFLC算法框架如圖6所示,其核心方程如公式(1)所示:
本文選取了MDS-UPDRS等級為2的患者的10s數據。過去的研究表明,靜息性震顫的頻率通常在4~6Hz[18]。因此,將患者的自主運動頻率設置為0~3Hz。經過計算,Y 軸加速度如圖7所示。
3.2 特征選擇
本文選擇了26個特征,包括11個時域特征(平均值、標準偏差、RMS振幅、RMS均方根、峰峰值、傾斜度、峰度、波峰因數、間隙因數、形狀因數和脈沖因數)、12個頻域特征以及3個時頻特征[19]。時域特征和頻域特征的公式如表2所示。
本文采用希爾伯特黃變換(Hilbert Huang Transform,HHT)作為特征提取方法,提取震顫信號的瞬時幅值、瞬時頻率和邊際譜作為3個時頻特征。震顫信號的邊際譜如圖8所示。
3.3 模型構建
本文對比了多層感知器(Multilayer Perceptron,MLP)、邏輯回歸(LogisticRegression,LR)、K近鄰算法(K-Nearest" Neighbors,KNN)和樸素貝葉斯(Naive Bayes,NB)對數據進行多重分類的效果。LR采用large-gfbs(lgfbs)來優化損失函數,具有收斂速度快、內存開銷小的優點。對于KNN,若步長較小,則模型的復雜度較高,容易出現過擬合,而較大的步長雖然可以減小學習的估計誤差,但是學習的近似誤差會增大。通過多次實驗對比,最終選擇步長為2的模型。MLP選取了一個兩層的隱層模型作為研究網絡,第一層包含5個神經元,第二層包含64個神經元,并選用ReLU函數作為激活函數。相較于Sigmoid和Tanh函數,ReLU函數能夠克服梯度消失的問題,并提高訓練速度。本文將以上26個特征輸入模型中進行學習。
4 結果(Results)
在基于機器學習的分類問題中,性能評價指標主要包括準確率、召回率、F1分數等。其中,TP為正類判定為正類,FP為負類判定為正類,FN為正類判定為負類,TN為負類判定為負類。在本文中,TP是指被正確診斷為某個級別的個體數量,TN是指被正確診斷為不屬于該級別的個體數量,FP是指被錯誤診斷為屬于該級別的個體數量,FN是指被錯誤診斷為不屬于該級別的個體數量。4種機器學習算法,分別為多層感知器(MLP)、邏輯回歸(LR)、K近鄰算法(KNN)、樸素貝葉斯(NB),其混淆矩陣如圖9所示。
為了評估本文收集的各種模型的診斷性能,本研究引入距離的概念,例如MDS-UPDRS的真實等級1與預測等級2之間的距離為1。然而在醫療問題中,誤診和晚期診斷會嚴重影響患者的健康,因此將真實等級1與預測等級0之間的距離設置為5,加權距離計算公式如公式(8)所示,其中d 為各等級的總距離,n 為總評價等級。
MLP模型在本文收集的數據集中獲得的指標結果如表3所示。支持度表示被判斷為該級別的數據集。在醫學統計學中,最基本的指標是敏感性和特異性。如果將本文所研究的問題視為一個二元分類問題,本文的敏感性是指被正確判斷為患病的患者,特異性是指被正確判斷為未患病的正常人。本文提到的精準度是指真實患者在所有被預測為患病的個體中所占的比例,召回率是指被判斷為患病的個體在所有實際患病的個體中所占的比例,即判斷患者是否存在由PD引起的帕金森震顫,本文提出的方法在這兩指標上均取得了非常高的結果,相比于以往的研究結果有了顯著的提升。
5 討論(Discussion)
研究表明,位于遠端肢體位置的傳感器在識別該肢體癥狀方面最為有效[20]。因此,本文將傳感器放置在患者的手指上,以期更準確地反映患者的肢體癥狀。通過將數據可視化并上傳到云端,極大地便利了醫生、患者和研究人員對數據的訪問和使用。
本文分析了BMWFLC算法在本研究中的適用性,并根據實際情況對其進行了相應的調整和應用。利用HHT等方法,研究人員在時域、頻域、時頻域共提取了26個特征。此外,為了評估不同模型的性能,本文確定了一個度量對MLP、LR、KNN和NB模型的準確性進行了比較。結果表明,MLP模型在本研究中表現最為優異。未來,隨著數據集的擴展,可以在數據集上使用深度神經網絡進行更深入的學習和預測。
在醫療問題中,指標的敏感性和特異性尤為關鍵。特異性關注的是誤診率的高低,而敏感性關注的是發現患者疾病的概率。與晚期診斷相比,誤診的后果更為嚴重。本研究涉及的是一個多類別問題,其評價水平與醫生對患者病情和用藥情況的判斷有關。本文雖然在二分類和多分類問題上取得了較好的效果,但是仍存在一些不足。一是樣本量小。采用更多的訓練數據將提高模型對震顫嚴重程度分類的準確性。二是患者是在醫生的指導下進行測試的,然而從近期的綜述中發現,很少有研究在無人監督的自由生活環境中進行癥狀檢測[21]。未來,將通過傅里葉線性組合系列算法驗證或改進對患者自主運動的估計,以滿足患者在日常生活中對評分的需求。三是云平臺對患者數據的分析還存在一定的滯后性。隨著MCU 產業的快速發展,在MCU上實現邊緣計算將是本研究未來的一個重要方向。
6 結論(Conclusion)
目前,PD的診斷主要依靠醫生的判斷,具有較強的主觀性。然而,準確、便捷地診斷PD一直是人們關注的焦點。隨著PD患者數量的急劇增加,國內外許多研究者都對PD運動癥狀進行了大量的定量研究,旨在幫助臨床醫生更好地進行疾病診斷和監測,并取得了一定的進展。本文設計了一種輕便、不影響患者運動的小型可穿戴設備,采用自適應BMWFLC算法對患者自主運動信號進行濾波,并提取出26個特征。此外,本文還提出了一種基于震顫數據的評價系統,為后續治療提供了重要依據。
通過將數據存儲在云服務器上,醫生能夠方便地跟蹤患者的病情,這有助于后續的檢查和治療。從長遠來看,遠程監控功能的實現不僅為醫生提供了便捷的在線診斷方式,也為患者帶來了方便的遠程隨訪體驗,從而大大減輕了門診的診斷壓力。盡管在考慮樣本數據及其判斷準確性時可能存在一些挑戰,但是相信在長期的監測和數據采集下,系統分類的各項指標會不斷提升。
作者簡介:張華青(1984-),男(漢族),臺州,工程師,碩士。研究領域:醫用傳感器,醫療信息系統。
岳星宇(1998-),男(漢族),南通,碩士生。研究領域:生物醫學信號處理。
蔣路茸(1982-),男(漢族),嘉興,副教授,博士。研究領域:物聯網技術。
齊鵬嘉(1992-),女(漢族),長春,講師,博士。研究領域:生物醫學信號處理。
楊健斌(1999-),男(漢族),武義,碩士生。研究領域:生物醫學信號處理。
童基均(1977-),男(漢族),蘭溪,教授,博士。研究領域:人工智能,醫學圖像處理。本文通信作者。