林志榕
(中國科學院福建物質(zhì)結(jié)構(gòu)研究所 泉州裝備制造研究所,福建 泉州 362216)
作為僅次于阿爾茨海默病的第二大神經(jīng)退變性疾病和繼腫瘤、心腦血管病之后的中老年“第三殺手”,帕金森病(Parkinson"s Disease,PD)被稱為“不死的癌癥”,主要癥狀表現(xiàn)為4個運動障礙癥狀:震顫、運動遲緩、肌肉僵直和姿態(tài)步態(tài)異常[1-2]。其中,震顫和運動遲緩作為帕金森病最主要的運動癥狀,嚴重影響患者的日常工作和生活質(zhì)量。
統(tǒng)一帕金森病評分量表(Unified Parkinson"s disease rating scale,UPDRS)是當前臨床上診斷帕金森病情程度等級使用最多的量表,其根據(jù)癥狀嚴重程度分為0~4分的5個等級,0分為正常,4分為最嚴重[3]。然而,量表的使用受限于醫(yī)生的臨床經(jīng)驗和主觀判斷,具有個體差異性,而且對于癥狀不明顯的患者,量表評分方式不夠準確,特別是缺乏診斷經(jīng)驗的年輕醫(yī)生,存在一定局限性。因此,帕金森病運動癥狀嚴重程度的量化評估至今仍是PD療效反饋和病情監(jiān)測中的一個難題。
隨著可穿戴傳感器技術的發(fā)展,國內(nèi)外的一些科研人員已經(jīng)基于傳感器和計算機系統(tǒng)來量化評價帕金森病的運動癥狀[4-6]。在評估過程中,帕金森病患者需要演示量表中規(guī)定的若干評估動作,并采用運動傳感器、光學系統(tǒng)、電磁跟蹤系統(tǒng)和肌電檢測儀等多種方式來采集相關動作的數(shù)據(jù),在此基礎上進行數(shù)據(jù)處理提取相關癥狀的量化指標,從而評估PD運動癥狀的嚴重程度[7-9]。但目前大多數(shù)研究都局限于傳感器信號量化特征與神經(jīng)科醫(yī)生UPDRS量表評分的相關性統(tǒng)計分析,并不能直接得到運動癥狀的嚴重程度等級(0~4分)。
鑒于此,本文設計了一套針對帕金森病震顫與運動遲緩癥狀的量化評估可穿戴式系統(tǒng),通過MEMS(micro-electro-mechanicalsystems)運動傳感器采集患者手部的運動信息,并基于運動傳感器數(shù)據(jù)提取與震顫和運動遲緩癥狀嚴重程度相關的特征,作為機器學習分類器的輸入,訓練機器學習模型,最終得到量化的震顫與運動遲緩癥狀嚴重程度等級(0~4分)。在機器學習模型的選擇上,本文構(gòu)建了支持向量機(Support Vector Machine,SVM)、隨機森林(Random Forest,RF)算法和K最鄰近(K-Nearest Neighbor,KNN)這3種適合于小樣本的機器學習分類算法進行驗證,并進行分類精度對比,從而得到最優(yōu)的分類評估模型。該研究工作可為PD震顫與運動遲緩癥狀提供了一種科學有效的量化評估方法,從而輔助神經(jīng)科醫(yī)生對PD患者的運動癥狀進行臨床診斷。
如圖1所示,本研究設計的PD運動癥狀量化檢測系統(tǒng)包括一個佩戴在用戶手腕的可穿戴設備和上位機采集軟件。可穿戴設備由佩戴在指尖的九軸慣性測量單元(BNO055,Bosch Sensortec GmbH,德國)、手腕的數(shù)據(jù)采集芯片(ATmega1284P,AtmelⅠnc.,美國)和WiFi數(shù)據(jù)傳送芯片(ESP-8266,Espressif Systems Pte.,Ltd.,中國)構(gòu)成,并將所有模塊集成通過彈性繃帶固定。慣性傳感模塊包括一個三軸加速度計、一個三軸陀螺儀和一個三軸磁力計,可獲取原始的加速度、角速度和磁場信號,也可通過內(nèi)置的九軸融合算法獲取線性加速度、歐拉角、四元數(shù)和旋轉(zhuǎn)矩陣等姿態(tài)數(shù)據(jù)。WiFi模塊將采集的原始傳感器數(shù)據(jù)發(fā)送到上位機軟件進行下一步處理,數(shù)據(jù)采樣頻率為100 Hz。上位機軟件采用LabVⅠEW 2014(NationalⅠnstrumentsⅠnc.,美國)平臺進行開發(fā),接收來自可穿戴設備的原始傳感器數(shù)據(jù),進行解析和保存,并做下一步的數(shù)據(jù)處理和算法實現(xiàn)。
圖1 PD運動癥狀量化評估系統(tǒng)
本研究共招募45名具有顯著性震顫與運動遲緩癥狀(UPDRS介于1~4分之間)的PD患者和30名年齡相仿的健康人(UPDRS評分為0)參與本次試驗,受試者的基本信息見表1。參與本試驗的帕金森病人都來自于福建醫(yī)科大學附屬協(xié)和醫(yī)院(福州)神經(jīng)內(nèi)科,這些病人都具有較為典型的運動障礙癥狀,包括震顫和運動遲緩,并由經(jīng)驗豐富的高年資神經(jīng)科醫(yī)生進行了UPDRS評分。對照組由身體健康且年齡與病例組相仿的30名參與者組成。
表1 參加試驗的病人和健康人的基本情況
標準的臨床測試動作可以提高評估的可靠性,因此本文分別采用UPDRS量表第20、21、23項規(guī)定的靜坐、維持手臂平舉向前和手指開合動作測試來評估靜止性震顫、姿勢性震顫和運動遲緩癥狀,評估任務的具體描述見表2,實際的試驗場景如圖2所示。參與試驗的PD患者需要停藥12 h,保證其處于藥效減退癥狀明顯的狀態(tài)。試驗開始前,研究人員指導受試者佩戴好PD運動癥狀量化評估可穿戴設備,并指導受試者按照表2所描述的動作要領,熟悉各癥狀的測試動作,之后進行正式測試,每個評估動作采集10 s的數(shù)據(jù),同時由一名臨床經(jīng)驗豐富的神經(jīng)科醫(yī)生對每個測試動作進行UPDRS量表評分。
圖2 震顫與運動遲緩量化評估任務
表2 癥狀評估動作描述
1.3.1 震顫特征提取
在新版國際運動障礙學會統(tǒng)一帕金森病評分量表(MDS-UPDRS)中,震顫嚴重程度的評估采用線性位移來定義,而現(xiàn)有的基于慣性傳感器的帕金森震顫量化研究通常是基于角速度、原始的加速度等信息來提取量化特征參數(shù),進而對帕金森震顫進行評估,該種方式可能導致評價結(jié)果的不統(tǒng)一和偏差。原始加速度信號中包含了重力信息,線性加速度則去除了重力分量的影響,用來獲取剛體運動時的線性位移信息。因此,本文將基于線性加速度提取手部發(fā)生震顫時的線性位移特征,并結(jié)合角速度提取震顫發(fā)生時手指運動的角度信息。
靜止性震顫和姿勢性震顫的頻率范圍通常在3.5~7.5 Hz,因此,為了排除受試者在采集數(shù)據(jù)過程中因為呼吸或者其他高頻運動引起的噪聲信號,本文采用頻率范圍為3~10 Hz的FⅠR等波紋帶通濾波器對線性加速度和角速度信號進行濾波,在此基礎上提取了H1、H2、H3和H44個量化特征,具體計算方式如下
式中:aL是線性加速度矢量;ω是角速度矢量;i=1,2,…;N代表信號的離散時間。H1和H2分別表示線性加速度和角速度矢量的平方和。H3表示線性加速度向量第i次和i+1次之間差異的平方和,反映了線性加速度信號的波動情況。wk(ξ)是角速度矢量ω(i)的快速傅里葉變換(FFT)。H4表示在3.5~7.5 Hz頻率范圍之間的角速度矢量FFT振幅的最大值。這里,H1和H3基于線性加速度進行計算得到的,能夠表示運動過程中的線性位移情況;而H2和H4是通過角速度計算得到的,能夠表示運動過程中的旋轉(zhuǎn)情況。
1.3.2 運動遲緩特征提取
臨床上對運動遲緩癥狀的評估主要通過觀察患者做手指拍打動作時的幅度和頻率,并根據(jù)UPDRS量表進行評分,但該評估方式具有較強的主觀性,不同醫(yī)生的評估結(jié)果相差較大。因此,本文采用九軸運動傳感器對帕金森病患者手指拍打動作進行高精度運動跟蹤,基于運動傳感器融合輸出的姿態(tài)角度信息提取手指拍打動作的角度幅度、拍打頻率及角度幅度變化情況,以此作為運動遲緩的量化特征參數(shù)來評估癥狀嚴重程度。
傳統(tǒng)的姿態(tài)表示方式通常為三維歐拉角,為了減少特征維度,我們采用軸-角表示方法來提取手指拍打動作中的幅度信息。三維空間中剛體的姿態(tài)信息可用繞特定旋轉(zhuǎn)向量的角度θ來表示,這就是軸-角表示方法,而該旋轉(zhuǎn)角度θ可以寫成下式
式中:q4是四元數(shù)矢量q=[q1q2q3q4]的實部分量。θ的角度范圍為0~180°。
為了進一步地提取與UPDRS手指開合動作特點(速度、幅度和幅度波動)密切相關的特征,我們定義了3個特征參數(shù)來表示手指開合時的狀態(tài),具體包括頻率、幅度和波動情況。
首先,通過計算10 s任務期間手指開合次數(shù)N來得到手指開合運動的頻率f
在手指開合動作評估過程中,θ代表了每次手指開合的幅度范圍,在整個評估周期內(nèi),我們通過計算峰值角度的平均值φ來得到周期內(nèi)手指開合幅度,具體如下
式中:θmax和θmin代表的是在第i個手指開合周期中張合角度的波峰值和波谷值。
為了描述評估周期內(nèi)手指拍打幅度的波動特征,本文通過計算標準差(SD)進行描述
為了直觀上對震顫和運動遲緩癥狀進行量化評估,得到癥狀嚴重程度等級(0~4分),本文基于上述提取的震顫(H1、H2、H3和H4)和運動遲緩特征參數(shù)(f、φ和σ|φ|)進行分類研究,將特征參數(shù)作為分類模型的輸入變量,而醫(yī)生的UPDRS評分作為真值標簽,建立機器學習分類模型,通過訓練模型評估癥狀的嚴重程度等級。在分類器的選擇上,因為數(shù)據(jù)樣本規(guī)模較小,本文分別采用了支持向量機(SVM)、K最鄰近(KNN)和隨機森林(RF)3種適合于小樣本的多分類器,通過試驗進行精度驗證和對比,得到精度最高的量化評估模型。
支持向量機是一種有監(jiān)督的機器學習模型,其通過核函數(shù)將輸入?yún)?shù)映射到高維特征空間,然后采用超平面來判斷不同類別的特征。SVM本身為一個二值分類器,當面對多類問題時,需要構(gòu)造合適的多類分類器。本文處理的癥狀嚴重程度等級(0~4分)是一個五分類問題,因此通過組合多個SVM二分類器來實現(xiàn)多分類器的構(gòu)造。本文通過“一對一”(one-versus-one,OVO SVMs)方式來設計多分類器,隨機選取數(shù)據(jù)集中的2個樣本設計一個二分類的SVM分類器,因此,如果數(shù)據(jù)集中的樣本有N個類別的話,則需要設計N(N-1)/2個SVM分類器。實際對一個測試樣本進行分類測試時,則通過統(tǒng)計得票最多的類別作為測試樣本的類別。
KNN是通過測量不同特征值之間的距離進行分類,可以采用Euclidean(歐幾里得)、Manhattan(曼哈頓)、Mahalanobis(馬氏距離)等距離用于計算。KNN算法思想是在數(shù)據(jù)集中找到與測試樣本最相似的K個樣本,假如找到的這些鄰居中大部分都歸于同一個類別,那么該測試樣本則判斷為同屬一個類型。實際測試中,K的選取通常是不超過20的整數(shù),并根據(jù)實際測試效果進行調(diào)整。
RF算法本質(zhì)上是基于決策樹算法來實現(xiàn)分類的,它的基本單元是決策樹,通過集成學習的思想將多棵樹集成隨機森林。具體做法是,通過bootstrap重采樣技術,從原始樣本集中隨機重復提取樣本,生成新的訓練樣本集來訓練決策樹模型,然后重復生成決策樹,形成隨機森林。根據(jù)分類樹中投票數(shù)形成的分數(shù)確定數(shù)據(jù)分類結(jié)果。單個樹的分類能力較弱,但在隨機生成多數(shù)決策樹后,測試樣本可以根據(jù)統(tǒng)計后每棵樹的分類結(jié)果選擇最可能的分類。
本文采用分類精度來評判各分類算法的性能,通過計算正確判斷類別的人數(shù)占所有參與人數(shù)的百分比來得到分類精度,而數(shù)據(jù)的真實類別則通過UPDRS量表來得到,量表評分邀請來自福建醫(yī)科大學附屬協(xié)和醫(yī)院神經(jīng)內(nèi)科具有豐富臨床診斷經(jīng)驗的高年資醫(yī)師進行。
為了驗證分類算法的性能,本文采用了留一法交叉驗證(Leave-one-out cross validation)對試驗數(shù)據(jù)進行測試。具體做法是,抽取數(shù)據(jù)集中的某個樣本作為測試樣本,剩余的全部數(shù)據(jù)則作為訓練樣本,通過訓練樣本訓練分類算法來驗證測試樣本的精度,直到所有的數(shù)據(jù)都被作為一次測試樣本后則結(jié)束,而最終的分類精度為所有樣本驗證后精度的平均值。
表3給出了震顫特征參數(shù)(H1,H2,H3和H4)與臨床醫(yī)生的UPDRS評分之間的相關性分析結(jié)果。r表示相關性系數(shù),p<0.01表示統(tǒng)計結(jié)果具有明顯的顯著性。從表3可以看出,本文提取的4個特征參數(shù)均與臨床UPDRS具有高度相關性,相關性系數(shù)r都大于0.8。因此,該特征參數(shù)可以用來表示震顫嚴重程度,并作為癥狀分類模型的輸入特征,進行算法訓練,并得到量化的震顫等級。
表3 震顫特征參數(shù)與UPDRS評分的相關分析結(jié)果
運動遲緩特征參數(shù)與臨床醫(yī)生的UPDRS評分之間的相關性分析結(jié)果見表4。從皮爾遜相關系數(shù)r和相應的p值來看,手指開合動作頻率f和開合幅度φˉ都與量表評分有顯著的相關性(|r|>0.9,p<0.01),幅度的波動特征σ|φ|則不存在明顯相關性(r=0.28)。因此,在分類器的輸入?yún)?shù)選擇上,本文優(yōu)選f和來構(gòu)造分類模型。
表4 運動遲緩特征參數(shù)與癥狀評分的相關性
表5給出了3種機器學習分類算法(SVM、KNN和RF)的測試結(jié)果對比,包括敏感性、特異性和分類精度,表中所有測試結(jié)果都是基于留一法交叉驗證的結(jié)果。分類精度通過正確判斷類型的人數(shù)占總?cè)藬?shù)的百分比進行計算(真值依據(jù)UPDRS量表評分),敏感性表示在患有帕金森病的參與人中,診斷正確的人所占的百分比,特異性表示在未患帕金森病的參與人中,診斷正確的人所占的百分比。從表中可以看出,3種機器學習分類模型的測試結(jié)果都比較好,敏感性、特異性和分類精度都高于90%。其中,SVM算法的分類結(jié)果最好,分類精度優(yōu)于96%,證明了該模型對于PD震顫與運動遲緩癥狀等級量化評估的有效性。
表5 3種機器學習分類模型的結(jié)果對比 (%)
針對帕金森病運動癥狀量化評估的難題,本文采用基于運動傳感器的可穿戴設備采集帕金森病患者手部運動信息,通過信號處理方法提取量化特征,并基于特征訓練多分類算法,輸出震顫與運動遲緩癥狀的病情程度等級。試驗結(jié)果表明,SVM分類模型對震顫和運動遲緩癥狀的嚴重程度分類準確率高達96%以上,優(yōu)于KNN和RF算法,驗證了基于運動傳感器和機器學習的帕金森病量化評估方法的可行性。本文提出的帕金森病運動癥狀量化檢測方法可以為臨床上診斷PD病情嚴重程度提供一種有效的技術輔助工具。