邵輝, 蘇芳茵, 程海波
(華僑大學 信息與科學工程學院, 福建 廈門 361021)
?

采用小波變換和高斯過程的肌電信號模型預測
邵輝, 蘇芳茵, 程海波
(華僑大學 信息與科學工程學院, 福建 廈門 361021)
根據表面肌電信號的生物電信號特點,采用小波變換和高斯過程建模的方法對表面肌電信號進行建模和預測.對非線性的表面肌電信號利用擬合能力強大的高斯過程進行建模,預測效果較好,但所需運算時間長.針對其運算時間長的缺點進行改進,將預處理后的表面肌電信號小波分解,對分解后的系數高斯建模,然后重構.實驗結果表明:該改進方法在響應時間和預測誤差方面效果明顯.
表面肌電信號; 高斯過程; 小波變換; 模型預測
表面肌電信號(surface electromyographic signal,sEMG)是人體在運動時骨骼肌產生的電信號在皮膚表面處的疊加,是一種信號微弱、噪聲復雜的非線性生物電信號[1].表面肌電信號作為智能手臂和假肢的控制源,其采集和處理要求很高.為了更好地控制機械臂,需要對肌電信號進行建模研究.目前,對其進行建模預測的研究相對較少,而常見的非線性建模方法在實際應用中都或多或少存在問題.高斯過程(Gaussian process,GP)于20世紀90年代進入機器學習領域[2-4],已成為非線性機器學習領域的研究熱點[5-7].它可以很好地避免這些問題,并且具有學習參數少,對處理小樣本、高維數、非線性等復雜問題有良好的適應性,且泛化能力強的優點.高斯過程模型應用非常廣泛.Williams等[8]率先將高斯過程應用于機器學習領域;Murray-Smith等[9]分析比較了基于蒙特卡羅方法的高斯過程先驗模型與多模型方法;Kocijan[10]率先提出了一種將高斯過程模型中的方差引入控制信號的預測控制方法.高斯過程模型善于處理小樣本、高維數、非線性等復雜問題.因此,本文首次將高斯過程模型應用到肌電信號的建模,并引入了小波變換(wavelet transform,WT).在高斯過程回歸前,對樣本集進行小波分解處理,從而減少模型學習的時間以提高預測速度.
1.1 表面肌電信號描述
對表面肌電信號的處理方法是肌電信號分析和應用的重要部分,其處理方法的選擇很大程度上要考慮肌電信號的產生機理.表面肌電信號的數學模型主要有4種:線型系統模型、雙極型模型、集中參數模型和非平穩模型.前3種模型均屬于穩態分析,即當肌肉用力恒定的平穩情況;當肌肉用力不均時,肌電信號變化不平穩,可以用非平穩模型表征肌電信號,即

(1)

圖1 非平穩模型Fig.1 Non-stationary model
式(1)中:c(t)為肌肉收縮程度的調制信號;m(t)為高斯噪聲(零均值單位方差)載波信號.表面肌電信號非平穩模型,如圖1所示.
1.2 高斯過程建模
高斯過程是在貝葉斯學習理論基礎上,發展起來的機器學習方法.它描述了任意有限變量集合的聯合密度函數,屬于高斯分布的隨機過程.對于任意有限隨機變量x1,…,xn,其中,n≥1,且為任意整數,與其對應的過程狀態f(x1),f(x2),…,f(xn)的聯合概率分布服從n維高斯分布.其具體過程可由均值m(x)與協方差函數k(x,x′)確定,即

(2)
給定訓練D={(xi,yi)|i=1,2,…,N},其中,xi∈Rd為輸入量,yi∈R是輸出向量.則輸出向量y由零均值函數m(x)和一個正定的協方差函數k(x,x′)的高斯先驗分布組成,即y~N(m,p).
假設輸入新的向量x*∈Rd,KN為訓練樣本的協方差矩陣,則其相應的待預測數據的高斯分布函數為y~N(m*,p*),其中
(3)
協方差函數的選擇沒有統一的指導性原則[11],只需滿足對稱性和半正定性.目前,常用的協方差函數為平方指數協方差函數,也稱為徑向基函數(RBF)或高斯函數,其形式為
(4)
式(4)中:x和x′為訓練集或測試集中的某個變量組合;σf,l,σn為超參數;δ為符號函數.一般常用極大似然法求解最優超參數[12].
高斯過程模型較適用于處理小樣本、高維數的問題,而表面肌電信號的樣本數量多,其運算量與訓練集樣本數成正比.因此,在訓練集樣本數較大時,計算逆矩陣所需要的時間和空間將成倍增大.考慮到這種情況,提出了小波變換結合高斯模型的預測方法.
小波變換的實質是將信號分解為一系列小波函數的疊加,而這些小波函數都是由一個母小波函數經過平移和尺度伸縮得來的.對信號逐步進行時間頻率多尺度細化,最終達到高頻處時間細分、低頻處頻率細分,能自動適應時頻信號分析的要求,從而可聚焦到信號的任意細節.
通過多分辨率離散小波變換將肌電信號y(t)分解,即
(5)
式(5)中:φ(t)為尺度函數;ψ(t)為小波函數.則尺度系數和小波系數的表達式為
(6)
(7)
將小波分解產生的尺度系數和小波系數分別進行高斯過程訓練,則其相應的待預測數據的高斯分布函數為cj~N(mc,pc),dj~N(md,pd).

(a) GP預測模型 (b) WT-GP預測組合模型 圖2 2種預測模型的對比Fig.2 Comparison of two forecast models
高斯過程模型(GP)和小波變換結合高斯過程(WT-GP)模型在實現過程上不同,具體的模型結構,如圖2所示.WT-GP預測模型選用db5小波,對表面肌電信號進行三級分解.db5小波具有較好的正則性,引入的光滑誤差不易被察覺,使信號重構過程較光滑.采用小波變換結合高斯過程模型對表面肌電信號進行建模預測.首先,將樣本數據進行小波三級分解,第一級可以得到一組低頻系數和一組高頻系數,繼續分解低頻部分,以此類推,最終可以得到一組低頻系數和三組高頻系數,其樣本數遠小于原來的樣本數據;然后,對四組系數分別進行高斯過程回歸建模;最后,將每個模型預測的系數重組得到最終的預測結果.
小波變換有多尺度的分析能力,將信號按照不同的尺度分解,降低信號非線性程度.由于非線性程度降低,預測信號的誤差減小,因此,提高了預測的精確度.而在小波分解后,低頻系數和高頻系數的維度明顯低于信號本身,所以對其分別求逆的運算量也低于對信號本身求逆.即使低頻和高頻系數維度相加等于信號自身,但是求逆過程的計算難度確隨著矩陣維數成倍增長,故運算時間明顯減少.由此可以得出,引入小波后的高斯過程模型預測回歸在誤差和運算時間上均有優化.
3.1 肌電信號采集方案
實驗采集設備:表面電極貼、PC機、PCL818L多功能數據采集卡、肌電傳感器.實驗采用的傳感器是日本司機工工程技術公司的TYE-1000M雙極型表面電極,其中,包含傳感器和放大器,配合使用一次性銀/氯化銀按鈕式電極貼片.

圖3 現場信號采集實驗圖Fig.3 Field signal acquisition experimental picture
采集系統的構建:實驗平臺采用MATLAB/Simulink/xPC Target的實時環境建立整個肌電信號采集系統,采樣頻率1 000 Hz,信號主要能量集中在10~500 Hz.現場信號采集實驗,如圖3所示.實驗方案:實驗前,上臂經過清洗處理,減少皮膚阻抗,且實驗之前未進行激烈運動;實驗時,將電極貼片黏在肱二頭肌和肱三頭肌上,受測者坐在椅子上,手成握拳狀,手臂自然下垂,采集兩種動作前臂屈伸和前臂旋轉各10次.
采集后的肌電信號含有噪聲,需要進行濾波.文中選擇常用的切比雪夫I型濾波器,其通帶下限頻率為20 Hz,上限頻率為510 Hz;阻帶下限為10 Hz,阻帶上限為520 Hz;通帶衰減小于1 dB,阻帶衰減大于60 dB.由此,可確定切比雪夫濾波器階數為4.
3.2 高斯過程模型預測結果
由理論分析可知:訓練集和測試集是兩個不同的集合,但這兩個集合是由同一個動作產生,因此,這兩個集合在本質上是屬于同一個樣本點集,其預測效果會比較好.如果測試集由其他動作產生,其效果會有所不同.
采集2種動作的肌電信號,從中分別抽取1 500組和1 000組樣本數據,選擇前一種動作的500組數據作為訓練樣本,剩下的1 000組數據作為測試樣本;而后一種動作的1 000組僅作為測試樣本.如此,兩個測試集中,一個和樣本集屬于同一集合,一個屬于不同集合.整個學習訓練的過程如上敘述,分別對1 000組測試樣本進行預測,結果如圖4,5所示.
由圖4可知:不管測試樣本與訓練樣本是否來自同一動作數集,其預測值與實際值的曲線都幾乎相似.圖5中:誤差曲線和方差曲線的精確度數量級很小.由此可以證明,高斯過程對非線性回歸有很強大的學習能力和泛化能力.
由圖5可知:屬于同一集合測試樣本的預測誤差曲線優于不同集合測試樣本的預測效果;同一集合的預測方差明顯低于不同集合的方差.這說明訓練后的高斯過程模型對同一集合的預測具有更大的可信度.在高斯過程建模時,根據訓練集500組數據求取最優化參數.因此,它對訓練集內1 000組數據預測時,準確度高于訓練集外部的1 000組數據.由此可知:高斯過程模型對訓練集外點預測的可信度已經降低,訓練集內的預測效果高于訓練集外的預測效果.

(a) 同一數集預測效果 (b) 不同數集預測效果圖4 實際信號與預測信號對比圖Fig.4 Actual signals and forecast comparison chart

(a) 同一集合誤差曲線 (b) 不同集合誤差曲線

(c) 同一集合方差曲線 (d) 不同集合方差曲線圖5 預測的誤差和方差曲線圖Fig.5 Prediction error and variance of graph
3.3 基于小波的高斯過程模型預測結果
采用上面的500組作為訓練樣本,不同集合的1 000組作為測試樣本.經過仿真結果比較可知:在誤差分析和響應速度上,WT-GP模型預測的效果都有良好地改善.引入小波預測后,在誤差分析上有變化.在訓練和預測前,將信號進行小波三層分解,將小波分解得到的低頻系數ca1和高頻系數cd1,cd2,cd3分別訓練和預測,分別重構得到低頻分量和高頻分量.各分量的實際值和預測值,如圖6所示.
將得到的低頻系數和高頻系數組合重構,得到預測后的信號,如圖7所示.由圖7可知:預測信號和實際信號沒有太大差別,而誤差和方差的數量級依然很小.實驗仿真用的數據不是同一集合,由此可見,其擬合能力和泛化能力依舊沒變.比較圖5與圖7中非同一集合預測的誤差,圖7的誤差更小一些,和圖5中同一集合預測誤差范圍比較接近.

(a) 小波分解低頻分量a3 (b) 預測低頻分量a3

(c) 小波分解高頻分量d1 (d) 預測高頻分量d1

(e) 小波分解高頻分量d2 (f) 預測高頻分量d2

(g) 小波分解高頻分量d3 (h) 預測高頻分量d3圖6 各分量的實際值和預測值Fig.6 Each component of actual value and predictive value

(a) 實際信號 (b) 誤差曲線

(c) 預測信號 (d) 方差曲線圖7 引入小波后的預測效果Fig.7 Prediction effect after introducing wavelet
兩種預測模型運算時間的比較,如表1所示.表1中,運行時間指訓練和測試所共用的時間.由表1可知:引入小波的高斯模型訓練時間明顯低于沒有使用小波的情況.不論測試集合和訓練集合是否來自同一集合,運行時間都會隨著訓練樣本數的下降而明顯變小;而當訓練組數確定時,同一集合的時間略小于不同集合的運行時間.經過小波分解后的訓練樣本數減少,運行的時間有很大的變化.

表1 兩種預測模型運算時間的比較
表面肌電信號是非線性的生物電信號,對其進行高斯過程回歸建模預測,能很好地擬合其非線性.高斯過程建模時,首先,確定核函數;然后,訓練高斯過程模型,從而得到最優超參數;最后,用訓練好的模型進行預測.仿真結果證明,高斯過程對表面肌電信號有良好的擬合能力和強大的泛化性能.在此基礎上,提出了基于小波的高斯建模,解決了單純使用高斯過程建模帶來的運行時間長和非同一集合預測誤差大的缺點.從仿真結果來看,引入小波后的預測效果在減小誤差和運算時間上都有明顯的優勢.
[1] 張啟忠,席旭剛,羅志增.多重分形分析在肌電信號模式識別中的應用[J].傳感技術學報,2013,26(2):282-288.
[2] RASMUSSEN C E,WILLIAMS C K I.Gaussian processes for machine learning (adaptive computation and machine learning)[M].American:MIT Press,2005:49-51.
[3] KOCIJAN J,GRANCHAROVA A.Application of gaussian processes to the modelling and control in process engineering[M]∥Studies in Computational Intelligence.Germany:Springer Berlin Heidelberg,2014:155-190.
[4] PARK C,HUANG Jianhua,DING Yu.Domain decomposition approach for fast gaussian process regression of large spatial data sets[J].Journal of Machine Learning Research,2011,12(4):1697-1728.
[5] HE Zhikun,LIU Guangbin,ZHAO Xijing,et al.Temperature model for FOG zero-bias using Gaussian process regression[J].Advances in Intelligent Systems and Computing,2012,180(1):37-45.
[6] 李鵬,宋申民,段廣仁.改進的平方根UKF及其在交會對接中的應用[J].電機與控制學報,2010,14(11):100-104.
[7] 孫斌,姚海濤,劉婷.基于高斯過程回歸的短期風速預測[J].中國電機工程學報,2012,32(29):104-109.
[8] WILLIAMS C K I,RASMUSSEN C E.Gaussian processes for regression[J].Advances in Neural Information Processing Systems Pages,1996,27(6):514-520.
[9] MURRAY-SMITH R,JOHANSEN T A,SHORTEN R.On transient dynamics, off-equilibrium behaviour and identification in blended multiple model structures[C]∥Proceedings of the European Control Conference.Karslruhe:IEEE Press,1999:BA-14.
[11] 張惠澤.基于高斯過程的pH中和過程控制研究[D].哈爾濱:哈爾濱工業大學,2010:26-29.
[12] 陳寶林.最優化理論與算法[M].北京:清華大學出版社,1989:280-288.
(責任編輯: 黃曉楠 英文審校: 吳逢鐵)
Model Forecasting of EMG Using Wavelet Transformation and Gaussian Process
SHAO Hui, SU Fangyin, CHENG Haibo
(College of Information Science and Engineering, Huaqiao University, Xiamen 361021, China)
According to the characteristics of the surface EMG signal, this paper uses wavelet transform and Gauss process modeling method to model and predict the surface EMG signal. The nonlinear surface EMG signal is used to model the fitting ability of the Gauss process, and the prediction effect is better, but the operation time is longer. To overcome the shortcomings of the long computation time, the wavelet decomposition of the surface EMG signal is processed, and the coefficients of the decomposition are modeled in Guassian. Experimental results show that the improved method has obvious effect on response time and prediction error.
surface electromyogram; Gaussian process; wavelet transform; model prediction
10.11830/ISSN.1000-5013.201606016
2016-01-14
邵輝(1973-),女,副教授,博士,主要從事機器人控制、運動規劃、智能控制、非線性系統LPV建模的研究.E-mail:shaohuihull@163.com.
福建省科技計劃項目(2015H0026); 教育部留學回國人員科研啟動基金資助項目(Z1534004); 福建省泉州市科技計劃項目(2013Z34)
TP 391
A
1000-5013(2016)06-0743-06