盧先領,徐 仙
(江南大學a.輕工過程先進控制教育部重點實驗室;b.物聯網工程學院,無錫214122)
基于加速度與HGA-BP神經網絡的人體行為識別
盧先領a,b,徐 仙a,b
(江南大學a.輕工過程先進控制教育部重點實驗室;b.物聯網工程學院,無錫214122)
在基于加速度傳感器的人體行為識別中,分類器復雜度較高,易產生過擬合現象。為此,通過遞階遺傳算法(HGA)訓練BP神經網絡作為分類器,采用三級染色體遞階結構表示神經網絡的結構和參數。設計新的適應度函數,采用選擇、交叉和變異操作聯合優化BP網絡的精確度和復雜度。測試結果表明,在基于加速度信號的行為識別系統中,相比基本HGA和其他常用算法,利用改進的HGA訓練BP網絡分類器可以有效控制網絡結構,在保證隱層神經元數目較少的情況下,盡可能降低輸出誤差,實現兩者的動態平衡,且對測試樣本的識別正確率可達94.63%。
行為識別;加速度傳感器;遞階遺傳算法;BP神經網絡;交叉;變異
近年來,人體行為識別受到各國學者的廣泛關注,它不僅可以獲取用戶運動信息,推測用戶所處環境,還可以為用戶提供智能化的服務。目前在人體行為識別的研究中,從信號的獲取渠道來分主要有基于計算機視覺的方法[1]和基于傳感器的方法[2-3]。隨著微電子與傳感器技術的迅速發展,加速度傳感器以其低功耗、高精度、可靠性強、攜帶方便等優點,在醫療保健、體域網、環境智能等領域中廣泛應用。
基于加速度信號的人體行為識別主要是面向軀干動作層次的簡單行為識別,一般采用統計模式識別的方法實現。其中,分類器的設計是該方法的核心內容,常見的分類器有支持向量機[4]、隱馬爾科夫模型[5]、人工神經網絡(Artificial Neural Netw ork,ANN)[6-7]等。ANN模擬人腦神經系統對外界信號接收、處理、存儲的過程,其優點是容錯性好,自適應能力強,具有非線性映射能力,易于并行計算和軟硬件的編程計算。文獻[8]將RBF神經網絡應用于基因表達數據分類中,具有網絡結構簡單、收斂速度快的特點,而當訓練樣本增多時,其網絡隱層神經元數目也急劇增加,導致結構過于龐大。文獻[9]采用反向傳播神經網絡(Back Propagation Neural Network,BPNN)構建分類器,具有很好的泛化能力以及強大數據識別和模擬能力,但存在誤差收斂速度慢,易陷入局部極小值的問題。文獻[10]將模擬退火算法、遺傳算法(Genetic Algorithm,GA)和BPNN結合,可避免BP網絡陷入局部解,但其收斂時間隨訓練精度的提高大幅增加,運算量大。本文采用改進的三級遞階遺傳算法(Hierarchical Genetic Algorithm,HGA)[11],同時優化BP網絡的結構和參數,使分類器結構精簡且誤差較小。
2.1 加速度數據采集與預處理
基于三軸加速度傳感器的人體行為識別的結構框圖見圖1,可穿戴數據采集模塊放置于人體腰腹位置。本文選用Freescale公司的MMA 7361L三軸加速度傳感器為核心采集數據,采樣頻率設定為30 Hz,靈敏度設置為-6.0 g~+6.0 g。傳感器的Y軸豎直向下,X軸和Z軸分別指向人體側方和前方。

圖1 基于三軸加速度傳感器的人體行為識別結構
基于三軸加速度傳感器的人體行為識別系統主要包括5個步驟:數據采集,預處理,特征提取,特征選擇和分類。其中,該系統的核心內容是分類器的設計。為實時處理數據,對傳感器每一軸數據進行加窗處理,本文選取的窗長為128,窗口有50%的重疊率,由于傳感數據的采樣頻率為30 Hz,完成每個窗的處理所需時間約為4.3 s,可以滿足大部分人體行為的識別需求。
2.2 特征提取
本文對加速度信號提取了8種特征,其中,時域特征包括均值、標準差、任意兩軸數據的相關系數和四分位間距(Interquartile Range,IQR)。頻域特征包括:每窗數據FFT前64維系數,基于功率譜密度振幅的均值和標準差。此外,為了更好地表征人體運動特點,還利用db5小波提取豎直方向信號的小波能量。除相關系數、IQR和小波能量外的特征都是對每一維每個窗的數據進行提取。考慮到特征分布的不均衡性,對提取的特征數據進行Z-score規范化處理[12],來消除特征數據的差異對識別結果的影響,通過主成分分析(Principal Component Analysis,PCA)[13]的方法將特征向量降低到15維。經過PCA降維后的特征向量作為BP神經網絡的輸入樣本。
3.1 HGA-BP神經網絡分類器
利用三級HGA訓練BP神經網絡,模擬遺傳選擇和自然淘汰的生物進化過程,達到優化網絡結構和參數目的。BP網絡與HGA染色體的對應關系如圖2所示。

圖2 BP神經網絡與HGA染色體的對應關系
采用三級染色體遞階結構表示神經網絡的結構和參數,通過HGA對該網絡進行優化求解。控制基因有2層,分別控制隱層的層數和隱層中被激活的神經元個數。參數基因被用來表示每個神經元的連接權值和閾值。
在BP網絡中,神經元用節點表示,網絡由輸入層、隱層和輸出層組成。PCA降維后特征向量的維數為輸入層節點個數,輸出層節點個數由待識別行為種類數決定。在圖2中,向量Xi(i=1,2,…,m),Yi(i=1,2,…,n)分別表示m個輸入層節點和n個輸出層節點。共t個隱層,P,q分別為第一隱層和第t隱層的節點個數。輸入層與第一隱層節點間的權值為,第一隱層節點的閾值為1第t隱層與輸出層節點間的權值為第t隱層和輸出層節點的閾值分別為q),bi(i=1,2,…,n)。設H為隱層節點總個數,在輸入層和輸出層節點數目確定后,H的大小直接影響網絡結構,H越大網絡結構越復雜,反之,越簡單。
3.2 改進的BP神經網絡
3.2.1 初始群體
HGA中控制基因采用二進制編碼方式隨機產生,以“1”和“0”表示其下級隱層神經元是否被激活。根據對網絡權值的精度以及染色體編碼長度的要求,參數基因采用實數編碼方式,由一定范圍內隨機產生的實數組成。分開編碼實現對BP神經網絡結構和參數的聯合優化。
合適的群體規模對HGA的性能有重要意義,規模太大,收斂速度會降低;規模太小,搜索空間受到限制,可能會過早收斂。本文設定的群體規模為K=60。
3.2.2 適應度函數的設計
適應值是群體選擇個體的唯一確定性指標,因此適應度函數決定了群體的進化行為。訓練BP網絡的目的是使網絡的精確度和復雜度都達到最小,這是一個雙目標優化問題。網絡的精確度由均方誤差決定,定義如下:

其中,M為樣本總數;yi表示第i個輸入樣本對應的網絡輸出;y^i為期望輸出。
而網絡的隱層層數和隱層節點個數決定網絡的復雜度。建立的適應度函數如下:

其中,a,b為待定參數;t為隱層層數;H,m分別為隱層和輸入層節點個數;f隨著H和t的減小而逐漸增加,通過調整參數a,b,可有效降低網絡的復雜度。
3.2.3 選擇操作
選擇即從群體中選出優勝個體,淘汰劣質個體的操作。本文采用適應值比例選擇[14],給定群體規模為K,群體中個體均為向量,其中個體αi的適應值為fi,則個體αi的選擇概率為:

3.2.4 交叉操作的改進
交叉在遺傳算法中起核心作用,是指把2個父代個體的部分結構加以替換重組而生成新的個體的操作。考慮到人體行為的多樣性和復雜性,加速度數據特征的取值范圍相對較大,傳統的算術交叉搜索空間有限,影響分類器的進化效率。本文對控制基因采用單點交叉的方式,對于參數基因,采用算術交叉的方式將2個個體的編碼串按某一規則進行線性組合產生新的個體,并通過四分位間距來改進交叉方式,達到自動確定交叉后代與編碼空間邊界距離的效果,2種交叉方式共同產生后代,擴大搜索范圍,提高了后代中優秀個體的生成效率。
給定規模為K的群體A={α1,α2,…,αK},從中隨機選取2個個體αi和αj,則算術交叉的后代為:

其中,λ是[0,1]范圍內均勻分布的一個隨機數。

其中,符號“·”為Hadamard乘積;向量E與η維數相同且元素全為1,有:

如式(8)所示,η為IQR與最大搜索區間對應位置元素的比值。αmax-αmin為最大搜索區間,γ由極小正實數組成。Λ1=[Λ11,Λ21,…,Λr1,…,ΛR1],Λ3=[Λ13,Λ23,…,Λr3,…,ΛR3],將全部個體的第r位基因從小到大排列分成四等分,四分位數即處于3個分割點位置的基因值,所得集合為Λr1表示第3個和第1個四分位數之差,即為IQR。結合算術交叉,后代集合為,其中適應值最大的2個個體為最終交叉后代。
3.2.5 變異操作的改進
變異的目的是維持群體的多樣性和局部的隨機搜索能力。對控制基因,變異操作采用基本位變異,對參數基因,采用均勻變異和非均勻變異2種方式,結合兩者優勢提高進化效率。均勻變異在整個編碼空間中均勻搜索,從對應基因位的取值范圍內任取一個隨機數替代原有基因,有利于提高群體的多樣性。而非均勻變異是對原有基因值作一個隨機擾動,以擾動后的結果作為變異后的新基因,有利于產生優秀后代。選個體αi的第r位基因βri為變異位,其基因取值范圍為[βi,min,βi,max],即:

其中,λ1為[0,1]之間均勻分布的隨機數。均勻變異產生的后代為
設個體αj的第s位基因非均勻變異,其基因取值范圍為[βj,min,βj,max],即:

其中,λ2為[0,1]之間的隨機數;t和T分別為當前和最大進化代數;b為系︵統參數,本文中b=︵1,非均勻變異產生的后代為因此,變異后代集合為其中適應值最大的個體作為最終變異后代。
4.1 實驗設置
本文在Matlab環境下對數據進行仿真處理。為驗證本文方法的有效性,10名實驗者參與了樣本數據的采集。將可穿戴數據采集模塊佩戴于實驗者腰腹位置,10名實驗者各自完成上樓、下樓、站立、行走、躺臥、騎車和跑步7種日常行為。選擇每種行為連續的3 m in數據進行實驗。由于傳感數據的采樣頻率為30 Hz,每軸可采集5 400個數據,本文選取窗長為128,窗口有50%的重疊率,因此,共有83個窗口,計算每個窗的多種特征構成特征向量,則每種行為有830個特征向量。將其中410個特征向量作為訓練樣本,用于訓練BP神經網絡,檢驗樣本和測試樣本各包含210個特征向量。通過檢驗樣本對BP網絡進行評估,而測試樣本在迭代完成后,計算網絡的輸出誤差和行為識別正確率。樣本標簽以“0”和“1”表示所屬行為,7種行為的樣本標簽如表1所示。

表1 7種行為的樣本標簽
4.2 實驗分析
本文共識別7種日常行為,首先提取2.2節中的8種加速度特征,每種行為的特征向量維數為209,這種高維數據包含大量冗余信息,提高空間復雜度,因此,利用PCA將特征降到15維。本文算法的主要參數設定如下:輸入層和輸出層節點個數分別為m=15,n=7,式(4)、式(9)和式(10)中λ= 0.3,λ1=λ2=0.4,群體規模K=60,最大進化代數為100,交叉概率為0.8,變異概率為0.001。
式(2)中適應度函數需設置合理的參數,a,b的取值會影響最終生成的網絡結構和識別率。為此,分別固定a,b,通過計算機仿真研究另一參數取不同值時所獲得的網絡結構復雜度和輸出誤差。大量仿真結果表明,a,b分別取值為3和0.8時,獲得了誤差較小,網絡結構較為精簡的分類器。通過3種不同算法訓練BP網絡,利用檢驗樣本分別計算網絡的輸出誤差和隱層神經元個數,圖3和圖4為兩者的進化曲線。本文算法最終獲得的網絡隱層數為2,分別包括24和13個隱層神經元。

圖3 不同算法的誤差進化曲線

圖4 不同算法的隱層神經元個數進化曲線
由圖3可知,由于GA是一種全局優化算法,在迭代過程中,始終向著誤差較小的方向不斷優化,然而采用不同的方法,通過HGA訓練BP網絡的輸出誤差明顯較低。而采用三級染色體遞階結構優化網絡時,不但保留了GA的優點,且將控制基因分為2層,可有效控制網絡隱層數目和隱層神經元個數,對網絡權值和閾值優化求解的同時還優化了網絡結構。分析圖4可知,采用GA-BP算法獲得的隱層神經元個數較多,網絡結構復雜。而采用本文算法不僅輸出誤差較低,其網絡的拓撲結構也更為精簡,在人體行為識別系統中具有良好的健壯性。
如圖5所示為僅采用普通算術交叉和均勻變異的基本HGA-BP算法與本文算法的輸出誤差進化曲線,2種算法相應的參數設定相同。與基本HGA-BP算法相比,采用本文改進的交叉擴大搜索范圍,增加了后代中優秀個體的生成率,并結合2種變異方式提高進化效率,分類器的輸出誤差更低,最終收斂于0.363 3。2種算法隱層神經元個數的進化曲線如圖6所示,采用本文算法雖然網絡結構略為復雜,但其收斂速度更快,而且輸出誤差小。基本HGA-BP算法和本文算法的隱層神經元個數分別在進化到第69代和第53代收斂于31和37。

圖5 不同遺傳操作的誤差進化曲線

圖6 不同遺傳操作的隱層神經元個數進化曲線
4.3 識別結果
通過本文算法,利用改進的HGA訓練BP神經網絡對7種人體行為的測試樣本進行識別。針對每個輸入向量,分別計算網絡輸出與7種行為樣本標簽的輸出誤差,選擇誤差最小的行為類別作為所屬行為,達到行為識別的目的。其混淆矩陣如表2所示,每一行對應行為的識別精度分別為92.38%, 93.33%,100.00%,94.26%,100.00%,90.48%,91.90%。

表2 7種不同行為的混淆矩陣
上樓和下樓的識別正確率較高,僅有少數特征向量發生混淆;而210個騎車測試樣本僅有20個識別錯誤,跑步樣本也僅有17個識別出錯,識別正確率分別為90.48%和91.90%。在運動行為識別中,行走的識別正確率最高,可達94.26%。另外,由于站立和躺臥是2種靜止的行為,它們的加速度數據與其他行為的區分度較大,其識別難度較低,采用本文方法,檢測結果均全部正確。最終結果顯示,1 470個測試樣本中有1 391個識別正確,平均識別率高達94.63%。
本文采用單個三軸加速度傳感器識別人體行為,提出了三級HGA訓練的BP神經網絡分類器,通過改進適應度函數和遺傳操作來優化網絡的精確度和復雜度。實驗結果表明,與目前常用的算法相比,本文算法獲得的分類器輸出誤差更低,網絡結構精簡,測試樣本的平均識別率高達94.63%。在今后的工作中,將進一步研究優化分類器的方法,提高行為識別的正確率。
[1] 梅 雪,張繼法,許松松,等.基于運動方向的視角無關行為識別方法[J].計算機工程,2012,38(15):159-161.
[2] ?zdemir A T,Barshan B.Detecting Falls with Wearable Sensors Using Machine Learning Techniques[J]. Sensors,2014,14(6):10691-10708.
[3] 劉 蓉,劉 明.基于三軸加速度傳感器的手勢識別[J].計算機工程,2011,37(24):141-143.
[4] Daniel R M,A lbert S,Carlos P,et al.SVM-based Posture Identification with a Single Waist-located Triaxial Accelerometer[J].Expert System s with Applications,2013,18(40):7203-7211.
[5] Sarkar A M J.Hidden Markov M ined Activity Model for Human Activity Recognition[J].International Journal of Distributed Sensor Netw orks,2014,10(1):1-8.
[6] Zhao Dongya,Ni W ei,Zhu Quanm in.A Framework of Neural Networks Based Consensus Contro l for Multiple Robotic Manipulators[J].NeuroComputing,2014,140:8-18.
[7] Wang Lei,Tuo Xianguo,Yan Yucheng,et al.A Geneticalgorithm-based Neural Network Approach for Radioactive Activity Pre-diction[J].Nuclear Science and Techniques,2013,24(6):1-5.
[8] Chandra B,Babu K.Classification of Gene Expression Data Using Spiking Wavelet Radial Basis Neural Network[J].Expert System s with Applications,2013,41(4):1326-1330.
[9] Huang Yanquan,Zhang Jie,Li Xu,et al.Thermal Error Modeling by Integrating GA and BP Algorithm s for the Highspeed Spindle[J].The International Journal of Advanced Manufacturing Technology,2014,71(9-12):1669-1675.
[10] Zhuo Li,Zhang Jing.An SA-GA-BP Neural Networkbased Color Correction Algorithm for TCM Tongue Images[J].NeuroComputing,2014,134(S1):111-116.
[11] Tarek M H,Won J M,Alimiam,et al.Hierarchical Genetic Algorithm with New Evaluation Function and Bicoded Representation for the Selection of Features Considering Their Confidence Rate[J].Applied Soft Computing,2011,11(2):2501-2509.
[12] Han Jiawei,Kam ber M.Data Mining:Concepts and Techniques[M].Waltham,USA:Morgan Kaufmann Publishers,2011.
[13] David N O,Iván G C,XoséA V S.Eigenspace-based Fall Detection and Activity Recognition from Motion Templates and Machine Learning[J].Applied Soft Computing,2012,39(5):5935-5945.
[14] 王小平,曹立明.遺傳算法ˉˉˉ理論、應用與軟件實現[M].西安:西安交通大學出版社,2002.
編輯 顧逸斐
Hum an Activity Recognition Based on Acceleration and HGA-BP Neural Network
LU Xianlinga,b,XU Xiana,b
(a.Key Laboratory of Advanced Control of Light Industry Process,Ministry of Education;b.School of Internet of Things Engineering,Jiangnan University,Wuxi214122,China)
The human activity recognition system based on accelerometer,referring to solve the problem s such as high complexity and over fitting phenomenon,a Back Propagation(BP)neural network classifier trained via the Hierarchical Genetic Algorithm(HGA)is utilized.A three-layer chromosome hierarchical structure is used to optimize the structure and parameters of BP neural network simultaneously.A new fitness function is proposed,meanwhile,im proved selection,crossover and mutation operator is beneficial to joint optimizing the complexity and accuracy of network.Results of tests show that it is better than the traditional HGA and other widely used algorithm s in human body activity recognition system based on accelerometer.The BP neural network classifier based on HGA can effectively control the network structure and parameters.The average accuracy rate of test data is 94.63%.
activity recognition;acceleration sensor;Hierarchical Genetic Algorithm(HGA);BP neural network;crossover;mutation
盧先領,徐 仙.基于加速度與HGA-BP神經網絡的人體行為識別[J].計算機工程,2015,41(9):220-224,232.
英文引用格式:Lu Xianling,Xu Xian.Human Activity Recognition Based on Acceleration and HGA-BPNeural Network[J]. Computer Engineering,2015,41(9):220-224,232.
1000-3428(2015)09-0220-05
A
TP393
10.3969/j.issn.1000-3428.2015.09.041
江蘇省產學研聯合創新資金前瞻性聯合研究基金資助項目(BY2014023-31);江蘇高校優勢學科建設工程基金資助項目;江蘇省“六大人才高峰”高層次人才基金資助項目(W LW-007)。
盧先領(1972-),男,副教授、博士,主研方向:神經網絡,無線傳感器網絡;徐 仙,碩士研究生。
2014-09-18
2014-10-18 E-m ail:jnluxl@gmail.com