摘要:針對基于小樣本場景下人體動作識別出現(xiàn)訓練效果差、過擬合現(xiàn)象以及傳統(tǒng)對抗生成網(wǎng)絡(luò)收斂速度慢、對計算機性能要求高等問題,從數(shù)據(jù)增強及超參數(shù)優(yōu)化方面提出了解決方案。首先,搭建AWR1243雷達數(shù)據(jù)采集平臺,對采集的回波信號進行預處理。其次,利用STFT進行時頻分析以及新提出的FT_SSIM算法進行數(shù)據(jù)增強。再者,利用提出的ICAGA_CNN進行分類識別,并與傳統(tǒng)的數(shù)據(jù)增強算法、超參數(shù)優(yōu)化進行實驗對比。為了驗證該算法具有一定的泛化能力,先后選擇了在公開KTH人體動作數(shù)據(jù)集以及利用雷達的實測數(shù)據(jù)進行驗證。實驗結(jié)果表明,一方面,提出算法有效避免了小樣本場景下過擬合的發(fā)生,降低了傳統(tǒng)數(shù)據(jù)增強對計算機性能的要求,加快了收斂的速度;另一方面,其具有更好的識別精度,平均識別率達到98.5%。這也說明了提出的算法在小樣本場景下雷達動作識別具有很好的表現(xiàn)。
關(guān)鍵詞:毫米波雷達;時頻分析;FT_SSIM數(shù)據(jù)增強;ICAGA超參數(shù)調(diào)優(yōu)
中圖分類號:TP391文獻標志碼:A
文章編號:1001-3695(2022)04-025-1105-06
doi:10.19734/j.issn.1001-3695.2021.09.0378
Research on radar action recognition method based on FT_SSIM and
ICAGA_CNN in small sample scenes
Jiang Liubinga,b,Pan Boc,Wu Minyangc,Zhu Boqingc,Che Lia,b
(a.School of "Information amp; Communication,b.Key Laboratory of Wireless Broadband Communication amp; Signal Processing in Guangxi,c.School of Computer amp; Information Security,Guilin University of Electronic Technology,Guilin "Guangxi 541004,China)
Abstract:Aiming at the problems of poor training effect,over-fitting phenomenon in human action recognition based on small sample scenarios,slow convergence speed of traditional confrontation generation network,and high requirements for computer performance,this paper proposed solutions from data enhancement and hyperparameter optimization.Firstly,it built the AWR1243 radar data acquisition platform to preprocess the collected echo signals.Secondly,it used STFT for time-frequency analysis and the newly proposed FT_SSIM algorithm for data enhancement.Furthermore,it used the proposed ICAGA_CNN for classification and recognition,and compared the experiments with traditional data enhancement algorithms and hyperparameter optimization.In order to verify the proposed algorithm that has a certain generalization ability,the public KTH human body motion data set and the actual measurement data of radar were used for verification.Experimental results show that,on the one hand,the proposed algorithm effectively avoids the occurrence of over-fitting in small sample scenarios,reduced the requirements of traditional data enhancement on computer performance,and accelerated the speed of convergence.On the other hand,the proposed algorithm has better recognition accuracy,with an average recognition rate of 98.5%.This also shows that the proposed algorithm has a good performance in radar action recognition in small sample scenarios.
Key words:millimeter wave radar;time-frequency analysis;FT_SSIM data enhancement;ICAGA hyperparameter tuning
0引言
由于雷達具有高分辨率、尺寸小、探測距離遠、低功率等優(yōu)點,其被廣泛地應(yīng)用于姿態(tài)識別、安防及醫(yī)療監(jiān)護等領(lǐng)域。基于雷達的人體動作識別研究是目前雷達領(lǐng)域的熱點話題。近些年對于動作識別的研究大多結(jié)合深度學習的方式進行[1~3],這樣就需要大量的標簽樣本。但在醫(yī)療領(lǐng)域或者安防領(lǐng)域數(shù)據(jù)采集難的場景下獲取大量的標簽數(shù)據(jù)就比較困難,且利用小樣本進行訓練容易導致過擬合。因此進一步研究數(shù)據(jù)集擴充算法對動作識別的研究具有重大意義。
由于深度學習具有學習能力強、覆蓋范圍廣、適應(yīng)能力強等優(yōu)點,所以深度學習在雷達人體動作識別的研究中得到了廣泛的關(guān)注。深度學習在分類和預測上具有傳統(tǒng)算法不具備的優(yōu)勢,大大提升了動作識別的性能。文獻[4]利用雷達收集測試人員的動作回波數(shù)據(jù)并轉(zhuǎn)換為時頻圖,然后使用深度學習對時頻圖進行分類。動作識別應(yīng)用于醫(yī)療領(lǐng)域也是一個重要的方面,將雷達應(yīng)用于患者監(jiān)護,選取坐、站立、臥三種姿勢,再結(jié)合深度學習進行分類[5]。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)作為深度學習的一種,由于其對高維數(shù)據(jù)具有很好的表達能力、高識別率等性能,被應(yīng)用于更為廣泛的識別領(lǐng)域。已有研究者對雷達回波進行處理,生成特征譜圖,再通過CNN識別取得了很好的識別效果[6~8]。
深度學習算法雖然具有目標識別準確率高、學習能力強等優(yōu)點,但是它需要大量的數(shù)據(jù)進行訓練。由于雷達數(shù)據(jù)的采集較為煩瑣,尤其在一些高危行業(yè)如醫(yī)療領(lǐng)域和安全領(lǐng)域等,采集數(shù)據(jù)更加困難。在數(shù)據(jù)量缺少的場景下進行訓練容易出現(xiàn)過擬合現(xiàn)象,因此近年來在擴充數(shù)據(jù)集方面也有較多的研究,主要包括隨機裁剪、翻轉(zhuǎn)、旋轉(zhuǎn)、調(diào)節(jié)亮度和對比度、調(diào)節(jié)色度、調(diào)節(jié)圖像飽和度來擴充數(shù)據(jù)集,但是這種方式不能完全避免過擬合現(xiàn)象的發(fā)生。近年來,生成對抗網(wǎng)絡(luò)(generative adversarial network,GAN)被廣泛應(yīng)用于數(shù)據(jù)集生成[9,10],但GAN存在對計算機的性能要求高、迭代次數(shù)多、運行速度慢等缺點。隨著深度學習的進一步發(fā)展,研究者在研究擴充數(shù)據(jù)集的同時也在不斷深入研究小樣本甚至單樣本進行訓練,但是這種識別效果很差[11~13]。因此在小樣本場景下通過數(shù)據(jù)增強的方式避免可能發(fā)生的過擬合現(xiàn)象具有一定的實際意義和應(yīng)用價值。
考慮到目前擴充數(shù)據(jù)集算法生成的圖像在進行分類與識別時識別率較低、收斂速度較慢、對計算機性能要求高等問題的存在,以及在超參數(shù)調(diào)優(yōu)的場景下容易陷入局部最優(yōu)解現(xiàn)象的發(fā)生。本文提出了基于特征變換—結(jié)構(gòu)相似性(feature transformation-structural similarity,F(xiàn)T_SSIM)來進行數(shù)據(jù)增強,同時與傳統(tǒng)的對圖像亮度和對比度調(diào)節(jié)的方式進行數(shù)據(jù)增強以及GAN生成數(shù)據(jù)集進行對比實驗,以此提高模型的泛化能力,防止小樣本數(shù)據(jù)集的過擬合。對于識別模型本文選取了目前比較流行的CNN進行識別,但是它存在大量的超參數(shù)以及權(quán)重需要優(yōu)化,因此本文提出了改進的基于混沌自適應(yīng)遺傳算法優(yōu)化CNN進行超參數(shù)調(diào)優(yōu),并與其他網(wǎng)絡(luò)以及機器學習的方式進行對比。
1相關(guān)理論
1.1短時傅里葉變換
人體動作的雷達回波信號是一個時變非平穩(wěn)信號,回波包含著人體身上多個反射點的信號,其中每一個時間點的回波都有若干個頻率分量。傅里葉變換(Fourier transform,F(xiàn)T)作為一種全局變換的方法無法提取時變非平穩(wěn)信號的時變特征,而利用STFT能夠分析出局部變化特性的復雜信號。常見的時頻分析技術(shù)主要有STFT、小波變換、戈勃展開(Gabor)以及維格納—威利分布(Wigner-Ville distribution,WVD)等[14~17]。為了避免多分量分析過程中交叉項的干擾,本文采用STFT進行信號的時頻分析。STFT是一種典型的線性時頻分析技術(shù),通過對原始信號加窗處理,將非平穩(wěn)信號在一個極短的時間段看成平穩(wěn)信號,從而實現(xiàn)非平穩(wěn)信號轉(zhuǎn)換為多個短時平穩(wěn)信號的疊加,之后再對每個短時的平穩(wěn)信號使用FFT處理,得到頻率隨時間變化的時頻圖。設(shè)原始信號為S(t),則S(t)的STFT如下所示。
STFT(t,f)=∫+∞-∞S(τ)w(τ-t)e-j2πfτdτ(1)
其中:w(t)為窗函數(shù);τ表示時延;f表示頻率。STFT的離散形式為
STFT(m,n)=∑∞k=-∞S(k)w(kT-mT)e-j2π(nfs)kdτ(2)
其中:S(k)表示S(t)的離散形式;m表示采樣點;n表示頻率采樣點;w(k)表示離散窗函數(shù);T表示時間采用間隔;fs表示頻率采樣間隔。
1.2對抗生成網(wǎng)絡(luò)(GAN)
GAN是2014年Goodfellow等人依據(jù)博弈論中納什均衡提出的一種深度學習模型[10],該模型包含了生成器(generator,G)以及判別器(discriminator,D),G主要是利用隨機噪聲去學習真實數(shù)據(jù),經(jīng)過反復迭代不斷趨近真實數(shù)據(jù),對于D主要是判別G生成數(shù)據(jù)的真?zhèn)危珿和D在這種聯(lián)合對抗中達到納什平衡。GAN的結(jié)構(gòu)如圖1所示。
對于判別器來說是一個二分類的模型。其目標函數(shù)為
J(D)=-12Ex∈pdata(x)[ln D(x)]-12Ez∈pz(z)[ln(1-D(G(z)))](3)
其中:E是目標的期望;x是原始數(shù)據(jù);z是隨機噪聲;G(z)是生成數(shù)據(jù)。G和D進行零和博弈,生成器G的目標函數(shù)J(G)=-J(D),則GAN的優(yōu)化問題可以轉(zhuǎn)換為極大極小博弈問題:
minGmaxDV(D,G)=Ex∈pdata(x)[lnD(x)]+Ez∈pz(z)[ln(1-D(G(z)))](4)
GAN的出現(xiàn)解決了使用深度學習算法時標簽數(shù)據(jù)不足的問題,進一步推動了深度學習的發(fā)展。目前,盡管GAN擴充數(shù)據(jù)集被廣泛地應(yīng)用于圖像處理的領(lǐng)域中,但是在雷達信號處理的領(lǐng)域中擴充數(shù)據(jù)集方法的研究卻很少。
1.3結(jié)構(gòu)相似性
從圖像角度判斷兩個圖像相似性的計算方式主要有直方圖匹配、余弦相似度、互信息匹配等,但是對于以上三種判別方式都存在著一些問題。因此本文選取了SSIM的方式作為數(shù)據(jù)增強的模型判別器來比較兩個圖像之間相似度,SSIM主要從亮度、對比度以及結(jié)構(gòu)三者聯(lián)合比較圖像的相似度。原理如下所示。
SSIM(x,y)=[l(x,y)]α[c(x,y)]β[s(x,y)]γ(5)
其中:
l(x,y)=2μxμy+c1μ2x+μ2y+c1
c(x,y)=2σxσy+c2σ2x+σ2y+c2,s(x,y) = σxy+c3σxσy+c3
SSIM是一個0到1的數(shù),越大表示輸出圖像和無失真圖像的差距越小,即圖像質(zhì)量越好。
2改進的系統(tǒng)模型
2.1提出FT_SSIM算法進行數(shù)據(jù)增強
雖然傳統(tǒng)的擴充數(shù)據(jù)集的方法在一定程度上解決了數(shù)據(jù)集缺失的問題,但是其識別效果較差。采用GAN的方法擴充數(shù)據(jù)集雖然可以生成識別效果較好的數(shù)據(jù),但是在計算機性能、迭代次數(shù)和識別時的收斂時間上要求比較苛刻。因此本文準備從圖像的特征入手研究基于結(jié)構(gòu)相似性的特征變換方式擴充數(shù)據(jù)集,達到既防止過擬合,又提高識別精度、降低對計算機的性能要求以及收斂速度快等優(yōu)點。
FT_SSIM主要包含兩個方面,分別是生成器G和判別器D。對于生成器G,本文采取按照比例隨機減少指定特征數(shù)量,再對減少后的圖像特征向量進行圖像重構(gòu)得到一系列的生產(chǎn)數(shù)據(jù)集。最后將重構(gòu)后的圖像輸入到判別器進行判定是否符合需求。生成器模型結(jié)構(gòu)如圖2所示。
對于判別器的設(shè)計,本文選取了SSIM算法來判別生成的圖像與原始圖像的差距。當相似度達到某一個閾值則將圖像進行保留放入數(shù)據(jù)集進行訓練,否則舍去。判別器的結(jié)構(gòu)模型如圖3所示。
對于模型的優(yōu)化,為了將人類的視覺感知納入考量,使用了SSIM損失函數(shù)作為模型優(yōu)化函數(shù),函數(shù)如下所示。
LSSIM(P)=1N∑p∈P1-SSIM(p)(6)
2.2提出ICAGA_CNN識別模型
已有研究表明,CNN是用于圖像分類和識別最有效的方式之一[18]。由于其通過自身的學習能力對訓練數(shù)據(jù)進行特征提取可以得到較好的效果。但CNN也存在許多的問題,其模型中含有大量的超參數(shù)與權(quán)值需要優(yōu)化,這也成為CNN模型亟待解決的問題之一。因此本文提出通過ICAGA優(yōu)化CNN參數(shù)。
2.2.1改進的混沌自適應(yīng)遺傳算法(ICAGA)
目前,參數(shù)調(diào)優(yōu)算法主要有網(wǎng)格搜索、交叉驗證和群體智能算法,但是這些算法對于超參數(shù)優(yōu)化的過程中都有可能出現(xiàn)陷入局部最優(yōu)解的情況。本文提出一種基于改進的混沌自適應(yīng)遺傳算法來對CNN超參數(shù)進行全局調(diào)優(yōu)。自適應(yīng)遺傳算法是對遺傳算法的改進,避免當個體的適應(yīng)度接近種群最大適應(yīng)度時交叉概率和變異概率為0的現(xiàn)象。遺傳算法的交叉概率和變異概率如下:
Pc=pcmax-(pcmax-pcmin)-(f′-favg)fmax-favgf′≥favg
pcmaxflt;favg (7)
Pm=pmmax-(pmmax-pmmin)-(f-favg)fmax-favgf≥favg
pmmaxflt;favg (8)
雖然自適應(yīng)遺傳算法在一定的程度上解決了交叉概率和變異概率停滯不前的狀態(tài),但是在超參數(shù)調(diào)優(yōu)的過程中仍然會陷入局部最優(yōu)解。為了解決此問題,本文引入了混沌算法,將混沌算法與自適應(yīng)算法相結(jié)合對其中具有最高適應(yīng)度的個體給予一定的步長混沌優(yōu)化搜索,解決自適應(yīng)遺傳算法可能陷入局部最優(yōu)解的情況,并加快搜索能力。
cxn+1=μ·cxn·(1-cxn)(9)
2.2.2ICAGA優(yōu)化CNN設(shè)計(ICAGA_CNN)
本文所提ICAGA算法對CNN進行優(yōu)化,流程如圖4所示。
利用ICAGA訓練CNN存在的主要難點是如何將網(wǎng)絡(luò)映射到染色體上、傳統(tǒng)做法是將每個網(wǎng)絡(luò)的參數(shù)作為染色體的一個元素,但是在規(guī)模較大的網(wǎng)絡(luò)結(jié)構(gòu)中使得染色體的結(jié)構(gòu)過于龐大,這就失去了利用改進的自適應(yīng)遺傳算法的意義。因此本文將每一個卷積層和全連接層看做一個整體作為一個染色體,即為每個染色體包含一層所有連接權(quán)值或過濾器所有值。這樣的設(shè)計大大減少了染色體的結(jié)構(gòu)規(guī)模,可以達到更快的收斂速度。結(jié)構(gòu)如圖5所示。
3搭建的人體動作識別系統(tǒng)模型
連續(xù)波雷達在動作識別中有其獨特的優(yōu)勢。它采用連續(xù)波的體制通過在時域上改變發(fā)射信號的頻率,并測量回波信號與發(fā)射信號的頻率差的方法進行測量目標的距離,同時也可以利用多普勒效應(yīng)測量目標的速度。毫米波雷達與其他體制的雷達相比較的優(yōu)勢主要有四點:
a)發(fā)射機功率較低,接收機的靈敏度較高。因此相比于脈沖雷達具有更好的抗干擾能力。
b)由于發(fā)射信號的時寬遠大于目標回波的時延,所以不存在距離的盲區(qū)。
c)具有比較高的距離分辨率。
d)尺寸小、成本小、結(jié)構(gòu)簡單。
基于毫米波雷達進行實驗數(shù)據(jù)采集,由于人體動作的回波信號是一種時變非平穩(wěn)信號,本文對回波信號利用STFT進行時頻分析得到時頻圖。為了應(yīng)對在安防和醫(yī)療領(lǐng)域中數(shù)據(jù)采集困難以及發(fā)生過擬合現(xiàn)象,本文將原始的數(shù)據(jù)集通過傳統(tǒng)的方式、GAN以及新提出的FT_SSIM進行擴充數(shù)據(jù)集,最后提出ICAGA與CNN相結(jié)合的方式對超參數(shù)進行優(yōu)化,并與沒有結(jié)合的CNN、VGG以及其他識別方式進行對比,突出FT_SSIM擴充數(shù)據(jù)集的方式以及ICAGA_CNN模型的優(yōu)越性。本文搭建的毫米波雷達人體動作識別系統(tǒng)如圖6所示。該系統(tǒng)主要由四個部分組成:
a)數(shù)據(jù)的采集與獲取。利用TI公司開發(fā)的AWR1243雷達對十種動作進行數(shù)據(jù)采集。
b)數(shù)據(jù)預處理與時頻分析。對采集的時變非平穩(wěn)回波信號經(jīng)過數(shù)據(jù)預處理后進行STFT時頻分析得到時頻圖。
c)擴充數(shù)據(jù)集。為了防止小樣本場景下動作識別過擬合的發(fā)生以及提高模型的泛化能力,提出了一種新的擴充數(shù)據(jù)集的算法即為FT_SSIM來解決目前擴充數(shù)據(jù)集存在的問題,同時與傳統(tǒng)擴充數(shù)據(jù)集的方式進行對比。
d)智能識別算法研究。常見的超參數(shù)優(yōu)化算法主要有網(wǎng)格搜索、交叉驗證以及群體智能算法。對于群體智能算法主要包括遺傳算法、粒子群算法以及蟻群算法等等,但是這些算法在含有多個極值點的情形下進行超參數(shù)優(yōu)化的過程中可能會陷入局部最優(yōu)解。因此本文提出改進的自適應(yīng)遺傳算法即ICAGA來優(yōu)化CNN進行超參數(shù)調(diào)優(yōu)。
4實驗結(jié)果和性能分析
4.1實驗設(shè)置和數(shù)據(jù)獲取
本次實驗的數(shù)據(jù)采集部分采用的是毫米波雷達的實驗平臺,它是由TI(德州儀器,Texas Instruments)公司開發(fā)的AWR1243雷達傳感器模塊以及DCA1000實時數(shù)據(jù)采集適配器模塊組成。AWR1243是單片的77 GHz和79 GHz頻率調(diào)制連續(xù)波(FMCW)收發(fā)器,主要的優(yōu)點就是功耗低、精確度高。DCA1000評估模塊(EVM)主要為AWR和IWR雷達傳感器EVM的兩通道和四通道低壓差分信號流量提供實時數(shù)據(jù)捕獲和流式傳輸。該雷達硬件開發(fā)平臺附帶PC控制端和數(shù)據(jù)處理軟件,可以實現(xiàn)數(shù)據(jù)的實時采集、傳輸以及數(shù)據(jù)的可視化等功能。AWR1243雷達硬件模塊如圖7所示。
數(shù)據(jù)采集實驗中設(shè)置每個人的動作在3 s內(nèi)完成,采集100幀的數(shù)據(jù),具體雷達參數(shù)設(shè)置如表1所示。
本文的實驗數(shù)據(jù)采集是在室內(nèi)進行,室內(nèi)無其他動目標干擾,有少量桌椅,雷達的天線固定在椅子上,距離地面80 cm,被測模板距離雷達天線的水平距離為2 m數(shù)據(jù)采集場景如圖8所示。動作的采集時間設(shè)置為3 s,一共選取了三位測試者,身高分別是170、173、180 cm。實驗共采集了10種動作回波信號,每個動作由三名測試者重復10次,共采集300組動作回波數(shù)據(jù)。主要包括蹲下后站起、原地跳躍、原地旋轉(zhuǎn)180°、原地旋轉(zhuǎn)360°、擺臂三次、雙手側(cè)平舉、踢腿再放下、行走、坐下、站起。
本文中將10種不同的動作每個動作重復做30次,并進行保存。通過圖9可以看出不同的動作,回波信號存在差異,這表明可以通過分析這種差異對回波信號進行特征提取和分類。
利用AWR1243采集10種動作的回波信號通過STFT進行時頻分析,分別得到了10組動作的時頻圖,如圖10所示。
4.2性能分析
由于對于小樣本場景下數(shù)據(jù)集擴充很少應(yīng)用于雷達信號處理的領(lǐng)域,基于此將本文算法應(yīng)用于雷達采集的人體動作識別的情形下與傳統(tǒng)擴充數(shù)據(jù)集算法以及GAN進行對比。
雷達采集的信號利用STFT轉(zhuǎn)換的時頻圖數(shù)據(jù)集主要包含十種動作的300個圖像數(shù)據(jù)。每個動作類別有30個重復動作,因此該數(shù)量的數(shù)據(jù)集非常適合小樣本數(shù)據(jù)集場景下的研究。
本文提出和改進的模型主要有兩個創(chuàng)新點:a)提出FT_SSIM算法對小樣本場景下為了防止過擬合以及提高模型的泛化能力對數(shù)據(jù)集進行增強處理,同時解決了傳統(tǒng)數(shù)據(jù)增強方式不能很好地提高模型泛化能力的缺點和GAN數(shù)據(jù)增強對計算機性能以及時間要求高的缺陷;b)改進了CNN分類識別算法,提出了ICAGA_CNN算法對CNN中含有的大量超參數(shù)和權(quán)值進行優(yōu)化,提高了CNN的識別性能和效率。
4.2.1傳統(tǒng)方式進行數(shù)據(jù)增強
傳統(tǒng)擴充數(shù)據(jù)集的方式主要有裁剪、旋轉(zhuǎn)、對比度調(diào)節(jié)以及亮度調(diào)節(jié)等方式來進行數(shù)據(jù)增強。本文選取了數(shù)據(jù)集亮度和對比度調(diào)節(jié)的方式擴充數(shù)據(jù)集,效果如圖11所示。
4.2.2GAN進行數(shù)據(jù)增強
GAN是目前對于擴充數(shù)據(jù)集來說比較流行的一種方式。雖然在數(shù)據(jù)增強領(lǐng)域解決了數(shù)據(jù)缺失的問題,但是它對計算機性能要求很高、需要進行多次迭代以及收斂速度慢等缺點。利用GAN迭代1 000次擴充的部分動作數(shù)據(jù)集如圖12所示。
4.2.3FT_SSIM進行數(shù)據(jù)增強
基于傳統(tǒng)擴充數(shù)據(jù)集的方式以及目前比較流行的GAN擴充數(shù)據(jù)集方式的缺陷提出了一種新的方式對數(shù)據(jù)集進行增強,具體如圖13所示。
4.3分類結(jié)果分析
通過原始雷達采集的數(shù)據(jù)集利用傳統(tǒng)的方式、GAN以及新提出的FT_SSIM擴充數(shù)據(jù)集的方式利用CNN與改進的ICAGA_CNN進行識別和分類,同時與其他分類識別算法進行對比實驗,結(jié)果如表2所示。
本文實驗分別利用KTH公開數(shù)據(jù)集與實測數(shù)據(jù)集通過迭代150次實驗來測試算法的有效性。實驗結(jié)果可以發(fā)現(xiàn):a)通過橫向?qū)Ρ劝l(fā)現(xiàn),提出的FT_SSIM算法進行數(shù)據(jù)增強可以提高模型的識別精度;b)利用GAN以及本文提出的FT_SSIM將生成的數(shù)據(jù)相融合后進行訓練,發(fā)現(xiàn)比傳統(tǒng)的數(shù)據(jù)增強算法訓練效果好;c)通過縱向?qū)Ρ菴NN、GA_CNN與ICAGA_CNN發(fā)現(xiàn),提出的ICAGA_CNN具有更好的識別效果;d)對于實測數(shù)據(jù),在利用CNN、GA_CNN以及ICAGA_CNN分別對GAN和FT_SSIM生成的數(shù)據(jù)與原始數(shù)據(jù)融合后進行識別,發(fā)現(xiàn)利用GAN的方式進行數(shù)據(jù)增強與提出的FT_SSIM算法都具有很好的識別精度,最好的識別率分別為95.7%和98.5%。
4.4模型檢驗
對于模型的檢驗,本文利用實測數(shù)據(jù)以及選取了GAN和提出的FT_SSIM擴充數(shù)據(jù)集的方式,分別利用CNN和改進的ICAGA_CNN進行識別分析。本實驗統(tǒng)一設(shè)置的迭代次數(shù)為150次,分別探討所提出算法隨著迭代次數(shù)的增加,準確率、損失率以及收斂速度的變化情況。分析結(jié)果如圖14所示。其中藍色曲線表示訓練結(jié)果,黃色曲線表示驗證結(jié)果(見電子版)。
通過圖14(a)~(c)對比發(fā)現(xiàn),數(shù)據(jù)增強后再進行識別具有更好的識別率,通過(b)(c)可以直觀地發(fā)現(xiàn),利用GAN擴充數(shù)據(jù)集的方式與本文提出的FT_SSIM都具有很好的分類效果且損失較小;(d)~(f)對比可以發(fā)現(xiàn),利用ICAGA優(yōu)化CNN不僅可以在一定程度上提高識別精度,也可以得到較低損失;再通過(e)(f)知道,雖然兩種方式都具有很好的識別效果,但是圖(e)的收斂速度太慢,而且對計算機的性能要求也很高。因此,基于FT_SSIM算法擴充數(shù)據(jù)集,再結(jié)合改進的ICAGA_CNN進行分類與識別的方法明顯優(yōu)于其他擴充數(shù)據(jù)集和分類與識別的方法,并且經(jīng)過實驗驗證具有很高的識別效果。
4.5實驗總結(jié)
針對本文的數(shù)據(jù)采集、實驗設(shè)計及對比實驗主要分為以下幾個步驟:
a)基于TI的AWR1243雷達采集卡搭建人體動作數(shù)據(jù)采集架構(gòu),實驗中設(shè)計了10種人體動作,每種動作采集30組,一共300組實驗數(shù)據(jù)。
b)通過實驗發(fā)現(xiàn),小樣本場景下進行識別容易發(fā)生過擬合以及泛化能力較差的情況,現(xiàn)有的數(shù)據(jù)增強方式收斂速度慢、且對計算機的性能要求比較高等,基于此提出了FT_SSIM算法對數(shù)據(jù)進行增強。生成器采用隨機降維特征變換,再進行二維重構(gòu),判別器采用SSIM算法與原始圖像對比達到閾值則保留,如圖2、3所示。
c)對于網(wǎng)絡(luò)訓練中含有多個極值點容易陷入局部最優(yōu)解的情況,提出了混沌算法與自適應(yīng)遺傳算法相結(jié)合的方式來對網(wǎng)絡(luò)進行優(yōu)化,采用將每一個卷積層和全連接層看做一個整體作為一個染色體,即為每個染色體包含著一層的所有連接權(quán)值或者過濾器所有值,這樣網(wǎng)絡(luò)的規(guī)模就得以大大的縮減。
d)利用公開的KTH人體動作數(shù)據(jù)集對以上提出的算法從損失、精確度、耗時三個方面對本文算法與傳統(tǒng)的算法進行對比,結(jié)果如表2所示。
e)用實測數(shù)據(jù)對本文算法進行驗證,結(jié)果如表2所示。
5結(jié)束語
本文提出了一個新的FT_SSIM算法來對某些缺乏數(shù)據(jù)集的領(lǐng)域進行數(shù)據(jù)增強。通過實驗驗證,提出的算法不僅可以很好地解決過擬合現(xiàn)象,且具有對計算機性能要求較低、收斂速度較快等優(yōu)勢。此外,在動作識別方面,本文提出了ICAGA算法與CNN相結(jié)合的方式,來對CNN的超參數(shù)進行優(yōu)化。實驗結(jié)果表明,與先有的研究相比,本文所提出的算法具有更高的準確率和實用性。
在本文中主要研究的是基于毫米波雷達在小樣本場景下單個動作的識別方法,下一步主要研究基于毫米波雷達的人體連續(xù)的多個組合動作的識別方法以及基于激光雷達點云的人體動作三維重建及識別。
參考文獻:
[1]侯春萍,蔣天麗,郎玥,等.基于卷積神經(jīng)網(wǎng)絡(luò)的雷達人體動作與身份多任務(wù)識別[J].激光與光電子學進展,2020,57(2):113-121.(Hou Chunping,Jiang Tianli,Lang Yue,et al.Multi-feature fusion human behavior recognition algorithm based on convolutional neural network and long short-term memory neural network[J].Progress in Laser and Optoelectronics,2020,57(2):113-121.)
[2]李宏坤,周帥,黃文宗.基于時頻圖像特征提取的狀態(tài)識別方法研究與應(yīng)用[J].振動與沖擊,2010,29(7):184-188.(Li Hongkun,Zhou Shuai,Huang Wenzong.Research and application of state recognition method based on time-frequency image feature extraction[J].Journal of Vibration and Shock,2010,29(7):184-188.)
[3]蔣留兵,魏光萌,車俐.基于字典學習的77GHz雷達人體動作識別[J].科學技術(shù)與工程,2020,20(6):2317-2324.(Jiang Liubing,Wei Guangmeng,Che Li.Human motion recognition by 77 GHz radar based on dictionary learning[J].Science Technology and Engineering,2020,20(6):2317-2324.
[4]Kim Y,Ling H.Human activity classification based on micro-Doppler signatures using a support vector machine[J].IEEE Trans on Geoscience amp; Remote Sensing,2009,47(5):1328-1337.
[5]Kiasari M A,Na S Y,Kim J Y.Classification of human postures using ultra-wide band radar based on neural networks[C]//Proc of International Conference on IT Convergence amp; Security.Piscataway,NJ:IEEE Press,2014:1-4.
[6]Kim Y,Moon T.Human detection and activity classification based on micro-Doppler signatures using deep convolutional neural networks[J].IEEE Geoscience and Remote Sensing Letters,2016,13(1):8-12.
[7]Zhang Jiajun,Tao Jinkun,Shi Zhiguo.Doppler-radar based hand gesture recognition system using convolutional neural networks[C]//Proc of the 6th International Conference on Communications,Signal Processing,and Systems.Berlin:Springer,2017:1096-1113.
[8]Kim B K,Kang H S,Park S O.Drone classification using convolutional neural networks with merged Doppler images[J].IEEE Geoscience and Remote Sensing Letters,2017,14(1):38-42.
[9]Doherty H G,Cifola L,Harmanny R I A,et al.Unsupervised learning using generative adversarial networks on micro-Doppler spectrograms[C]//Proc of the 16th European Radar Conference.Piscataway,NJ:IEEE Press,2019:197-200.
[10]Goodfellow I J,Pouget-Abadie J,Mirza M,et al.Generative adversarial nets[C]//Proc of the 27th International Conference on Neural Information Processing Systems.Cambridge,MA:MIT Press,2014:2672-2680.
[11]蔣留兵,周小龍,車俐.基于無載波超寬帶雷達的小樣本人體動作識別[J].電子學報,2020,48(3):188-201.(Jiang Liubing,Zhou Xiaolong,Che Li.Small sample human action recognition based on carrier-free ultra-wideband radar[J].Chinese Journal of Electronics,2020,48(3):188-201.)
[12]Li Feifei,F(xiàn)ergus R,Perona P.One-shot learning of object categories[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2006,28(4):594-611.
[13]雷相達,王宏濤,趙宗澤.基于遷移學習的小樣本機載激光雷達點云分類[J].中國激光,2020,47(11):1110002.(Lei Xiangda,Wang Hongtao,Zhao Zongze.Small sample airborne lidar point cloud classification based on transfer learning[J].Chinese Journal of Lasers,2020,47(11):1110002.
[14]Duan Lili,Li Jie,Ji Hongfei,et al.Zero-shot learning for EEG classification in motor imagery-based BCI system[J].IEEE Trans on Neural Systems and Rehabilitation Engineering,2020,28(11):2411-2419.
[15]Wang Yuegang,Ji Shao,Xu Hongtao.Non-stationary signals proces-sing based on STFT[C]//Proc of the 8th International Conference on Electronic Measurement and Instruments.Piscataway,NJ:IEEE Press,2007:3-301-3-304.
[16]See Y C,Noor N M,Low J L,et al.Investigation of face recognition using Gabor filter with random forest as learning framework[C]//Proc of TENCON-IEEE Region 10 Conference.Piscataway,NJ:IEEE Press,2017:1153-1158.
[17]Pelluri S G,Sreenivas T V.Parameter estimation of a moving acoustic source:linear chirplet transform vs WVD[C]//Proc of the 23rd National Conference on Communications.Piscataway,NJ:IEEE Press,2017:1-6.
[18]于凌濤,夏永強,閆昱晟,等.利用卷積神經(jīng)網(wǎng)絡(luò)分類乳腺癌病理圖像[J].哈爾濱工程大學學報,2021,42(4):567-573.(Yu Lingtao,Xia Yongqiang,Yan Yusheng,et al.Using convolutional neural network to classify breast cancer pathological images[J].Journal of Harbin Engineering University,2021,42(4):567-573.)
收稿日期:2021-09-14;修回日期:2021-11-09基金項目:國家自然科學基金資助項目(61561010);廣西創(chuàng)新驅(qū)動發(fā)展專項(桂科AA21077008);廣西重點研發(fā)計劃資助項目(桂科AB18126003,AB18221016)
作者簡介:蔣留兵(1973-),男,江蘇泰興人,研究員,碩導,主要研究方向為雷達信號處理;潘波(1993-),男(通信作者),安徽淮南人,碩士研究生,主要研究方向為人體動作識別(1115916862@qq.com);吳岷洋(1998-),男,江蘇南通人,碩士研究生,主要研究方向為雷達動作識別;朱柏青(1998-),男,安徽淮北人,碩士研究生,主要研究方向為手勢識別;車俐(1977-),女,高級實驗師,碩導,主要研究方向為毫米波雷達.