999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于無線感知和集成學習的人流量監測方法

2022-11-25 07:26:34楊志勇王環環
計算機工程與設計 2022年11期
關鍵詞:方法模型

楊志勇,王環環,劉 燦

(南昌航空大學 軟件學院,江西 南昌 330063)

0 引 言

目前,人流量監測方法可以分為基于圖像和非圖像的兩大類。基于圖像的方法通常需要對圖像進行處理以提取頭肩特征,進而實現對人員的統計及人流量監測。例如,文獻[1]利用圖像的顏色和深度信息識別頭部實現人流量統計,文獻[2]提出在靜態圖像中進行人群計數的新方法。然而,基于圖像的方法也存在一些問題,比如存在盲區、易受光線影響、擁擠場景識別困難等。非圖像的方法根據采用的感知技術不同,有傳統閘機、傳感器和無線信號感知的方法3類。閘機最為常見,其簡單可靠、能精確統計,但通行效率低。基于傳感器的方法中,主要采用壓敏傳感器[3]和紅外傳感器[4,5],該類方法有一定的適用范圍,后期維護不易。近年來,目標手持設備的接入信息[6]、接收信號強度[7](received signal strength,RSS)、信道狀態信息(channel state information,CSI)[8]也被用于人流量監測,此類方法要求目標攜帶設備。最新的人流量監測方法是采用被動無線感知技術,利用WiFi設備[9]、無線傳感網絡[10]的無線信號構建監測系統。本文研究利用無線傳感網絡各節點之間無線鏈路的RSS信號和機器學習算法進行人流量監測。該方法首先構建對無線感知網絡以采集的RSS信號,然后利用支持向量機、梯度提升迭代決策樹、XGBoost和邏輯回歸算法構造兩層集成學習分類器,以識別通過監測網絡的瞬時人數,最后利用連續的識別累積實現人流量監測。此方法大幅度提升了人流量監測的精度,達到94.29%。

1 基于射頻信號強度的人流量監測模型

本文提出的基于射頻信號和集成學習的人流量監測方法包括3個部分:數據采集、特征提取和人流量監測模型,基于射頻信號的人流量監測方法框架如圖1所示。

圖1 基于射頻信號的人流量監測方法框架

1.1 數據采集及預處理

在一個“門”形框架上部署若干個物聯網節點,構建無線感知網絡。節點以輪詢廣播的方式進行無線通信,每一個節點接收所有廣播消息以獲取該無線鏈路的RSS值,并將其放入消息包中。所有節點都廣播一次無線消息為一個采樣周期。Sink節點偵聽網絡所有通信,并將偵聽到的數據包通過串口傳到電腦端進行后續處理。預處理包括對原始數據進行物理RSS值的轉換和對缺失節點數據的處理。

1.2 特征提取

考慮到硬件采集到的原始數據過多且存在噪聲,不適合直接用機器學習算法進行處理,需要對原始信號進行特征提取,特征提取過程分為兩個步驟:首先,根據節點的部署選取有效鏈路;然后,將有效鏈路的測量值與其空環境時的基準值做差,得到有效鏈路因行人的陰影衰落效應導致的接收信號強度的衰減值,并將其作為特征值。

若一個無線射頻網絡由K個節點組成,所有節點均可相互通信,從1號節點到K號節點依次發射一個廣播消息形成一個完整的采樣周期。當一個采樣周期結束,每個節點理論上都能收到 (K-1) 個信息包,網絡中共有L=K(K-1)/2條不區分方向的無線鏈路。然而,在人流量監測的實際過程中,有些無線鏈路的視距路徑沒有穿越行人可能通過的空間,也就不會因行人的經過而發生陰影衰落,本文將這些鏈路定義為無效鏈路。無效鏈路的RSS值對人流量識別及統計沒有幫助,需要根據節點的部署將其剔除。剩余的那些視距路徑穿越了“門”下區域的各條鏈路,當行人經過時有可能產生陰影衰落,這些鏈路被視為有效鏈路。有效鏈路動態監測時的實測RSS值與靜態空環境時的基準RSS值的差值是該鏈路受人體影響的衰減值,本文將全體有效鏈路衰減值構成的RSS向量作為特征值。

1.3 模型建立

人流量監測模型基于兩層集成機器學習[11,12]算法構建。首先,將帶有標簽的不同人數通過監測區域時的RSS值作為機器學習算法的輸入,分別用支持向量機、梯度提升迭代決策樹和XGBoost(extreme gradient boosting)算法訓練出3個初級分類器;然后,將3個初級分類器的輸出類概率作為次級學習器——邏輯回歸算法的輸入,構建基于“學習型”集成思想的瞬時人數識別模型;最后,將基于兩層集成學習分類器判斷的瞬時人數在時間上累計,實現人數的統計和人流量監測。詳細算法將在下節描述。

2 人流量監測算法

分別利用支持向量機、梯度提升迭代決策樹和XGBoost機器學習算法建立了3個初級分類器,并利用集成思想建立融合模型得到最終的人流量監測算法模型。

2.1 支持向量機

支持向量機(support vector machine,SVM)是基于統計學習理論提出的一種方法。基于統計學習理論,根據結構風險最小化的原則建立模型庫,在有限樣本條件下得到的決策規則對獨立測試數據集的期望風險仍然較低。SVM的訓練過程是在高維空間中尋找最優的超平面來分割數據[13]。

以二分類問題為例,存在訓練樣本集D={(x1,y1),(x2,y2),…,(xn,yn)}。 其中yi∈{-1,+1}, SVM方法是通過尋找一個最優分類超平面,將D中的樣本按各自特征進行分類。分類超平面為wTx+b=0, 其中w是確定超平面的法向量,b決定了超平面到原點的距離。因此,SVM的基本公式如式(1)所示

(1)

如果輸入向量是線性可分的,那么所有的樣本都可以被劃分到分離超平面的正確邊,且邊界至少為1。然而,如果輸入向量不是線性可分的,就不能用線性分類來處理這些向量。需要利用核函數將輸入向量映射到高維空間,從而將低維空間的非線性可分性問題轉化為高維空間的線性可分性問題。通過尋找分類超平面來實現分類的目的。核函數如式(2)所示

K(xi,xj)=〈φ(xi)·φ(Xj)〉

(2)

φ是一個從X到內積特征空間的映射。任何滿足Mercer條件的函數都可以看作是一個內核函數。選擇不同的核函數會生成不同的模型,核函數的選擇會影響SVM的分類結果和機器學習能力。常見的核函數有多項式核函數、徑向基核函數、拉普拉斯核函數和Sigmoid核函數等。本文通過實驗選擇多項式核函數作為SVM的核函數對實驗數據進行處理,其公式為

(3)

由于本文研究的人流量監測是多分類問題,而SVM最初用于二分類問題,因此,需要構造多個SVM解決多分類問題。本文采用“一對其余”的構造方法對n分類問題構建n個支持向量機,每個支持向量機負責區分本類數據和非本類數據。

2.2 GBDT

梯度提升迭代決策樹(gradient boosting decision tree,GBDT)是集成學習家族中的一員,GBDT通過多輪迭代,每次迭代都會生成一個弱分類器,每個分類器會都會根據之前分類器與真實數據的殘差進行擬合訓練,使得殘差越來越小,等達到迭代次數之后就停止迭代[14,15]。GBDT在迭代過程中,每次迭代的弱分類器為CART樹,其模型結構如圖2所示。

圖2 GBDT模型結構

GBDT與Bagging的均勻采樣思想不同,GBDT的各輪訓練集與之前各輪迭代學習結果有關,通過減少殘差來提高最終分類器的精確度。每次迭代過程中會有一些數據點被錯分,因此,可以降低被正確分類的數據點的權重而提高被錯分數據點的權重,使得錯分的數據點得到更多的關注。當迭代停止時,會得到迭代輪數一致的分類器,然后將它們組合即可得到最終的分類模型。GBDT算法流程如下:

(1)初始化模型f0(x), 即初始化弱分類器,公式如下

(4)

(2)計算損失函數的負梯度來近似損失,如式(5)所示

(5)

GBDT通過計算rti就可以得到新的樣本數據集 [(xi,ric),i=1,2,…,N]。 我們可以將這個數據集當作新的訓練集來擬合CART樹。新的樹模型由節點Rjc(j=1,2,…,J) 組成。

對每個葉子節點,需要最小化損失函數,如式(6)所示

(6)

然后,可以得到如下的擬合的決策樹

(7)

最終的輸出模型為

(8)

2.3 XGBoost

XGBoost是一種有效的樹模型增強方法,多棵樹的線性組合可以很好地擬合訓練數據,描述輸入和輸出數據之間復雜的非線性關系[16]。模型的基本型如式(9)所示

(9)

(10)

(11)

其中,gi和hi分別是損失函數的一階和二階梯度統計。通常無法枚舉所有可能的樹結構來選取最優,因此可以采用貪婪算法來代替,如從單個葉節點開始,迭代分裂給樹增加節點。節點分裂前后的增益為

(12)

2.4 集成學習算法

模型融合方法是機器學習分類問題和回歸問題的一種有效方法,而模型融合方法常用的框架是集成學習,其主要思想是利用前一層機器學習模型的學習輸出結果作為下一層模型的輸入變量[17]。集成學習常用的兩大類是Bagging和Boosting[18-20]。本文采用“學習型”結合策略的集成思想,即先從初始訓練集訓練出初級學習器,然后“生成”一個新數據集用于訓練次級學習器。在這個新數據集中,初級學習器的輸出被當作樣例輸入特征,而初始樣本的標記仍被當作樣例標記。在訓練階段,采用交叉驗證方式來訓練初級學習器未使用的樣本來產生次級學習器的訓練樣本。

在我們設計的人流量監測系統中,使用了兩層集成學習模型,結構如圖3所示。第一層使用了3個常用模型:SVM、GBDT和XGBoost。第一層使用較復雜的分類器可以學習到RSS衰減值中隱含的更深層的特征。我們將所有數據分成訓練集和測試集,對訓練集做五折交叉驗證,其中四折用于訓練分類器,另一折數據作為驗證集。通過對3個分類器分別交叉驗證,得到3個初級分類器的輸出,將其合并后作為第二層分類器的訓練集。在第二層,采用邏輯回歸算法,LR經過3個初級分類器得到的訓練數據集訓練之后,用測試集評估Stacking集成學習算法的性能。

圖3 人流量監測模型

3 實驗與結果

本節介紹實驗設置、數據處理及集成學習算法模型的性能評估。

3.1 實驗設置

實驗環境如圖4所示。本實驗利用18個自制CC2530節點和一個金屬支架組成門框。門框上等距分別部署5個節點,上方的門梁上部署10個節點。門架寬2.4 m,高2.0 m。匯聚節點放置在離監測點約5 m遠的地方,并與PC通過虛擬串口連接,實驗時將偵聽到的RSS數據包傳到電腦進行后續處理。

圖4 實驗環境

3.2 數據采集與預處理

傳感器節點組成一個無線傳感網絡,以輪詢的方式依次發送數據。某個節點發送數據時,其它感知節點均接收此消息,但對消息包不做任何處理,只是獲取此次通信的RSS值并存儲到數組中對應的位置,等到自己發送消息時將該RSS數組封裝到消息包中發送出去。匯聚節點偵聽接收來自無線傳感網絡所有節點的消息包,提取其RSS值數組并傳輸到PC機存儲。

數據采集與預處理流程是:①數據采集。通過搭建的無線傳感網絡進行實驗數據的采集;②數據缺失處理。由于少量丟包現象導致個別采樣周期數據不完整,采用歷史值填充的方法進行缺失處理;③進制轉換。將十六進制RSS數據轉換為十進制;④RSS物理值提取。將從CC2530節點寄存器讀出的接收信號強度指示(received signal strength indication,RSSI)的原始數值,轉換為物理接收信號強度(dBm);⑤計算鏈路衰減值。將監測時的鏈路值減去空環境時的鏈路基準值,得到監測時的鏈路衰減值。

3.3 有效鏈路與特征提取

主要考慮行人是否對鏈路有影響,提取出受行人影響的鏈路,舍棄不會因行人而產生陰影衰落效應的鏈路。由圖5可知1到5號節點分別與6到18號節點組成有效鏈路,6到13號節點與14到18號節點組成有效鏈路,則有效鏈路總共有105條。

圖5 節點以及鏈路分布

3.4 實驗結果

分別采集了靜態實驗和動態實驗的數據作為數據集。靜態實驗先后有5名研究生參與,共采集包括1個人的場景600組數據、2個人場景540組數據、3個人場景1440組數據。動態實驗采集了人流量較少和人流量較大兩種情況各3個連續時間段的數據,每段持續5 min。靜態實驗數據用于模型訓練和驗證,動態環境實驗數據只用于模型算法驗證。

(1)初級學習器調參優化

在訓練第一層的3個初級分類器時,需要先通過訓練設置最優參數。為了評估分類性能,我們使用精度(Accuracy)性能度量,精度是指分類正確的樣本數占樣本總數的比例。公式如式(13)所示

(13)

核函數對于SVM非常重要,采用不同的核函數會對實驗模型帶來不同的效果。我們對4種常見的核函數采用交叉驗證法來尋找最優核函數。表1顯示了不同核函數對應模型的準確率。

表1 不同核函數對模型準確率影響

從表1可以看出,在4種常用的核函數中,線性核函數的準確率最高,因此我們選擇線性核函數作為SVM的核函數對實驗數據進行分類。

GBDT模型有兩個重要參數,一個是學習器的最大迭代次數,最大迭代次數太小模型容易欠擬合,太大又會過擬合;另一個參數是步長,較小的步長意味著需要更多的迭代次數。兩個參數相互影響。表2為兩個參數不同取值時對應的準確率。

表2 不同參數對GBDT模型準確率影響

從表2實驗結果可以看出,當步長取0.6、最大迭代次數取150時模型的準確率最高,故將其選為最優參數。

XGBoost有兩個重要參數,第一個參數是樹的最大深度,為了防止出現過擬合,最大深度不能設置的太大。第二個參數為“gamma”,此參數指定了節點分裂所需的最小損失函數下降值,參數越大,模型越保守。這兩個參數都與模型建立有很重要的關系,使用交叉驗證法進行參數的選擇。表3為不同參數和對應的準確率。

表3 不同參數對XGBoost模型準確率影響

從表3可以看出,當最大深度取值為2和gamma=0.1時模型的準確率最高,故將其選為最優參數。

(2)集成學習模型性能評估

將3個初級分類器和Stacking集成學習器在實驗數據集上5折交叉驗證的精度進行對比,結果如圖6所示。圖6的實驗結果表明:集成學習模型方法相比于SVM、GBDT和XGBoost更穩定。

圖6 模型精度對比

與基于機器視覺類的方法對比意義不大,因此,本文只選擇了與同樣基于RSS信號的文獻[10]提出的隱馬爾可夫模型方法對比,結果見表4。可以看出融合模型方法的精度更高,達到94.29%的準確率,顯著高于文獻[10]中的平均準確率75.63%。

表4 不同模型平均精度對比

ROC曲線是模型性能評價的常用方法,ROC曲線的面積越大代表著模型的性能越好。圖7給出了兩層集成學習分類器模型和獨立分類器的ROC曲線對比。從圖7可以看出,集成學習模型方法相較于其它3個獨立的分類器ROC面積更大,性能更優。

圖7 模型ROC對比

以上實驗結果表明:集成學習模型方法的平均精度和ROC面積值相較于其它3個單獨的分類器更高,即融合模型方法的性能要優于單個的分類器和已有的基于RSS的方法。

4 結束語

本文提出了一種基于無線傳感網絡射頻信號和Stacking集成機器學習算法的行人流量監測系統方法。該方法利用行人對射頻信號的陰影衰減效應,提取有效射頻鏈路的RSS的衰減值作為特征向量,采用“學習型”策略訓練得到一個包括SVM、GBDT、XGBoost和邏輯回歸的兩層集成學習Stacking識別模型。實驗結果表明,該方法可以達到94.29%的行人流量監測精度,驗證了本文所提出的人流量監測方法的有效性。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 午夜视频在线观看免费网站| 在线综合亚洲欧美网站| 色成人综合| 福利在线免费视频| 一级看片免费视频| 99久久这里只精品麻豆| 欧美福利在线| 91福利免费视频| 五月天综合网亚洲综合天堂网| 色婷婷久久| 2020国产精品视频| 欧美在线导航| 色综合久久88| 国产精品自在拍首页视频8 | 91激情视频| 精品成人免费自拍视频| 国产91av在线| 国产精品久久久久久搜索| 无码国内精品人妻少妇蜜桃视频| 99热这里只有成人精品国产| 91网在线| 国产自在线拍| 99视频精品全国免费品| 欧美日韩亚洲综合在线观看 | 国产人人乐人人爱| 国产高清不卡| 精品人妻无码中字系列| 99久久免费精品特色大片| 久久熟女AV| 国产视频大全| 欧美日本不卡| 99国产在线视频| 国产99热| 亚洲一区免费看| 99尹人香蕉国产免费天天拍| 尤物精品国产福利网站| jizz国产在线| 美美女高清毛片视频免费观看| 久久精品电影| 国产精品永久免费嫩草研究院 | 欧美v在线| 中文字幕首页系列人妻| 亚洲男人的天堂久久香蕉| 免费看a级毛片| 欧美成人午夜在线全部免费| 国产麻豆福利av在线播放| 日韩AV无码免费一二三区 | 国产av一码二码三码无码| 欧美精品一区二区三区中文字幕| 国产精品久线在线观看| 中文字幕日韩久久综合影院| 91福利免费视频| 91网站国产| 久草视频中文| 亚洲欧洲日产无码AV| 亚洲国产系列| 日韩小视频网站hq| 一级做a爰片久久毛片毛片| 国产午夜精品鲁丝片| 狠狠色丁香婷婷综合| 国产精品开放后亚洲| 成年A级毛片| 国产男女免费视频| 极品国产一区二区三区| 无码综合天天久久综合网| 亚洲av无码片一区二区三区| 久热中文字幕在线| 国产精品自在线拍国产电影| 很黄的网站在线观看| 国产精品亚洲一区二区三区z| 特级毛片8级毛片免费观看| 久久6免费视频| 国产迷奸在线看| 中文字幕66页| 亚洲国产高清精品线久久| 午夜小视频在线| 久久免费观看视频| 手机在线免费毛片| 中文字幕中文字字幕码一二区| 免费无码在线观看| 国产一区二区三区夜色| 日本免费新一区视频|