孫振浩,張殿生,董嫘嫘,張 政,阮士峰
(1 武漢科技大學資源與環境工程學院 湖北 武漢 430000)
(2 安陽工學院飛行學院 河南 安陽 455000)
近年來,隨著人們生活質量的不斷提升,民航客機在交通運輸中的比重逐步上升。 民航飛行安全成為人們日益關注的話題。 機場作為提供飛機安全、有序、高效運行的場所,其安全性在飛行安全中占有極大比重。 《民用運輸機場安全保衛設施》(MH/T7003-2017)[1]于2017 年頒布,規定需在飛機活動區域周邊建設與公眾活動區相分離的實體邊界和輔助設施,并且提出了推進以人臉識別技術為代表的智能化機場建設的要求。 同時,文件[1]中還提出視頻監控系統在大場景跟蹤、卡口等場景下的目標檢測和識別需要達到新的高度。
傳統的機場周界監測技術包括:監控探頭、振動電纜、脈沖電子柵欄、紅外成像、地下電纜探傷等[2]。 傳統監控技術可以有效地防止異物入侵,提高機場的安全性,可以在一定程度上實現監測功能,有效的防止異物入侵,但也存在各種各樣的局限性,如監視器必須要有安保人員全天候實時查看,且不能自動發出警報;振動電纜易于翻越,易受到氣候及其他因素的干擾而產生誤報;具有穩定性和魯棒性較差、誤檢率高和實時性較差等缺點。
因此,如何有效防止機場周界異物入侵事件的發生成為機場安全管理領域的重點研究課題,本文在機場周界場景的基礎上,梳理和總結現有的入侵檢測技術,重點從檢測速度和精確度兩個角度出發,對基于深度學習的各種入侵檢測方法進行介紹。
機場周界異物入侵指的是不屬于機場內部的外來人員或物品,如不明飛行物、無關人員等,以非常規途徑進入機場周界以內,或出現在不該出現的位置,如飛鳥沖入跑道、旅客誤入禁區等,直接或間接地對機場的安全性造成較大影響。 基于機場周界場景下的入侵檢測指的是結合監控設施,應用各種目標檢測算法,對所有的目標進行實時檢測,并對其進行分類和識別。 判斷發生異物入侵的可能性,可能性大于閾值則立刻發出警報并實時監控其位置及行為信息以保障機場起飛、降落等功能的正常運行。 基于機場周界場景下的入侵檢測主要存在以下問題和挑戰:
(1)機場周界區域空間巨大,監控設施無法全方位無死角覆蓋。
(2)機場周邊及其附近人員組成復雜,極難判斷是否為非法分子闖入。
(3)機場空域為視野開闊的開放區域,背景變化較快,無法有效識別目標對象。
(4)在夜間監控光照條件較差,且由于區域過大,視頻中小物體對象較多。
除去監控設施無法全面覆蓋不談,良好的入侵檢測算法可以很好地克服以上困難和挑戰。 傳統的入侵檢測方法大致可以分為基于特征和基于分割的入侵檢測方法,基于特征的入侵檢測指的是通過人為設計檢測目標的相關特征,將圖片或視頻序列放入算法中進行特征提取,從而判斷是否發生入侵,人為設計的主要特征有尺度不變特征[3](scale-invariant feature transform, SIFT)、梯度直方圖特征[4](histogram of oriented gradients, HOG)和局部二值模式[5](local binary patterns, LBP)等。 而基于分割的入侵檢測指的是通過對圖像顏色、邊緣及區域等進行分割,從而對圖像進行檢測和識別。 在入侵檢測早期,傳統的入侵檢測方法確實能夠節省部分人力、物力,但由于機場周界環境的復雜性,時常有大量旅客進入機場或者機場與其所屬空域有飛鳥經過,傳統的入侵檢測算法檢測速度較慢且無法有效地判斷是否發生入侵。 而基于卷積神經網絡的入侵檢測算法能夠快速準確地對機場周界場景下的目標進行檢測。
自從Alexnet 在2012 ImageNet 圖片分類比賽中獲得了冠軍,人們逐漸意識到,利用深度學習抽取特征比手工設計的方法更加高效。 因此,基于卷積神經網絡[6-7](convolutional neural network, CNN)的入侵檢測方法逐漸被人們所接受,并不斷地優化網絡結構以增強其性能。
2014 年GIRSHICK 等[8]研發出首個基于CNN 框架的入侵檢測算法RCNN,標志著目標檢測算法的發展進入了新紀元。 RCNN 系列的基本思路是:首先在圖像中隨機產生大量的候選框,利用CNN 對候選框進行卷積操作以達到對目標特征提取的目的;其次把所抽取的特征輸入支持向量機,經過多次卷積和池化操作后,最后輸出目標種類、邊界框等信息,大致流程如圖1 所示。 RCNN 的成功將大量研究人員的目光吸引到基于卷積神經網絡的目標檢測算法上,之后又先后提出了空間金字塔池化網絡(spatial pyramid pooling network, SPPNet) 、RCNN 的升級版Fast RCNN 和Faster RCNN。 RCNN 系列總結如表1 所示。

圖1 RCNN 流程圖
現有的機場周界的監控視頻1 s 有25 幀或者60 幀,雖然Faster RCNN 的檢測速度相比之前有了大幅度提高,但距離達到實時檢測目標還是略有差距。 因為基于RCNN 發展的一系列入侵檢測方法都是先進行候選框提取,后分類檢測的兩階段檢測方法,其復雜的網絡結構限制了檢測速度的提升。
YOLO[12-16]算法一經問世就迅速地引起了全球范圍的廣泛關注,其中2015 年發出的YOLOv1 是真正意義上第一個端對端檢測算法,YOLO 系列的主要思想就是把對目標的檢測問題轉換成一個簡單的線性回歸問題,可以把任何大小的圖像直接輸入到網絡中,經過檢測識別后,得到目標的類別和位置信息。
隨著近年來的不斷發展,YOLO 已經從最初的v1 版本發展至YOLOv5 甚至是YOLOvx。 其中YOLOv5 可以稱作是巔峰之作。 YOLOv5 的網絡結構是由輸入端、Backbone、 Neck、 Transformer 預測結構( Transformer prediction head, TPH)和輸出端構成[16]。 圖片自輸入端進行預處理后傳輸至Backbone,經由Neck 模塊進一步提取特征后,最后傳輸至TPH 進行圖像邊界框和目標種類的回歸,得出最后結果。 如圖2 所示即為基于YOLOv5 對機場周界環境下的異物入侵進行檢測的示范圖。

圖2 YOLOv5 檢測示范圖
SSD 是LIU 等[17]在2016 年提出的檢測算法。 相對于Faster RCNN 來說,在速度上有很大的優勢;和YOLO 相比,在均值平均精度(mean of average precision, mAP)上也有很大的優勢。 與YOLO 類似,SSD 將檢測問題轉換為一個簡單的回歸問題,實現了對目標進行一次定位與分類。和YOLO 不同的是,SSD 同樣繼承了Faster RCNN 中的先驗框(Anchor)思想,選用回歸候選框思路,提高檢測速度和檢測精度。
目前能夠對入侵檢測性能評估的數據集有很多,表2對典型的目標檢測算法進行了性能評估。

表2 典型目標檢測算法性能對比
結合機場周界場景下的異物入侵檢測問題,本文從VOC07/12 數據集挑選部分圖片對YOLOv5 和SSD 進行訓練,客觀評價哪種算法適用于機場周界異物入侵檢測系統,部分數據集和性能對比如圖3 所示。

圖3 部分數據集(上)和性能對比圖(下)
在基于機場周界的場景下,當檢測任務較重時,YOLOv5 算法表現出良好的性能,意味著當有外來人員進入非工作人員禁止進入的區域或者有飛鳥進入機場區域時,YOLOv5 能夠更高效地進行識別并發出警報。
基于卷積神經網絡的入侵檢測算法具有魯棒性較好、誤報率低、實時性較強等優點。 對機場周界場景下的異物入侵檢測算法進行深入研究,能夠很好地提高機場的安全性。
目前,異物入侵檢測算法大多是在目標檢測的基礎上增添報警功能和目標跟蹤功能,在今后的研究中,還需進一步完善基于機場周界場景下的數據集的建設工作和進一步提高現有算法對小目標檢測的效果。