連福生,丁昭彥
(1.烏魯木齊鐵路公安局,烏魯木齊 830011;2.成都智勝三維應用技術有限責任公司,成都 619000)
安全檢查在維護公共交通安全,防范恐怖襲擊和安全威脅等方面起到重大作用。當前,利用X 射線、熱紅外等非接觸式的安全檢查設備,是利用最為廣泛的安檢設備,被大量的應用在物流和交通樞紐或者安全警戒級別較高的關鍵場所。射線源發射的X 光射線穿過安檢設備中通過的物體,部分射線會被不同的物體所吸收,X 射線安檢儀能夠根據物體對射線的吸收劑量,在顯示屏上呈現不同顏色的影響供安檢操作員識別和判斷?,F下X 安檢設備的發展已經很成熟,市場上主流的安檢設備不僅可以現實被檢測物品的透視圖像,還可以對各種有機物、無機物混合物等使用不同的顏色進行標記,進一步使物品顯示的更為直觀;也有部分雙視角安檢機,可以得到物體俯視和側視的透視圖,更為細節化的展現被測物體,從而降低了人工識別的難度。但是相對于X 射線安檢設備,安檢工作過于依賴人工,主要依靠安檢操作員進行人工的篩選標定。據相關數據顯示,僅僅在上海市地鐵系統中,就有9000以上的安檢人員從事地鐵安檢工作,幾乎每臺安檢機都會配備至少一人安檢操作員。相對于在各行各業日益增加的安檢級別,我國安檢設備需求量也會相伴增長,因此每年投入到安檢工作中人力物力也是非常的巨大的。X 射線掃描圖像不同于自然采集圖像等,安全檢查通常處理的行李或手提箱等對象是隨機堆放和嚴重重疊,并非是孤立存在的。因此,在掃描圖像中,目標對象可能與任意擺放的無關對象混在一起,甚至可以被安檢人員忽略。
本文提出了一種基于CNN 深度神經網絡X 射線圖像的檢測分類方法,對鐵路安檢設備采集圖像進行檢測分類。我們通過使用卷積神經網絡對復雜的訓練圖像進行特征提取,將任務目標轉化為一個優化任務,比對預測結果和真實結果的歐氏距離,達到最終的對目標對象的檢測和識別任務。由于真實場景中的X 射線掃描圖像較多是含有多物體的復雜重合圖像,所以我們的方法對目標圖像進行單位分割,以及后續的檢測識別任務,所使用的數據集也是含有較多遮擋情況的復雜圖像。
本文主要有三個特點:
第一,提出目標檢測圖像的單位分割方法在鐵路紅外安檢影像中的應用,提高檢測目標的感興趣區域,提升檢測效果;
第二,提出利用精簡的CNN 卷積神經網絡,實現鐵路紅外安檢的快速的目標檢測;
第三,提出人工與機器結合的半自動深度學習訓練機制,提升紅外安檢影像的目標檢測識別的準確度。
本文是在研究鐵路危險品安檢圖像檢測算法,通過傳統的圖像算法和深度學習網絡的結合的方法,進行研究和設計的。在此過程中,進行了大量的國內和國外相關X 光圖像檢測的前沿論文的研究和準備。對于X 光圖像的檢測特征曲線方法[1]是利用圖像形狀和高低能灰度特征曲線相結合的方式可以全面的檢測出危險品。在基于深度學習的管制物品自動檢測算法研究一文中提出使用深度學習來檢測大圖片中的小目標[2]?;诰矸e神經網絡的輪胎X 射線圖像缺陷檢測[3]方法設計了一個卷積神經網絡來檢測圖像缺陷,采用了局部關鍵點和動態學習率來快速調節訓練模型?;诎氡O督生成對抗網絡X 光圖像分類算法[4]在傳統的無監督生成對抗網絡的基礎上用Softmax替換最后輸出層提高了學習的性能。X 射線安檢設備測試圖像分割方法[5]采用基于HSI 色彩空間對圖像邊緣進行多邊形逼近簡化處理后再進行幾何分離,提高了質量較差圖像的分割。本文的方法通過對X 射線圖片的傳統方法的預處理歸一化,再通過深度學習網絡來進行目標分割和檢測,最后通過比較檢測出的物體的特征向量的距離相似度來檢測、分類和篩選。綜合考慮了訓練集、測試集、深度學習網絡、傳統算法、時間空間復雜度來提高檢測的速度和精度。
對紅外光影像進行預處理和歸一化操作,然后對其進行人工標注數據,在大量的訓練集的基礎上,選用最新的CNN 網絡YOLOv3,對其進行深度學習的訓練,調整網絡結構和參數,最后進行交叉驗證,檢驗訓練模型的優劣,不斷迭代試錯調整,最終得出識別率較高的模型??傮w的算法描述圖,如圖1 所示。
傳統的X 射線圖像自動檢測方法是利用人工設計的特征進行物品分類,對通用圖像進行分類人工特征設計,對X 射線圖像進行特征提取,經過特征表達后利用分類器進行分類。主要的區別是特征提取和分類方法的不同,具有代表性的就是GesickR[6]中:利用邊緣檢測和模式匹配的方法結合、Daubechies 小波變換和KNN 算法分類方法結合、尺度不變特征變換算法(SITT)特征提取方法等。Franzel 等人[7]提出了一種基于線性支持向量機和梯度直方圖的滑動窗口檢測方法,并且利用多視圖集成將各個視角的單透視圖的檢測結果進行融合,以避免虛假的檢測,以此來提高對手槍的檢測性能。有的利用半監督學習體系結構中的生成對抗性網絡,想要通過生成對抗網絡來解決圖片資源的稀缺問題,用于擴展數據。這種方法首先在傳統無監督生成對抗網絡基礎上用Softmax 替換最后輸出層,擴展成為半監督生成對抗網絡,其次對生成樣本定義額外類別標簽引導訓練,最后采用半監督訓練方式對網絡參數進行優化,并將訓練得到的判別網絡運用于X 光圖像分類中。對于胸部X 光圖像,結合自動化分類診斷選取了6 種肺部疾病的X 光前視圖進行實驗,實驗結果表明本文的算法提高了利用標注數據的監督學習性能,同時對比其他半監督分類方法,也都表現出優越性能。本文在方法的基礎上受到啟發,想要通過半監督圖片分類方法來生成鐵路危險品檢測的圖片,以此擴展數據用于后續的訓練。本文利用SIXray違禁物品x 射線圖像數據集,經過實驗,我們在原本人工挑選的3000 數據的基礎上,通過傳統的數據擴展方式,包括加噪點,分割組合,通道提取等,再加上生成對抗網絡生成的數據,一共擴展了1 萬數據,數據樣例如圖2 所示。

圖1 總體算法描述圖

圖2 待檢測X光圖片樣例
數據集包括了正樣本和負樣本,其中負樣本為無危險物品的安檢圖片,正樣本包含單一危險品、多危險品、多物品重疊。為了達到更好的識別檢測效果,本文利用了目標檢測的單位分割方法,將物品進行初步的分割,然后進行識別和檢測。
基于單位分割的目標檢測算法:由于待識別的X光圖片整體太大,需要檢測的區域相對于整張圖片來說只集中在某一個區域,所以本文在傳統的圖像分割的方法的啟發下,將原始圖片進行單位分割,進而縮小感興趣區域的大小,減少打量的計算量和算法復雜度,也能有效地提高檢測的準確度。
本文提出的一種半自動危險檢測機制,即首先通過大量的數據的多次迭代的訓練生成初步的可靠的模型,然后在使用模型的初期,進行人工對于數據的再次分類,找出模型檢測結果中失敗的數據,再放入訓練網絡中迭代訓練,半自動的自我學習,自我完善,逐步提高模型的識別精度,減少失誤率,保證人民生命財產的相對安全。
YOLO 是一個全卷積的卷積神經網絡,最終的輸出都是特征映射上應用1×1 的卷積核生成。在YOLOv3 中,對三個不同的位置的三種不同大小的特征圖上使用1×1 的核進行檢測。新架構值得夸耀的有殘差跳連接(residual skip connections)和上采樣。YOLOv3能夠更好的對小目標的檢測,檢測的效果更好。YOLOv3 的網絡結構如圖3 所示,圖中注意Convolutional是指Conv2D+BN+LeakyReLU,和DarkNet53 圖中的一樣,而生成預測結果的最后三層都只是Conv2D。

圖3 YOLOv3的網絡結構圖
訓練使用了1000 張標注好的圖片,并進行了擴展,最后參與訓練的總共有11000 張圖片,按照1∶5 的比例分成了驗證集訓練集進行訓練??偣驳? 萬次訓練,得到了loss 較低,IOU 較高的模型進行測試。在剩余2000 張未參與訓練的數據中測試得到檢測到存在管制刀具的準確率為85%,檢測到存在槍械的準確率為80%。圖4 為檢測結果樣例。
當樣本圖片中只包含管制刀具和槍械時,識別率很高。但由于樣本中不光含有槍械和管制刀具兩種金屬制品,還有其他的金屬物品,會干擾檢測結果。

圖4 檢測結果
針對結果誤識的情況可以考慮增加負樣本的訓練,標注訓練非槍械和管制刀具的物品分類,以提升本方法的準確率。針對訓練網絡可以考慮修改超參數,此外針對數據集可以增加更多種類的數據來提高本方法的泛化能力。
本文利用最新的YOLOv3 的深度學習檢測網絡,調整了部分參數和模型結構,使其更能適應鐵路危險品檢測圖片的識別,大大提高了自動識別的效率精度,減少人工檢測的失誤率,極大地提高了鐵路安全保障系統,保護人民生命和財產安全。利用人工智能的發展成果,設計和實現了一種鐵路危險品檢測的計算機視覺的解決方案。過程中綜合了大量的相關前沿技術成果,例如,生成對抗網絡(GAN)、目標檢測的單位分割算法、多尺度的相似度分析。但是,用于原始數據量的不足和人工標注數據的人力物力的巨大,使得訓練集等相關數據不是特別充足,導致訓練出來的模型出現過擬合現象,基于以上分析,在后續的研究和設計過程中,可以通過增加數據集特別是負樣本的數量進行多次迭代訓練,來避免訓練模型時的過擬合問題。