


摘要:隨著社會發展,公共場所對于安全性的要求日益提高,監控數據量也呈指數級增加,如何準確并快速地對監控視頻中人臉進行特征檢測篩選,從而提高整體工作效率,對于維護社會穩定、保護人民生命財產安全具有重要意義。本文提出了一種基于互聯網上傳的海量監控數據的人臉特征目標檢測方案,通過對人臉特征,如胡須、眼鏡、口罩等特征,對互聯網聯機多場所監控視頻進行檢測,篩選出目標人群,從而減少機器人臉識別或傳統人工識別工作量,提高識別速度,降低成本,最后以口罩佩戴檢測系統的實現案例驗證了系統可行性及精準度,并對目標檢測技術應用前景進行了展望。
關鍵詞:互聯網;目標檢測;人臉特征;監控視頻
引言
近年來,監控作為視頻證據采集的主要工具被大量安置在城市公共區域各個角落,有效保證了人民群眾的生命財產安全,但隨著攝像頭增多,監控視頻數據量也成倍增加。在證據調取時,線下監控存儲銷毀時限規定不一、收集處理視頻監控數據缺乏隱私保護手段、偵查人員取證能力欠缺等問題[1],一直困擾著工作人員與場所管理人員。
伴隨互聯網高速發展,多地區多場所監控視頻線上整合成為可能,通過多地區多單位聯網,將監控攝像頭拍攝視頻數據由本地服務器發送整合至線上服務器,相關人員取證時只需由線上系統平臺選定人臉特征,由線上服務器執行檢測功能并返回篩選結果,降低了人力交通成本,同時也降低了對本地檢測設備的要求。但龐大的數據量無疑增加了傳統人工檢測成本,造成人力浪費,若直接采用深度學習,快速精準人臉識別也將難以實現,同時大多肖像描述也局限于部分特征描述,故如何高效地對公共場所人群監控進行特征分析、篩選出對應特征人員成為一大關鍵問題。
1. 相關研究與發展
1.1 目標檢測相關研究
目前,目標檢測發展已有20余年,作為計算機視覺領域中重要的一項研究課題[2],主要研究內容為將圖像或視頻中目標物體與其他無關信息進行區分,即判斷是否存在目標物體,若存在則輸出目標坐標位置。經過數十年發展已經分為兩種類型:基于手工標注特征的傳統目標檢測方法、基于深度學習的目標檢測方法。
其一,傳統目標檢測[2]利用滑動窗口提取候選區特征并進行分類,存在著時間復雜度過高、手工設計特征局限等問題,隨著神經網絡算法研究與推廣,傳統檢測算法逐漸退出。其二,基于深度學習的目標檢測方法相較于傳統方法,具有結構靈活、檢測精度高、速度快等特點。近年來關于人臉特征目標檢測多采用深度學習方法,根據應用場景及響應時間需求有著不同選擇。
有學者針對復雜施工環境下小目標安全帽佩戴檢測,提出了基于無錨框機制的安全帽檢測器[3],也有學者選用的是Faster R-CNN改進算法在增加錨點條件下完成安全帽佩戴檢測[4]。除此之外,還有學者利用YOLOv3進行人臉檢測[5],在對安全帽潛在區域進行圖像增強并利用傳統分類器進行判斷,YOLO算法優勢在于實時性,對于實時目標檢測無疑有著更大的優勢。對于其他人臉特征,如胡須、帽子等特征,有學者提出基于卷積神經網絡的檢測方式,并在圖片輸入前進行人臉關鍵點標記及放射變換[6],消除扭曲旋轉影響從而提升了測試效果。
1.2 互聯網線上平臺發展
近年來,互聯網飛速發展,依靠5G技術高速率、低延遲、大連接特點,互聯網將曾看似不相關的載體連接在一起,將曾因延遲過高、效率過低而暫緩的線上平臺移植成為可能。互聯網正推動各行各業的發展,在互聯網快速發展、線上平臺技術日益成熟的背景下,各地方單位更應引入互聯網思維,整合系統資源,優化事務處理流程并減低人力物力成本,打造互聯網線上平臺,將各地區各場所信息整合,從而提高服務效率與質量。
2. 人臉特征目標檢測模型
對于深度學習目標檢測模型的選擇,由檢測階段數量及模型復雜程度可分為單階段檢測算法及二階段檢測算法。根據監控視頻中目標密度高、尺度小,且對實時性要求低的特征,本次人臉特征檢測選用基于深度學習的二階段檢測Faster R-CNN算法[7],算法檢測流程如圖1所示。該算法較其他算法的最大優勢在于檢測框生成改進,提出了“anchor”,并改進了目標候選框生成機制,提高了檢測框生成速度,從而突破原有R-CNN模型速度瓶頸,且該算法相較其他一階段檢測算法有著明顯的精準度優勢,故在滿足檢測速度要求的前提下,選用Faster R-CNN算法能極大地提升在特定公共區域人臉佩戴檢測需求。
3. 總體設計方案
3.1 系統架構
基于互聯網的公共場所監控人臉特征目標檢測系統整體架構設計如圖2所示,整個系統由本地攝像頭、本地視頻服務器、線上服務器、本地查詢服務器構成,首先由本地攝像頭將錄制視頻保存至本地,再由本地視頻服務器將視頻文件保存時間、文件名稱等信息傳至線上服務器,當本地查找服務器有特征篩選需求時,連接至線上服務器,提交所需目標人臉特征及地點時間信息,線上服務器篩選對應視頻并對視頻進行人臉特征目標檢測,并將最終結果返回至本地查找服務器。
3.2 檢測系統設計方案
基于深度學習的人臉特征檢測系統架設在線上服務器,系統結構如圖3所示,整體由PyQt5設計圖形化界面封裝,系統設計共分為圖像檢測與視頻檢測兩個部分,由外部接口將視頻或圖像數據輸入,其中視頻需要抽幀為圖片,之后將圖像進行預處理,再交由已完成訓練的深度學習目標檢測模塊,最后再輸出圖片或拼幀為視頻。
4. 系統設計原理
本系統基于互聯網線上平臺部分目前已有成熟體系,下面僅介紹主要模塊人臉特征檢測系統設計原理。
4.1 基于Faster R-CNN的人臉特征檢測模型
人臉特征檢測模型是整個系統核心,要實現訓練數據收集與處理、模型訓練、訓練結果分析與優化三個階段,模型訓練的好壞直接關系到整個系統檢測的速度及精準度。
4.1.1 人臉特征數據收集與處理
作為整個模型的基礎,數據集設計與處理對模型有效性有著較深的影響,數據的真實性和廣泛性至關重要。根據所需人臉特征的不同,有著不同的數據收集方法,對于已有公開數據集的特征,可直接選用公開數據集,其數據標注與訓練集、測試集分配更為合理;對于無公開數據集特征,則需要自行爬取清洗、標注數據制作數據集,并以2:1數據量分為訓練集與測試集。
4.1.2 模型訓練
將訓練集數據導入Faster R-CNN模型進行訓練。
4.1.3 訓練結果分析與優化
將測試集數據輸入已訓練模型中,再針對錯誤判定數據進行分析并調整參數優化模型,重復訓練直至測試集準確率滿足需求。
4.2 輸入圖像預處理
現實檢測中,真實環境背景較為復雜,真實檢測效果需要以真實反饋判斷,故對識別框位置準確性要求較高,當外界輸入圖像后,由于無法保證圖像清晰度及對比度,需要對圖像進行預處理,以滿足檢測條件,如通過圖像變換算法調節,可通過灰度直方圖直觀判定預處理結果。
4.3 系統圖形化界面設計
受益于python語言強大的第三方庫所帶來的高開發效率,筆者推薦圖形化界面可由PyQt5設計,PyQt5是一套Python綁定Digia QT5應用的框架,作為Python的一個模塊,擁有620多個類以及6000個函數和方法,可用于Python 2和3,可以運行在所有的主要操作系統,滿足了本系統在不同環境下的使用需求。
5. 系統實現
將人臉特征定為口罩佩戴,實現基于深度學習的人臉口罩佩戴檢測系統的設計與精準度檢驗。
5.1 人臉口罩佩戴識別數據集收集與制作
筆者爬取與收集共計10000余張圖片數據,其中包括不同顏色口罩佩戴人臉、手遮擋人臉、無遮擋人臉三種數據,統一圖片大小,對數據進行清洗標注處理。將測試數據集與訓練數據集數據比例按2:1分配。
5.2 檢測算法測試與綜合優化
選用Faster R-CNN算法將訓練數據集導入訓練,并根據測試集輸出結果調整訓練參數,本次實驗由PR曲線及平均精度值(Mean Average Precision,mAP)作為測試結果評價指標,PR曲線即Precision(精準度)-recall(召回率)曲線,Precision(精準度)表示正確檢測是否佩戴口罩的比例,recall(召回率)則表示測試集中被正確檢測的圖片所占全部數據比例,平均精度值為兩種類別檢測準確率的平均值。理論上mAP值越高(最大值為1),PR曲線越高越好。
經過對參數調整及模型錨點修改,最終檢測結果如圖4所示,其中have_mask曲線為口罩佩戴檢測精準度,達到88.83%,基本滿足檢測需求。
5.3 圖像預處理
對于本次口罩佩戴檢測系統設計,由于口罩多為白色或藍色,如背景色仍為淺色系再加上光線干擾,模型難以判斷出口罩與環境邊界,故需對圖片亮度及對比度調整,經過對比實驗,最終選取限制對比度自適應直方圖均衡化圖形變換算法,再次出入圖片測試后結果明顯改善。
5.4 系統封裝
將系統由PyQt5框架設計圖形化界面,如圖5所示。
5.5 系統可行性檢驗
系統封裝完成后,先后進行本地圖片、視頻與攝像頭視頻導入測試,檢測效果良好,結合模型設計優化階段精準度88.83%檢測結果,表明本次系統設計成功完成,基于深度學習的人臉特征目標檢測系統具有可行性。
本文基于目前互聯網以及目標檢測技術發展,提出了一種基于互聯網的公共場所監控人臉特征目標檢測系統,并以實際樣例驗證了系統可行性,打破了傳統壁壘,通過互聯網線上平臺,整合監控視頻資源,并依靠深度學習技術對人臉特征目標檢測,從而篩選出對應人臉目標,反饋給線下本地工作人員,減輕工作人員前期數據收集、篩查工作強度,降低了對本地服務器的硬件需求,有效提高了工作效率,減輕了地區人力、物力壓力。
結合目標檢測技術的普適性及應用場景,我們未嘗不可將其移植于其他場景,隨著移動端互聯網及目標檢測技術發展,將更加輕便、更加快速的目標檢測算法移植于移動端,可擺脫PC機攜帶困難等問題,并應用于便攜式掃描設備,又比如將目標檢測移植于工廠生產,對于特定物體的定位及篩選工作,可極大減少人力消耗,從而降低生產成本。現階段,已有部分目標檢測系統投入實際生產之中,其中最為典型的便是自動駕駛中應用的目標檢測[8],應用于對周圍物體尺寸、距離、位置等信息進行精準判斷,從而給自動駕駛系統提供路徑規劃數據,雖然目前自動駕駛中目標檢測仍存在多傳感器融合誤差、特征提取策略存在改進空間、標注數據依賴過高等問題,但不可否認其給汽車領域所帶來的巨大變革,為自動駕駛領域提供了一個目前最優的解決方案。
自動駕駛領域的興起,打破了原有傳統車企對于汽車行業的掌控,從人工智能領域另辟蹊徑,為眾多科技企業打破行業隔閡、探索陌生領域提供了可能。目前,谷歌、特斯拉、蔚來、百度、華為等企業已紛紛開始布局自動駕駛研發及測試,結合與互聯網類似的車聯網系統,實現車輛與車輛之間位置速度等信息交流,將更加準確地為汽車自動駕駛提供最優路徑選擇。除此之外,還可應用于農作物生產水產養殖領域的病蟲害識別以及魚群檢測等問題[9],機器目標檢測技術的鑒別速度快、穩定性、準確度高等特點,能夠幫助養殖者提高處理效率,節省勞動力,從而擴大養殖規模,提高經濟效益。
結語
總而言之,在即將到來的工業5.0時代,隨著中國經濟發展與對實體產業布局的重視程度不斷加深,以互聯網為基礎的信息技術將逐步進入并改變傳統工業生產,轉變現有行業理念,目標檢測也將不僅僅局限于人臉特征檢測等傳統功能。筆者相信隨著目標檢測技術的不斷進步與創新,將會有更為輕便、準確的新型模型被提出,從而應用于實際生產之中,突破已有生產瓶頸,提升社會整體運行效率,創造出新的社會財富,提升我國經濟實力,為我國社會主義現代化社會建設提供有效助力。
參考文獻:
[1]王紀鋒.刑事訴訟中視頻監控數據收集程序問題研究[D].北京:中國人民公安大學,2021.
[2]葉釗.目標檢測技術研究進展[C]//中國計算機用戶協會網絡應用分會.中國計算機用戶協會網絡應用分會2019年第二十三屆網絡新技術與應用年會論文集.北京:中國計算機用戶協會網絡應用分會,北京聯合大學北京市信息服務工程重點實驗室,2019:245-249.
[3]王子明.基于深度學習的安全帽佩戴檢測方法研究[D].吉林:東北電力大學,2022.
[4]吳冬梅,王慧,李佳.基于改進Faster RCNN的安全帽檢測及身份識別[J].信息技術與信息化,2020,(1):17-20.
[5]何超.基于改進YOLOv3的安全帽檢測系統研究[D].武漢:華中科技大學,2019.
[6]顧旸鋮,邱衛東.基于卷積神經網絡的胡須及帽子特征檢測[J].信息技術,2017 (09):121-124,129.
[7]Ren S,He K,Girshick R,et al.Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2015, 39(6):1137-1149.
[8]任柯燕,谷美穎,袁正謙,等.自動駕駛3D目標檢測研究綜述[J/OL].控制與決策:1-24[2022-09-27].
[9]楊奉水,王志博,汪為通,等.人工智能識別茶樹病蟲害的應用與展望[J].中國茶葉,2022,44(6):1-6.
作者簡介:趙旭東,本科,研究方向:機器學習、大數據分析。