孫秀斌,王 渤,張 旭
(北京市警衛局,北京 100006)
隨著計算機技術、通信技術、圖象處理技術的不斷發展,視頻監控系統已經逐漸成為一種重要的安全防范手段。視頻監控作為信息融合系統研究的一個重要課題,由于其在軍事和民用領域已經展現出有效與廣闊的理論和應用前景,而備受國內外學者和眾多實際工程領域專家的高度關注[1]。隨著安全敏感場合(如酒店、機場、會場等)對智能監控系統的需求,非接觸式遠距離的身份識別技術近來倍受關注。同時,智能視頻監控系統用攝像機獲取圖像并且用計算機對獲取的圖像進行處理獲取運動目標[2-3]。當有異常情況發生時,發出預警提醒監控人員,同時啟動錄像功能,對異常現場進行錄制保存。這樣既節省人力又能節省大量的存儲空間。
據此,對于重要人物入住的住地安保工作,本文提出一種基于人臉識別技術的輕小型智能成像系統,利用集成有高可靠性和高識別率人臉識別算法的顯控軟件,與依據輕小型化原則設計以滿足快速部署的硬件設備相結合,同時該系統也可廣泛應用于公安工作中,如交通卡口,機場,火車站和重要會場等場所安保實時視頻監控。
輕小型智能成像系統主要由高清成像前端單元、POE供電單元和智能終端控制單元組成,其系統組成框圖如圖1所示。

圖1 系統組成框圖
高清成像前端單元通過多樣化的安裝方式實現圖像采集,并將信息通過以太網線傳輸至后端智能終端控制單元。POE供電單元將高清成像前端單元的供電與視頻通訊信號傳輸融為一體,具有鏈路簡單,裝配快捷等優點。智能終端控制單元能夠實現對前端2路高清視頻信號的接收和焦距控制,對圖像進行智能處理與分析,具備越界報警、人臉識別等多種功能。
采用高清成像器,配以電動變倍鏡頭。成像分辨率最大可到200萬像素(1080P),具有星光級感光靈敏度,具有增強夜視功能,能夠在較弱光線下實現清晰成像。成像信噪比大于52db,采用數字寬動態技術和3D數字降噪,具備全焦段量程變化條件下的實時自動聚焦,保證目標在變焦過程中不丟失。成像器主要性能如表1所示,成像效果如圖2所示。
組件配以接口板的設計模式。外觀設計中采用輕質鋁合金結構進行封裝,殼體厚度1mm。部分結構零部件采用塑料作為加工材料,質量更輕。在設備外殼上,對外保留RJ45網絡接口,供電與數據鏈路并行傳輸。在安裝方式上,保留一個物理螺紋接口,實現與不同轉接件的快速安裝。

表1 成像器主要性能指標

圖2 成像器成像效果圖
POE供電單元將高清成像前端單元的供電與視頻通訊信號融為一體,具有鏈路簡單,裝配快捷等優點,網線長度25m。
采用黑色網線,網線長度25m,網線采用8芯結構,以用于POE供電。為方便網線的快速收縮和伸展即在地面布設便利,采用黑色八芯全銅導體網線,實現小型化、輕量化,如圖3(a)所示。通過伸縮便攜式萬兆15m網線盒,實現超長便攜式網線的快速展線和收線,如圖3(b)所示。伸縮盒體積為160mm×148mm×23mm,通過圓形自動收縮設計,網線能夠快速收縮;轉盤上設計有凹槽,手指轉動即可操作。

圖3 (a)網線 圖3 (b)便攜式伸縮盒
智能終端控制單元能夠實現對前端2路高清視頻信號的接收和焦距控制,對圖像進行智能處理與分析,具備越界報警、人臉識別等多種功能。包括顯控軟件和智能視頻處理算法。
智能終端控制單元集成于高性能處理計算機,主要運行圖像處理軟件和顯控終端軟件。其中圖像處理軟件主要包括人臉識別、圖像復原和視頻摘要濃縮等功能,顯控終端軟件為人機交互界面。
智能終端處理單元集成于高性能處理計算機,選用國產聯想P50高配商用筆記本,采用I7高性能處理器,主頻2.6GHz,8G內存,內置512G存儲容量,為保證足夠的錄像空間,筆記本外接3T容量的USB3.0 接口高速硬盤。為方便設備安裝與運輸,所有后端設備集成于一個設備箱內。設備箱配有手提把手、欄桿或滑輪,方便設備的運輸。后端設備箱內包含人臉識別服務器、電源適配器和高性能計算機等設備。設備箱分兩層,下層用于安裝各類服務器、適配器和緊固件等,上層放置筆記本電腦,用于人機交互,如圖4所示。設備箱僅2個接口,一個220V@50Hz供電接口,一個是以太網接口,操作方便。

圖4 設備箱示意圖
顯示控制終端軟件采用C++語言編寫,其主界面主要分為顯示區和控制區兩個部分。
顯示區通過SDK開發包提供的圖像輸入函數,并調用相機自帶的解碼包,從而獲取高清視頻數據,并將該數據進行規定格式的顯示與存儲,具有實時視頻存儲、抓圖、全屏顯示等功能。根據與用戶的溝通結果,顯示區分為主顯示區、輔顯示區,主顯示區顯示當前的2路監控視頻和狀態信息,輔顯示區顯示每路視頻在用戶操作后(如人臉識別報警、視頻檢索)的感興趣抓圖圖片,在人臉識別等產生報警信號是自動抓取當前圖片,顯示在輔顯示區。
控制區設置了多種功能區,包括相機控制、報警區聲音控制等。與前端通訊部分采用Pelco協議,通過SDK的功能函數將通訊數據打包通過網絡進行傳輸至前端相機。綜合顯控單元初步效果如圖5所示:

圖5 綜合顯控初步效果
人臉識別技術是基于人的臉部特征信息進行身份識別的一種生物識別技術。用成像器或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部特征處理的一系列相關技術,通常也叫做人像識別、面部識別[4-7]。
現有的人臉識別系統在用戶配合、采集條件比較理想的情況下可以取得令人滿意的結果[4-6]。但是,在用戶不配合、采集條件不理想尤其是在運動中采集的情況下,現有系統的識別率將陡然下降。也就是說,人的姿態如果發生較大變化,系統可能就會認證失敗。同時,光照、裝飾等對機器識別人臉都有影響。
特征臉方法利用主分量分析進行降維和提取特征[7]。主分量分析是一種應用十分廣泛的數據降維技術,該方法選擇與原數據協方差矩陣前幾個最大特征值對應的特征向量構成一組基,以達到最佳表征原數據的目的。因為由主分量分析提取的特征向量返回成圖像時,看上去仍像人臉,所以這些特征向量被稱為“特征臉”。
在人臉識別中,由一組特征臉基圖像張成一個特征臉子空間,任何一幅人臉圖像(減去平均人臉后)都可投影到該子空間,得到一個權值向量。計算此向量和訓練集中每個人的權值向量之間的歐式距離,取最小距離所對應的人臉圖像的身份作為測試人臉圖像的身份。

圖6 人臉主分量分析
最左邊的為平均臉,其他的為對應最大特征值的特征向量。利用CNN基于卷積神經網絡的學習方法,利用先驗人臉圖片訓練網絡,利用訓練后的網絡進行實時在線檢測,與實時捕獲的人臉圖像進行匹配,匹配度超過閾值即為同一人臉。
如圖7所示,本系統中可根據需要,設置多類目標(A,B,C),如普通,重要,黑名單等,以不同方式(a,b,c)進行報警提示,實時在線捕獲特定人臉目標。如圖8所示為人臉識別效果圖,能夠進行在線實時比對。

圖7 本系統人臉識別預警方案

圖8 本系統人臉識別效果圖
本文中所設計的輕小型智能成像系統集成小型高清網絡攝像機與智能顯控終端,采用POE供電方式,具有安裝方式靈活,能夠快速部署等特點,其智能圖像處理算法時間復雜度低,能夠部署在便攜式計算機上實時執行,人臉識別延遲時間不超過1秒,準確率高于95%。隨著硬件能力的不斷提升與軟件算法的不算優化,未來智能監控系統將繼續向小型化、移動化、多功能集成、智能化等方向發展,可實現將圖像處理算法移植固化在前端設備中,極大降低對后端計算機處理能力的要求。■
[1]周謐.計算機智能視頻監控技術在大型活動安保工作中的作用[J].信息通信,2014(3):127-128.
[2]馬海兵,白潔.人臉識別技術在智能視頻監控系統中的應用[J].現代電子技術,2007(12):125-128.
[3]楊明,王汝琳.視頻監控技術的發展——智能監控技術[J].智能建筑與城市信息,2007(11):93-95.
[4]宋紅,石峰.基于人臉檢測與跟蹤的智能監控系統[J].北京理工大學學報,2004,24(11):966-970.
[5]劉青山,盧漢清,馬頌德.綜述人臉識別中的子空間方法[J].Acta Automatica Sinica,2003,29(6):900-911.
[6]蘇煜,山世光,陳熙霖等.基于全局和局部特征集成的人臉識別[J].軟件學報,2010,21(8):1849-1862.
[7]楊瓊,丁曉青.對稱主分量分析及其在人臉識別中的應用[J].計算機學報,2003,26(9):1146-1151.