房大偉 國家知識產權局專利局專利審查協作江蘇中心
智能視頻監控技術與傳統意義上的視頻監控的區別在于將簡單的被動采集變為主動采集與分析,其不僅利用攝像單元代替人眼,而且利用計算機的分析處理能力,通過一系列算法分析,回答人們對于視頻數據的“是誰、在哪、在做什么”的問題,然后可以按照預先設定的報警規則,及時發出報警或預警信息,不僅可以提前進行預防和控制,還可以與其他安防設備進行聯防聯動,有效在事件發生前將隱患消除。

圖2.1
上世紀90 年代,智能視頻監控技術計入了萌芽期,2000 年后技術人員對智能視頻監控技術的研發力度開始加大,特別是9.11 事件發生后,全球市場需求日益增加,促使智能視頻監控技術申請量開始迅速增長。國內相關申請在1997 -2008 年隨著計算機視覺技術發展逐步萌芽中,而隨著國際反恐形勢日益嚴峻,并且物聯網、智慧城市等的發展要求2009-2014 年智能視頻監控技術進入快速發展期。從上述趨勢可以看出,中國專利申請起步較晚,專利儲備量少,但國內已經認識到智能視頻監控領域的重要性與其背后的巨大市場,目前相關研究也逐漸進入相對活躍的時期。
為實現智能視頻監控,首先必須解決的問題是目標在哪里的問題,即對目標進行識別與追蹤,其在整個智能視頻監控中處于基礎地位。
目標識別與追蹤技術涉及的技術路線大致可以分為兩類:識別追蹤算法的改進以及與傳感器等聯動實現識別與追蹤。

圖2.2 目標識別追蹤技術的演進路線
1996 年提出了根據光流法進行目標識別并控制攝像頭進行追蹤(申請號為DE 19600958),1996-2005 年研究主要集中在如何改進目標識別與跟蹤算法上,研究人員不斷將最新的計算機技術融入到目標識別與追蹤中(例如TW97133611 中的背景建模技術;TW 99134811 中的根據3D 建模技術以及CN 201310064203的特征模板算法),以進一步提高其智能性、主動性以及效率。在2005 年,出現了依賴RFID 技術實現視頻監控中目標的識別與追蹤的方法,此后逐漸出現了根據紅外傳感器的檢測結果進行目標的識別和追蹤以及根據聲學信號進行目標識別和定位追蹤等與傳感器聯動實現識別與追蹤的額技術。
動作/行為分析是利用計算機視覺信息來分析目標究竟在做什么,一般分為靜態姿態識別以及運動行為識別,其中基于視頻的運動行為識別是目前動作/行為分析方法的主要研究方向。

圖2.3
其中霍尼韋爾公司于2004 年提出根據行為分析引擎對監控對象進行無監督行為分析的方案,后續其他申請人在計算機技術發展的基礎上,不斷針對模型建立、自主學習建模、模板匹配方式等方面進行進一步研究。并且,國內外動作/行為分析技術起步時間相近,并且技術起點相同,國內外技術水平差距不明顯。
如果把攝像機看做人的眼睛,智能視頻監控技術則可以看做是人的大腦,隨著攝像頭在安防系統中所占比例的增加,其帶來了視頻數據的幾何倍數式的增長,這給智能視頻監控技術發展帶來了新的挑戰以及機遇:
1.如何實現設備自組網、自動調整是在設備層面應解決的問題。
2.如何快速實現有效數據提取識別,進而實現事件預判是智能視頻監控在軟件層面應當解決的問題。
智能視頻監控技術在大規模應用中的核心關鍵技術尚在積累階段,如何能夠將物聯網、大數據等新興技術與智能視頻監控該技術有機結合,搶占該領域的空白是我國技術工作人員應當努力的方向。