吳思坤 山東省廣饒第一中學(xué)59級6班
近年來,大規(guī)模分布式攝像頭數(shù)量的迅速增長,攝像頭網(wǎng)絡(luò)的監(jiān)控范圍迅速增大。攝像頭網(wǎng)絡(luò)每天都產(chǎn)生規(guī)模龐大的視覺數(shù)據(jù)。這些數(shù)據(jù)無疑是一筆巨大的寶藏,如果能夠?qū)ζ渲械男畔⒓右约庸ぁ⒗茫诰蚱鋬r值,能夠極大地方便人類的生產(chǎn)生活。然而,由于數(shù)據(jù)規(guī)模龐大,依靠人力進行手動處理數(shù)據(jù),不但人力成本昂貴,而且不夠精確。具體來講,在監(jiān)控任務(wù)中,如果給工作人員分配多個攝像頭,很難保證同時進行高質(zhì)量監(jiān)視。即便每人只負責單個攝像頭,也很難從始至終保持精力集中。此外,相比于其他因素,人工識別的基準性能主要取決于操作人員的經(jīng)驗和能力。這種專業(yè)技能很難快速交接給其他的操作人員,且由于人與人之間的差異,很難獲得穩(wěn)定的性能。隨著攝像頭網(wǎng)絡(luò)覆蓋面越來越廣,人工識別的可行性問題越來越明顯。因此在計算機視覺領(lǐng)域,學(xué)者對攝像頭網(wǎng)絡(luò)數(shù)據(jù)處理的興趣越來越濃厚。本文將針對近年來計算機視覺技術(shù)在攝像頭網(wǎng)絡(luò)中的應(yīng)用展開分析。
隨著私家車數(shù)量與日俱增,車主駕駛水平參差不齊,超速行駛、闖紅燈等違章行為時有發(fā)生,交通監(jiān)管的壓力也越來越大。依靠人工識別違章車輛,其性能和效率都無法得到保障,需要依靠計算機視覺技術(shù)實現(xiàn)自動化。現(xiàn)有的車牌檢測系統(tǒng)已擁有較為成熟的技術(shù),識別準確率已經(jīng)接近甚至超過人眼。光學(xué)字符識別技術(shù)是車牌檢測系統(tǒng)的核心技術(shù),該技術(shù)的實現(xiàn)過程分為以下步驟:首先,從拍攝的車輛圖片中識別并分割出車牌;然后,查找車牌中的字符輪廓,根據(jù)輪廓逐一分割字符,生成若干包含字符的矩形圖像;接下來利用分類器逐一識別每個矩形圖像中所包含的字符;最后將所有字符的識別結(jié)果組合在一起得到車牌號。車牌檢測系統(tǒng)提高了交通法規(guī)的執(zhí)行效率和執(zhí)行力度,對公共交通安全提供了有力保障。
2014年12月31日晚,在上海外灘跨年活動上發(fā)生的嚴重踩踏事故,導(dǎo)致36人死亡49人受傷。事件發(fā)生的直接原因是人群密度過大。活動期間大量游客涌入觀景臺,增大了事故發(fā)生的隱患及事故發(fā)生時游客疏散的難度。這一事件發(fā)生后,相關(guān)部門加強了對人流密度的監(jiān)控,某些熱點景區(qū)已投入使用基于視頻監(jiān)控的人群計數(shù)技術(shù)。人群計數(shù)技術(shù)大致分為三類:基于行人檢測的模型、基于軌跡聚類的模型、基于特征的回歸模型。其中,基于行人檢測的模型通過識別視野中所有的行人個體,統(tǒng)計后得到人數(shù)。基于軌跡聚類的模型針對視頻序列,首先識別行人軌跡,再通過聚類估計人數(shù)。基于特征的回歸模型針對行人密集、難以識別行人個體的場景,通過提取整體圖像的特征直接估計得到人數(shù)。人群計數(shù)在擁堵預(yù)警、公共交通優(yōu)化方面具有重要價值。
在機場、商場此類大型分布式空間,一旦發(fā)生盜竊、搶劫等事件,肇事者在多個攝像頭視野中交叉出現(xiàn),給目標跟蹤任務(wù)帶來巨大挑戰(zhàn)。在這一背景下,行人再識別技術(shù)應(yīng)運而生。行人再識別的主要任務(wù)是分布式多攝像頭網(wǎng)絡(luò)中的“目標關(guān)聯(lián)”,其主要目的是跟蹤在不重疊的監(jiān)控視野下的行人。行人再識別要解決的是在一個人在不同時間和物理位置出現(xiàn)時,對其進行識別和關(guān)聯(lián)的問題,具有重要的研究價值。近年來,行人再識別問題在學(xué)術(shù)研究和工業(yè)實驗中越來越受關(guān)注。目前的行人再識別技術(shù)主要分為以下步驟:首先,對攝像頭視野中的行人進行檢測和分割;然后,對分割出來的行人圖像提取特征;接下來,利用度量學(xué)習(xí)方法,計算不同攝像頭視野下行人之間在高維空間的距離;最后,按照距離從近到遠對候選目標進行排序,得到最相似的若干目標。由于根據(jù)行人的視覺外貌計算的視覺特征不夠有判別力,特別是在圖像像素低、視野條件不穩(wěn)定、衣著變化甚至更加極端的條件下有著固有的局限性,要實現(xiàn)自動化行人再識別仍然面臨巨大挑戰(zhàn)。
在候車廳、營業(yè)廳等人流量大、人員復(fù)雜的場所,或夜間的ATM機附近較容易發(fā)生犯罪行為的場景,發(fā)生斗毆、扒竊、搶劫等擾亂公共秩序行為的頻率較高。為保障公共安全,可以利用監(jiān)控視頻數(shù)據(jù)對人體行為進行智能分析,一旦發(fā)現(xiàn)異常及時發(fā)出報警信號。異常行為檢測方法可分為兩類:一類是基于運動軌跡,跟蹤和分析人體行為,判斷其是否為異常行為;另一類是基于人體特征,分析人體各部位的形態(tài)和運動趨勢,從而進行判斷。目前,異常行為檢測技術(shù)尚不成熟,存在一定的虛警、漏警現(xiàn)象,準確率有待提高。盡管如此,這一技術(shù)的應(yīng)用可以大大減少人工翻看監(jiān)控視頻的工作量,提高數(shù)據(jù)分析效率。
基于監(jiān)控視頻的計算機視覺技術(shù)在交通優(yōu)化、智能安防、刑偵追蹤等領(lǐng)域具有重要的研究價值。近年來,隨著深度學(xué)習(xí)、人工智能等研究領(lǐng)域的興起,計算機視覺技術(shù)的發(fā)展突飛猛進,一部分學(xué)術(shù)成果已經(jīng)轉(zhuǎn)化為成熟的技術(shù),應(yīng)用在人們生活的方方面面,為人們提供著更加便捷、舒適、安全的環(huán)境。展望未來,在數(shù)據(jù)飛速增長的時代,挑戰(zhàn)與機遇并存,相信計算機視覺技術(shù)會給我們帶來更多的驚喜。