李 戈
(大連外國語大學(xué) 軟件學(xué)院, 遼寧 大連 116044)
隨著各行業(yè)對安全的需求,監(jiān)控系統(tǒng)的應(yīng)用越來越廣泛.同時隨著對監(jiān)控信息質(zhì)量要求的提高,監(jiān)控信息量也在急劇增加,傳統(tǒng)的采用人工來監(jiān)管處理和分析監(jiān)控信息的方式已不能滿足實(shí)際需要.主要體現(xiàn)在:監(jiān)控信息量大,對存儲設(shè)備的容量提出了更高的要求;工作人員疲倦可能導(dǎo)致監(jiān)控失效;無法實(shí)時查詢切事后查詢耗時太長,但大都是無效信息多(無異常信息);無法實(shí)現(xiàn)異常情況提供實(shí)時報警且能通過提供各種手段阻止異常事件發(fā)生.
智能視頻監(jiān)控[1-2]由于采用基于計算機(jī)視覺及圖像處理及分析技術(shù),可以將傳統(tǒng)監(jiān)控的“事后查詢”變?yōu)椤爸鲃臃雷o(hù)”,能夠提供實(shí)時報警、基于網(wǎng)絡(luò)的異地快速視頻查詢、事前趨勢預(yù)測等諸多功能.由于可進(jìn)行智能視頻錄制及圖像拍攝,存儲設(shè)備的容量大大降低.從而把工作人員從繁重的不間斷的分析視頻監(jiān)控場景的工作量成倍地降低.
智能視頻監(jiān)控在軟硬件的協(xié)同配合下,可以實(shí)現(xiàn)在無需人為干預(yù)的情況下, 根據(jù)需要錄制或者拍攝,記錄的信息分辨率自動調(diào)節(jié).利用計算機(jī)視覺處理技術(shù)和圖像分析方法,對攝像機(jī)錄制的視頻或者拍攝到的圖像序列進(jìn)行自動分析,并可以按照特定的需求對監(jiān)控內(nèi)容進(jìn)行提取.通過控制系統(tǒng)的運(yùn)動部件對動態(tài)場景中目標(biāo)的定位、識別和跟蹤[3],從而提高了監(jiān)控的效率、質(zhì)量,使得錄制信息的有效信息率成倍增加,而工作人員的勞動量大幅度降低,并且能在監(jiān)控目標(biāo)出現(xiàn)異常情況的時候作出及時反應(yīng).
智能視頻監(jiān)控的核心是智能化的分析處理系統(tǒng),該系統(tǒng)采用各種智能算法對采集的數(shù)據(jù)進(jìn)行處理,從而實(shí)現(xiàn)了對目標(biāo)現(xiàn)場的智能檢測及控制.主要采用了以下幾種技術(shù)[4].
1)運(yùn)動目標(biāo)檢測技術(shù)
該技術(shù)是從視頻圖像序列中,將用戶感興趣的運(yùn)動區(qū)域從背景圖像中提取出來.運(yùn)動目標(biāo)檢測技術(shù)是智能視頻監(jiān)控的基礎(chǔ),可以為目標(biāo)分類、目標(biāo)跟蹤和行為分析提供所必需的數(shù)據(jù).由于背景圖像及其環(huán)境隨時間的不確定性,造成檢測的可靠度降低.目前這種方法有時間差分法、光流法和背景減除法.
2)目標(biāo)跟蹤技術(shù)
該技術(shù)是在視頻序列中對感興趣的目標(biāo)進(jìn)行有效的跟蹤,是智能視頻監(jiān)控系統(tǒng)的一個重要組成部分.常用的方法有基于模型的跟蹤、基于輪廓的跟蹤、基于特征的跟蹤及基于外表的跟蹤.其中基于特征的跟蹤包括特征的提取和特征的匹配兩個過程.
3)行為模式分析技術(shù)
該技術(shù)是智能視頻監(jiān)控的關(guān)鍵技術(shù),也是目前視頻監(jiān)控技術(shù)研究的熱點(diǎn).行為模式分析技術(shù)通過對視頻數(shù)據(jù)的海量信息進(jìn)行自動分析,過濾掉用戶不關(guān)心的信息,提取用戶關(guān)注的信息,實(shí)時發(fā)現(xiàn)監(jiān)控畫面的異常,預(yù)測可能發(fā)生的事件,最大限度的降低誤報、提高監(jiān)控效率.該方法將視頻監(jiān)控的功能從“事后查詢”變成了“事前預(yù)測”,大大改進(jìn)了視頻監(jiān)控的性能.
4)視頻檢索技術(shù)
該技術(shù)是從大量的視頻數(shù)據(jù)中找到用戶所需要的視頻片段.目前基于內(nèi)容的視頻檢索研究最多,主要集中在識別和描述圖像的顏色、紋理、形狀、空間關(guān)系,對視頻數(shù)據(jù)進(jìn)行鏡頭邊緣檢測、關(guān)鍵幀選取以及故事情節(jié)的重構(gòu)等方面.
5)圖像處理技術(shù)
該技術(shù)是對監(jiān)控現(xiàn)場進(jìn)行靜態(tài)圖像拍攝,通過圖像處理技術(shù),對拍攝的圖像進(jìn)行圖像處理,如圖像增強(qiáng)處理、灰度處理、濾波、變換、圖像分割、形態(tài)學(xué)分析、特征提取,并結(jié)合模式識別技術(shù),人工神經(jīng)網(wǎng)絡(luò),支持向量機(jī)等技術(shù)對圖像進(jìn)行識別,從而智能地判斷監(jiān)控現(xiàn)場的狀態(tài).
6)智能存取技術(shù)
該技術(shù)根據(jù)圖像處理的結(jié)果,實(shí)時動態(tài)地決定某時刻是拍攝還是錄制狀態(tài),調(diào)整拍攝或錄制圖像或視頻分辨率,間隔時間等.
7)智能控制技術(shù)
根據(jù)圖像處理分析結(jié)果,通過控制運(yùn)動控制器,控制云臺的運(yùn)動,實(shí)時地跟蹤監(jiān)控目標(biāo).并通過聲光報警,或拔打值班人員電話,發(fā)送異常狀態(tài)信息.
在以上各技術(shù)中,視頻檢索技術(shù)及圖像處理技術(shù)是智能控制的基礎(chǔ).其決定了智能監(jiān)控的品質(zhì)和水平.
隨著電子技術(shù)的發(fā)展和計算機(jī)硬件成本的不斷降低,智能監(jiān)控系統(tǒng)的計算機(jī)硬件價格已大幅度減低,利用計算機(jī)作為主要的控制中心已成為可能.當(dāng)前1000GB的大容量硬盤僅有300~400元.采用大容量的硬盤來存儲實(shí)時攝取的靜態(tài)圖像及視頻數(shù)據(jù),通過對圖像進(jìn)行壓縮和灰度化處理,可以大大節(jié)省磁盤空間.通過設(shè)置無異常場景圖像、舊圖像自動刪除的周期,現(xiàn)代硬盤完全可以無須更換就可以使系統(tǒng)長時間地工作.
如圖1所示,系統(tǒng)將視頻控制矩陣或攝錄機(jī)的AV端輸出端連接于FlyVideo的外接信號輸入端,以增加可錄入的圖像信號源的路數(shù).AV信號經(jīng)圖像采集卡轉(zhuǎn)換為數(shù)字圖像后傳輸給主機(jī)并存儲在計算機(jī)主機(jī)的硬盤上.

圖1 智能監(jiān)控系統(tǒng)的硬件構(gòu)成
如果需要高分辨率的視頻或靜態(tài)圖像,可以采用數(shù)字高分辨率攝像頭.運(yùn)動控制部分如圖2所示.多功能控制卡用來向云臺控制器和輔助設(shè)備發(fā)送控制信號,控制指令的格式及何時發(fā)出指令由計算機(jī)控制程序根據(jù)現(xiàn)場狀態(tài)自動實(shí)現(xiàn).
云臺、鏡頭、防護(hù)罩多功能控制器,主要用于對云臺、電動三可變鏡頭、防護(hù)罩的雨刷等受控設(shè)備的控制.多功能控制器原理圖如圖2所示[5].

圖2 多功能控制原理圖
監(jiān)控系統(tǒng)采用Visual studio 2010開發(fā),使用語言為C++,系統(tǒng)運(yùn)行平臺為 Windows XP或者 Windows 7.
智能監(jiān)控系統(tǒng)的軟件模塊構(gòu)成如圖3所示.主要由定時器、鍵盤及紅外探頭觸發(fā)模塊,圖像管理模塊,圖像存儲模塊,圖像查詢模塊,圖像分析模塊,圖像傳輸模塊,圖像處理算法模塊等功能模塊組成.

圖3 智能監(jiān)控系統(tǒng)的軟件模塊構(gòu)成圖
其中圖像管理模塊可以實(shí)現(xiàn)視頻或圖像的分辨率管理及控制;信號源設(shè)置;壓縮率級灰度化處理;圖像備份及圖像刪除等功能.圖像查詢模塊可實(shí)現(xiàn)按文件名查詢,按日期時間查詢,多條件鏈接查詢,異常事件查詢等.
進(jìn)行圖像處理的關(guān)鍵是:鎖定靜態(tài)內(nèi)存,獲得內(nèi)存指針;創(chuàng)建用戶自己的圖像緩沖區(qū);將靜態(tài)內(nèi)存中的數(shù)據(jù)讀入圖像緩沖區(qū),對內(nèi)存中的圖像數(shù)據(jù)進(jìn)行處理,圖像保存或圖像回顯.設(shè)計的關(guān)鍵實(shí)現(xiàn)函數(shù)主要有HGDataTransform( ) ,HGStaticMemlock(),HGOpenSnapEx ( ),HGStartSnapEx ( ) .如圖4所示.

圖4 圖像處理流程圖
視頻采集卡負(fù)責(zé)采集現(xiàn)場圖像及錄制視頻,視頻控制矩陣的視頻輸出可由程序控制,可以獨(dú)立地切換畫面、控制云臺的水平轉(zhuǎn)動及垂直轉(zhuǎn)動等.
圖像遠(yuǎn)程傳輸主要通過定時觸發(fā)方式、侵入圖像觸發(fā)方式以及約定觸發(fā)方式三種.
當(dāng)觸發(fā)發(fā)生時,同時觸發(fā)網(wǎng)頁內(nèi)容的更新和文件發(fā)布及相關(guān)數(shù)據(jù)的傳輸.
數(shù)字化圖像監(jiān)控系統(tǒng)的最大優(yōu)點(diǎn)在于分辨率高,并且可調(diào).對于智能監(jiān)控和自動化監(jiān)控是最理想的首選.
侵入圖像偵測的原理是,把監(jiān)視場景的背景圖像或前一時刻的圖像作為監(jiān)控的原始標(biāo)準(zhǔn)圖像,監(jiān)控過程中如果有侵入事件發(fā)生,那么這幅作為標(biāo)準(zhǔn)的圖像就會發(fā)生變化.即攝入的圖像在部分像素上與原背景圖像相比發(fā)生了一定的變化,而根據(jù)兩幅圖像的變化率大小和變化分布特點(diǎn)區(qū)域,利用一定的判定規(guī)則、人工智能、機(jī)器學(xué)習(xí)等算法,就可以判斷侵入事件發(fā)生的真?zhèn)?從而使系統(tǒng)自動進(jìn)入最佳分辨率,最佳間隔時間的圖像拍攝及影像錄制,或報警提示或其他處理例程.
為了滿足攝制圖像的實(shí)時性及提高智能判斷的準(zhǔn)確率要求,局部像素的噪聲干擾信號通過像素點(diǎn)變化取舍值而剔除[6].
侵入圖像的各種偵測方式的實(shí)現(xiàn)如下
1)圖像相減方式偵測
代數(shù)運(yùn)算是指對兩幅圖像進(jìn)行點(diǎn)對點(diǎn)的加、減、乘、除四則運(yùn)算而得到輸出圖像的運(yùn)算.通過對兩幅圖像的減法運(yùn)算,判斷一幅圖片中是否有變化及變化的幅度大小.圖像減法處理運(yùn)算的數(shù)學(xué)表達(dá)式如下:
C(x,y)=A(x,y)-B(x,y)
其中A(x,y)和B(x,y)為輸入對象,而C(x,y)為運(yùn)算結(jié)果輸出對象.
圖像相減可用于去除一副圖像中不需要的加性圖案,也可以用于檢測同一場景的兩幅圖像之間的變化.
對于色彩圖像,需進(jìn)行相關(guān)處理,由灰度值判斷圖像變化.根據(jù)YUV的顏色空間分析,Y分量的物理含義就是亮度,它包含了灰度圖的所有信息,所以只用Y分量就能夠表示出彩色圖像的灰度信息.YUV和RGB之間的關(guān)系如下公式所示:
Y=0.3R+0.59G+0.11B
根據(jù)R、G、B的值求出Y值后,就可以用此值表示出灰度圖.因此,圖像的減法運(yùn)算可以根據(jù)兩幅圖像(原始圖像和實(shí)時圖像)的灰度值相減來得到,并根據(jù)經(jīng)驗選取適當(dāng)?shù)拈撝祷蛲ㄟ^人工智能算法計算合適的閾值,從而求出變化的像素總數(shù).
通過計算“相減結(jié)果”所在的區(qū)域所占像素數(shù)在整個監(jiān)控畫面中所占的百分比,就可判斷出原始場景中是否有侵入.如圖5所示.

(a) (b) (c)圖5 圖像相減方式
2)顏色分量比較方式偵測
在很多情況下,我們監(jiān)控的目的不是為了看到發(fā)生侵入現(xiàn)象前后相減的圖像,而是為了在不用直接觀察監(jiān)視器的情況下就能判斷是否有侵入現(xiàn)象,所以只要計算出發(fā)生異常區(qū)域所占的比例即可,以此為依據(jù)進(jìn)行侵入現(xiàn)象判斷.
3)交叉掃描方式偵測
把整個監(jiān)視場景圖像交叉劃分,在整個監(jiān)控圖像區(qū)域形成一張柵格監(jiān)控網(wǎng).偵察掃描有間隔的行和列的像素段數(shù)據(jù),如果圖像中某幾個地方有異常,將相當(dāng)于“網(wǎng)”的某幾段有觸動.實(shí)質(zhì)上就是把實(shí)時圖像與原始圖像相比較,判斷在哪幾段的像素值發(fā)生了灰度變化,根據(jù)發(fā)生變化的情況,判斷場景的異常.這種方法的優(yōu)點(diǎn)是計算量小.
4)交錯馬賽克方格方式偵測
該偵測方法用均勻分布的小塊區(qū)域圖像統(tǒng)計的方法偵測場景圖像的變化.把整個偵測區(qū)域分成多塊交錯小方格,每個小方格代表一塊探測區(qū)域.這種方式容易消除一些因自然的光照問題而產(chǎn)生的不規(guī)則灰度變化影響,比用單一細(xì)線網(wǎng)格方式偵測更能反映局部變化情況.
表1給出了采用人工監(jiān)控和智能監(jiān)控兩種方式下,分別采用高、低分辨率對某場所進(jìn)行12h實(shí)時監(jiān)控時所用的查詢時間及占用磁盤空間的對比實(shí)驗數(shù)據(jù).

表1 兩種監(jiān)控方式下的監(jiān)控數(shù)據(jù)
實(shí)驗分析表明,在相同監(jiān)控時間下,智能監(jiān)控查詢所需時間縮短,占用磁盤空間減小,降低了成本,提高了檢出率,適應(yīng)實(shí)時性要求.
通過比較,線像素內(nèi)存操作模式比點(diǎn)像素處理模式速度快60~90倍,故圖像監(jiān)視系統(tǒng)中應(yīng)首先考慮采用線像素內(nèi)存操作模式.
通過實(shí)際測試,動態(tài)圖像中各像素的噪聲干擾信號可通過選取合理的閾值過濾掉,閾值一般取8~26.圖像亮度小,閾值可取較小值;亮度大,可取較大值.圖像減法運(yùn)算準(zhǔn)確直觀;顏色分量比較方式速度比較快;交叉網(wǎng)格掃描方式比較適中;交錯馬賽克方格掃描方式偵測具有一定的均衡性.因此,線像素內(nèi)存操作模式的四種方式可分別用于不同的場合,也可以根據(jù)實(shí)際環(huán)境情況,按照可靠性和準(zhǔn)確性的不同要求,對其中的方式進(jìn)行動態(tài)調(diào)整.
本文研究的基于數(shù)字圖像處理的智能監(jiān)控系統(tǒng),克服了傳統(tǒng)的監(jiān)控系統(tǒng)存在的諸多缺點(diǎn).具有實(shí)時性強(qiáng),反應(yīng)速度快,外存儲器容量要求小,智能化程度高等優(yōu)點(diǎn).為分散式小型監(jiān)視系統(tǒng)的實(shí)現(xiàn)提供了一個簡易而方便的構(gòu)建方案.它適應(yīng)于不同層次的家庭防盜、小區(qū)保安、醫(yī)療監(jiān)視和教學(xué)、銀行監(jiān)視和變電所無人職守等系統(tǒng)中.本文論述的方法同樣可以應(yīng)用于其他智能監(jiān)控系統(tǒng)中.
系統(tǒng)的智能化程度取決于智能軟件的程度,基于專家系統(tǒng)的智能監(jiān)控系統(tǒng)將提高智能監(jiān)控水平.
[1]AdlemanL.Molecularcomputationofsolutiontocombinatorialproblems[J].Science, 1994, 66: 1021-1024.
[2]OuyangQ,KaplanPD,LiuSM, et al.DNAsolutionofthemaximalcliqueproblem[J].Science, 1997, 278: 446-449.
[3]QinJ,ZengXP,LiYM, et al.Intelligentsurveillantsystembasedonvideoanalysis[J].ComputerEngineeringandApplications, 2008, 44(25) : 6-8.
[4]RossDA,LimJW,LinRS,et al.Incrementallearningforrobustvisualtracking[J].InternatianalJournalofComputerVision, 2008,77:125-141.
[5] 劉富強(qiáng).多媒體圖像技術(shù)及應(yīng)用[M].北京:人民郵電出版社,2000.
[6] 蔣先剛.基于delphi的數(shù)字圖像處理工程軟件設(shè)計[M].北京:中國水利水電出版社,2006.