陳小龍
(廣州供電局有限公司,廣東廣州,510000)
目前的視頻監(jiān)控系統(tǒng)并沒有自動分析功能,自動化程度低,運行人員不能利用這些監(jiān)控系統(tǒng)及時發(fā)現(xiàn)問題,及時處理。為使監(jiān)控系統(tǒng)功能更加智能化,需要利用圖像處理技術(shù)在視頻監(jiān)控中自動識別異常事件及設(shè)備狀態(tài),以機(jī)器的方式代替人力監(jiān)控工作,對可能或已經(jīng)發(fā)生的異常現(xiàn)象及時告警并保存現(xiàn)場的圖像資料,便于及時發(fā)現(xiàn)危險隱患,保障安全生產(chǎn),為無人值守模式提供更完備、可靠的保障。本項目主要研究內(nèi)容為基于深度學(xué)習(xí)算法的變電站內(nèi)鳥巢智能識別研究。
數(shù)字圖像處理和識別的研究開始于1965年。數(shù)字圖像與模擬圖像相比具有存儲,傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優(yōu)勢,這些都為圖像識別技術(shù)的發(fā)展提供了強(qiáng)大的動力。現(xiàn)代圖像識別技術(shù)的一個不足就是自適應(yīng)性能差,一旦目標(biāo)圖像被較強(qiáng)的噪聲污染或是目標(biāo)圖像有較大殘缺往往就得不出理想的結(jié)果。圖像識別問題的數(shù)學(xué)本質(zhì)屬于模式空間到類別空間的映射問題。目前,在圖像識別的發(fā)展中,主要有三種識別方法:統(tǒng)計模式識別、結(jié)構(gòu)模式識別、模糊模式識別[1]。
現(xiàn)有的深度學(xué)習(xí)模型屬于神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)的歷史可追述到上世紀(jì)四十年代,曾經(jīng)在八九十年代流行。神經(jīng)網(wǎng)絡(luò)試圖通過模擬大腦認(rèn)知的機(jī)理,解決各種機(jī)器學(xué)習(xí)的問題。2006 年,Geoffrey Hinton 提出了深度學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)再度成為熱門研究技術(shù)。其原因在于大數(shù)據(jù)在很大程度上緩解了訓(xùn)練過擬合的問題。計算機(jī)硬件的飛速發(fā)展提供了強(qiáng)大的計算能力,使得訓(xùn)練大規(guī)模神經(jīng)網(wǎng)絡(luò)成為可能。此外神經(jīng)網(wǎng)絡(luò)的模型設(shè)計和訓(xùn)練方法都取得了長足的進(jìn)步。非監(jiān)督和逐層的預(yù)訓(xùn)練使得在利用反向傳播對網(wǎng)絡(luò)進(jìn)行全局優(yōu)化之前,網(wǎng)絡(luò)參數(shù)能達(dá)到一個好的起始點,從而訓(xùn)練完成時能達(dá)到一個較好的局部極小點。
2007 年人臉識別技術(shù)開始興起。Labeled Faces in the Wild (LFW)是當(dāng)今最著名的人臉識別測試集,測試集包含了6000 對人臉圖像,隨機(jī)猜的準(zhǔn)確率是50%。LFW 從互聯(lián)網(wǎng)收集了五千多個名人的人臉照片,用于評估人臉識別算法在非可控條件下的性能。在非深度學(xué)習(xí)的算法中,最好的識別率是96.33%。目前深度學(xué)習(xí)可以達(dá)到99.47%的識別率。
智能視頻監(jiān)控系統(tǒng)的發(fā)展十分迅猛,國內(nèi)外的許多學(xué)者對行人目標(biāo)區(qū)域跟蹤方面的理論與技術(shù)做出了重要的貢獻(xiàn)。檢測的方法主要包括運動區(qū)域檢測,目標(biāo)識別與分類,目標(biāo)特征描述,目標(biāo)跟蹤檢測,動作識別行為理解幾個部分。而目標(biāo)的特征描述是識別目標(biāo)的重要環(huán)節(jié),國內(nèi)多采用方向梯度直方圖HOG,SIFT特征描述子,Haar-like特征,LBP紋理特征等。模型訓(xùn)練是分類的一個常用方法,SVM分類器,也叫作支持向量機(jī),以及分類器Adaboost等都可以起到這個作用。在目標(biāo)跟蹤方法上有Mean-Shift、對Mean-Shift的改良算法Camshift、粒子濾波、跟蹤-學(xué)習(xí)-檢測算法等。在人體動作識別方面,可以歸為兩類方法:單層模型和多層模型的方法。
關(guān)于區(qū)域跟蹤技術(shù),有國內(nèi)學(xué)者設(shè)計開發(fā)了基于OpenCV的校園智能視頻監(jiān)控系統(tǒng),另外采用分模塊設(shè)計智能監(jiān)控系統(tǒng),改進(jìn)了前景提取的方法,將幀差法和背景差分法結(jié)合起來實現(xiàn)互補。在目標(biāo)跟蹤模塊中使用卡爾曼濾波法,提取了目標(biāo)特征,進(jìn)行目標(biāo)匹配。將HOG特征與LBP特征結(jié)合,再使用SVM分類器一起檢測行人。二且結(jié)合LBP特征提取圖像中小部分的紋理信息,使HOG算法更為準(zhǔn)確。針對擁擠的人群,可以利用紋理特征提出一種新的判斷方法。再次在光流場的基礎(chǔ)上,在光流的算法中考慮會改變的亮度,建立新的模型并實施檢測。線性變化的亮度給光流計算提供新的約束,從而增強(qiáng)易于被亮度影響的光流的有效檢測。再有把金字塔光流和FAST角點作為特征點,利用金字塔光流追蹤。利用光流計算特征點的加速度,用于表示運動的加速度特性。在光流水平豎直兩個分量的基礎(chǔ)上進(jìn)行研究,通過不同行為構(gòu)建表征運動特征的模型。隨著時間的推進(jìn),把光流方向直方圖進(jìn)行累加。
站內(nèi)設(shè)備架構(gòu)上存在鳥巢,而且鳥巢由樹枝疊成,遇到風(fēng)雨天氣能造成設(shè)備短路,嚴(yán)重威脅變電站的安全可靠運行。現(xiàn)階段監(jiān)控攝像頭,對視頻及圖像還是通過現(xiàn)場人員進(jìn)行肉眼識別,人工判斷,智能化程度極低。項目將對所有現(xiàn)場獲得的視頻或進(jìn)行多源異構(gòu)數(shù)據(jù)融合與清理,建立基于人工智能、深度學(xué)習(xí)的多輸入快速的鳥巢識別技術(shù)是本項目的技術(shù)關(guān)鍵點及難點之一[2]。
鳥類的筑巢行為也會影響變電站的安全運行,極易造成線路短路或跳閘。為了保證電網(wǎng)的正常運行,必須對鳥類在輸電線路上的筑巢行為進(jìn)行監(jiān)控、預(yù)警和防護(hù)。由于傳統(tǒng)識別算法的局限性及識別率隨樣本數(shù)量增大趨于飽和的特點,將深度學(xué)習(xí)方法應(yīng)用到鳥巢識別技術(shù)中,設(shè)計出深度學(xué)習(xí)網(wǎng)絡(luò)對特征自動進(jìn)行提取,成功避免了特征選擇的影響,隨著訓(xùn)練樣本的增多以及網(wǎng)絡(luò)模型的強(qiáng)大,將取得最優(yōu)的檢測結(jié)果。本研究選取變電站場地的構(gòu)架作為監(jiān)測試驗對象[3]。如圖1所示。

圖1 基于深度學(xué)習(xí)算法的變電站內(nèi)鳥巢智能識別
深度學(xué)習(xí)源于大腦認(rèn)知原理的研究,是一種能夠模擬出人腦的神經(jīng)結(jié)構(gòu)的機(jī)器學(xué)習(xí)方式,從而能夠讓計算機(jī)擁有人工智能,大家所熟知的 AlphaGo 就是深度學(xué)習(xí)典型的一個應(yīng)用。深度學(xué)習(xí)的許多研究成果,離不開對大腦認(rèn)知原理的研究,尤其是視覺原理的研究。人類識別氣球的視覺原理如下:從原始信號攝入開始(瞳孔攝入像素 Pixels),接著做初步處理(大腦皮層某些細(xì)胞發(fā)現(xiàn)邊緣和方向),然后抽象(大腦判定,眼前的物體的形狀是圓形的),然后進(jìn)一步抽象(大腦進(jìn)一步判定該物體是只氣球)。

圖2 深度學(xué)習(xí)與傳統(tǒng)目標(biāo)檢測算法比較
使用深度學(xué)習(xí)方法進(jìn)行分類能夠更好的提取特征,以及模型能夠具備更強(qiáng)大的描述能力;所以基本上對深度學(xué)習(xí)的使用也慢慢的從當(dāng)成特征提取進(jìn)步到特征提取與分類、回歸等問題結(jié)合起來的端到端(End-to-End)方式。基于深度學(xué)習(xí)的目標(biāo)檢測算法,主流的檢測方式有兩種:基于候選區(qū)域的,如 R-CNN、SPP-net、Fast R-CNN、Faster R-CNN、R-FCN;另一種是基于回歸方法的,端到端(End-to-End),無需候選區(qū)域的,如YOLO、SSD。
TensorFlow是一個采用數(shù)據(jù)流圖(data flow graphs),用于數(shù)值計算的開源軟件庫。TensorFlow 最初由Google Brain小組(隸屬于Google機(jī)器智能研究機(jī)構(gòu))的研究員和工程師們開發(fā)出來,用于機(jī)器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)方面的研究,TensorFlow計算框架可以很好地支持深度學(xué)習(xí)的各種算法,但這個系統(tǒng)的通用性使其也可廣泛用于其他計算領(lǐng)域。它靈活的架構(gòu)讓你可以在多種平臺上展開計算。如圖3所示,TensorFlow與其他深度學(xué)習(xí)工具進(jìn)行對比分析,該軟件效果更理想。

圖3 不同深度學(xué)習(xí)工具社區(qū)流行度指標(biāo)比較(2016年11月17日GitHub)