張祖赫
(浙江省新昌中學,浙江 紹興 312000)
利用圖像處理技術協助老師進行寢室管理,能在大大提高工作效率的同時改善相關問題。本文從寢室管理存在的問題出發,利用經典目標檢測算法Faster R-CNN構建寢室紀律監管系統,智能識別寢室在上課期間是否有人逗留,或檢測就寢時人是否到齊,從而解放老師的工作壓力并提高工作效率,幫助老師做好寢室監管工作,同時,這也能提高同學們自覺遵守學校規章制度的意識,讓校園多一分和諧與秩序。
神經網絡是一種受生物學啟發,模仿人類大腦結構的智能網絡。
前饋神經網絡又稱為多層感知機,是基于反向傳播算法[1](BP算法)的一種常見神經網絡,通常包含三個層次:輸入層、中間層和輸出層,每一層的輸出是下一層的輸入。其中,輸入層與輸出層的節點數根據任務而定,相對容易確定,而中間層則需要根據模型的表現進行不斷調整。神經網絡就如同一個復雜的函數,訓練神經網絡就是在學習其中參數的值。
在神經網絡中,神經元是最簡單的計算單元,其包含輸入、計算以及輸出。這些神經元相互連接構成神經網絡,通過訓練來修改它們的權值以獲得一個從輸入空間到輸出空間的映射。圖1為基本的神經元結構圖,其中,xn為輸入信號,wn為連接權值,θ表示一個閾值。

圖1 神經元結構圖
卷積神經網絡[2](Convolutional Neural Network,CNN)是一類主要用來處理圖像的前饋神經網絡,其結構示意圖如圖2所示。卷積神經網絡包含了輸入層、卷積層、池化層、全連接層等,采用稀疏連接的方式連接不同層之間的神經元,且同一層中同一個通道都共享一個卷積核權重,這樣既能減少計算量又能防止過擬合。

圖2 卷積神經網絡結構示意圖
2.2.1 卷積層
卷積層是卷積神經網絡中最重要的一層,其利用卷積核(也稱過濾器)對圖像進行卷積操作,從而生成一個跟原始圖像對應的特征圖。特征圖的優點在于其能保存圖像的顯著特征同時減小圖像的規模。
卷積層的計算方法如公式2.1所示。

其中,“σ”表示激活函數;“img”表示原始圖像的像素矩陣;“.”為卷積操作;“W”為卷積核;“b”為偏置。
2.2.2 池化層
池化層存在于卷積層之后,其作用是壓縮數據和參數的量,提取主要特征,避免過擬合。與此同時,還要保證特征不變性,去除特征不明顯的信息。池化層降低了特征圖的尺寸,能夠減少計算量,防止過擬合,使得特征具有平移不變性。
常用的有最大值池化(Max pooling)和平均值池化(Average pooling)兩種池化操作。(如圖3所示)

圖3 池化操作示意圖
目前,常用的基于候選區域的目標檢測算法有R-C NN、Fast R-CNN、Faster R-CNN等。基于候選區域的目標檢測算法需要分兩步,第一步是生成候選區域,第二步是對候選區域進行分類。R-CNN是從滑動窗口檢測器改進而來的,滑動窗口檢測器通過遍歷的方法掃描整個圖片,但這樣的缺點就是窗口過多,導致模型過慢,R-CNN則通過選擇性搜索(Selective Search)來獲取候選區域以減少窗口數量,從而達到加快模型速度的目的。Fast R-CNN則利用卷積神經網絡先提取圖像的特征網絡,再將生成候選區域的方法直接應用于特征圖上以加快速度。Faster R-CNN相比Fast R-CNN則將外部候選區域生成方法改成了由網絡自己選擇,從而突破生成候選區域計算慢的瓶頸。
Faster R-CNN[3]是一種基于分類的目標檢測算法,相比傳統目標檢測算法,其在精度上有著較明顯的優勢。該算法的思想是先通過區域生成網絡生成若干候選區域,再進行分類判斷。
3.2.1 特征提取網絡
在Faster-RCNN中,一般采用預訓練好的深度卷積神經網絡作為特征提取網絡。特征提取只需進行一次,之后,提取得到的特征圖會被區域生成網絡和分類網絡所共享,這樣可以避免重復計算,提高模型速度。
3.2.2 區域生成網絡(RPN)
區域生成網絡的引入,突破了外部候選區域生成方法計算慢的瓶頸。
區域生成網絡用來生成候選區域,由兩個子網絡構成,其中,分類子網絡用來判別矩形框(Anchor)是前景(目標)還是背景。邊框回歸子網絡則用來修正矩形框以獲得更精確的候選區域。
本系統采用Faster R-CNN作為目標檢測算法,其中,采用深度卷積神經網絡作為特征提取網絡。
本系統使用VGG-16[4]作為特征提取網絡。VGG-16的輸入為圖片,經過多次卷積計算和池化操作后得到原始圖像的特征,最后通過全連接層進行分類任務。
而在我們的寢室紀律監管系統中,VGG-16只用于特征提取,不用進行分類任務,所以我們取最后一層卷積層的輸出作為特征提取結果,即原始圖像的特征圖。
如圖4所示,Faster R-CNN網絡主要分為RPN和Fast R-CNN兩部分。兩者都有一部分來自預先訓練好的模型,故先使用模型對RPN和Fast R-CNN分別進行初始化和訓練,訓練完成之后,固定其中一個網絡進行交替訓練[5]。最終得到一個基于Faster R-CNN的寢室紀律監管系統。

圖4 基于Faster-RCNN 的寢室紀律監管系統
該系統利用校園內的監控設備對各個寢室進行實時監控,并將采集到的圖像傳入訓練好的寢室紀律監管系統中進行處理,可智能識別出寢室是否有人逗留以及有多少人,從而對寢室紀律行為進行實時的監管。
Faster R-CNN,是一個全卷積網絡,它的輸入為特征圖,輸出為候選框ROI,將候選框選擇、特征提取、分類、檢測框回歸都整合在了一個網絡中,通過對圖像生成候選區域,提取特征,判別特征類別并修正候選框位置。完全端到端,使得精度和速度大幅提升。本文使用經典目標檢測算法Faster R-CNN構建寢室紀律監管系統,有效減少老師們的工作量并提高工作效率。該系統可推廣到大部分學校,為老師提供方便。同時,也可應用到類似的環境中,用于安保工作,減少保安們的工作量。