范海紅
(浙江郵電職業技術學院 管理信息學院,浙江 紹興 312000)
近幾年,隨著電子商務迅速發展,相應的物流產業也快速發展,包裹數量遠超歐美國家的總和。但在物流技術比如包裹圖像識別等方面為我國還相對落后。目前,計算機圖像識別等已經在人臉識別、醫學圖像中廣泛應用,如何將圖像識別技術運用到物流運輸等行業中成為比較熱門的話題。物流運輸中,包裹圖像的檢測非常重要,可以快速有效地確定包裹的數量,分配資源,同時也能避免卡塞、掉落等異常現象。但在運送過程中包裹很容易產生遮擋現象,從而導致包裹檢測困難的增加,因此必須使用分類器來識別包裹特征。所以本研究通過引入卷積神經網絡獲得特征,從而完成包裹圖像識別等的檢測任務。
卷積神經網絡系統是一個涉及卷積處理計算的深層次的前饋神經網絡,網絡結構一般涵蓋了數據輸入層、卷積計算層、池化層、連通處理層以及全連接層。卷積層可以提取大量數據的基本特征信息,通過卷積核的卷積運算得到輸入圖像的深層特征信息。池化層對卷積層的計算結果進行優化降維,降低圖像的分辨率,減少參數量,同時獲得圖像平移和形變的魯棒性。交替組合使用卷積優化層和圖像池化層,完成圖像特征信息的提取,同時降低圖像的分辨率,完成數據降維效果。
目前,最常見的卷積神經網絡有很多,比如AlexNet、VGG、ResNet等。而VGG網絡系統在圖像數據獲取方面也相當優秀,而且泛化能力強大,使用范圍廣闊。目前,VGG-16網絡系統主要分為十三個卷積層和三處全連通層,卷積核為3×3,步長為1,該網絡可以減少參數優化計算。為降低包裹檢驗的時間消耗和內存耗費,本文采用了VGG-16網絡技術來獲取特征信息,并將ImageNet數據集上VGG-16權重值作為本文提取網絡特征的起始權重,輸出的特征信息用作包裹檢測依據。
區域生成網絡RPN 通過CNN 提取到特征信息,獲取候選框。而網絡訓練過程中,每個像素點都會產生9個錨節點,在分類層中,利用激活函數softmax對每一個錨節點進行判斷,區分為前景圖像還是背景圖像,在回歸層中,通過調整錨節點的參數,擬合得到候選框位置,綜合前景圖像和候選框位置生成候選區域,RPN網絡結構圖如圖1所示。

圖1 RPN網絡結構圖
Faster R-CNN 算法是基于卷積神經網絡的Fast R-CNN 算法和RPN 網絡結構結合實現的算法。與經典的檢測框生成方法不同,Faster R-CNN直接采用RPN網絡結構獲取檢測框,提升生成速度。首先,通過RPN網絡搜索出粗略范圍,識別出保護壓板所在區域,然后用投入狀態和退出狀態的壓板圖片對Faster R-CNN進行訓練,從而提高算法對壓板投退特征的識別能力,最后采用已訓練完成的Faster R-CNN算法對RPN算法劃定的搜索范圍進行特征檢索,識別搜索框中壓板的投退狀態。Faster R-CNN算法的原理圖如圖2所示。

圖2 Faster R-CNN算法設計原理演示圖
當對一個包裹目標進行定位分類時,常常需要用一個定位分類器對不同包裹類型進行計算。目前,我們使用的主要包裹檢測方法是SVM分類器,在結合卷積神經網絡的包裹追蹤檢測算法中,使用Softmax 分類函數計算包裹目標追蹤概率,并以此方式判斷包裹類別和完成包裹目標的定位。目標定位時,先開始得到一個候選框,接著再開始使用全連接層和Softmax函數對每個包裹進行定位劃分。由于部分候選框并沒有很精確地選中目標物,所以就必須對每個候選框都作出細微的調節,這個方法就叫做邊界框調整回歸。如圖3所示,最原始的目標候選框為一個虛線框P,而回歸目標框為點線框G,回歸目的為利用大數據訓練得到與目標候選框P和回歸目標框G更接近的回歸框(實線框S)。當P和G之間的距離較近時,回歸法對確定目標的位置更精確有效。

圖3 邊界框回歸示意圖
邊界框回歸過程中,主要利用回歸算法完成對檢測框位置的調整,包括大小和長度比的調整。具體坐標參數化設定:

其中,水平方向的中心為,垂直方向中心為,和表示寬和高,而表示真實的目標框G的數據,表示初始候選框P 的數據,從而目標框數據可以用(t,t,t,t)表示。
為了完成目標劃分和定位功能,在卷積層中使用的卷積核都必須進行訓練,并且還必須把分類損失函數L與定位損失函數L結合,融合到同一個損失函數里。采用基于Softmax的損失函數作為分類損失函數,而Faster R-CNN的損失函數主要定義如下:



由于快遞中轉中心產生了大量包裹,從而形成聚集現象,容易導致包裹識別錯誤。本文通過使用RepGT損失函數調節包裹檢測計算中的回歸項,以選取更合理的候選框,從而減小預測框與目標框之間的間距,并增加與其周圍非相應目標框的間距。因而可以設計的損失函數如下:




是(0,1)區間上連續可微的函數,∈[01)是異常值的敏感參數。可以發現,如果同時存在多個候選框都與目標框重合,則RepGT損失函數就會通過增大懲罰損失使得整體的損失值不斷增大,這樣就能獲得對該目標框最合適的候選框。
本文將以改進前后的Faster R-CNN兩個檢測算法作為對照實驗,在Faster R-CNN的損失函數上再添加損失函數 。全部實驗都在同樣的實驗條件下完成,并且設置相同的計算參數,其中正則化系數為10,動量系數為0.9,通過隨機梯度下降算法完成優化。初始學習效率為0.001,在20 000 次迭代后進行0.1倍的衰減,共計迭代60 000次。
為檢驗Faster R-CNN算法的有效性,選擇了物流企業某時刻下的包裹數據圖片,利用改進后的Faster R-CNN網絡,對包裹目標信息進行了檢驗。具體的訓練方法是,在同樣的實驗數據和同樣的參數訓練網絡下,先得到訓練模型,并在測試集中進行測試,然后對測試結果進行統計分析。
圖4的數據分析結果可得,通過增加RepGT損失函數得到的改進后的算法可以更高效、更準確地分離目標框,相比傳統的Faster R-CNN,檢測效率更佳。從表1中可發現,對于平均準確精度AP值,傳統Faster R-CNN 的檢測準確度為56.60,而改進后的算法檢測準確度達到了58.98,比傳統的Faster R-CNN算法增加了2.38AP,在精度方面有了顯著的提高。

圖4 算法實驗結果對比圖

表1 包裹檢測數據集的測試結果


表2結果表明隨著參數的變化,模型性能也跟著變化,對算法的檢測精度也有一定的影響。表中結果表明當參數1 時,包裹檢測數據集中檢測精確度最佳。

表2 不同參數的測試結果
針對密集包裹檢查問題,建立了由損失函數改進的Faster R-CNN 的檢查計算。使用了傳統的Faster R-CNN的包裹檢查流程,包含了特征提取、區域形成、目標定位和分析,并結合RepGT損失函數對密集堆積包裹和遮擋現象中的問題進行了計算修正,并通過數據實驗得到結果,顯示改進后的檢測精度從56.60提升到58.98。同時對損失函數中參數做了調試分析,得出在參數1 時算法性能良好,有待今后研究借鑒。但針對現代物流中的包裝檢驗問題,目前還是存在著類似于小目標包裝檢驗、人工標注等方面的不足,仍有待今后進一步研究。