王立凱
(南通大學,江蘇 南通 226000)
隨著社會的不斷進步,各方面對自動身份驗證的快速和有效性提出了越來越高的要求,同時卷積神經網絡在人臉識別上的應用技術得到了飛速發展。面部特征是一種具有很強自身穩定性和個體獨特性的人體自身屬性,所以面部特征識別成為一種有效身份認證的依據。
n模式的人臉查找任務即在所給數據集中找出與待測人臉相匹配的人臉,也就是回答“這人是誰”的問題。
數據預處理→數據輸入→訓練過程→驗證結果→最終測試→計算機輸出匹配錯誤&正確率。
在使用冬令營提供的學員照片進行試驗時發現,所有照片并非都是優質照片。很多照片在提交時并沒有統一化處理,半身照、燈影占比大、亮度過大和表情模糊等因素都會造成最終準確率低的結果。因此,需對數據進行相應的預處理。
1.3.1 歸一化處理
照片顏色歸一化、大小歸一化,處理后的圖片相對于原圖片人臉數據更明顯。
1.3.2 翻轉數據集
為達到準確識別,需要為機器提供大量數據進行訓練。一張人臉圖片翻轉后也是同一個人,且可以增加1倍的訓練數據量。實驗結果表明,翻轉數據集后的訓練結果會有更高的準確率。
(1)數據輸入
將100個同學、每人10張照片轉換為向量輸入,通過循環進行每張圖片的訓練。
(2)訓練過程
將100位同學每人前8張照片數據經過卷積、池化、dropout處理后輸出至全連接,卷積后輸出的數據向量進入訓練。
(3)驗證過程
用100位同學每人一張照片驗證訓練結果。(4)最終測試
用100位同學每人一張照片做最終測試。
2.1.1 卷積核的大小
根據7×7與3×3卷積核loss值的對比可以發現,在初始階段卷積核較大時準確率更低,因為卷積核越大每一次訓練時丟棄的特征值越多。但是,隨著訓練次數的增加,卷積核較大的實驗最終達到甚至高于同等條件下卷積核較小的實驗對象的準確值。
2.1.2 卷積核的數量
在一定范圍內,適當增加卷積核的數量可以提高準確率。剛開始設置的卷積核數目較少,運行出的精確度較低,且收斂慢;后來將卷積核數目增多,每次提取更多的特征,發現loss函數下降越快,識別精度越高。
2.1.3 卷積的層數
每一層卷積神經網絡提取一個特征值,提取的特征值越多,則越能區分每一張圖片。因此,理論上卷積的層數越多,圖像識別的準確率越高。
2.1.4 bitchsize尺寸
batchsize由原來的81變為40,每個網絡的神經元個數減少了,但是網絡的個數增多了1倍。batchsize指的是每一批處理的樣本數量。當batchsize增大時,處理速度會加快,但處理精度會下降。另外,batchsize太小會導致loss函數震蕩而不收斂。隨著batchsize的增大,處理數據量的速度加快,達到相同精度所需要的訓練次數數量越來越多,所以batchsize存在一個峰值。
2.1.5 dropout(丟棄率)
dropout的作用在于簡化網絡。網絡越復雜,需要的訓練數據越多,訓練速度會越慢。因此,適當增加丟棄率可以提高訓練速度。實驗驗證,適當提高dropout會減小噪聲導致的誤差,增加準確率。
學習次數越多,機器識別率越高。訓練次數初始值為50,準確率不高,在測試中將它逐步增加到100、200、300、400,準確率逐漸得到提高。
系統整體結構如圖1所示。
經過多次調參,最終達到較高的準確率,如圖2所示。

圖1 系統整體結構

圖2 多次調參的最終結果
人臉識別技術是未來生物特征識別的主流技術,無論是在應用范圍還是便捷程度方面,都擁有其他識別方式無可比擬的應用前景和優勢,但在防偽性和識別率上與指紋等其他識別方式有著較大區別。影響人臉識別結果準確率的因素主要包括以下幾個方面[1]:
(1)人臉圖片的背景可能會影響圖片的識別;(2)人臉自身不會保持不變,眼鏡、發型等都有可能影響準確率;
(3)人臉動態變化的表情可能會影響識別;
(4)設計各種領域的綜合性問題。
人臉識別技術最終要應用到大規模的人群識別中,因此如何快速準確地在大批人群中找到特定的人臉是人臉識別技術發展的方向。
每一張人臉互不相同,同樣每一塊局部也具有獨特的辨識特征。人臉識別現實應用時檢測到的人臉并不一定都是標準而且完整的,根據人臉的一部分來判別整張人臉是解決此類問題的有效方法。
鑒于目前卷積神經網絡的設計,已經做到準確率87.65%。通過增加訓練數據和訓練次數等方式,可以進一步提高正確率。
今后的工作方向是研究實驗過程中的數學原理,分析超參數對應的內涵和深度學習中的數據交換,將會是一個有趣的方向。