■韓志濤
(山西科技學院能源工程學院,山西 太原 030499)
隨著人工智能與大數據的高速發展,圖像分類任務作為大數據處理中的一個基本任務,受到了學者們的廣泛關注。圖像分類是通過算法找出一副圖片的所屬類別,計算機不同于人類的大腦,它無法顯式地判斷給定圖片的類別。這就要求算法具有提取圖像中隱含信息,即特征的能力,在特征提取之后,算法通過判斷特征與已有數據的標簽類別的相似程度,將圖像進行分類,這種技術廣泛應用于人臉識別、自動駕駛、點云數據識別等領域。然而傳統的圖像分類技術只能提取簡單的圖像特征,如顏色、位置、形狀等,這是由于即使是一張維數很小的圖片,其特征數也會達到百萬級別,傳統的圖像分類算法無法同時識別數據量如此巨大的特征數,并且對其進行分類。
人工神經網絡(artificial neural networks,ANN)的出現解決了這一難題[1],最基本的人工神經網絡包括輸入層、隱藏層和輸出層,如圖1所示,人工神經網路通過模擬人體神經元的工作模式,在算法層面實現一種自適應性的學習模式,使得模型具有學習數據中隱含知識的能力。在人工神經網絡的基礎上,陸續提出了前饋神經網絡、卷積神經網絡、遞歸神經網絡、生成對抗網絡等。為了進一步提升圖像分類的性能,2012年,Krizhevsky等[2]提出了AlexNet網絡。該網絡作為深度學習的代表,在卷積神經網絡的基礎上,用多個小卷積層的疊加替換了單個的大卷積層,獲得了非常好的圖像分類能力?!?br>