桂 豐,丘靈華
(惠州市博實結科技有限公司,廣東 惠州 516000)
圖像分類作為計算機視覺領域的重要任務之一,旨在將圖像準確地分為不同的類別。近年來,隨著深度學習技術的飛速發展,基于深度神經網絡的圖像分類方法取得了顯著的進展。然而,現有的圖像分類方法仍然存在一些問題,如過分關注正負樣本區分導致泛化能力差,只訓練正樣本聚合特征而忽視正負樣本間的區別以及將樣本分成大量類別導致分類效率低下。
為了解決這些問題,本文提出了一種圖像單類別分類的新方法。該方法通過深度神經網絡結合對比損失函數和中心損失函數進行訓練,有效學習目標圖像的聚合特征,同時充分考慮正負樣本之間的區別。該方法的核心在于設計的對比損失函數,使目標圖像特征之間的距離盡可能接近,而目標圖像特征與非目標圖像特征之間的距離盡可能遠離,從而實現單類別分類的目標[1]。
本實驗采用了多個數據集和不同類別的圖像,包括交通紅綠燈和產品的合格和缺陷圖像。經過大量實驗驗證,本文的方法在不同數據集上取得了顯著的分類效果,并展現了優越的泛化能力和高效率的分類性能。
本文提出了一種新的圖像單類別分類方法,旨在解決傳統圖像分類方法在單類別場景下存在的問題。該方法采用深度神經網絡,并結合對比損失函數和中心損失函數進行訓練,以有效學習目標圖像的聚合特征并充分考慮正負樣本之間的區別。圖像分類步驟如圖1所示。

圖1 圖像分類步驟
本文通過現有數據集或者在線數據采集等方式,采集多張目標圖像和多張非目標圖像,并將它們分別放入設定的目標圖像文件夾和非目標圖像文件夾。
在數據預處理階段,實驗將采集到的圖像進行大小調整,以適應深度神經網絡的輸入尺寸要求。同時,圖像進行歸一化處理,將像素值縮放到[0, 1]范圍內或[-1, 1]范圍內。
在本方法中,此研究可以選擇VGG、ResNet或MobileNet等深度神經網絡作為基礎模型。根據問題的特點和數據集的大小,模型可以進行適當的調整和設計,包括增加或減少層級、調整卷積核大小等[2]。
在模型訓練過程中,此研究需要定義損失函數,并根據權利要求中的描述,可以采用對比損失函數和中心損失函數。
對比損失函數用于學習目標圖像的特征和非目標圖像特征之間的差異。具體的對比損失函數可以表示為:
L1= ∑1≤i≤N‖f(Ii)-f(Ji)‖^2 + ∑1≤i≤Nmax{0, 2- ‖f(Ii)-f(Ki)‖^2}
其中,N表示訓練樣本的數量,Ii表示第i個目標圖像,Ji表示與Ii對應的其他目標圖像(不同圖像,同類別),Ki表示與Ii不同類別的非目標圖像,f(Ii)表示目標圖像Ii在深度神經網絡中得到的特征表示。
中心損失函數用于學習目標圖像特征和中心特征之間的差異。具體的中心損失函數可以表示為:
L2= ∑1≤i≤N‖f(Ii)-c‖^2 + ∑1≤i≤Nmax{0, 2- ‖f(Ki)-c‖^2}
其中,c表示目標圖像特征的中心,該中心是在訓練過程中動態學習得到的。
實驗采用最小化優化算法(如SGD或Adam)和反向傳播算法,以最小化總的損失函數(L=L1+L2),從而更新深度神經網絡模型的參數。訓練過程中,可以設置訓練輪數和學習率等超參數。
在模型訓練完成后,實驗者可以通過驗證集或測試集對模型進行評估,計算分類準確率、召回率等性能指標。
實驗輸入一張待分類的圖像到訓練得到的深度神經網絡模型中,通過前向傳播計算該圖像的特征表示。然后,將該特征與目標圖像的中心特征進行對比,以判斷圖像是否屬于目標類別。
以上即為基于深度神經網絡的單類別分類方法的具體步驟。通過這些步驟,本文可以實現對單一類別圖像的高準確率分類,并在應用中進行目標檢測和圖像識別等任務。
2.1.1 圖像單類別分類裝置模塊
如圖2所示的圖像單類別分類裝置是用于執行前文提出的圖像單類別分類方法的設備。裝置包括以下模塊:

圖2 實驗設置
(1)輸入模塊10。
該模塊負責接收圖像數據作為輸入。輸入模塊包含2個子模塊,分別是目標圖像采集模塊11和非目標圖像采集模塊12。目標圖像采集模塊用于收集與目標類別相關的圖像樣本,而非目標圖像采集模塊用于收集其他類別的圖像樣本。
(2)處理器20。
該模塊與輸入模塊10電連接,采用單片機的形式(例如AT89S52、STC89C51RC或STC89C52RC中的任一種)。處理器負責根據預設程序對其他模塊的工作進行控制,并協調裝置的整體運行。
(3)存儲器30。
存儲器包含目標圖像文件單元31和非目標圖像文件單元32,用于存儲已采集的目標圖像和非目標圖像。此外,存儲器中還存有用于圖像單類別分類的預設程序,且該程序可能包括模型參數、訓練樣本等。
(4)訓練模塊40。
訓練模塊是深度神經網絡模塊41,其用于執行圖像分類訓練。訓練模塊內部包含第一損失函數單元411和第二損失函數單元412,用于幫助模型優化和訓練過程中的損失計算。
(5)顯示模塊50。
顯示模塊是一個顯示屏,用于展示圖像類別預測結果。在模型進行圖像分類預測后,結果將在顯示屏上顯示。
(6)輸出模塊60。
輸出模塊是預測模塊61,負責對輸入圖像進行分類預測。預測結果可以通過顯示模塊50展示給用戶,也可以連接到其他外部設備進行進一步處理或應用。
2.1.2 整個裝置的工作流程
整個裝置的工作流程如下:首先,輸入模塊10通過目標圖像采集模塊11和非目標圖像采集模塊12收集的所需圖像樣本,并將它們傳遞給存儲器30進行存儲。其次,處理器20根據預設程序控制訓練模塊40進行深度神經網絡的訓練。訓練完成后,輸入模塊10將待分類的圖像傳遞給輸出模塊60進行預測。最后,預測結果將通過顯示模塊50顯示給用戶或輸出到其他設備中。
總之,該圖像單類別分類裝置結合了深度學習技術和現有的圖像處理技術,并能夠對圖像進行高效準確的分類,廣泛應用于圖像識別、智能監控等領域。
根據描述,該裝置涉及2個應用場景:交通標志和紅綠燈識別和產品缺陷檢測,均采用深度神經網絡進行分類訓練和預測。
2.2.1 交通標志和紅綠燈識別
在這個應用場景中,圖像單類別分類的目標是識別交通標志或紅綠燈,將其設定為目標圖像,同時將其他非目標圖像(如行人、車輛等)設定為非目標圖像。為了實現這一目標,首先需要采集大量交通標志、紅綠燈的圖像和其他非目標圖像,作為訓練數據用于深度神經網絡的分類訓練。
在訓練過程中,深度神經網絡作為一種強大的機器學習模型,用于自動從圖像中學習特征和模式。這種神經網絡通常由多個層次組成,包括卷積層、池化層和全連接層,可以有效地提取圖像中的信息和特征。通過將大量交通標志或紅綠燈的圖像輸入深度神經網絡,并根據其真實標簽進行訓練,網絡可以逐漸調整自身參數以提高對目標圖像的識別準確性。
經過一段時間的分類訓練,深度神經網絡將學習到辨別目標圖像和非目標圖像之間的差異和特征,從而得到了一個交通標志或紅綠燈的圖像分類器,能夠準確地將輸入的圖像分為2類:目標圖像或非目標圖像。
當輸入任意一張圖像時,分類器會對圖像進行分析和處理,然后輸出一個分類預測結果。如果輸入圖像屬于交通標志或紅綠燈的類別,分類器將預測它是目標圖像;如果輸入圖像屬于其他非目標類別,分類器將判斷它不是目標圖像。
這種圖像單類別分類的方法具有廣泛的應用前景。例如,它可以用于交通監控系統中的標志和信號燈檢測,幫助識別特定目標是否出現在監控畫面中。同時,該方法也可用于無人駕駛汽車中的場景,通過訓練網絡來識別交通標志和信號燈,提高自動駕駛車輛的安全性和可靠性。
2.2.2 產品缺陷檢測
在產品缺陷檢測應用場景中,圖像單類別分類的目標是識別合格產品圖像,將其設定為目標圖像,同時將缺陷產品圖像和異類產品圖像設定為非目標圖像。為了實現這一目標,將收集的大量合格產品圖像作為訓練數據,并將缺陷產品圖像和異類產品圖像作為負樣本,用于深度神經網絡的分類訓練。
在訓練過程中,本文利用深度神經網絡對圖像進行特征學習和模式識別。該網絡通過多層次的卷積、池化和全連接層來提取圖像的高級特征,從而能夠區分合格產品圖像與缺陷產品圖像或異類產品圖像之間的差異。反復訓練數據輸入神經網絡可以將誤差反向傳播和參數優化,使得網絡逐漸調整自身權重和偏置,從而提高對合格產品的識別準確性。
經過一段時間的分類訓練,深度神經網絡將學習到合格產品圖像的獨特特征和模式,從而得到了一個合格產品分類器。合格產品分類器能夠準確地將輸入的產品圖像分為2類:合格圖像和不合格圖像。
當輸入任意一張產品圖像時,合格產品分類器會對圖像進行處理和分析,然后輸出一個判定結果。如果輸入的產品圖像屬于合格產品的類別,分類器將預測它是合格圖像;如果輸入的圖像屬于缺陷產品圖像或異類產品圖像,分類器將判斷它為不合格圖像。
這種圖像單類別分類方法具有廣闊的應用前景。例如,在制造業中,該方法可以用于產品質量檢測,幫助及時發現和剔除缺陷產品,提高產品質量和生產效率。同時,該方法也可用于安防領域,用于識別合格產品和異常產品,以保障產品的合規性和用戶的安全。
在實際應用中,圖像數據的多樣性、光照、角度等因素對分類器性能的影響還需進一步考慮,并采用深度神經網絡的優化和模型壓縮等技術來提高分類器的準確性和實時性。這2個實施案例都充分說明了本文提出的圖像單類別分類方法應用的廣泛性[3]。通過深度神經網絡的訓練,該方法能夠對圖像進行有效分類,應用于動物圖像識別、產品缺陷檢測等領域,為用戶提供準確的分類結果,具有較高的實用價值。
經過實驗,此研究取得了較好的效果,且結果表明,深度神經網絡可以準確地識別目標圖像,并將其與非目標圖像區分開來,對網絡的結構和參數進行優化可以進一步提高分類器的準確性。在實際應用中,圖像數據的質量、網絡結構的優化和系統性能的實時性等因素還需要考慮,以進一步提高分類器的準確性和魯棒性。
本文提出的圖像單類別分類方法基于深度神經網絡,在圖像分類領域表現出良好的性能。深度神經網絡能夠從大量圖像數據中學習特征表示,通過對目標圖像和非目標圖像的分類訓練,得到了具有較高準確率的分類器。該方法能夠在不同的應用場景中進行遷移學習,即通過在一個場景中訓練得到的分類器,也可以用于另一個場景的圖像分類,具有較好的泛化能力。
通過產品缺陷檢測實驗,此研究以合格產品圖像為目標圖像,缺陷產品圖像和異類產品圖像為非目標圖像,經過訓練得到了一個合格產品分類器。該分類器能夠對輸入的產品圖像進行分類,判斷其是否合格。實驗結果表明,該分類器在識別合格產品方面表現出較高的準確率,對缺陷產品和異類產品也能夠進行有效區分。
此外,該方法對關鍵模塊進行了分析和優化。對于數據采集與預處理模塊,注意到圖像數據的質量和數量對分類器性能的影響很大。因此,在數據采集過程中,盡可能多地收集各類樣本,保證了數據的全面性和多樣性。在數據預處理階段,圖像增強和標準化處理提高了數據的質量和一致性。對于深度神經網絡模型,經典網絡結構根據具體任務對網絡進行了微調,以提高其性能。
總體而言,本研究提出的圖像單類別分類方法在動物圖像識別和產品缺陷檢測等應用場景中表現出了較好的效果。該方法具有很大的應用潛力,在工業、醫療、安防等領域具有重要的實用價值。然而,本方法仍然存在一些不足之處,例如對于少樣本學習和類別不平衡問題的處理還有待改進。今后的研究可以進一步優化方法,提高分類器性能,并探索更多的應用場景,拓展該方法的應用范圍。