999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于自編碼和知識蒸餾的表面缺陷檢測方法

2021-12-07 10:09:08劉太亨何昭水
計算機應用 2021年11期
關鍵詞:分類檢測方法

劉太亨,何昭水

(廣東工業大學自動化學院,廣州 510006)

0 引言

表面缺陷檢測是檢驗產品表面情況的重要步驟,是保證產品質量和制造效率的重要步驟。缺陷物品必須及時檢測并清除生產線,否則將嚴重影響后續裝配線,導致整體質量水平下降[1]。傳統上,表面缺陷檢查是手動執行的,這種檢測存在采樣率低、檢測精度低和效率低、勞動強度高等問題。因此,利用機器學習方法來替代人工檢測成為目前的主流檢測方法,因為采用自動化方式替代人工檢測,不僅可降低人工成本,而且可提高缺陷檢測效率[2-4]。

傳統的機器學習方法包括神經網絡[5]、支持向量機(Support Vector Machine,SVM)[6]等。例 如,Jeon 等[7]使 用Gabor濾波器并進行邊緣對檢測,并且將基于直方圖和梯度紋理特征輸入SVM來檢測板面上的劃痕。Song等[8]提出了一種基于熱軋鋼帶表面缺陷的局部二進制模式特征的方法。Ding等[9]提出了一種基于定向梯度特征直方圖和SVM的織物缺陷檢測方法。Chondronasios等[10]提出了一種基于灰度共發生矩陣的鋁型材表面缺陷分類方法。但是,這些方法有一定的局限性,如傳統的機器學習方法在現實生活中很難應用于復雜的缺陷情況,如遮擋、物體變形等,它們提取的特征水平低、不夠穩固。

近年來,隨著圖像處理和深度學習技術的飛速發展,深度神經網絡(Deep Neural Network,DNN)取得了重大成功,尤其在圖像分析和識別方面[11]。深度神經網絡能夠構建復雜的表示,并自動學習輸入和輸出之間的組成關系,將輸入圖像映射到輸出標簽。在表面缺陷檢測中,基于深度學習的方法是近年來的發展趨勢,大致分為三類:1)基于圖像分類;2)基于對象檢測;3)基于像素分割分成。為了提供高精度的缺陷檢測,許多研究者提出了基于深度學習的分類方法,試圖設計一個復雜的網絡結構,以提高檢測功率和缺陷分類的性能[12-13]。然而,為了追求高精度,這些復雜的網絡算法具有參數多、計算復雜、訓練時間長等缺點,對實際應用條件提出了嚴格的要求。這些方法并不適用于那些硬件條件低的中小企業,以至于難以在實際環境中大規模使用。

針對上述問題,本文提出了一種基于自編碼和知識蒸餾的表面缺陷檢測方法(Surface defect Detection method based on Auto-Encoding and Knowledge Distillation,SD_AEKD)。該方法包含兩個部分:缺陷檢測和分類。檢測模塊的目的是對輸入的原始圖片進行缺陷的定位。分類模塊的目的是將已經定位缺陷區域通過知識蒸餾方法進行類別分類。實驗結果表明,該方法不僅能夠精準地定位物品缺陷的區域,而且能夠提高分類的精度。

1 相關工作

知識蒸餾是將知識從大模型(Teacher Model)轉移到小模型(Student Model)的過程。盡管Teacher 模型(例如非常深的神經網絡或許多模型的集合)具有比小型模型更高的知識能力,但這種能力可能未得到充分利用。即使模型使用很少的知識能力,評估模型在計算上也可能同樣代價昂貴。知識蒸餾將知識從大模型Teacher 轉移到小模型Student 而不會喪失有效性。由于較小的模型評估成本較低,因此可以很容易將其部署在功能較弱的硬件(例如移動設備)上。

近年來,知識蒸餾在許多計算機視覺任務中得到了成功的利用。Hinton 等[14]率先探索神經網絡中的知識蒸餾的研究,通過研究圖像分類問題,將教師網絡的軟輸出定義為包含有用信息的知識,這些信息表示類內的相似性和多樣性。Romero 等[15]利用教師網絡隱藏層的中級提示來訓練一個薄而深的學生網絡。Li 等[16]提及的對象檢測研究中,小型檢測網絡有望在大型網絡的高級功能的監督下,學習更多有關對象表示的知識。Wei等[17]利用模擬和量化策略來訓練一個非常小的檢測網絡,在該方法中,通過轉移來自教師網絡的知識來提高學生網絡的性能;同時,將全精度網絡轉換為量化網絡,而性能不會大幅下降。通過對未標記數據進行知識蒸餾,自適應蒸餾知識損失(Adaptive Distillation knowledge Loss,ADL)[18]的性能優于僅使用硬目標的數據蒸餾方法。通過采用ADL,Student 檢測器的性能優于其Teacher 的性能。文獻[19-20]研究了在大型網絡的額外監督下訓練小型語義分割網絡的知識提煉策略。Liu 等[19]只是簡單地將分割問題視為聚合的單獨像素分類問題,用知識蒸餾策略對緊湊的語義分割網絡進行訓練。He 等[20]提出了一個新的親和力蒸餾模塊,將這些廣泛分離的空間區域之間的長期依賴性從教師模型轉移到學生模型。基于知識蒸餾技術的這些優勢,本文利用其來進一步提高SD_AEKD 的檢測精度,同時也使SD_AEKD具有高實時性。

2 本文方法

本文提出了一種用于物品表面缺陷檢測的基于自編碼和知識蒸餾的框架。該框架主要包含兩個主要部分:缺陷檢測和分類,如圖1所示。

圖1 基于自編碼和知識蒸餾的表面缺陷檢測方法流程Fig.1 Flow chart of surface defect detection method based on auto-encoding and knowledge distillation

2.1 缺陷檢測

2.1.1 級聯自動編碼器

自編碼器(Auto-Encoder,AE)網絡廣泛用于信息編碼和重建。通常,AE網絡包括編碼器網絡和解碼器網絡。該網絡由一個或多個解碼器層塊組成。編碼器網絡是一個轉換單元,通過它將輸入圖像轉換為多維特征圖像,用于特征提取和表示,獲取的要素圖中存在豐富的語義信息。相反地,解碼器網絡通過合并所有中間圖層中所學要素映射中的上下文信息來微調像素級標簽。此外,解碼器網絡可以使用向上采樣操作將最終輸出還原到與輸入圖像相同的大小。

由于物品表面缺陷是均勻紋理中的局部異常,缺陷和背景紋理具有不同的特征表示。利用AE 網絡了解缺陷數據的表示,找出物品表面缺陷的共性。因此,物品表面缺陷檢測問題變成了物體分割問題。使用編碼器解碼器體系結構將輸入缺陷圖像轉換為像素預測掩碼。

在級聯自動編碼器(Cascaded Auto-Encoder,CAE)中,新的圖像分割架構基于兩個AE 網絡的級聯,這兩個AE 網絡共享相同的結構。如圖1 所示,第一個網絡的預測掩碼作為第二個網絡的輸入,像素標簽的進一步微調在第二個網絡中執行。這樣,后一個網絡可以增強前一個網絡的預測結果。

圖2 顯示了單個AE 體系結構。由于物品表面膜不同,損壞點等相同缺陷具有不同的顏色。這種模棱兩可的顏色會影響AE 網絡的訓練。因此,將原始彩色圖像規范化為512 ×512 灰度圖像,然后輸入到AE 網絡中,以減少顏色干擾并加快缺陷分割。該體系結構由編碼器和解碼器組成,如圖2所示。

圖2 自動編碼器(AE)網絡的體系結構Fig.2 Architecture of Auto-Encoder(AE)network

解碼器網絡的結構與編碼器網絡相似。編碼器部分包括10個卷積層,每個卷積層包含3× 3卷積操作以及隨后的整流線性單元(Rectified Linear Unit,ReLU)非線性操作。兩個卷積層中每個層后跟2 × 2 最大池操作,步幅為2。本文在每個最大池層后將要素數量增加一倍,以減少語義信息的丟失。在兩個卷積層中每個層之后,在解碼器應用2 × 2向上采樣操作。向上采樣操作的結果與編碼器部分的相應要素貼圖串聯,以獲取最終要素貼圖。在最后一層,1× 1 卷積與軟最大層連接到AE網絡,以將輸出轉換為概率圖。最終預測掩碼是缺陷概率圖,其大小調整為與輸入圖像的大小相同。

上述AE 網絡中具有穩定的卷積范圍。此網絡很難“看到”整個缺陷并集成全局上下文以生成預測掩碼。在真實的工業檢驗環境中,產品缺陷區域的大小是不一樣的以及其缺陷的形狀也是多種多樣的。上述網絡不了解物品表面有更大的檢測對象,如灰塵和纖維。因此,必須設計不同尺寸的接受字段以適應這種情況。本文對空洞卷積進行單元化,以增加網絡檢測大缺陷的感受野。在圖3 中,圖(a)表示卷積是常規的3× 3 卷積,圖(b)表示卷積是因子為2 的3× 3 空洞卷積。空洞卷積將卷積中求和的像素外化,但總和像素與常規卷積相同。空白中卷積的權重為0,不參與卷積操作。因此,它們的有效感受野是7× 7。AE 網絡編碼器部分的常規卷積被填充1 和步幅1 所替換。AE 網絡中卷積的詳細參數顯示在表1中。在編碼器部分中,有四個卷積層被“卷積”所取代。

圖3 空洞卷積示意圖Fig.3 Schematic diagram of atrous convolution

表1 AE網絡中空洞卷積的參數Tab.1 Parameters of atrous convolution in AE network

為了訓練AE 網絡,改進了像素交叉熵與重量的減少wa設計。通常,物品表面的捕獲圖像的背景像素比有缺陷的像素多,因此要重新加權不平衡的類,即設置wdefect=0.8 和wbackground=0.2。損失函數定義為:

其中:wa表示權重;A=2 表示類數(背景和缺陷);N表示訓練樣本的大小;M表示每個圖像補丁中的像素數是指標函數,當=k時,它的值為1,否則為0是第i張圖像中的第j個像素補丁,表示的真實標簽;Pa(·)表示像素為第a類的概率,這是Softmax層的輸出。

2.1.2 閾值模塊

閾值模塊作為獨立模塊添加到ACMD 網絡的末尾,主要用于進一步優化預測掩碼的結果,它還可以對概率圖應用像素閾值操作。本文中,給定的閾值Gs分配給最終預測掩碼:

其中:ITH表示二值化后的最終圖像;Ipm表示二進制化后的預測掩碼圖像;Gs表示細化閾值。當ACMD 訓練時,Gs是檢驗體系結構中需要調整的唯一閾值。在ITH中,灰色值為0 的像素表示缺陷區域,灰色值為1 的像素表示非缺陷區域。為了便于顯示被檢測到的缺陷,在原始彩色圖像上用白色標記缺陷區域的像素。

2.1.3 缺陷區域檢測

當獲得所有可能缺陷的語義分割結果時,將進一步使用斑點分析來找到準確的缺陷輪廓,并從缺陷圖像ITH中提取基于缺陷輪廓的最小封閉矩形區域(Minimum Enclosed Rectangular area,MER)。這是因為MER 能夠準確地反映缺陷區域,最終使分類模塊的輸入更加準確和容易。

由于MER 具有隨機方向,因此本文基于仿射變換將斜MER 轉換為正方向。正MER 設置為關注區域(Region Of Interest,ROI),最終缺陷區域是這些ROI。這些缺陷是從原始圖像中裁剪出來,并將其輸入到下一個模塊進行分類。

2.2 缺陷分類

在分類模塊中,將缺陷區域劃分為特定類別。當被檢測的物品不同時,通過成像,相同的缺陷(損傷點)可能具有不同的顏色。因此,顏色信息無助于缺陷的分類。首先,將圖像的缺陷區域補丁轉換為灰度圖像,以減少不同背景顏色和照明的影響。其次,考慮到在工業應用中,系統檢測的精度、速度和效率等都是至關重要的。雖然較大的網絡可以實現高精度,但是較小的網絡運行時間較少,成本更低。因此,為了更好地權衡較大和較小網絡的優點,本文采用知識蒸餾的方法對物品缺陷區域進行分類。

在知識蒸餾中,為了保持Teacher 模型和Student 模型之間的功能一致性,本文中的Student 模型采用高至低分辨率網絡(High-to-low Resolution Network,HRNet)——HRNet-18[21],Teacher 模型采用HRNet-32,其中HRNet-32 與HRNet-18 具有相同的架構但HRNet-32要大得多。

所提出的知識蒸餾方法通過Teacher 和Student 的平行訓練進行。這意味著Teacher 和Student 的批處理大小、迭代計數、優化器以及學習率等訓練條件是相同的。此外,Teacher和Student 同時訓練。Teacher 經過訓練可以最大限度地減小Teacher 預測結果與真實結果之間的Softmax 交叉熵損失。但是,對Student 進行訓練,目的是使Teacher 最后一個卷積層的特征圖FT與Student最后一個卷積層的特征圖FS之間的L2損失最小。Teacher和Student模型的損失函數分別定義如下:

其中:x為輸入的圖像;W表示分類器的權重;p(xi)表示從訓練數據獲得的類的概率分布;q(xi)表示通過HRNet-32模型推導的類的概率分布;C表示輸入圖像的通道;H表示輸入圖像的分辨率。

因此,知識蒸餾總損失函數為:

其中,α為平衡參數。在本文中,為了減少實驗的復雜性,知識蒸餾的平衡參數設置為α=0.5。

3 實驗設置與結果分析

3.1 數據集

本文采用兩個真實的數據集來驗證方法的性能。

1)DAGM 數據集。該數據集有10個類,如圖4所示,每個類包含1000 個非缺陷圖像和150 個有缺陷的圖像。數據處理方法如下:本文使用128× 128像素窗口來滑動和剪切原始的512 × 512像素圖像,對于無缺陷圖像步長為128,對于有缺陷的圖像步長為8,無缺陷圖像的數量多于有缺陷的圖像數量。對于剪切的缺陷圖像,本文保留圖像超過80%的缺陷部件,并混合10 種類型的圖像。最終訓練集包含790 個缺陷圖像和5260 張無缺陷圖像,測試集包含710 個缺陷圖像和5040張無缺陷圖像。

圖4 DAGM數據集的部分樣例Fig.4 Some samples of DAGM dataset

2)Magnetic-tile數據集。Magnetic-tile由6個數據集組成,如圖5所示,每個數據集包括等比例的Image和正確標注圖片(Ground Truth,GT),其中Blowhole 有230 張,Break 有170 張,Crack 有114 張,Fray 有64 張,Uneven 有206 張,Free 有1904張。為了更好地驗證所提方法的性能,本文隨機將整個數據集拆分為訓練集和測試集,比率為3∶1。數據處理方法如下:本文使用128× 128 像素窗口來滑動和剪切原始的1408×512 像素圖像,步長為128;對于無缺陷圖像,步長為8。對于剪切的缺陷圖像,本文存儲了包含55%以上缺陷部件的圖像,因為部分瓦片缺陷區域較小,并且在數據集中的缺陷圖像數量很少。最終訓練集包含588 張缺陷圖像和142 張無缺陷圖像,測試集包含196張缺陷圖像和476張無缺陷圖像。

圖5 Magnetic-tile數據集的部分樣例Fig.5 Some samples of Magnetic-tile dataset

3.2 評價指標

為了評估模型的性能,本文采用準確率(Accuracy)、精確率(Precision)、召回率(Recall)和交并比(Intersection over Union,IoU)來評價物品缺陷圖像檢測和分類的性能。四個評價指標的定義如下:

其中:TP、FP、TN和FN分別表示真陽性、假陽性、真陰性和假陰性;GT表示真實檢測框;PM表示預測檢測框。

3.3 結果分析

3.3.1 SD_AEKD的缺陷檢測性能

為了評估SD_AEKD 的檢測性能,將所提出的SD_AEKD方法與下面的七種方法進行實驗對比分析:1)用于裂痕檢測的圖像處理工具箱(Image processing Toolbox for Crack detection,CrackIT)[22],這是一套全面的圖像處理算法,用于檢測和表征路面的表面裂紋。2)最小路徑選擇(Minimal Path Selection,MPS)[23],這是一種從二維路面圖像自動檢測裂痕的新方法,它依賴于每個圖像中最小路徑的定位。3)基于隨機樹的道路裂痕檢測(Crack detection based on random Forest,CrackForest)框架[24],這是一種基于隨機結構化森林的新型道路裂縫檢測框架,用于道路裂痕不均勻檢測。4)U 型卷積網絡(U-shaped convolutional Network,U-Net)[25],這是一種全卷積網絡進行語義分割的算法,用于對缺陷圖像進行分割檢測。5)全卷積網絡(Fully Convolutional Network,FCN)[1],這是一種端到端的圖像分割方法,用于圖像像素級別的標簽預測。6)快速區域卷積神經網絡(Fast Region-Convolutional Neural Network,Fast-RCNN)[26]是一種快速對整個圖像進行區域獨立特征提取的網絡,用于圖像的目標檢測。7)掩模區域卷積神經網 絡(Mask Region-Convolutional Neural Network,Mask-RCNN)[27]是一種基于Fast-RCNN的目標檢測網絡,它在Faster R-CNN的基礎上添加了一個預測分割mask的分支。這些方法涵蓋了目前對表面缺陷檢測的各個類別,即檢測、分類和分割。

表2 給出了在兩個真實數據集上的檢測結果。從表2 可以看出,本文所提出的SD_AEKD 方法在數據集DAGM 上以0.9647 的準確率(Accuracy)、0.9392 的精度(Precision)、0.9578 的召回率(Recall)和0.8192 的IoU 達到最佳性能,且在Magnetic-tile 上以0.9647 的準確率(Accuracy)、0.9392 的精度(Precision)、0.9578 的召回率(Recall)和0.8192 的IoU也達到最佳性能。圖6 給出了一些樣例在數據集DAGM 上的檢測分類結果。

圖6 部分樣例在DAGM數據集上的檢測分類結果Fig.6 Detection and classification results of some samples on DAGM dataset

表2 不同方法在物品表面缺陷檢測上的性能指標對比Tab.2 Performance index comparison of different methods in item surface defect detection

3.3.2 SD_AEKD的分類性能

為了定量評估知識蒸餾的分類性能,本文將所提出的SD_AEKD 方法與其他的三種傳統的機器學習分類方法進行比較,這些方法的代碼可以公開獲取。

1)灰度共生矩陣(Gray Level Co-occurrence Matrix,GLCM)[10]:此方法是經典的紋理提取,其中包括四個典型的描述:能量、對比度、熵和相關性。

2)定向梯度直方圖(Histogram of Oriented Gradient,HOG)[9]:它通常可以通過以下步驟獲得。首先,通過將圖像劃分為較小的連接區域來獲得單元;然后,獲取單元中每個像素的梯度或邊緣方向直方圖;最后,通過組合這些直方圖來構成完整的特征描述符。

3)HOG+SOBEL:本文以SOBEL 操作為特征計算梯度幅度,并結合以上HOG特征形成一個新特征。

取決于上述特征,使用多層感知器(MultiLayer Perceptron,MLP)進行了三個缺陷分類實驗。MLP 在隱藏層和具有三個輸出變量的輸出層中包含15 個單元。輸入層數由上述特征的尺寸決定。MLP中優化算法的最大迭代次數為1000。GLCM 功能由六個灰度級組成,并在共現矩陣中計算90°方向。HOG 中灰度值的量化為8。SOBEL 中濾鏡的大小為33。表3 給出了不同分類方法的性能對比。可以看出,在DAGM 和Magnetic-tile 數據集上,三種傳統的基于機器學習的淺層特征方法的平均準確率分別達到了70.54%和79.26%,而知識蒸餾的準確率相較于這些方法分別提高了19.87 個百分點和15 個百分點。圖7 給出了一些樣例在Magnetic-tile 數據集上的檢測分類結果。

表3 不同方法在物品表面缺陷分類上的性能指標對比Tab.3 Performance index comparison of different methods in item surface defect classification

圖7 部分樣例在Magnetic-tile數據集上的檢測分類結果Fig.7 Detection and classification results of some examples on Magnetic-tile dataset

4 結語

本文提出了一種新穎的基于自編碼和知識蒸餾的表面缺陷檢測體系結構,可以針對復雜的工業場景準確執行物品表面的缺陷檢測和分類任務。在SD_AEKD框架中,檢測模塊將缺陷圖像轉換為僅包含缺陷像素和背景像素的逐像素預測蒙版,目的是能夠精準地定位缺陷的區域。此外,分類模塊利用知識蒸餾方法將所檢測出來的缺陷進行類別分類。最后,在兩個真實的表面缺陷數據集的實驗結果表明,本文所提出的SD_AEKD方法的缺陷檢測平均準確率為97.00%,在IoU評價指標上的平均得分為86.05%,并進一步驗證本文所提出的SD_AEKD方法在檢測和分類的性能顯著提升。

猜你喜歡
分類檢測方法
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
分類算一算
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
小波變換在PCB缺陷檢測中的應用
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: AV无码无在线观看免费| 欧美a√在线| 国产成人亚洲欧美激情| 男女性午夜福利网站| 制服丝袜 91视频| 亚洲中文无码av永久伊人| 中文纯内无码H| 无码人妻免费| 国产成人无码播放| 免费国产小视频在线观看| 精品福利视频导航| 六月婷婷激情综合| 91精品视频网站| 亚洲国产精品一区二区第一页免| AV不卡在线永久免费观看| 亚洲综合天堂网| 欧美激情网址| 亚洲第七页| 国产欧美在线视频免费| 亚洲成aⅴ人片在线影院八| 亚洲av无码久久无遮挡| 亚洲aⅴ天堂| 手机永久AV在线播放| 久久综合九九亚洲一区| 国产va免费精品观看| 亚洲码一区二区三区| 97视频在线观看免费视频| 亚洲AV无码精品无码久久蜜桃| 色婷婷狠狠干| 国产91色在线| 欧美日韩资源| 亚洲中文字幕久久精品无码一区 | 久久亚洲精少妇毛片午夜无码| 国产精品久久久久鬼色| 99热这里只有精品在线观看| 日韩精品中文字幕一区三区| 日本不卡在线播放| 亚洲成AV人手机在线观看网站| 国产无码精品在线播放| 国产视频大全| 免费黄色国产视频| 19国产精品麻豆免费观看| 亚洲欧洲日产国码无码av喷潮| 久操中文在线| 亚洲国产成人综合精品2020 | 中国一级特黄大片在线观看| 无码人妻免费| 亚洲精品国产乱码不卡| 午夜啪啪福利| 精品国产黑色丝袜高跟鞋| 99久久精品免费观看国产| 欧美不卡视频一区发布| 欧美精品二区| 人妻丰满熟妇αv无码| 亚洲精品老司机| 青草91视频免费观看| 国产拍在线| 99九九成人免费视频精品| 亚洲精品在线91| 色婷婷视频在线| 欧洲成人在线观看| 国产午夜人做人免费视频中文| 色丁丁毛片在线观看| 成人永久免费A∨一级在线播放| 97精品久久久大香线焦| 无码视频国产精品一区二区| 免费激情网址| 国产真实二区一区在线亚洲| 中文字幕啪啪| 日韩无码视频专区| 欧美日本在线播放| 国产精品视频久| 精品撒尿视频一区二区三区| 精品视频一区二区三区在线播| 亚洲国产中文在线二区三区免| 亚洲欧美日韩中文字幕一区二区三区| 国产亚洲精品无码专| 麻豆AV网站免费进入| 亚洲成年人网| 免费观看亚洲人成网站| 麻豆AV网站免费进入| 四虎影视库国产精品一区|