張翔 張守震
摘 要:基于深度學習方法對數據集進行特征提取。傳統的殘差神經網絡有效解決了網絡層數過深帶來的梯度彌散問題,但是低網絡層高分辨率對圖像語義特征提取不足,高網絡層低分辨率對圖像細節特征提取不足,課題研究提出了一種多尺度特征融合的方式改進網絡,以提升特征提取的質量。通過遷移學習的方式在PCB圖像數據集上訓練該網絡并進行驗證,相比于其他神經網絡得到明顯提升。對大規模數據集挖掘進行的研究有助于解決關聯規則挖掘時的內存瓶頸問題,提高聚類算法的執行效率以及結果的質量,對以后相關的研究工作也有一定的借鑒意義。
關鍵詞:神經網絡;特征提取;深度學習
圖像數據集的內容千變萬化,想要通過單一的一種特征很難描述出圖像完整的信息,借助某一個特征進行的圖像檢索的結果也并不十分滿意,所以可嘗試將不同的特征融合,采取多特征相結合的方式進行圖像檢測以提高準確率。不同的特征能夠反映出不同部位的信息,整體信息和細節信息也都不一樣,因此特征也可以被分為全局特征和局部特征。在數據挖掘和知識發現中利用約束信息可以提高挖掘的效率、精度等等。事實上,對于大規模數據集而言,可能蘊含著巨大的關聯規則。如果盲目地進行挖掘,不僅效率很低,而且可能發現很多不相關的規則。利用約束,可以對具體的關聯規則挖掘任務進行定程度的控制,從而使挖掘
工作向著我們期望的方向發展。
一、神經網絡數據集處理和缺陷檢測
PCB缺陷檢測的研究對象即PCB裸板的圖像數據,該圖像數據是由工業相機拍攝所得,成像結果極易受到拍照時的光照條件、溫度條件、空氣條件的影響,此外傳送帶履帶的抖動、拍攝相機的抖動都有可能導致 PCB 圖像的質量,而 PCB 圖像數據的質量直接影響了后續對于圖像中的缺陷進行識別定位分類的準確程度,因此為了保證后續的深度學習算法的良好效果,需要對 PCB 圖像數據進行圖像預處理[1],這一步驟十分關鍵。
PCB 圖像數據集來自于北京大學智能機器人開放實驗室免費公開提供的印刷電路板瑕疵數據集(http://robotics.pkusz.edu.cn/resources/dataset/)。該數據集共包含 1386 張具有多種不同缺陷類型的原始 PCB 圖像,用于 PCB 圖像的缺陷檢測、分類和定位等問題的研究。
二、圖像數據集灰度化處理
三維顏色 RGB 空間由三原色紅綠藍(RGB)構成,圖像可以理解為由三原色按照不同的比例疊加而成。對于相機拍攝得到的圖像進行數字離散化,則圖像中的每一個像素的像素值都在[0,225]的區間范圍內,則圖像就可以轉變成一個三維數組[H,W,C],其中 H 代表圖像的橫向量,W 代表圖像的列向量,C 代表圖像的通道數量,在 RGB 顏色空間下即為 RGB 三個通道,當計算機對圖像數據進行操作時,就需要計算三個通道的像素值,運算量太大,因此可以將三個通道的彩色圖像轉變成單通道的灰度圖[3],參數計算量會大大減少,這便是圖像灰度化,RGB 空間的灰度轉換的公式如式1 所示:
Gray(i, j) =0.29xR(i, j) +0.59xG(i, j) +0.11xB(i, j)? ? ? ? ?(1)
(一)灰度圖像均衡化消除
圖像直方圖[3]反映了圖像中不同亮度值的像素所占的比例,能夠直觀地看出圖像的亮度分布,但是對于單通道的灰度圖像來說,直方圖則反映了該圖像中不同灰度級出現的統計情況。圖像的灰度直方圖是一維離散函數,如式 2 所示:
h(k) =nk, k =0,1, , 255? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(2)
其中, nk 表示為圖像的灰度值為 k 的像素點的個數,圖像的灰度級有 256 種。其中p(k)表示圖像像素中灰度值為k出現的概率。分別計算PCB數據集的原始圖像和灰度圖像的直方圖,得到的結果如圖1所示。
三、訓練數據集的圖像實驗塊選擇
與那些在人工標注真實角點位置的實際拍攝棋盤數據集上進行訓練的基于深度學習的棋盤角度檢測方法不同[3],我們的網絡在帶有真實亞像素角點位置的合成訓練集上訓練。
如果在訓練時,我們僅對每個真實亞像素角點所在像素,取其15×15鄰域作為輸入圖像參與訓練 (cn與 pc在同一像素內),那么訓練時的亞像素角點坐標偏移量真實值 dx和 dy應該在 [0.5,0.5) 范圍內。在測試時,如果第一步的整數角點定位獲得了正確的整數位置,我們的網絡能夠正確進行后續的亞像素精調。但是如果測試時第一步的整數角點定位包含錯誤結果 (一般情況下是不可避免的),此時出現了訓練時沒有的情況,輸入網絡的 15×15 圖像塊的中心像素并沒有包含亞像素角點,這種情況下我們的網絡將無法進行亞像素位置精調。
(一)測試數據集合成測試實驗
由于合成棋盤數據集的真實亞像素角點位置是已知的,我們能夠計算平均角點定位誤差MELE,此外我們也比較了棋盤角點檢測算法中最常用的MERE。我們首先對合成測試集進行了不同下采樣系數δ的雙三次下采樣,用來測試網絡的輸入圖像尺寸對結果的影響。在測試圖片具有不同分辨率,15×15的網絡輸入大小具有最低MED誤差,因此我們選擇15×15作為網絡輸入圖像塊的大小。不同亞像素角點檢測方法在不進行模糊,不同噪聲等級的合成測試集上的平均歐式重投影誤差 (MERE)如表1所示。
四、總結
對于原始的數據集圖像,往往因成像條件不同導致圖像特征不明顯,并伴隨產生很多噪聲,不能直接用于特征提取。本文采用將圖像灰度化,以摒棄色彩信息干擾,再對灰度圖進行直方圖均衡化以增強前景與后景的對比,最后通過高斯濾波等方式降低圖像的噪聲干擾,實現了神經網絡數據集圖像突出特征,過濾噪聲的目的。由于用于訓練神經網絡的圖像數據集規模較小,且采用遷移學習的方法進行訓練,而深度學習模型對于數據集的規模需求較大,因此訓練的效果有限,后續可以對數據集進行全方位補充。
參考文獻:
[1]Zakria. 基于深度學習的快速車輛再識別研究[D].電子科技大學,2020.DOI:10.27005/d.cnki.gdzku.2020.004719.
[2]劉皓. 基于深度學習的行人再識別問題研究[D].合肥工業大學,2017.
[3]吳國清. 科學計算時變數據集的數據挖掘算法研究[D].中國工程物理研究院,2019.