, , ,運杰
(山東科技大學 電子通信與物理學院,山東 青島 266590)
我國礦產資源豐富,煤炭作為最重要的戰略資源在經濟發展中有著舉足輕重的作用。煤炭開采過程中矸石的混入極大地影響了煤的使用效率,煤與矸石的分選是煤炭利用過程中不可或缺的環節[1]。機器視覺技術[2]具有通用性強且易于實施的特點,可以實現非接觸式的檢測,利于環境保護,適用于煤炭開采這種重復性的工業生產,煤與矸石識別的關鍵在于如何有效地表達煤與矸石圖像特征,特征提取的好壞將會直接影響分類識別的結果。于國防等[3]提出了利用灰度值進行煤和矸石圖像識別的方法,但需要一定輔助條件,并且過程比較復雜;王祥瑞[4]提出的煤與矸石圖像特征提取方法較為簡單,但基于灰度值的特征提取方式單一,在煤礦特定環境下影響識別的準確度,不能滿足實際需求;何敏等[5]采用了灰度共生矩陣的特征提取方法,由于提取到的特征參數比較少,容易影響識別的結果;廖陽陽等[6]采用BP網絡的識別方法,因受到實驗樣本差異的影響,其識別精度不高。而且上述特征提取方法難以適應在實際環境情況下的分類識別,準確率也有待提高,因此需要研究可以精確描述煤與矸石圖像的特征提取方法。
近年來,字典學習算法[7-8]在圖像去噪、面部識別、圖像修復、圖像超分辨率以及圖像分類等領域有著廣泛的應用。字典學習算法因其稀疏的表示方式使學習得到的字典原子數量增加、形態豐富,可以與信號或者圖像本身的結構進行更好的匹配。本文將采用字典學習中的K-SVD算法提取煤與矸石的圖像特征,隨機選擇煤與矸石的樣本圖像作為字典原子后,將學習字典按列的順序隨機進行更新,以最大限度地將煤與矸石的圖像特征有效表達出來,提高識別的效率。
隨著稀疏表示理論的不斷成熟,字典學習理論被提出并應用于信號處理和圖像信息領域,其中信號的“簡單性”是目前研究的熱點,尤其是信號的稀疏性表示,即稀疏表示。字典學習方法通過優化相應的字典學習代價函數,獲得對信號進行稀疏表示的字典[9]。稀疏表示的模型為:給定字典D=d1,d2,…,dq∈Rp×q,字典D中的每一列dq∈Rp表示為一個原子,信號Y=y1,y2,…,ys∈Rp×s表示為字典D中若干原子的線性組合:Y≈DX,其中X=x1,x2,…,xs∈Rq×s為信號Y在字典D下的表示系數,由于X矩陣內有大量的零元素向量導致每個列向量都是稀疏的,因此X為稀疏矩陣。本文使用的是K-SVD字典學習算法[10-11],與其他字典學習算法相比,該算法時間復雜度較低,計算量小,適用性強,并且已經趨于成熟。
為了將字典學習算法融于煤與矸石的圖像特征提取與識別中,把信號Y看作是煤與矸石的圖像信號,字典D通過煤與矸石的樣本圖像學習得到,X為煤與矸石的圖像信號Y在學習字典D下的表示系數。求解Y≈DX式中的D和X的過程便為字典學習的過程,所對應字典學習的優化問題可表示為:

(1)
式中:Y為煤與矸石的圖像信號矩陣;xi為稀疏矩陣X中某一列向量;‖·‖F為F范數;‖·‖0為L0范數;T0為設定的初始值,與稀疏度相關。為求解學習過程中的優化問題,K-SVD字典學習利用稀疏編碼和字典更新兩步的迭代學習算法求解固定字典D和稀疏矩陣X,直到所求變量收斂或者達到設定的迭代次數。在稀疏編碼階段,稀疏矩陣X用OMP追蹤算法[12-13]進行求解,具體運算過程如圖1所示,其中步驟(3)表示的是求殘差r的最相關列標號,步驟(4)是通過最小二乘法獲得關于每個樣本圖像的稀疏系數X,步驟(5)更新殘差r,步驟(6)表示達到了設定的迭代次數,迭代終止。第二步是字典更新階段,利用求解到的稀疏矩陣X對字典D進行逐列更新,若需要更新字典中的第kk=1,2,…,K列dk,目標方程可表示為:

(2)


為提高煤與矸石的識別率,本文在字典初始化時從煤與矸石圖像的訓練樣本中隨機選擇不同的樣本作為字典原子,與順序選擇樣本相比可以降低運算復雜度,提高算法收斂的速度。然后按照列的順序隨機進行字典原子的更新,最后經過多次迭代來選擇最優的字典D。
輸入:樣本矩陣Y=[y1,y2,…,ys]∈RP×S,字典D=[d1,d2,…,dq]∈Rp×q
輸出:稀疏矩陣X=[x1,x2,…,xs]∈Rq×s
(1)i=1;
(2)r0=yi,Ω0=?,k=1;
(3)jk=arg max|〈rk-1,dj〉|,j=1,2,…,q,Ωk=Ωk-1∪{jk};

(5)rk=yi-DΩkxk;



圖1稀疏編碼的算法流程
Fig.1 Process of sparse coding algorithm
選取來自山西大同煤礦的大小形狀各異的煤與矸石樣本圖像800幅,其中煤與矸石兩類各400幅,每幅圖像的像素大小均為100×100,灰度級為256,格式為jpg。圖像經過預處理后,隨機從每類抽取340幅圖像放入訓練集,剩下的60幅圖像作為測試集。由于煤與矸石的開采處在地下,采集到的圖像容易受到周圍環境的影響,本研究只考慮了在相同光照強度因素下的煤與矸石圖像識別,如圖2所示。

圖2 同一光照強度下的煤與矸石樣本圖像Fig.2 Coal and gangue sample images under different illumination conditions
本文的實驗數據是在Matlab 7.14.0(R2012a)上測試得到。
為了更好地對煤與矸石的圖像進行特征提取,將拍攝到的含有大量干擾信息的彩色圖像轉換為灰度圖像,利用PCA算法降維[14-15]。PCA算法是一種常用的數據降維方法,是在盡可能代表原始數據的前提下,通過線性變換將高維空間中的樣本數據投影到低維空間,以去掉圖像中大量的冗余信息,從而提高K-SVD算法的特征提取效率。首先將放入訓練集的每一幅樣本圖像隨機相連形成訓練樣本矩陣,經PCA算法進行降維處理后,對降維后的樣本圖像進行歸一化處理,使訓練樣本矩陣中每一個列向量的模都為1。降維處理的投影公式為
B=ETA-M,M=m,m,……,m。
(3)
式中,A為所需要處理的樣本矩陣,E為特征空間,m為樣本圖像的均值向量,將矩陣B進行歸一化處理得到的矩陣Y便是所求的煤與矸石的圖像信號矩陣。
預處理后,利用K-SVD字典學習算法將歸一化后的信號矩陣Y進行學習,經過兩步的迭代學習算法求解出字典D與稀疏矩陣X。字典D實質為經過不斷的學習與優化找到合適的變換空間,而稀疏矩陣X則是信號矩陣Y在變換空間D下的投影。于是信號矩陣Y的每一列向量對應著稀疏矩陣X的每一列向量,稀疏矩陣X便作為樣本圖像的特征向量對應著訓練集的每一幅樣本圖像,故求解稀疏矩陣X的過程即為煤與矸石的圖像特征提取過程。
支持向量機(SVM)[16]兼顧訓練誤差與測試誤差的最小化,具有良好的適應性和泛化能力,是識別率最好的二分類器,所以本研究選用SVM對煤與矸石的圖像進行二分類。
經測試,影響煤與矸石識別率的因素主要有兩個:字典D和分類器的選擇。將著重研究字典D對識別率的影響,通過調整參數選擇最優的字典D來提高煤與矸石的識別率。

在字典D的列數為45,稀疏誤差ε=0.045,稀疏度α=0.45情況下,首先進行不同字典初始化,在更新方法下經過連續10次測試得到煤與矸石的識別率(圖3)。可看出,第6次的識別率最高,選擇這次的識別率作為該參數條件下煤與矸石圖像的識別率,同時圖中表現出的識別率波動差距較大,表明字典的初始化與更新對識別效率有較大影響。
圖4則表示在ε=0.039,α=0.27情況下,不同字典列數對煤與矸石的識別率影響曲線。從圖中可以看出,在字典列數大于50以后,煤與矸石的識別率隨著字典列數的不斷增加逐漸下降,而在小于50時識別率是不斷提高的。同時隨著字典列數的增加,程序運行時間也會越長,相應地也增大了識別時間,空間代價也越大。
圖5給出了字典列數為40,稀疏度為0.33的條件下,不同稀疏誤差對煤與矸石識別率的影響曲線??煽闯?,煤與矸石的識別率在稀疏誤差為0.035之前一直呈上升趨勢,之后不斷下降,表明稀疏誤差在0.035時識別效率最高。

圖3 不同字典初始化與更新下的識別率Fig.3 Recognition rate under different dictionary initialization and update

圖4 不同字典列數下的識別率Fig.4 Recognition rate under different number of dictionaries

圖5 不同稀疏誤差下的識別率Fig.5 Recognition rate under different sparse error

圖6 不同稀疏度下的識別率Fig.6 Recognition rate under different sparsity
圖6給出了在字典列數為41和稀疏誤差為0.035的情況下,稀疏度對煤與矸石識別率的影響曲線。從圖中可知在稀疏范圍內,識別率在0.2~0.4間保持平穩狀態,在0.35左右達到峰值,在0.4以后不斷下降。
為了判斷字典參數的優劣對煤與矸石識別率的影響,本文通過調節字典參數測得煤與矸石的樣本識別率以及識別時間(表1)可以看出,實驗測試的樣本識別率最高可達97.5%,錯誤樣本僅為3,其中識別時間為2.9 s,字典的初始化與更新、字典列、稀疏誤差和稀疏度對識別率都有較大的影響。表2給出使用字典學習和不使用字典學習對煤與矸石識別率的影響情況對比,可知使用字典學習將煤與矸石的識別率從81.6%提高到97.5%,有效地提取出煤與矸石的圖像特征,達到更佳的分類識別效果。
為了驗證本論文所提方法的效果,在相同樣本情況下與已有幾種方法的最高識別率進行了對比測試,基于灰度值的特征提取方式、基于小波變換的特征提取方式和基于灰度共生矩陣的特征提取方式的最高識別率分別為92.5%、94.1%和95.8%,而本文識別方法的最高識別率為97.5%。此外,煤礦中采煤機平均切割線速度一般約為7 cm/s,2.6 s的識別反應時間滿足實際煤與矸石的自動分選要求。

表1 不同字典參數影響下的識別率Tab.1 Recognition rate under different dictionary parameters

表2 是否使用字典學習對識別率的影響Tab.2 The effect of dictionary learning on recognition rate
研究了基于字典學習的煤與矸石圖像特征識別方法,得到結論如下:
1) 基于K-SVD字典學習算法可以有效地表達煤與矸石的圖像特征,具有較好的稀疏性,可適用于規模較大的圖像信息采集;
2) 字典學習算法中的字典初始化與更新、字典的列數、稀疏誤差和稀疏度均會影響煤與矸石的識別率,調節好字典中的最優參數可有效提高煤與矸石的識別率;
3) 與其他煤與矸石的圖像特征提取方法相比,基于字典學習的紋理特征提取方法有著特征維數較少,計算量小的優勢,時間和空間代價較小,為煤與矸石的自動識別分選提供了一種新的思路和方式,為后續的分類識別打下良好基礎。
由于條件有限,本文只考慮了同一光照強度對識別效果的影響,下一步將著重研究在實際開采過程中,受到更多噪聲影響下的煤與矸石識別率提高的問題。
參考文獻:
[1]石煥,程宏志,劉萬超.我國選煤技術現狀及發展趨勢[J].煤炭科學技術, 2016,44(6):169-174.
SHI Huan,CHENG Hongzhi,LIU Wanchao.Present status and development trend of China’s coal preparation technology[J].Coal Science and Technology,2016,44(6):169-174.
[2]田原.淺談機器視覺技術在煤礦中的應用前景[J].工礦自動化,2010,36(5):30-33.
TIAN Yuan.Brief discussion of application prospect of technology of machine vision in coal mine[J].Industry and Mine Automation,2010,36(5):30-33.
[3]于國防,鄒士威,秦聰.圖像灰度信息在煤矸石自動分選中的應用研究[J].工礦自動化,2012,38(2):36-39.
YU Guofang,ZOU Shiwei,QIN Cong.Application research of image gray information in automatic separation of coal and tangue[J].Industry and Mine Automation,2012,38(2):36-39.
[4]王祥瑞.煤礦矸石自動分選中圖像處理與識別技術的應用[J].煤炭技術,2012,31(8):120-121.
WANG Xiangrui.Application of image processing and recognition technology in waste automatic separation of coal mine[J].Coal Technology,2012,31(8):120-121.
[5]何敏,王培培,蔣慧慧.基于SVM和紋理的煤和煤矸石自動識別[J].計算機工程與設計,2012,33(3):1117-1121.
HE Min,WANG Peipei,JIANG Huihui.Recognition of coal and stone based on SVM and texture[J].Computer Engineering and Design,2012,33(3):1117-1121.
[6]廖陽陽.基于BP網絡和圖像處理的煤矸石的動態識別[J].工業控制計算機,2015(7):119-122.
LIAO Yangyang.Recognition of coal and stone based on BP[J].Industrial Control Computer,2015(7):119-122.
[7]WEI C,MIGUEL R D R.Dictionary learning with optimized projection design for compressive sensing applications[J].IEEE Signal Processing Letters,2013,20(10):992-995.
[8]SHI J,WANG X H.Image super-resolution reconstruction based on improved K-SVD dictionary-learning[J]. Acta Electronica Sinica,2013,41(5):997-1000.
[9]練秋生,石保順,陳書貞.字典學習模型、算法及其應用研究進展[J].自動化學報,2015,41(2):240-260.
LIAN Qiusheng,SHI Baoshun,CHEN Shunzhen.Research advances on dictionary learning models,algorithms and applications[J]. Acta Auto matica Sinica,2015,41(2):240-260.
[10]JIANG Z L,LIN Z,DAVIS L S.Label consistent K-SVD:Learning a discriminative dictionary for recognition[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2013,35(11):2651-2664.
[11]劉雅莉,馬杰,王曉云,等.一種改進的K-SVD字典學習算法[J].河北工業大學學報,2016,45(2):1-8.
LIU Yali,MA Jie,WANG Xiaoyun,et al.An improved K-SVD dictionary learning algorithm[J].Journal of Hebei University of Technology,2016,45(2):1-8.
[12]LI J,WANG Q,SHEN Y.Near optimal condition of OMP algorithm in recovering sparse signal from noisy measurement[J].Journal of Systems Engineering and Electronics,2014,25(4):547-553.
[13]李少東,裴文炯,楊軍,等.貝葉斯模型下的OMP重構算法及應用[J].系統工程與電子技術,2015,37(2):246-252.
LI Shaodong,PEI Wenjiong,YANG Jun,et al.OMP reconstruction algorithm via Bayesian model and its application[J].Systems Engineering and Electronics,2015,37(2):246-252.
[14]FOUZI H,MOHAMED N N,HAZEM N N. Enhanced monitoring using PCA-based GLR fault detection and multiscale filtering[C]//IEEE Symposium on Computational Intelligence in Control and Automation.2013:1-8.
[15]胡嘉良,高玉超,余繼峰, 等.基于PCA-BP神經網絡的非常規儲層巖性識別研究[J].山東科技大學學報(自然科學版),2016,35(5):9-16.
HU Jialiang,GAO Yuchao,YU Jifeng,et al.Lithology identification of unconventional reservoirs based on PCA-BP neural network[J].Journal of Shandong University of Science and Technology(Natural Science),2016,35(5):9-16.
[16]丁世飛,齊丙娟,譚紅艷.支持向量機理論與算法研究綜述[J].電子科技大學學報,2011,40(1):2-10.
DING Shifei,QI Bingjuan,TAN Hongyan.An overview on theory and algorithm of support vector machines[J].Journal of University of Electronic Science and Technology of China,2011,40(1):2-10.