李小萌 趙巧蓉
(河北工程大學礦業與測繪工程學院)
我國“十三五”規劃將“加快推進煤炭無人開采技術的研發和應用”列入能源領域的重點工程[1],這意味著煤炭資源開采逐漸向無人化、智能化方向發展,煤矸自動化識別是實現煤炭智能化開采的關鍵技術。傳統的人工分選勞動量大、效率低、粉塵多、對人體危害大;同時,煤炭采出后的濕法選煤對水資源消耗量及環境污染大,而干法選煤粉塵大、嚴重危害工人身體健康[2-4]。發展煤矸智能自動化識別技術有利于提高工作面煤炭回采率和煤炭分選效率,降低自動化放煤的含矸率、避免煤炭洗選造成的環境污染問題,是實現煤炭安全高效、無人化、智能化開采的關鍵。
目前,常用的煤矸識別方法主要包括基于自然射線的煤矸識別法、基于聲波信號的煤矸混合度識別技術、基于振動信號的煤矸識別法、紅外探測技術以及基于圖像處理技術的煤矸識別方法等。
基于自然射線的煤矸識別技術,抗干擾能力差;聲波信號的煤矸混合度識別技術受工作面噪聲影響較大,且聲信號不易分析,識別率較低;振動信號的煤矸識別技術易受外界環境干擾;紅外探測技術易受采煤機溫度等的影響;圖像處理的煤矸識別技術,通過灰度、紋理特征差異對煤和矸石進行區分,具有較高的識別率,不僅有利于實現放頂煤的自動化控制,還能應用于選煤廠的煤矸分選,因此得到諸多學者的青睞。
基于圖像處理的煤矸識別是近幾年發展起來的一種新型煤矸識別方法,該方法通過煤與矸石的顏色、光澤和紋理等信息差異,利用數字圖像處理技術提取煤巖樣品的表征參數,進而識別煤與矸石。
利用圖像處理進行煤矸識別的主要流程如圖1所示。首先對煤和矸石的待訓練圖像進行預處理,以降低因環境等因素造成的影響,然后對定位的煤矸圖像進行特征提取,將所提取的煤矸特征參數存入數據庫。利用安裝在帶式輸送機上的工業相機拍攝運動中的煤和矸石圖像,然后為降低圖像體積、縮短圖像處理和識別時間,利用高斯濾波等方法對圖像進行灰度化等預處理,最后,基于數據庫中提取的煤矸特征參數,利用分類器進行分類訓練與測試,最終實現煤矸的分類識別。

受采集設備和環境因素的影響,圖像中存在噪點會對識別結果產生影響,因此需要進行圖像預處理以保證分類的準確性[5]。圖像預處理通過灰度化、去噪等處理使其滿足實際需要,并節省空間占有量,增快傳輸和處理速度,能夠有效突出不同特征的差異。數字圖像處理方法主要分為空間域處理和頻域處理,空間域處理操作直觀,而頻域處理不僅具有較高的運算速度而且方便信息提取[6]。其中,最大類間方差法通過自動獲取圖像的閾值,實現圖像分割和二值化處理[7];中值濾波和圖像指數增強處理的共同利用,減少了預處理過程中的運算量,從而處理得快速高效[8]。
雖然圖像預處理能在一定程度上解決環境和設備對圖樣的干擾,但井下環境復雜,容易造成采樣圖像中的噪點和光影增加,增大處理難度,降低識別精度。
1.3.1參數提取方法
煤矸識別結果主要依賴于所提取參數的準確度和真實性,因此,煤矸石參數提取和選擇是識別的關鍵。在煤矸圖像中,紋理和灰度參數區分度較大,因此,多選用紋理和灰度參數進行識別。
其中,通過灰度直方圖法實現灰度特征參數的提取,該方法所提取的特征參數能直觀地反映圖像中灰度出現的頻率,具有運算簡單且實用性和識別準確性較高的特點[8]。而紋理特征提取方法常用的是紋理灰度差分法[9-10]和紋理共生矩陣法[11],其特點如表1所示。紋理共生矩陣法所得出的紋理對比度和熵的煤矸區分度大于紋理灰度差分法所得出的區分度[9],反映了不同方法所提取的相同特征參數對煤矸特征值的衡量和區分度存在差異,特征提取方法對煤矸參數存在識別影響。
1.3.2參數選擇
部分學者將幾何特征參數引入煤矸識別中,研究基于不同煤質的紋理和灰度特征的煤矸區分度,如圖2所示[6]。圖2中顯示了3種神經網絡模型在不同參數情況下的識別率,可以看出,在單一參數的情況下,3種神經網絡模型的識別率較低,將灰度和紋理2種參數結合時識別率有所提高,但不明顯,當3種參數相結合時識別率最高。可見,特征參數的選取和組合對煤矸識別率有著較大的影響。
在特征參數的選取中,由于煤巖組分結構復雜,單一的特征量不足以區分煤矸,但過多的特征參數存在較高的特征空間維數,導致信息的冗余,致使識別精度降低[12]。其中,僅有少數學者引入顏色參數,通過Relief算法對所提取特征進行權重分析,利用SVM—RFE方法剔除冗余特征并且獲取最佳分類參數[13]。
綜上所述,參數選取方面主要存在以下問題:①煤質極大影響煤矸圖像的灰度和紋理特征,目前煤矸圖像樣本的選擇隨意性較大;②對特征參數的相關性及組合研究較少,參數的選取依賴于傳統的實驗分析,理論研究不足。

?

基于圖像處理的煤矸識別技術中,識別算法的選擇直接影響煤矸識別的準確性,目前,最常用的是支持向量機和神經網絡算法。
支持向量機以結構化風險最小為原則,即兼顧訓練誤差最小化和測試誤差最小化,具有較好的學習能力和泛化能力[14]。但是,需要較大的存儲空間,因此,難以實現大規模的訓練。其中,支持向量機對核函數及其參數具有敏感性,但核函數和參數的選擇都是人為根據經驗進行選取,因此,在不同實驗中識別精度會出現不同程度的波動。
然而,神經網絡具有較強的容錯能力[15],能夠減小環境影響所帶來的誤差。通過對比不同網絡模型的訓練時間和識別效果,分析發現,適當構建卷積神經網絡模型可以縮短訓練時間并提高識別率[16-17]。
煤矸圖像識別技術需要獲取高質量的數字圖像,但煤和矸石感光度不同,在井下光照不均的環境中,可能會出現過暗甚至煤矸陰影的情況,同時井下粉塵濃度高、濕度大等會造成圖像中噪點增多。且實際采樣過程中,煤矸和采樣器之間的相對運動狀態、設備成像和采樣精度[18]等都會引起采樣圖像的非線性模糊,可從圖像預處理和提高圖像采集設備及傳輸設備質量入手,來降低環境噪聲。
深度學習由G E Hinton和R R Salakhutdinov為解決數據降維問題提出[19],目前已在圖像處理、語音識別等領域得到較好的應用。深度學習相較于傳統的機器學習理論,明顯具有更優的性能、更快的速度和更好的分類決策效果[20],其中,卷積神經網絡在針對海量數據集進行特征提取和處理速度上都具有較好的效果。
由于煤矸識別過程具有較高的實時性,因此需要識別算法具有較高的處理速度,普通算法在較大的數據集處理中不具備該優勢,但深度學習通過對訓練速度和測試速度的調節,能夠達到快速的處理數據并作出決策。深度學習理論在學習過程中,樣本數據集越大,得到的模型誤差越小,使決策結果更接近真實值,具有更強的泛化能力。其中,卷積神經網絡模型不需要對圖像進行預處理,能夠自適應提取煤矸特征,降低人為因素的同時提高識別精度,同時,算法的泛化性在進行分類時,能夠減小環境變化帶來影響。
綜上,在面對大數據集的煤矸圖像的實時性、復雜性和多樣性等特點時,深度學習將傳統的經驗與未知的參數關系緊密結合在一起,以達到較好的處理效果,具有較強的特征提取能力,可以降低圖像預處理及人為因素對識別精度的影響。因此,將深度學習理論應用于煤矸圖像識別,將極大提高識別精度,應用前景廣闊。
目前,智能分選系統和傳統的人工分選成為了主要的分選方式,但隨著科技的發展,智能分選系統逐漸取代人工分選。例如,我國引進了基于γ射線傳感器的GDRT煤矸智能分選系統,填補了我國該領域的空白,極大地提升了分選的效率[21-22];其次,開灤集團將機器學習與圖像處理技術相結合,研發出人工智能煤矸分選機器人,具有較高的煤矸識別率,為企業帶來了可觀的經濟效益。然而,目前煤矸數據集仍然不夠完善,煤和矸石數據集的建立將會提高分選系統的識別率,可為煤矸分選系統的研究提供依據。
(1)傳統煤矸識別依賴于人工分選,有勞動強度高、危害大等缺點;目前常用的煤矸識別易受環境等因素的影響導致識別率低;煤矸圖像識別技術可極大降低煤矸分選工作強度和環境污染、提高識別精度,是實現采煤工作面無人化、智能化的關鍵技術之一。
(2)井下采樣環境復雜會增加環境噪聲,影響識別的準確性,提出可通過提高采集、傳輸設備質量和圖像預處理的方法降低環境噪聲。
(3)深度學習理論的實時性、圖像處理的簡便性和較強的特征提取能力,可有效解決煤矸圖像處理過程中數據復雜性、多樣性和大數據集的難題。因此,將深度學習理論與煤矸圖像識別相結合,具有廣闊的應用前景,是未來研究的重點領域。
(4)智能分選系統的應用,解決了傳統分選所帶來的問題,填補了該領域的空白;同時,大量煤矸數據集的建立,將會為智能分選的研發提供依據。