張澤琳 胡 齊 章智偉 王 黎
(1.冶金礦產資源高效利用與造塊湖北省重點實驗室,湖北省武漢市,430081;2.武漢科技大學資源與環境工程學院,湖北省武漢市,430081)
目前,常見的選煤方法為水洗工藝和干選工藝,水洗工藝主要包括跳汰、重介和浮選等,占比達到了80%以上,而基于風選的復合干選、空氣重介、碎選等工藝應用不多,主要集中于新疆、內蒙等干旱缺水的地方,然而這些地方的原煤儲量巨大,是我國將來煤炭重要供給源。從保護環境、節約水資源以及我國煤炭開發的前景考慮,干法選煤意義重大,是未來選煤行業的發展方向。近年來,基于γ射線、X射線成像光電以及機器視覺的煤炭智能干選機的相關研究和應用日益增多,其節能、降耗、無水、性價比高等優勢使其具有較大的市場應用前景,這類技術是煤炭干選領域的一個重大技術突破,為我國干旱缺水地區的煤炭分選提供了一種全新的思路。
智能干選技術是將原煤平鋪后,基于傳感器和人工智能算法對煤與矸石或多產品進行智能化識別,進而通過高壓風或擊打裝置將產品分開。目前,智能干選機多以γ射線、X射線成像識別為主,機器視覺識別研究較少。選煤廠有經驗的工人均能夠通過肉眼觀察煤料質量并指導相關設備生產,而機器視覺中圖像分析技術能夠代替人眼來捕捉目標的相關信息,進而實現對礦流的識別與判斷。圖像分析技術已經被廣泛應用于選礦行業,并受到了業內學者的高度重視。
張國英等研究人員提出了一種基于圖像分析的原礦石粒度在線檢測與分析方法,建立了礦石群中的粒度組成與分布的預測模型;Kistner和Perez等研究人員利用圖像分析技術,提取了與礦石粒度高度相關的特征參數,并建立礦石粒度預測模型,實現了礦石粒度的在線檢測;Patel等研究人員提取了石灰石基于RGB顏色模型各分量上的加權平均值、偏度和和峰度等9個統計特征,對PNN分類器進行驗證,發現模型的錯誤率低于6%,證明了提出的基于圖像分析的模型可以很好地對石灰石進行分類;Ebrahimi等研究人員通過獲取礦石表面圖像,提取出顏色、光澤、形狀、紋理等表觀物理特征,用層次分析法(AHP)對提取出的所有特征進行篩選,保留了權重較大的7個特征,并用人工神經網絡(ANN)建立了礦石類型預測模型;王團鋒等研究人員采用X射線熒光分析法對金礦石進行了在線識別與監測,設計了合適的金礦石分揀平臺,成功實現了礦石預分選階段的拋尾工作,大幅度提高了入選礦石的品質;楊沫等研究人員以煤與矸石表面的灰度信息作為主要的特征參數,設計了一種基于圖像分析的煤與矸石自動分類系統,大幅度降低了選煤廠的經濟和人力成本。
因此,本文針對無煙煤三產品提出了一種基于圖像分析技術的分類方法。首先,通過顯微煤巖組分與表面特征分析,從微觀到宏觀揭示了精煤、中煤和矸石三產品的表觀差異性,為無煙煤三產品圖像識別與分類奠定理論基礎;其次,通過圖像預處理、特征提取和篩選以及分類模型的建立對無煙煤三產品進行分類預測。該方法為煤料智能干選設備的開發提供了一定的理論基礎和技術支撐。
試驗煤樣為寧夏太西無煙煤精煤、中煤和矸石三產品,粒級為13~40 mm。通過灼燒稱重法,3個密度級產品的灰分分別為7.12%、20.55%和50.32%。
圖像采集系統由計算機、工業相機和光源3部分組成,圖像像素大小為1280×1024 pixel,試驗共獲取了1226張煤粒圖像,其中精煤612張、中煤302張、矸石312張。圖像采集系統和煤粒圖像如圖1所示。

圖1 圖像采集系統和煤粒圖像
對試驗中精煤、中煤和矸石三產品進行顯微與宏觀煤巖組分分析,結果見表1。

表1 顯微與宏觀煤巖組分分析結果 %
由表1可以看出,不同密度級無煙煤之間顯微組分含量、宏觀煤巖組分含量均有顯著差異,使其從光亮型煤向暗淡型煤轉變,導致其顏色、光澤、紋理等物理表觀特性的不同。
為了進一步觀察和對比精煤、中煤和矸石煤樣表觀特性的差異,拍攝了20 μm尺度下三產品的SEM表面形貌圖像如圖2所示,工業相機下拍攝的照片如圖3所示。

圖2 三產品煤樣20 μm尺度下SEM圖像

圖3 工業相機下拍攝的三產品煤粒圖像
由圖2可以看出,精煤表面以薄層狀結構為主,質地均一光滑,斷口較為平整;中煤表面以細條帶碎片為主,裂隙增多,斷口參差不齊,無規則;矸石表面以致密纖維狀和線理狀結構為主,磨砂般平滑,內生裂隙不發達。圖3中工業相機拍攝圖像在表面形貌上與圖2中的SEM圖像一致,由于煤巖組成的不同導致三產品煤樣在顏色和光澤上也呈現出較大的差異性。精煤煤樣偏黑色,表面光澤很強,質地均一且易于反光,導致表面偏亮;中煤絲炭和暗煤含量較高,反光性差、表面暗淡且偏黑;矸石主要成分為礦物質,灰分較高,表面平滑致密,質地堅硬,幾乎不反光,表面偏灰色。
顯微和宏觀煤巖組分分析揭示了精煤、中煤和矸石三產品表觀差異性的根源,而SEM圖像分析和工業相機圖像分析更加直觀反映了三產品煤粒表面在顏色、光澤和紋理上的差異。上述分析不僅為精煤、中煤和矸石三產品圖像分析奠定了理論基礎,而且為后續煤粒表面特征量化指明了方向。
為了方便量化煤粒表面特征,需對獲取的圖像進行預處理,如圖4所示。
(1)灰度圖與二值圖像轉化。將RGB彩色原圖轉化為灰度圖,并采用大津法進一步轉化為二值圖像,將目標區域與背景區域分離。
(2)面積閾值法與孔洞填充。設定面積閾值去除圖像區域內小于面積閾值的雜點和細小顆粒,消除后續目標區域識別的誤差,進而將目標區域內容的孔洞進行填充。

圖4 圖像預處理結果
(3)形態學腐蝕處理。試驗過程中發現目標區域與背景交接處存在異常亮點,對后續特征參數的提取會產生誤差,因此采用10×10 pixel圓形結構體對各目標區域邊緣進行腐蝕操作,消除亮點區域。
(4)目標區域標記和截取。在二值圖像中對各目標區域進行標記,進而分別提取原圖中R、G、B三分量矩陣中對應的目標區域,重建優化后的煤粒彩色圖像,最終采用垂直方向上的外接矩形截取各目標區域。
根據煤巖分析與表面特征分析,精煤、中煤和矸石三產品煤粒表面的顏色、光澤和紋理存在較大差異性。最常用的顏色、光澤特征量化方法是基于RGB顏色模型、灰度模型和HSV顏色模型。
選取頻率直方圖的常用統計特征來量化煤粒表面顏色和光澤信息。Kistner等研究人員指出用基于圖像像素的二階統計特征作為目標的特征參數已經占據了主導地位;Patel等研究人員提取了石灰石基于RGB顏色模型各分量上的加權平均值、偏度和峰度等9個統計特征,建立了石灰石的類型預測模型,并取得了良好的試驗效果。因此本文選擇頻率直方圖的均值、標準差、偏度和峰度來量化煤粒表面的顏色和光澤特征。根據前期研究,R分量和B分量、G分量和灰度圖像的相關統計特征基本一致,在進行顏色和光澤特征提取時各選其一即可,即提取R分量和灰度圖像的均值、標準差、偏度和峰度即可。
本文對比分析了三產品煤粒R、G、B三分量偽彩色圖和頻率直方圖,三產品煤粒原圖及R分量偽彩色圖和頻率直方圖如圖5所示。

圖5 三產品煤粒原圖及其R分量偽彩色圖和頻率直方圖
通過觀察三產品煤粒H、S、V三分量的偽彩色圖和頻率直方圖,三產品煤粒H分量的偽彩色圖和頻率直方圖如圖6所示。

圖6 三產品煤粒H分量偽彩色圖和頻率直方圖
針對不同產品煤粒、不同HSV分量之間的顯著差異,選擇在HSV分量間提取灰度差分統計法、小波紋理、Gabor小波紋理以及灰度共生矩陣紋理特征進行分析對比,最終共提取65個顏色、光澤和紋理特征參數如圖7所示。

圖7 65個顏色、光澤和紋理特征參數
采用箱線圖對三產品煤粒每個特征參數進行對比分析,去除幾乎不變的特征參數,篩選出變化較大的特征參數。若部分特征參數變化趨勢基本一致,則通過計算其相關性系數,保留閾值以下的特征參數。特征篩選的目的在于減少三產品煤粒分類模型的冗余特征參數,在保留分類精度的前提下提高模型運算速度和魯棒性。
通過對三產品煤樣表面特征的箱線圖進行分析,發現共有6種變化趨勢(以每一類典型的變化趨勢為例),如圖8所示。不同變化趨勢下的特征參數見表2。

圖8 特征參數的6種變化趨勢

表2 不同變化趨勢下的特征參數
除去基本不變的特征參數外,對每個變化趨勢下的特征參數進行相關性系數分析。設定相關系數閾值R為0.4、0.5、0.6、0.7、0.8和0.9,對比分析不同R篩選出來的特征參數集相對應的分類預測模型精度。當相關性系數大于R時,則判定兩特征參數之間很相似,保留其一;反之,兩特征全部留下。R值越小則特征參數越少,反之則特征參數越多。通過不同R值的設定,確定最終保留的特征參數,通過對比三產品分類模型的精度,確定最佳的R值和最合適的特征參數集。增大變化趨勢中特征參數之間的相關性系數分析圖如圖9所示,圖中可根據顏色和橢圓形狀直觀顯示特征之間的相關性大小。系數閾值條件下篩選出的特征參數見表3。

圖9 增大變化趨勢中特征參數相關性系數分析
本文采用箱線圖中的異常點檢測標準,這種方法不需要事先假定數據服從特定的分布形式,沒有對數據作任何限制性要求,在識別異常值方面有一定的優越性。取Nl-3IQR~Nu+3IQR為特征參數的正常變化范圍,
選用支持向量機(SVM)作為三產品煤粒分類建模方法,其中主要調整的兩個參數為懲罰參數c和核函數參數g。在實際應用中,常用交叉驗證法優化這兩個參數。交叉驗證的基本思想是將原始數據分為若干份,其中一份作為測試集,其余作為訓練集,循環建立分類模型,選出平均精度最高的c值和g值,即Bestc和Bestg。其中訓練集的數據越多,關于對象的描述就越準確,模型的識別精確度就越高;而測試集用于檢測模型的泛化能力,即采用非訓練集數據作為模型的輸入,輸出的分類精確度越高說明模型的泛化能力越強。
分別選用R值條件下篩選出的有效特征參數,對其進行異常點檢測后,去除帶有異常點數據的煤粒特征,剩余1189組數據。隨機選取精煤、中煤和矸石三產品煤粒數據的2/3作為訓練集,1/3作為測試集對模型進行訓練與測試,每次測試均采用交叉驗證方法得到Bestc和Bestg,重復10次取其平均值,并對其預測時間進行對比分析(指煤粒圖像預處理、特征參數提取以及分類預測在內的總時間),不同閾值R的訓練集和測試集分類準確率見表4。

表4 不同閾值R的訓練集和測試集分類準確率
分類測試結果表明,隨著R閾值的增加,特征參數個數增多,無煙煤三產品分類精度隨之增高,預測時間也隨之增加。然而,當R大于0.6時,其訓練集和測試集分類準確率相差不大,但特征參數個數差異較大,說明冗余特征增多,對于無煙煤三產品分類模型的實時性和穩定性不利。綜合考慮特征參數個數、分類精度以及預測時間,確定R為0.6時的特征參數集及其分類模型最合適,其訓練集和測試集的分類準確率分別為92.66%和88.50%。
以無煙煤精煤、中煤和矸石三產品為試驗樣本,提出了一種基于圖像分析的三產品分類預測方法,并得出以下結論:
(1)無煙煤煤巖分析和煤粒表面圖像分析可以有效證明煤粒表面顏色、光澤以及紋理等表觀特征與其密度級之間存在緊密聯系,為無煙煤精煤、中煤和矸石三產品圖像分析奠定了理論基礎,并為煤粒表面特征的量化指明了方向。
(2)通過圖像預處理后,有針對性地提取了8個顏色和光澤特征以及57個紋理特征;采用箱線圖對比分析不同密度級煤粒表面特征參數的變化趨勢,結合相關性系數提出了特征參數篩選的策略。
(3)采用支持向量機(SVM)建立了煤粒密度級預測模型,利用不同閾值R條件下篩選出的有效特征參數對模型進行訓練和測試。綜合考慮三產品分類模型的實時性、穩定性和準確性,R為0.6時的特征參數集及其分類模型最佳,其訓練集和測試集的分類準確率分別為92.66%和88.50%,具備作為基于圖像分析的煤炭智能干選機在線分類方法的潛力。