李云紅,余天驕,周小計,管今哥,鄭永秋,張成飛,程 博
(1.西安工程大學電子信息學院,陜西 西安 710048;2.北京大學電子學院,北京 100871;3.中北大學 省部共建動態測試技術國家重點實驗室,山西 太原 030051;4.內蒙航天動力機械測試所,內蒙古 呼和浩特 010076)
在我國煤炭開采行業領域中,煤炭檢測的精度和對煤炭成份分析不僅影響著煤炭的利用率還影響著煤炭企業經濟的發展。而傳統的檢測分析方法主要是人工煤炭檢測,實驗分析常用設備有灰分儀和碳硫儀[1-2]等,檢測速度慢、效率低、實驗儀器操作復雜、精確度低,隨著科學技術的發展已不能夠滿足大規模的實驗檢測分析。為了準確檢測煤樣的各種元素含量以及灰分值等關鍵工業指標,利用激光誘導擊穿光譜技術進行煤樣的光譜強度信息采集,這在煤炭檢測分析中是一種安全、可靠、快速的技術。
近年來,更多的學者開展了對煤炭灰分檢測的深入研究。Xie G[3]研制了一種基于偽雙能X射線透射的實時灰分分析儀,通過X射線灰分含量與5個特征參數的線性關系,驗證了X射線灰分分析儀的可行性。郭西進[4]等利用多層神經網絡對煤泥浮選尾礦灰分進行檢測。然后對其灰分值進行回歸預測,并與實際尾礦灰分值進行比較分析。建立了基于深度卷積網絡的灰分檢測模型,驗證其具有較好的實時性。郭宇瀟[5]等使用機器學習方法結合LIBS技術進行定量的分析,提出了一種兩階段的變量選擇方法。研究結果表明了,該方法在LIBS定量分析中的高效性和普適性。李云紅[6]等通過搭建激光測量煤灰分實驗平臺,研究了三種不同標準煤樣在不同厚度下的譜線強度和相對標準偏差。實驗結果表明,煤樣的厚度對煤灰分準確度的測量具有較大的影響。王龍龍[7]等利用機器學習從大量數據中找到選煤過程中參數的規律,同時利用機器視覺進行矸石分揀灰分預測,提高了選煤廠在選煤過程中的效率。Ali D等[8]利用隨機森林、人工神經網絡、自適應神經模糊推理系統來預測細粒高灰分煤炭特征。LegnaioliS[9]等利用安裝在發電廠的激光誘導擊穿光譜技術實驗裝置,研究了煤炭灰分含量的影響。實驗結果表明,樣品的選擇應考慮LIBS測量灰分的大小,可以有效的避免燃燒器在運行期間結垢結渣。ZhaoyuQiu[10]等采用多項式回歸(PR)、特征選擇多項式回歸(PRFS)和粒子群優化支持向量機(PSO-SVM)建立了煤的灰分預測模型。Zhang K[11]等提出了一種基于神經網絡回歸的灰分在線測量方法,用于快速估算煤炭的灰分含量。周濤[12]等利用基于激光誘導擊穿光譜技術與傳統的激光熔覆分析手段進行對比,實驗結果表明激光誘導擊穿光譜技術能夠有效的克服傳統分析手段所需的復雜預處理程序。
由于神經網絡模型具有較強的自適應和自學習的能力,對于非線性模型問題能夠很好的建模和逼近,為解決非線性模型提供了思路。本文利用激光誘導擊穿光譜技術進行了煤炭灰分特征的快速識別,結合了粒子群優化BP神經網絡模型的定量分析,利用均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)、平均絕對誤差(MAE)作為煤炭灰分預測模型的綜合評價指標。探究了煤炭灰分的特征規律,建立了一種快速、安全的灰分檢測識別方法,此方法對煤炭的勘探和開發具有一定參考價值。
激光誘導擊穿光譜(Laser-Induced Breakdown Spectroscopy,LIBS)技術測量原理為,脈沖激光經過透鏡和反射鏡聚焦在樣品表面上,在高強度的激光脈沖作用下樣品表面粒子會吸收激光燒灼能量由固態燒融狀態轉化為蒸汽狀態,最終形成等離子體。同時溫度的升高使得等離子體發生迅速膨脹,煤樣的表面由于熱壓力的產生會分解為不規則的小顆粒。在冷卻過程中處于激發態原子、離子發生能級躍遷并產生特征譜線,該過程由光纖收集信號傳至光譜儀最終由計算機分析。
LIBS分析儀測試流程如圖1所示。首先要進行初始化包括程序的初始化和光譜儀的初始化,然后設置光譜儀相關參數包括光譜覆蓋范圍、分辨率、信噪比等,同時光譜儀會自動進行對暗背景的測量。其次器件激光器會自由運行并不斷由Q開關向光譜儀發送觸發信號,接收到觸發信號的光譜儀經過設定的延遲時間開始進行光譜測量。并對光譜信號進行積分,當積分時間結束后將光譜數據傳輸到電腦中判斷是否達到測量點數。如果沒有達到,則等待Q開關的下一次觸發。如果達到則復位平移臺,保存光譜數據同時建立初始煤炭樣本光譜信息數據庫,作為測試模型訓練集和測試集。通過matlab軟件建立定量分析優化灰分預測模型,并對煤炭樣本灰分值預測。

圖1 LIBS分析儀測試流程
LIBS的實驗裝置,如圖2所示。實驗環境在北京大學電子學院量子電子所冷原子與精密測量實驗室,采用調Q的Nd∶YAG脈沖激光器作為激發光源,脈沖激光器波長為1064 nm,脈沖寬度10 ns,頻率為1 Hz。在激光誘導擊穿光譜的煤質檢測應用場景下,要求光譜儀不但有較廣的光譜探測范圍200~950 nm,還要求有較高的分辨率,因此光譜數據的采集使用AVANTES公司的AvaSpec-Dual型光纖光譜儀,焦距為10 nm,光學的分辨率為1150。實驗中的光譜信號由光纖收集后傳至光纖光譜儀進行分光探測,并通過光譜數據傳輸至計算機分析。同時在實驗檢測中使用195 nm~467 nm的單通道可以檢測到Si、Al、Fe、K等煤質灰分值檢測所需的元素特征譜線。

圖2 LIBS實驗系統框圖和實物圖
實驗樣品為濟南眾標科技有限公司銷售的標準煤粉樣品,并以此建立了表1相應煤灰分值的數據庫初始樣本。實驗中煤粉樣品的顆粒小于0.5 mm,將標準的煤粉樣品放在模具中,通過自動壓餅機在20 t壓力下壓制成餅狀的煤樣,防止煤粉在實驗過程中飛濺造成實驗環境的污染。煤餅的直徑為4 cm,厚度為0.7 cm,并進行統一樣品編號。

表1 數據庫初始樣本
將壓好的煤餅樣品固定在LIBS測量系統的電動平臺上測量。每個煤餅表面選定不同測量位置,經過100 μs左右的延遲時間收集光譜信號。每次激光脈沖擊打樣品表面后,產生在樣品表面的浮塵,會吸收激光能量利用吸塵器除塵。在處理基底噪聲方面,通過增加光譜儀的延遲來消除噪聲。在實驗進行前,開機LIBS儀器15 min,能夠更好地提高激光器穩定性。
LIBS測量過程中由于硬件設備產生的波動以及煤餅制樣過程中存在的不均勻性,每條光譜數據的特征向量會不同。通過多條光譜數據的平均處理來削弱測量產生的波動,并對煤樣光譜數據模型的訓練集和測試集的合理劃分。
在光譜數據預處理之前,經常會遇到維度較高的數組,并且變量與變量之間存在著很多相互的關系,造成數據在處理過程中很難抓住主要特征信息。主成分分析算法的核心是通過數值的變化將多維的特征變量轉換為維度較小的不相關變量。同時這些變量盡可能反映出數據預處理之前的相關信息。利用主成分分析算法分析光譜數據的響應特征,將原始數據的變量轉化為相對獨立的數據變量。同時數據在降維的過程中能夠排除數據的異常點,簡化數據的結構。降維往往作為預處理步驟,在數據應用到其他算法之前對其清洗。在利用主成分分析方法之前對輸入光譜數據先進行歸一化處理,可以降低光譜的不確定性,提高光譜與元素濃度之間的相關性。
設x1,x2,…xp為P個原始特征變量,數據樣本個數為n,構成n×p維矩陣X:
(1)
對矩陣X進行主成分分析主要步驟如下[13-15]:
(1)為了避免數據受到量綱的影響,對光譜數據進行標準化處理。并計算出P×P維的協方差矩陣A。
cov(xi,xj)=E[(xi-E(xi))(xj-E(xj))]
(2)
(3)

(2)計算出特征值對應的特征向量。用特征值分解方法求協方差矩陣A的特征值,得到λ1,λ2,…λp特征值。對應特征值的大小λ1≥λ2≥…λp,此時對應的最大特征值λi特征向量為:
(4)

BP算法(Back Propagation)是一種多層前饋神經網絡,是由輸入層、隱含層、輸出層三部分組成,如圖3所示。BP神經網絡算法的傳播方向包括,正向傳播與反向傳播。正向傳播,是從輸入層x1經過LR傳輸至輸出層y1。若輸出值y1與期望輸出預測結果存在一定的誤差,則進行反向傳播。通過神經網絡的反復學習訓練后,梯度下降不斷修正參數使得實際輸出值與期望值不斷地接近。BP神經網絡根據梯度下降法,不斷更新調整網絡各層的輸入層和隱含層之間權值和閾值,而隱含層和輸出層之間閾值容易使得BP神經網路獲得局部最優解,這會使得灰分預測值和灰分實際真值相差甚遠,最終導致模型預測精度降低。

圖3 BP神經網絡模型
其中,隱含層的節點數公式如下[16]:
(5)
式中,s表示的是神經網絡的節點數;m與n分別代表的是BP神經網絡的輸入節點數和輸出層的節點個數;λ代表是常量取值范圍為λ∈(1~10)。
使用激活函數為非負的Sigmoid函數:
(6)
式中,e是納皮爾常數2.7182…,Sigmoid函數作為激活函數,進行信號轉換,轉換后的信號被傳送至下一個神經元。隱含層選取Sigmoid函數,該函數的梯度隨著x增大或減小均趨于0,在反向傳播時會造成“梯度消失”現象。
BP神經網絡訓練的步驟如下:
令樣本x={x1,x2,…,xn}為輸入向量,y={y1,y2,…,yk}為輸出向量,xn為輸入層個數,LR為隱含層個數,yk為輸出層個數,Wij和Wjk分別為輸入層到隱含層和隱含層到輸出層的連接權值。
粒子群算法(Particle Swarm Optimization,PSO)是一種模擬鳥群覓食行為的智能搜索算法。通過群體中的個體相互協作和信息共享來尋找最優的解。其基本思想是模擬鳥群搜尋食物的路徑找到食物最多的地點,即根據局部的最優解尋找全局最優解。粒子群算法對于解決高維光譜數據優化問題具有一定的優勢。
粒子群算法優化主要包括兩方面:第一,對于BP神經網絡拓撲結構的優化。第二,對權值和閾值進行優化。粒子群算法的關鍵是粒子位置和速度,邏輯步驟如下:
(1)初始化規模為N粒子群中每個粒子的位置和速度。
(2)計算粒子群中每個粒子的適應值。
(3)若某個粒子當前的適應值相比于之前記錄該粒子的最優解pbest更好,則更新此時的最優解pbest。
(4)若某個粒子當前的適應值相比于之前記錄的全局最優解gbest更好,則更新此時的最優解gbest。
(5)更新后的最優解gbest符合要求,則結束程序。反之更新粒子的速度和位置:
v(k+1)=wv(k)+c1r1(pbest(k)-present(k))+c2r2(gbest(k)-present(k))
(7)
present(k+1)=present(k)+v(k+1)
(8)
其中,w代表慣性權重;c1和c2代表是學習因子;r1和r2代表伯努利分布的0到1的隨機數;v(k)代表是某個粒子在k時刻的速度;present(k)代表是某個粒子在k時刻的位置。
(6)繼續循環到步驟(2)中。
粒子群算法優化BP神經網絡模型的訓練流程圖如圖4所示。整個模型的訓練學習過程包括粒子群算法和BP神經網絡。而粒子群算法優化BP神經網絡模型,通過對各層神經元權值和閾值的不斷修正,使得誤差函數沿梯度方向下降。當誤差平方和小于目標誤差時滿足實驗條件,輸出最優權值、閾值。同時對模型的最優參數進行訓練輸出預測結果。

圖4 粒子群優化流程
實驗選取均方根誤差(Root Mean Square Error,RMSE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)、平均絕對誤差(Mean Absolute Error,MAE)來評估模型的性能。即RMSE、MAPE、MAE越接近于0,表明模型預測具有較好的精度。其指標評價的計算公式如下:
(9)
(10)
(11)

實驗模型以180組激光誘導擊穿光譜實驗測試光譜數據為基礎,分別用BP神經網絡模型和PSO-BP神經網絡模型對數據進行訓練和測試。在表1編號中1~140樣本數據用于訓練集,141~180號樣本數據作為測試集。在實驗過程中,由于測得的原始光譜數據是4096的高維向量,數據樣本量過大。同時存在一種元素對應多條特征譜線的情況,多出來的特征譜線反應都是同一元素的特征,而過多的參數數量在模型訓練的過程中更容易出現過擬合等負面的影響。因此通過主成分分析特征提取,提取后每條數據的向量維度為27維,分別對應著樣本煤主要元素成分Si,Al,Fe,Ca等元素。
通過建立BP神經網絡,設置輸入層神經元個數為6,隱含層神經元個數為15,輸出層神經元個數為1。先后對比了1到27不同維度下,BP神經網絡模型預測值和灰分實際真值,同時以RMSE、MAPE、MAE為評價預測模型分析的指標。表2所示為不同維度訓練模型BP網絡訓練結束后得到預測值,通過主成分分析技術對數據進行預處理之后,6維訓練效果明顯好于其他維度。因此先后比較了27維、7維、6維和5維,對應的均方根誤差、決定系數、平均絕對誤差大小。而6維BP神經網絡的預測結果較為準確,對應的均方根誤差、決定系數、平均絕對誤差較低,效果明顯好于相鄰維度的大小,則選擇6維BP神經網絡對其進行模型優化。

表2 不同維度BP網絡模型訓練結果
如圖5所示BP神經網絡模型算法下,27維、7維、6維和5維下的預測結果輸出值和實際真值結果分析比較。

圖5 BP神經網絡模型預測結果
為了避免BP神經網絡陷入局部極小值,提高預測模型的精度,建立PSO算法優化BP神經網絡模型。優化后的6維BP神經網絡模型,決定系數R2為0.88501更接近于1,表明建立的模型具有較好的預測性能。平均絕對誤差MAE為0.43882,均方根誤差RMSE為0.51984,平均絕對百分比MAPE為2.83 %。在6維PSO-BPNN實驗中使用MATLAB仿真軟件對180組光譜數據進行訓練和預測,模型訓練之前對光譜數據進行歸一化處理。設置輸入層節點數為6,隱含層節點數為15為,輸出層節點數為1,粒子群初始粒子數量為50,期望誤差設置為0.001。采用PSO-BPNN方法預測灰分值的適應度函數值變化過程如圖6所示,從圖6的實驗結果可以看出PSO算法能避免BP神經網絡陷入局部極小值。初始迭代時獲取的適應度函數值大于4.0,隨著迭代次數的迅速下降當迭代次數增加至10次時,適應度函數值的變換逐漸的在變緩。當迭代次數到達20次時,訓練樣本的均方誤差到達最優狀態,灰分預測值與灰分真值無限逼近。此實驗結果灰分值預測具有較少的迭代次數,有效的驗證了,基于粒子群算法優化結合BP神經網絡方法,能夠更好地提升灰分值預測的精度同時具有較好的收斂效果。

圖6 PSO-BPNN網絡模型預測結果和迭代次數
(1)為了快速識別煤炭灰分特征,提出了基于粒子群優化的BP的煤炭灰分優化識別方法。發現優化后的BP神經網絡模型,能夠更好的克服在尋優過程中容易陷入局部最優缺陷,提升了模型的泛化能力和預測精度,同時削弱了神經網絡陷入局部最優的局限。
(2)對比了27維、7維、6維和5維預測模型的分析指標。優化后的6維BP神經網絡模型,決定系數R2為0.88501更接近于1,表明建立的PSO-BP模型具有較好的預測性能,此時的灰分預測值與灰分實際真值無限逼近。
(3)通過對煤炭灰分特性研究,對模擬分析的結果進行綜合評價。實驗驗證了,本文提出煤炭灰分值參數的預測優化算法的有效性,為后續的LIBS術應用于煤炭檢測提供一定的理論依據。由于煤炭成分的相對復雜性,本次研究未對預測模型的魯棒性進行考慮,未來研究還將進一步改進,以提高設計模型預測的準確性。