高云鵬 ,羅蕓 ,孟茹 ,張微 ,趙海利
(1.湖南大學 電氣與信息工程學院,湖南 長沙 410082;2.礦冶過程自動控制技術國家重點實驗室,北京 100160;3.礦冶過程自動控制技術北京市重點實驗室,北京 100160)
我國地質資源豐富,但礦石資源存在貧瘠、細碎、雜質多的特點,品位值普遍偏低,為滿足工業生產中對優質爐料的需求,我國積極推動以浮選為代表的選礦技術的發展.精礦品位作為浮選生產的重要經濟指標,其穩定和提高可為企業帶來巨大的經濟效益[1].目前浮選過程精礦品位主要依靠人工化驗獲得,然而這種方法具有較大的滯后性,操作員無法及時獲取精礦品位的變化信息,無法為浮選生產操作和過程優化提供有效的指導[2].因此研究浮選過程生產指標實時在線檢測方法,對穩定浮選過程、優化浮選操作及提高我國礦石資源的綜合利用水平具有重要的價值和意義.
針對浮選過程精礦品位檢測方法,國內外學者進行了大量的研究,主要分為基于機理的建模方法和基于數據的建模方法[3].浮選機理復雜,其過程涉及到化學、物理學且伴隨較多隨機因素,為準確描述真實浮選過程,傳統基于機理的建模方法會對其進行一定的假設和簡化[4].目前浮選產品指標的檢測主要采用基于數據的建模方法[5],該方法只需在獲得輸入和輸出數據后,利用誤差最小化原理和統計分析方法擬合已有數據,而無需了解復雜的浮選內部機制,因而逐漸成為主流的浮選精礦品位檢測方法.Kaartincal 等[6]采集給礦流量、氣量pH 值等為輸入變量,利用偏最小二乘法(Partial Least Squares,PLS)建立銅浮選過程精礦品位預測模型,得到較為滿意的預測效果.Shean 等[7]對比研究線性回歸、PLS、神經網絡等方法,以給礦品位、給礦濃度等作為建模參數建立精礦品位預測模型,對比結果顯示基于PLS 方法建模效果更好,可為現場操作人員提供有效指導.Cook 等[8]利用泡沫大小、個數、RGB 值及其他工況參數作為輸入變量,在多層感知機基礎上開展浮選精礦等級預測.Shahbazi 等[9]以給礦品位值、精礦閥門開度、尾礦閥門開度為輸入變量,引入動態前饋神經網絡,使得浮選過程的關鍵性能指標預測的精度有一定提升.Allahkarami 等[10]以藥劑量、泡沫層厚度、進氣量等作為輸入,采用多層前饋神經網絡構建銅精礦及鉬精礦品位預測模型,其實測及仿真結果表明多層前饋神經網絡相較線性回歸預測建模更準確.
已有研究雖對精礦品位預測的各方面進行深入探討,但仍然存在一些不足.首先,大部分浮選精礦品位預測研究集中在利用生產過程給礦濃度、溫度等工藝參數建立預測模型,該種建模方法無法充分考慮實際浮選過程的滯后和耦合特征,易引入顯著誤差[11].并且,神經網絡的外推能力和解釋能力較弱,當訓練過程中出現訓練集與測試集差異較大情況時,這種局限性將導致所建立的神經網絡模型無法準確預測精礦品位[12].
為解決上述問題,考慮浮選過程工藝參數的耦合性、滯后性及精礦品位小樣本建模預測的需求,本文采集浮選現場載流X 熒光品位分析儀數據,并在最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)方法基礎上構建精礦品位預測模型.為了解決單一核函數在保證良好泛化性和較高預測準確度方面存在的困難,通過對現有經典核函數特征的分析,構建一種新型混合核函數,用于解決浮選精礦品位預測過程中輸入特征空間的映射問題.同時為增強模型的自適應性,設計改進麻雀搜索算法(Improved Sparrow Search Algorithm,ISSA)對混核最小二乘支持向量機(Hybrid Kernel Least Squares Support Vector Machine,HKLSSVM)預測模型的參數進行優化,建立基于ISSA-HKLSSVM 的浮選過程精礦品位預測模型,并基于某選礦廠浮選車間的實際生產工況驗證本文提出方法的準確性和有效性.
單槽浮選是一種常用的礦石分離方法,其工作原理如圖1 所示.在該過程中,上游生產環節的礦漿通過浮選槽的給礦口進入,同時加入浮選藥劑.為增強浮選效果,向浮選槽中通入空氣使其形成微小氣泡,這些氣泡會吸附礦物顆粒,并上浮至礦漿表面形成泡沫層.隨后,泡沫層被刮出并回收,而未被浮選的顆粒則仍然留在料漿中,經過適當處理后被廢棄.精礦品位作為評價浮選過程的關鍵性能指標,其結果能夠有效指導生產,提高浮選產品質量.精礦品位過低,表征生產過程中存在磨礦細度過大、礦漿濃度不足、藥劑種類及數量不適宜、充氣及攪拌時間過短等問題,浮選效率較低.為確保浮選過程的順行和產品質量,操作者需要對精礦品位進行實時在線的監控.

圖1 單槽浮選過程原理圖Fig.1 Schematic diagram of single cell flotation process
載流X 熒光品位分析儀為一種實時在線檢測礦物質品位的分析儀器,應用于選礦廠浮選流程,可實現對礦漿樣品品位的監測[13],其工作原理是對礦漿樣品中化學元素的特征X 射線進行激發和測量,所激發射線的能量和元素種類有關,強度與元素含量有關.其工作原理如圖2所示.

圖2 載流X熒光品位分析儀工作原理Fig.2 Working principle of BOXA current carrying X-ray fluorescence grade analyzer
礦漿經采樣器采樣后,經由多路器流入BOXA載流X 熒光品位分析儀中,分析儀對礦漿進行熒光激發,測得礦漿樣品中不同元素的特征射線強度,進行建模,輸出精礦品位.
礦漿中礦物的組成復雜,其元素成分、粒度大小均會對主要元素所激發的射線強度產生一定影響,由此決定了精礦品位的模型也是多變量的,具有強非線性和不確定性.因此,精礦品位可由一個非線性模型描述,其表達式為:
式中:t表示采樣時間;xt表示t時刻的輸入向量,即載流X熒光品位分析儀各個能量通道的值;yt表示在采樣時刻t的輸出,即精礦品位的值.因此,精礦品位的在線檢測等同于構建基于數據驅動的預測模型F′,使其盡可能逼近非線性的浮選過程以準確實現精礦品位的在線預測.據此,本文建立新型F′來構建精礦品位預測模型,采用改進算法對F′進行訓練及優化,進一步提高精礦品位預測模型的性能.
LSSVM 作為一種用于處理數據分類與回歸的新技術,小樣本學習使其具有很強的泛化能力[14],因而更適合浮選過程精礦品位的在線建模研究.在LSSVM 的訓練過程中,核函數用于將輸入空間映射為高維特征空間,其特征會影響到LSSVM 的訓練過程及預測結果準確度[15].本文線性組合高斯核函數與多項式核函數,利用HKLSSVM 方法實現精礦品位預測.為得到更好的模型參數,提出ISSA 方法,對預測模型進行參數優化.
LSSVM 為基于支持向量機(Support Vector Machine,SVM)的改進,將SVM 優化問題里的不等式約束替換為等式約束,并將二次規劃問題轉變為較簡單的線性方程組進行求解,因此運行速度較快,計算復雜性較低[16].基于LSSVM的優勢,在分析經典核函數特性后,本文建立一種混核LSSVM 以兼顧模型的學習能力與泛化能力.
首先在高維特征空間構造最優決策函數,將非線性估計函數轉化為線性估計函數:
式中:xi=(xi,1,xi,2,…,xi,D)表示輸入數據,D為輸入數據的維度;N為樣本數;(fxi)為函數輸出值;b為偏差;wT為回歸系數.
把回歸問題轉換成帶有約束的優化問題,即
式中:γ為懲罰因子;ξi為松弛變量;φ(xi)為從低維到高維特征空間的映射.
引入拉格朗日乘子,構造函數:
式中:αi為拉格朗日乘子.
利用L分別對式(4)的拉格朗日乘子αi、偏差b、松弛變量ξi以及回歸系數w進行求導,可得:
消去w和ξi后,求解的優化問題轉化為如下線性方程組.
式中:Ω=K(xi,xj)=φ(xi)Tφ(xj);I=[1,1,…,1]T;y=[y1,y2,…,yN]T;α=[α1,α2,…,αN]T.
由此得到最終LSSVM預測模型為:
核函數K(xi,xj)分為全局核函數和局部核函數,其主要實現樣本從低維到高維特征空間的映射.全局核函數對于遠距離樣本泛化性能較好,但對于近距離樣本學習性能較差.局部核函數學習性能強,但泛化性能弱.通過構造混合核函數,可有效結合兩者的優點.
高斯徑向基函數局部性強,可將數據映射至一個更高維的空間內,使其變得線性可分,基于這一優勢,選取其為精礦品位預測模型的局部核函數.
式中:σ為高斯徑向基核函數的寬度參數.
多項式核函數具有出色的全局性能,在整個數據空間中都能捕捉到全局關系,結合這一特點,選取其為精礦品位預測模型的全局核函數:
式中:m為多項式核函數參數.
通過線性組合構造混合核函數,仍然滿足容許核條件:
通過對混合核函數權重系數α進行調整,可實現精礦品位預測模型局部特性與全局特性的平衡.
為得到準確的HKLSSVM 精礦品位預測模型參數,本文提出改進麻雀搜索算法對其參數進行優化.
麻雀搜索算法(Sparrow Search Algorithm,SSA)靈感來源于麻雀的覓食和反捕食行為,該算法模擬麻雀種群中的探索者、伴隨者、偵查者三種角色,以及相互間的交互和更新機制[17-18],與其他算法相比具有更高的收斂性能和更強的局部搜索能力.
在SSA 中,種群中n只麻雀在d維解空間的初始位置為:
式中:d表示變量維度;n表示麻雀數量.
則初始種群中麻雀的適應度值為:
式中:FX每行的值代表每個麻雀個體的適應度.
SSA 位置更新流程可分為三個步驟,即探索者更新、伴隨者更新和危險預警.在進化過程中,用下式更新探索者的位置信息.
式中:t代表當前進化代數;itermax為預先設定的最大進化代數;Xij為種群中序號為i的麻雀在第j維中的位置;R2為停滯閾值;ST 為安全閾值;α為[0,1]中的隨機數;P=[1,1,…]1×d;Q為正態分布的隨機數.
伴隨者的位置信息更新計算式為
式中:XP、Xworst分別表示當前全局適應度最佳、最差的麻雀;A表示每個成員被隨機賦值-1 或1 的矩陣,且A+=A(TAAT)-1;當i>n/2時,說明第i個加入者適應度值較低,狀態較差,需要向其它方向移動進行覓食,以獲取更多能量.
偵查者的位置信息更新計算式如式(15)所示.
式中:K為步長因子,是范圍在[-1,1]的隨機數;Xbest為全局最佳位置;β表示步長控制參數,為服從N(0,1)的隨機數;fi為第i只麻雀的適應度;fw為當前最差適應度;fg為當前最佳適應度;當fi>fg時,表示麻雀在群體外圍,向群體內部靠攏;當fi=fg時,意味著位于中央的麻雀感知到危險,需向種群中其他麻雀方向移動.
SSA 在算法搜索后期面臨無法躍出局部極值的問題[18].因此,本文提出ISSA進行精礦品位的預測建模,在探索者更新機制中引入正弦余弦思想并融合非線性學習因子,提高收斂速度;在伴隨者更新機制中引進Levy 飛行策略,擾動當前最佳位置,增強SSA的局部逃逸能力.改進后探索者位置更新式如下.
式中:r1為[0,2π]內的隨機數;r2為[0,2]內的隨 機數.
當探索者進化到一定代數且適應度值不變時,為防止算法在局部最優處停滯,引入Levy 飛行策略對伴隨者位置進行擾動,提高算法全局搜索能力.改進后伴隨者的位置更新計算式如下:
式中:r3、r4均為[0,1]內的隨機數;ξ的值可取1.5.
結合本文提出的混合核函數與ISSA 特性,建立基于ISSA-HKLSSVM 精礦品位預測方法的計算流程如圖3所示,其主要步驟如下:

圖3 ISSA-HKLSSVM 流程圖Fig.3 ISSA-HKLSSVM Flowchart
1)精礦品位預測數據集構建.對載流X 熒光品位分析儀采集的各通道數據進行數據清洗,去除異常值、離群值,將清洗后數據標準化,分為訓練集和測試集,完成精礦品位預測數據集構建;
2)設置ISSA 參數和適應度函數.初始化麻雀算法種群參數、最大進化代數,建立適應度函數;
3)計算麻雀個體適應度,確定最優個體的位置.從適應度較好的麻雀中選取部分為探索者,引入動態學習因子加快求解速率,根據式(17)更新探索者位置.剩余麻雀作為伴隨者,引入Levy飛行策略進行擾動,根據式(18)對伴隨者位置進行更新.部分麻雀隨機選作偵查者,根據式(16)對其位置進行更新;
4)ISSA 算法優化HKLSSVM 模型參數.根據適應度函數進行評估,直到達到預設的終止條件,記錄此時的全局最優解賦予HKLSSVM模型參數;
5)浮選過程精礦品位預測輸出.基于ISSAHKLSSVM 方法建立精礦品位預測模型,實現浮選精礦品位的預測輸出.
為驗證本文提出的基于ISSA-HKLSSVM 方法的浮選精礦品位預測模型的準確性和有效性,用該方法在國內某浮選廠鋅精礦流道上實際采集數據開展工業試驗,其預測結果可為浮選現場操作工人提供實時的品位變化信息.
本文數據來源于載流X 熒光品位分析儀的SQL Serve 云端數據庫.通過對比研究來自載流X 熒光品位分析儀數據監測客戶端的礦場數據,基于數據量大小和數據質量好壞進行篩選,最終以某浮選廠鋅精礦浮選生產過程為研究對象,采集其浮選車間的359 組數據作為樣本,以ISSA-HKLSSVM 預測模型為基礎,確定鐵、銅、鋅、鉛、鈧5 個能量通道的計數率為輸入變量,鋅精礦品位為輸出變量,浮選精礦品位預測模型的輸入、輸出變量見表1,現場采集的數據見表2.

表1 ISSA-HKLSSVM 精礦品位預測模型輸入變量Tab.1 ISSA-HKLSSVM Concentrate Grade Prediction Model Input Variables

表2 ISSA-HKLSSVM 精礦品位預測模型部分數據Tab.2 Partial data of ISSA-HKLSSVM concentrate grade prediction model
由表1及表2可看出,浮選車間所采集數據可能存在超出參考值范圍、噪聲干擾、包含異常值等問題.為確保模型建立的準確性和穩定性,對數據進行預處理.
本文基于2σ原則對所采集浮選精礦品位的5個變量進行異常值處理,其基本過程如下.
采用2σ原則對數據進行篩選,剔除掉與平均值相差大于2σ的異常值后,原始的357 組數據最終剩余347 組.為了消除指標之間的量綱影響,對數據進行歸一化,其計算式如下.
式中:Z*為數據歸一化后的結果;Z為需要歸一化的數據;Zmax、Zmin分別為所需歸一化數據的最大值和最小值.
為了評估模型的精礦品位預測效果,選用平均相對誤差(Mean Relative Error,MRE)、均方誤差(Mean Squared Error,MSE)、均方根誤差(Root Mean Squared Error,RMSE)、決定系數(Coefficient of Determination,R2)作為評價指標對所提方法進行評價[19],具體計算式分別為:
式中:yi為精礦品位的真實值;為所構建模型的預測值;m為樣本個數.
根據前文所描述ISSA-HKLSSVM 方法構建精礦品位預測模型,開展浮選精礦品位預測研究.所采集原始數據清洗后剩余347 組,其中以80%作為訓練集,20%作為測試集,分別用于所構建模型的訓練及測試.
為比較本文提出的基于ISSA-HKLSSVM 方法建立的精礦品位預測模型的性能,將LSSVM 方法用于建模討論,其參數與ISSA-HKLSSVM 預測模塊中的保持一致,目的是為了對比分析引入的ISSA 及新的混合核函數對精礦品位預測性能的影響.考慮到浮選工業過程中經常采用最小二乘法(Ordinary Least Squares,OLS)、PLS、BP 神經網絡等方法實現礦石品位建模,因此這三種方法也被用來建模比較.實驗使用64 位Windows 處理系統,利用Matlab 軟件進行數據分解和模型預測的計算.詳細的實驗對比結果如表3所示.

表3 浮選精礦品位預測模型實驗結果比較Tab.3 Comparison of experimental results of flotation concentrate grade prediction models
由表3 可見,相比于OLS、PLS 方法,由BP 神經網絡、LSSVM 及其優化方法建立的模型性能更佳,其原因是精礦品位的模型是多變量的,具有很強的非線性和不確定性,而后者所用方法有助于挖掘數據中隱含的關系,進而提高模型的性能.相比于BP 神經網絡,LSSVM 方法更適用于精礦品位預測的小樣本學習,具有更強的泛化能力.對比未經改進的LSSVM 方法,由ISSA 及新的混合核函數優化的LSSVM 決定系數達到了0.906 9,均方誤差、均方根誤差及平均相對誤差分別為1.194 6、1.092 9、1.67%,表明前期的麻雀搜索算法可找到合適的品位預測模型參數,有助于提高模型的自適應性,對比單核和混核的預測結果,混核的引入使得預測模型的性能優于單核LSSVM 模型.綜合以上實驗統計結果,本文提出的ISSA-HKLSSVM 方法可高效對精礦品位進行預測,滿足實際浮選現場品位預測準確度需求.
為直觀展示精礦品位預測的細節信息,對比不同模型的性能,繪制了如圖4 所示模型預測值和實際值的曲線圖.對比發現,基于ISSA-HKLSSVM 方法所預測的精礦品位和實際品位值在數值與趨勢上吻合較好,進一步證明了本文所提方法的準確性.

圖4 不同方法精礦品位預測值和實際值曲線圖Fig.4 Curve plots of predicted and actual concentrate grades using different methods
為更加清晰地展示基于不同方法的精礦品位預測結果誤差分布情況,繪制模型預測值和實際化驗值相對誤差分布曲線如圖5 所示.由圖5 可知,基于OLS、PLS、BP 三種方法預測的鋅精礦品位誤差值波動較大,無法保證結果的準確性.相比之下,基于改進LSSVM 算法得出的結果更符合浮選現場實際精礦品位的檢測準確度要求,且混合核函數和ISSA 的引入,使得精礦品位預測模型能夠更有效地探索特征空間,模型的精度得到顯著提升.由此,本文所提出的ISSA-HKLSSVM 模型能夠以較高的準確率預測精礦品位.

圖5 不同方法的預測相對誤差對比Fig.5 Comparison of relative prediction errors between different methods
為進一步闡述模型的準確性和穩定性,將不同模型預測的品位值和實際化驗值分別作為橫、縱坐標,繪制散點分布圖如圖6 所示.由圖6 可知,基于OLS、PLS、BP 方法預測的精礦品位值其散點圖有大量的點分布在y1=x+1.5 的上方,預測性能較差.基于LSSVM、HKLSSVM 的散點圖有部分位于在y1=x+1.5和y2=x-1.5 兩條臨界線之外.此外,分布在兩條臨界線之間的散點也呈現較大的分散度.這表明,盡管這兩種方法的預測結果在一定程度上滿足準確度要求,其預測精度仍有提升空間.而基于本文提出的ISSA-HKLSSVM 方法的散點分布在y=x附近,只有極少數的點分布在界線外,且分布在界限內的散點相對集中,說明本文模型獲得的預測值與實際值更接近.

圖6 不同方法預測值和實測值的散點圖Fig.6 Scatter plots of predicted and measured values using different methods
通過以上實驗及其對比分析證明,本文提出的基于ISSA-HKLSSVM 精礦品位建模方法準確度和泛化能力相較于其他現有方法得到了增強,可更好實現浮選過程精礦品位可靠預測和實際工程應用.
基于本文提出的ISSA-HKLSSVM 精礦品位預測方法,構建浮選過程精礦品位預測系統的結構框圖如圖7所示.系統由安裝于浮選車間載流X熒光品位分析儀機身的X 光管激發礦漿樣品,由探測器測得能量通道計數率,上傳至云端數據庫,完成精礦品位預測所需自變量的存儲,再通過LabVIEW 的Database Connectivity 工具包建立與數據庫的連接,并基于本文提出方法開發浮選精礦品位預測系統.

圖7 浮選過程精礦品位預測系統結構框圖Fig.7 Structure diagram of flotation process concentrate grade prediction system
將本文提出的精礦品位預測方法融入上位機系統,系統管理界面如圖8 所示,可實現對精礦品位預測、誤差分析、數據存儲等功能.上位機系統可從礦場的SQL 數據庫中獲取品位儀通道數據,并基于本文提出ISSA-HKLSSVM 方法實現精礦品位的預測輸出.基于本系統對某選礦廠不同流道品位值進行實際預測,分析結果如表4所示.

表4 系統實際預測分析結果Tab.4 The actual prediction and analysis results of the system

圖8 浮選過程精礦品位預測系統界面Fig.8 Interface of flotation process concentrate grade prediction system
由表4 可見,采集鋅精礦、鉛精礦、硫精礦三個流道數據,在該系統中進行實例品位預測,結果顯示其平均相對誤差均低于2%,本文開發的浮選精礦品位預測系統準確率較高,可為實際浮選生產操作提供準確可靠檢測結果和有效指導.
針對浮選過程變量滯后、耦合特征及建模樣本數量少所導致的精礦品位難以準確預測的問題,本文提出了基于ISSA 優化HKLSSVM 的精礦品位預測方法.實驗分析結果表明:針對浮選過程的強耦合性、滯后性問題,本文在采集載流X 熒光品位分析儀數據基礎上采用LSSVM 方法進行建模,有效解決了精礦品位預測中的非線性、高維數及小樣本問題;針對單核LSSVM 對核函數類型依賴性強的弱點,本文引入混合核函數解決了單核函數的局限性,提升了LSSVM 的魯棒性;針對LSSVM 性能易受懲罰系數等參數影響的問題,本文采用改進麻雀搜索算法,有效提高了模型的準確度和收斂精度,提升了全局搜索能力和收斂速度.本文提出的基于ISSA-HKLSSVM精礦品位預測方法具有良好的學習能力和泛化能力,且相比現有方法,提高了預測準確率,為浮選效率提高和過程優化控制提供了準確可靠判據.