羅小燕,陳慧明,盧小江,熊 洋
(江西理工大學機電工程學院,江西 贛州 341000)
基于網格搜索與交叉驗證的SVM磨機負荷預測
羅小燕,陳慧明,盧小江,熊 洋
(江西理工大學機電工程學院,江西 贛州 341000)
針對實際生產中只能依據專家經驗判斷磨機負荷(ML)狀態,難以檢測ML及其直接相關參數的問題,該文通過分析反應磨機內部負荷的振動信號,提取頻譜特征,利用支持向量機(SVM)建立磨機負荷參數的預測模型。為解決SVM核函數參數g和懲罰因子C主觀選取問題,提出采用網格搜索與交叉驗證相結合的方法,對SVM參數進行優化。最后基于Matlab與VC混合編程,建立仿真平臺,實現球磨機負荷參數的預測仿真。分別利用SVM默認參數和最佳優化參數代入ML回歸預測模型,通過參數ML預測對比,得到SVM最佳優化參數下訓練的平均平方誤差(MSE)和平方相關系數(r2)均優于SVM默認參數下的預測結果。
磨機負荷;網格搜索;交叉驗證;參數優化;混合編程
磨礦是選礦生產流程中十分重要的環節[1],它是將礦石碎磨至使有用礦物基本單體解離或富集合的細度,再經過分級過程后供浮選,磨礦工序產品質量的好壞直接關系著整個選廠的經濟和技術指標。磨礦過程是選礦生產中的耗能大戶,通常該工序成本占總生產費用的40%~60%。因此,科學、準確地預測磨機內部運行狀態及開發磨礦優化控制技術是選礦行業實現節能降耗、提質提產的根本任務之一[2]。
近年來基于支持向量機的磨機負荷軟測量檢測方法研究越來越多,取得了相應的成果。澳大利亞CSIRO公司開發了在線筒體振動檢測系統,建立了支持向量機預測模型控制磨機運行狀態,降低了鋼耗[3]。文獻[4]根據磨機負荷參數與筒體振動的相關性,建立基于支持向量機的磨機負荷參數軟測量模型。基于主元分析(PCA)提取分頻段特征,文獻[5]提出建立支持向量機(SVM)模型預測磨機內部負荷的方法。文獻[6]提出多源數據特征融合的球磨機負荷軟測量,利用SVM建立磨機負荷模型。上述方法都是在利用SVM建模過程中,SVM參數都是根據經驗選用定值,這樣使模型的學習和泛化能力下降,導致模型的預測效果不理想。
為了使SVM更好地應用在工程實際中,文獻[7]利用網絡搜索對SVM參數進行優化,很好地解決了梯級水電系統隱隨機調度問題。文獻[8]利用最小二乘SVM參數優化模型在煤礦安全預測中應用,很好地解決了樣本的高維、不確定性等方面的問題,文獻[9]采用多種群混合算法進行SVM預測模型參數的優化選取,結果表明該方法能夠滿足球磨機負荷檢測的實時性要求。基于此本文提出基于交叉驗證與網格搜索對SVM進行參數尋優,利用優化模型對磨機內部負荷參數進行預測。
SVM對樣本分類的方法是根據統計學的VC維理論和結構風險最小原理進行的,對特定訓練樣本的學習精度和學習能力之間尋求最佳折衷,以期獲得最好的泛化能力[10]。SVM主要思想是建立一個超平面作為決策曲面,使得待分樣本之間的間隔最大化,并實現將分類問題轉化為一個帶約束的最值問題,如下式:

式中:ζ——松弛變量;
C——懲罰因子;
N——樣本數。
由式(1)可知影響SVM模型精度主要有松弛變量ζ和懲罰因子C。其中松弛變量ζ使SVM在樣本回歸時,具有容錯能力[11];而懲罰因子C是解決SVM分類器為了少量離散點而使得目標‖w‖變小的問題[12];核函數k<w,xi>反應了各支持向量的相關程度,將向量w與xi在低維空間不可分的情形映射到高維空間再進行內積,實現將模型的求解轉換為帶約束的規劃問題。常用的核函數如表1所示。

表1 常用核函數
根據SVM基本原理,核函數g和懲罰因子C對模型起著關鍵的作用,故本文利用網格搜索與交叉驗證相結合的方法對參數g和C進行尋優。
2.1 交叉驗證
交叉驗證是在樣本訓練過程中消除隨機取樣所帶來偏差的方法[13],它的基本思想是,按照事先設定的規則將原始樣本分為訓練集和測試集。首先通過訓練樣本對模型進行訓練,再用測試樣本對訓練得到的模型進行驗證,以此評價模型的準確性。常用的交叉驗證方法有K-fold交叉驗證法、重復隨機抽樣法、留一法等。其中K-fold交叉驗證法具有計算效率高的特點,故本文采用K-fold交叉驗證法對訓練得到的模型進行性能評價。K-fold法是將原始樣本分成K組,將每個子集樣本分別做一個測試集,其余K-1組樣本作為訓練集,得到K個模型,用這K個模型最終測試集的準確率的平均數作為此模型下的性能指標。
利用K-fold法對模型的訓練樣本性能進行評價,以模型準確率最高的SVM參數作為優化參數,提高了模型的穩定性和泛化能力。交叉過程中,各組參數下的模型準確率通常采用最小均方誤差(MMSE)來表征,在參數空間內尋優,找到均方誤差最小的參數取值。均方誤差為

式中:yi——實際值;
2.2 網格搜索
網格搜索是一種窮舉法,是指在參數空間每維上取若干分隔,計算時遍歷參數空間所有網格交叉點得到最優解,其優點可以保證所得的最優解是劃分網格中的全局最優解,避免了由于人為給定值所造成的重大誤差。文中對C和g進行尋優,將網格在其各自區域等分為M和N個點,形成一個M×N的網格平面。在每個參數組合通過交叉驗證的方法可計算出其估計模型的MMSE,當計算遍歷網格平面的每個節點時,可找出MMSE最小的參數組合,即為最優參數。
2.3 參數選取步驟
網格搜索法可遍歷每個可能的參數組合,結合交叉驗證方法可找出使MMSE最小時的參數組合,從而避免了局部最優解的出現,本文在網格搜索中應用K-fold交叉驗證法對每組(C,g)的性能指標進行評價。基于K-fold交叉驗證的網格參數尋優步驟如下:
1)選擇初始化參數選擇范圍。令a=[-a1,a2]、b= [-b1,b2],步長為1,取網格參數的節點為C=2a、g=2b。
2)劃分樣本。將訓練數據等分為K個子集,對網格中每一組參數(C,g),首先任意選擇一個子集作為測試集,其余K-1個子集作為訓練集,利用訓練集訓練模型后對K-1個測試集進行預測,統計該組參數下測試結果的均方誤差值。
3)求取預測誤差值。將下一組子集作為測試集,剩下的K-1個子集作為訓練集,統計該組參數下測試結果的均方誤差值,直至K個子集都被作為一次測試集后,取K組均方差的平均值δMMSE作為該組參數的預測誤差。
4)求取最優的參數組合。更換參數組合(C,g),重復步驟2)、3),分別計算出網格中各參數組合下模型的均方差平均值δMMSE,并對其進行大小排序,選出δMMSE最小時對應的組合參數(C,g)即為網格區間內最優的參數組合。
利用K-fold方法,以參數平均誤差δMMSE最小化為參數優選的目標,以各參數范圍為約束條件,避免了訓練樣本的隨機性對模型準確率的影響,提高了參數優選的效率和準確性。
3.1 磨礦試驗
采用型號為480mm×260mm的小型球磨機進行磨礦實驗,球磨機轉速為42 r/min,即筒體每轉動一圈需0.7s,為使頻譜分析結果能全面反應筒體整體情況,每個振動數據樣本選取磨機運行的5個運轉周期,共選5個數據樣本,每個樣本數據長度5 000×8。根據實際生產經驗總結,在磨礦過程中選取轉速率為0.8,填充率為20%,料球比分別為0.6,0.8,1.0,1.2進行磨礦試驗,分別測取各自狀態下的振動信號,試驗方案如表2所示。磨機尺寸:480mm×260mm;轉速率:0.8;入料粒度:1~9mm。

表2 負荷填充率為20%的礦物和鋼球質量
試驗步驟:
1)預先對待磨礦料進行篩分,入料粒度在1~9mm范圍的礦料為實驗所用礦料;
2)按照填充率、料球比計算好的鋼球質量和物料質量給磨機填料,關閉進料口,調節變頻器至計算值,啟動球磨機,并開始計時;
3)清零和平衡動態數據采集儀,設定采樣頻率為5kHz,待磨機運行1 min后,開啟數據采集儀,待磨機運轉5個周期后,關閉數據采集儀,停止磨機;
4)為了保證實驗條件一致性,取出礦物,重復步驟1)~3),得到不同運行狀態參數下的振動信號,進行后續分析研究。
3.2 SVM參數優化
本文基于Matlab與VC混合編程技術,建立仿真平臺,實現磨機內部負荷參數的預測仿真,仿真系統主要包括,系統模塊、信號導入模塊、信號分析和負荷預測模塊。各模塊具體內容如下:
信號導入模塊:將振動數據樣本導入,采用閾值小波去噪方法對振動信號進行去噪處理,為消除不同頻譜段振動信號的幅值對預測結果的影響,統一將數據處理為區間[0,1]之間的數據,如下式:

xmin——總體數據中最小值;
xmax——總體數據中最大值;
x——當前值。
信號分析模塊:對振動信號進行功率譜估計,根據振動信號的能量譜較高的頻率段,提取反映磨機內部負荷的振動信號,得到振動信號的頻譜特征。
負荷預測模塊:基于網格搜索和交叉驗證對SVM參數進行尋優,得到SVM模型最優化參數C和g,并將得到的最優參數輸入到SVM負荷預測模型。仿真系統負荷參數預測過程如圖1所示。
3.3 仿真結果分析

圖1 負荷參數預測流程
基于VC和Matlab混合編程方法,是將SVM的模型訓練和預測模塊(.cpp文件),選擇C++編譯器將VC文件編譯為Matlab可識別文件(.m),最后設置VC和Matlab對應的數據接口即可。利用建立的磨機負荷參數的預測仿真平臺,磨礦過程在填充率為20%,料球比分別為0.6,0.8,1.0,1.2的磨礦負荷參數下,進行負荷參數的預測驗證。SVM參數優化結果及對應的預測準確率,結果如圖2所示。

圖2 SVM參數選擇3D結果圖
從圖中可以看出,當SVM核函數參數g和懲罰因子C不斷變化過程中,球磨機負荷預測準確率也相應不斷變化。采用網格搜索與交叉驗證尋優得到,當懲罰因子C為0.57,核函數參數g為84.45時,磨機內部運行狀態參數預測準確率最高,達到97.2%。
將尋優得到的磨機負荷最優參數組合(C,g)代入到SVM負荷預測模型,取振動數據樣本400組為訓練樣本,另400組為測試樣本,以平均平方誤差MSE和平方相關系數r2作為評價指標,求得訓練樣本和測試樣本的預測結果如圖3所示。

圖3 訓練樣本和測試樣本的預測結果圖
由圖3(a)訓練樣本預測誤差較低,負荷參數料球比為1時,誤差最小,而料球比增加到1.2時,預測誤差增大,在測試樣本預測結果有相類似的趨勢;通過對比圖3(a)、圖3(b)發現料球比預測誤差有向中趨勢,即在料球比為1時預測誤差最小。
分別利用SVM默認參數和最佳優化參數代入負荷回歸預測模型,對上述數據樣本進行預測,得到兩種模型在訓練和測試樣本的平均平方誤差MSE和平方相關系數r2,如表3所示。

表3 兩種模型預測結果比較
從表3可以看出,K-SVM最佳優化參數下訓練的平均平方誤差MSE和平方相關系數r2分別為0.24和97.2,測試集分別為0.83和95.3,均優于SVM默認參數下的預測結果。
1)采用網格搜索與交叉驗證相結合的方法,對SVM參數進行優化,避免了SVM核函數參數g和懲罰因子C主觀選取問題,提高了模型的泛化能力,降低了模型預測誤差,預測的準確率達到97.2%。
2)通過利用Matlab與VC混合編程技術,建立磨機負荷預測仿真平臺,實現了球磨機負荷參數的預測仿真。經過SVM參數優化后,模型的預測準確率更高,證實了該方法的可行性和有效性,為磨礦過程優化控制提供了有力的技術支撐。
[1]石立,張國旺,肖驍.金屬礦山選礦廠磨礦分級自動控制研究現狀[J].金屬材料與冶金工程,2014(1):43-48.
[2]WEI D H,CRAIG I K.Grinding mill circuits a survey of control and economic concerns[J].International Journal of Mineral Process,2009,90(14):55-56.
[3]HUANG P,JIA M P,ZHONG B L.Investigation on measuring the fill level of an industrial ball mill based on the vibration characteristics of the mill shell[J].Minerals Engineering,2009,22(14):1200-1208.
[4]TANG J,ZHAO L J,ZHOU J W,et al.Experimental analysis of wet mill load based on vibration signals of laboratory scale ball mill shell[J].Minerals Engineering,2010,23(9):720-730.
[5] 馮雪,趙立杰,鄭瀚洋.基于KPCA頻譜特征提取的球磨機負荷檢測方法 [J].沈陽化工大學學報,2014,28(2):175-180.
[6]湯健,趙立杰,岳恒,等.基于多源數據特征融合的球磨機負荷軟測量[J].浙江大學學報(工學版),2010,44(7):1406-1413.
[7]紀昌明,周婷,向騰飛,等.基于網格搜索和交叉驗證的支持向量機在梯級水電系統隱隨機調度中的應用[J].電力自動設備,2014,34(3):125-131.
[8]周華平,熊博杰,桂海霞.最小二乘支持向量機優化模型在煤礦安全預測中的應用[J].測繪科學,2014,39(7):150-154.
[9]張炎欣,王偉,張航.基于即時學習策略的火電廠球磨機負荷軟測量[J].計算機工程與應用,2012,48(7):224-230.
[10]方帥,夏秀山,曹洋,等.基于噪聲水平估計的圖像盲去噪[J].模式識別與人工智能,2015,28(1):51-57.
[11]李翠平,鄭瑤瑕,張佳,等.基于遺傳算法優化的支持向量機品位插值模型[J].北京科技大學學報,2013,35(3):837.
[12]崔曉祥,李娟.基于支持向量機回歸的電力系統負荷建模[J].江蘇電機工程,2012,31(3):37.
[13]ITO K,NAKAMO R.Optimiznig support vector regression hyperparameters based on crossvalidation[C]∥Proceedings of the international Jonit Conference on Neural Networks,2003,3(7):2077-2081.
(編輯:劉楊)
Forecast of SVM mill load based on grid search and cross validation
LUO Xiaoyan,CHEN Huiming,LU Xiaojiang,XIONG Yang
(School of Mechanical and Electrical Engineering,Jiangxi University of Science and Technology,Ganzhou 341000,China)
In order to address the problem that mill load (ML)state only can be estimated with expert experience and ML parameters directly relevant to ML and ML state are hard to be monitored during actual production.This article proposed the method of combining grid search and cross validation to optimize SVM parameters and solve the problem of subjective selection between SVM kernel function parameter g and penalty factor C,by analyzing and reflecting vibration signal inside mill,extracting spectrum signature of signal and establishing forecasting model for mill load parameters by using support vector machine(SVM).Forecast simulation of ball mill load parameter was achieved by establishing simulation platform based on hybrid programming of Matlab and VC. Both training mean square error(MSE) and square correlation coefficient(r2) obtained under optimized SVM parameters are higher than the forecasting results under default SVM parameters by respectively substituting default SVM parameters and optimized SVM parameters into ML regression forecasting model and ML parameter forecasting and comparison.
mill load;grid search;cross validation;parameter optimization;hybrid programming
A
:1674-5124(2017)01-0132-04
10.11857/j.issn.1674-5124.2017.01.027
2016-06-22;
:2016-07-20
國家自然科學基金項目(51464017);江西省高等學校科技落地計劃項目(KJLD1304(45))
羅小燕(1967-),女,江西贛州市人,副教授,碩士生導師,研究方向為機電系統智能監測與控制。