王 葛,尹少峰,李 珊,張瑞忠,安領軍,李 強,3,*(.燕山大學國家冷軋板帶裝備及工藝工程技術研究中心,河北秦皇島066004; .河北鋼鐵集團邯鄲鋼鐵集團有限責任公司,河北邯鄲05605; 3.燕山大學亞穩材料制備技術與科學國家重點實驗室,河北秦皇島066004)
基于支持向量機算法的連鑄漏鋼預報模型研究
王葛1,尹少峰1,李珊1,張瑞忠2,安領軍2,李強1,3,*
(1.燕山大學國家冷軋板帶裝備及工藝工程技術研究中心,河北秦皇島066004; 2.河北鋼鐵集團邯鄲鋼鐵集團有限責任公司,河北邯鄲056015; 3.燕山大學亞穩材料制備技術與科學國家重點實驗室,河北秦皇島066004)
摘要:漏鋼預報系統的性能往往取決于其算法模型的性能,支持向量機(SVM)算法在解決小樣本、非線性及高維模式識別中具有許多特有優勢,能夠避免神經網絡隱含層節點選擇及局部極小值等問題,而不同的SVM算法參數往往會對其性能產生顯著影響。為此,本文利用GS網格搜索法、PSO粒子群算法和GA遺傳算法對SVM支持向量機的算法參數進行了優化,并將優化后的SVM支持向量機算法應用到連鑄漏鋼預報系統中;利用某鋼廠CSP連鑄生產線的歷史生產數據對各優化后的SVM支持向量機算法進行了訓練和測試。測試結果表明,用GA遺傳算法優化后的SVM支持向量機算法測試效果較好,得到了98.33%的預報率和100%的報出率,從而驗證了基于SVM支持向量機漏鋼預報系統的可行性和有效性。
關鍵詞:漏鋼預報;支持向量機;遺傳算法;粒子群算法
漏鋼是連鑄過程中的災難性事故,不僅會影響正常生產,還會導致設備損壞,造成巨大的經濟損失。采用漏鋼預報系統對漏鋼作出早期預警和處理是解決連鑄漏鋼事故最有效和最直接的手段[1]。粘結性漏鋼在所有漏鋼事故中占到70%以上,成為漏鋼預報系統的研究重點。目前采用的漏鋼檢測方法主要有熱電偶測溫法、結晶器熱交換分析法、摩擦力測量法、振動波形分析法以及超聲波探測法等[2]。其中熱電偶測溫法是根據埋設在結晶器銅板內的熱電偶所測得的結晶器表面溫度的變化情況來判別是否漏鋼,因其能夠快速準確的反映結晶器內的溫度分布,具有實時性和可操作性,成為現有漏鋼預報系統所采取的主要檢測方法[3]。
支持向量機(Support Vector Machine,SVM)[4]以統計學習理論為基礎,在解決小樣本、非線性及高維模式識別中表現出許多特有的優勢,避免了神經網絡隱含層節點選擇及局部極小等問題,已經成為模式識別技術中最實用的方法之一。但目前對SVM算法參數選擇尚缺乏成熟的理論依據,不同的算法參數選擇往往會對算法的實際識別性能和效果產生顯著影響。對SVM參數進行優化,國際上尚沒有公認的最好方法,目前較為常用的SVM參數尋優方法主要有網格搜索法、遺傳算法和粒子群算法等。
網格搜索法(Grid Search,GS)是一種最基本的參數優化算法,其基本思想是讓待搜索參數在一定空間范圍內按照規定步距劃分網格并遍歷網格內所有點進行取值,并將每次取出的參數組帶入系統中驗證其性能,最終取使系統性能達到最優的參數組作為最佳參數。該算法實質上就是通過暴力搜索的方式,對每一組參數進行試算,因此當規定的搜索范圍比較大且網格劃分比較密集時,網格搜索尋優法會非常耗時。遺傳算法(Genetic Algorithm,GA)[5]是一種基于自然選擇和遺傳學原理的優化方法,它從一個初始種群開始,利用選擇、交叉和變異等遺傳算子對種群進行不斷進化,最后得到全局最優解;其優點是擅長全局搜索,對中小規模優化問題能夠獲得較滿意的最優解。粒子群優化算法(Particle Swarm Optimization,PSO)[6]是一種基于群體智能的進化式算法,它采用實數求解,需要調整的參數較少且易于實現,且每代種群中的解具有“自我”學習和向“他人”學習的雙重優點,可以在較少的迭代次數內找到最優解。因此可以將GS網格搜索法、GA遺傳算法、PSO粒子群算法與SVM支持向量機算法相結合,對SVM支持向量機算法參數進行優化,以開發出更適合用于連鑄漏鋼預報系統的算法模型。
為此,本文將SVM算法應用于連鑄漏鋼預報系統結晶器熱電偶的溫度模式識別中,并通過GA遺傳算法、PSO粒子群算法和GS網格搜索法對SVM的算法參數進行了優化,建立了GA-SVM算法模型、PSO-SVM算法模型和GS-SVM算法模型,并利用某鋼廠CSP連鑄生產線上現場采集的熱電偶溫度數據對其進行了訓練和測試。
粘結漏鋼的發生主要是由于結晶器液面不穩定,彎月面處潤滑不好,凝固坯殼與彎月面間發生粘結時拉坯阻力增大,粘結處坯殼被拉裂并向下和兩側擴展,隨著結晶器振動和鑄坯的向下運動,當鑄坯坯殼破裂位置移出結晶器而產生的,其基本原理如圖1所示[1]。正常澆鑄過程中,上排熱電偶溫度高于下排熱電偶溫度,熱電偶溫度隨時間變化的曲線相對平穩,如圖1(a)所示;當鑄坯在彎月面處與結晶器發生粘結時,隨著結晶器的振動及坯殼的下移,粘結部位以下的坯殼很容易被拉裂,如圖1(b)所示;當粘結裂口擴展至上排熱電偶處時,鋼水與結晶器銅板直接接觸,熱電偶溫度會迅速上升,如圖1(c)所示;隨著粘結裂口的繼續下移,上排熱電偶溫度因坯殼的固化彌合而逐漸下降,如圖1(d)所示;同樣,當粘結裂口通過下排熱電偶時也會出現一個先上升后下降的溫度變化模式,只是在時間上要延后一些,如圖1 (e)和(f)所示。
基于熱電偶測溫法的漏鋼預報系統,主要目的是對熱電偶的溫度模式是否具有粘結漏鋼特征進行判別,其本質是熱電偶溫度曲線的模式識別問題,而基于SVM的漏鋼預報系統,就是利用SVM算法將正常溫度模式數據和漏鋼溫度模式數據區別開來。

圖1 粘結漏鋼預報原理Fig.1 Mechanism of sticking breakout prediction
SVM是建立在統計學習理論的VC維理論和結構風險最小原理基礎上,根據有限樣本信息在模型的復雜性(即對特定訓練樣本的學習精度)和學習能力(即無錯誤地識別任意樣本的能力)之間尋求最佳折衷,以期獲得最好的推廣能力(或稱泛化能力)的一種算法[8]。其基本思想是在尋求分類超平面的同時引入一個核函數,并通過非線性映射的方式將輸入樣本映射到一個高維特征空間中,然后在這個高維特征空間中構造最優超平面,從而將其轉化成為一個求解線性約束的凸二次規劃問題。
對于n個訓練樣本(xi,yi),i = 1,2,…,n,其中xi是輸入模式的第i個實例,yi是對應的期望輸出。假設由yi= + 1代表的模式和yi=-1代表的模式是線性可分的,用于進行分類的超平面方程表示為

式中,xi為輸入向量;ω為超平面的法向量,為可調權值的向量; b為偏置量。
由于樣本線性可分,則可以固定函數間隔為1,則訓練樣本即滿足如下條件

將式(2)合并為一個不等式,可得

計算幾何間隔γ

求最大間隔超平面,即最小化‖ω‖,也就是最小化。轉化為求解如下優化問題

若求解上面的約束優化問題,可構造拉格朗日函數

式中,αi≥0,為拉格朗日乘子。
分別對ω和b求偏導數,并令αi[1-yi(ωxi+ b)]=0,i


其中,Lp和L的最大值發生在相同的ω、b和αi處。

在真實的數據中,噪聲是不可避免的,對于線性不可分的輸入樣本,原優化問題的對偶形式為無界的目標函數,不能得到解決,需要引入松弛變量ξi,來放松約束條件。這樣的SVM分類器又稱作軟間隔分類器。對于每個樣本松弛變量ξi定義如下

同時指定一個懲罰參數C,來調節對輸入樣本誤分帶來的影響。根據ξi的定義,只有被錯誤分類的點對應的ξi非零,那么就表示訓練誤差的上界,通過引入松弛變量ξi和懲罰參數C把最大化分類間隔的問題轉化為同時最大化分類間隔和最小化分類誤差的問題,即

通過非線性映射將輸入樣本映射到一個高維特征空間中,并求解優化問題,可得到

引入核函數K,根據泛函理論,只要核函數K滿足Mercer定理[9],即K(xi,xj) =(xi)(xj),則可避免(x)的直接運算。
因此,最終優化問題可轉化成為

通過決策函數可以將不同類型的輸入數據進行識別,從而輸出不同的結果,達到分類的目的。決策函數為

基于SVM的漏鋼預報模型,最終目的是要找到能夠正確區分正常溫度模式和漏鋼溫度模式的最優超平面。其基本框架如圖2所示。

圖2 基于SVM的漏鋼預報模型框架Fig.2 Model of breakout prediction system based on SVM
首先,從CSP連鑄生產線現場所采集的熱電偶溫度數據中篩選出訓練樣本,并對其進行預處理;然后,選擇恰當的SVM分類器類型和核函數類型;最后,確定合適的算法參數,并使用訓練樣本對SVM模型進行訓練。
由于選擇不同的SVM算法參數往往會對算法的性能產生顯著的影響,為此本文采用GA遺傳算法、PSO粒子群算法和GS網格搜索法對其算法參數進行了優化選擇,再使用具有最優參數的SVM分類模型對溫度數據進行了測試,以驗證SVM模型的精度。
3.1SVM模型訓練樣本數據
1)樣本的選擇。訓練數據為某鋼廠CSP連鑄生產線現場歷史溫度數據,從中選取70組典型溫度模式作為訓練樣本對SVM分類器進行訓練,其中包括20組正常樣本和50組漏鋼樣本。
2)樣本維數的確定。通過對生產現場采集到的歷史溫度數據分析發現,30秒數據就可以體現一個完整的熱電偶溫度波形。因為現場溫度數據的采樣頻率為1次/s,所以訓練樣本輸入數據為30維。設置正常樣本輸出為0,漏鋼樣本輸出為1。
3)結晶器漏鋼預報系統熱電偶排布。文中CSP連鑄生產線的結晶器內共裝有120個熱電偶,但實際用于漏鋼預報系統的熱電偶只有36個,分2排布置,其中寬面上每排16個,窄面上每排2個。結晶器液面距其頂部為80 mm,而第一排熱電偶距結晶器頂部227 mm,所以第一排熱電偶在正常澆注時液位下方的147 mm處。
3.2數據預處理
3.2.1不良數據的處理
連鑄現場工況復雜,影響溫度信號采集系統的因素較多,因此采集到的溫度數據中難免存在不良數據,通過對生產數據進行分析發現,在正常情況下所采集到的熱電偶溫度波動較小,基本成一條直線,溫度值范圍在80℃~250℃之間;當漏鋼發生時,溫度數據變化幅度較明顯,但在相鄰2個采樣時刻的溫度值變化幅度不會超過30%,因此超過此范圍的數據可當作不良數據進行處理,若當前溫度值較前一采樣時刻溫度值變化幅度超過30%,就用前一時刻的溫度值代替當前數據,以避免噪聲數據對預報精度的影響。
3.2.2數據的PCA降維處理
現場采集到的溫度數據中存在數據的冗余現象,本文采用PCA主成分分析法對其進行降維預處理。成分分析結果如圖3所示。

圖3 數據的PCA降維Fig.3 Dimensionality reduction of data by PCA
PCA主成份分析法,就是將給定的一組變量通過線性變換轉換為另一組不相關的變量,這些新的變量按方差遞減的順序排列,構成相應的主成份[10],其具體步驟如下:
1)設X = (x1,x2,x3…xn)T是一個n維隨機向量,計算X的協方差矩陣Σ= XXT;
2)計算Σ的特征值λi(i =1,2,…)及對應的特征向量Pi(i = 1,2,…),則X的第i主成分為Y=PTiX ;
由圖3可以看出,3個主成分的累計貢獻率已經超過95%。通過PCA算法降維后,不僅抑制了數據中的噪聲,而且消除了數據中的冗余信息,降低了模型復雜度。
3.3SVM分類器的類型及核函數選擇
因為不能保證漏鋼樣本和正常樣本為線性可分的數據,所以本文在選擇分類器時采用了式(13)表示的軟間隔SVM分類器。由于選擇不同的核函數對不同數據類型的分類效果存在較大差異,而RBF核函數對各種數據類型都有良好的分類效果,為此本文采用RBF核函數[11],其函數表達式為

因為式(13)中,對偶形式的目標函數和約束條件中,訓練樣本為已知數據,只有核函數參數σ和懲罰參數C需要選擇,并且對SVM分類器性能有著顯著影響,因此需要對參數C和σ進行優化選擇。
3.4SVM分類模型的參數優化
分別采用GS網格搜索法、GA遺傳算法和PSO粒子群算法完成參數的選擇過程。
3.4.1網格搜索法優化SVM參數
網格搜索法(Grid-search,GS),是先指定SVM算法參數C和σ的范圍和取值的步長,然后取參數(C,σ)的所有取值訓練SVM分類器,經過比較后選取效果最好的一對參數值作為SVM模型參數。本文設定log2C∈(-5,5),log2σ∈(-5,5),C和σ取值步長為1。圖4給出了網格搜索法選擇SVM參數的過程。
3.4.2GA算法優化SVM參數
GA遺傳算法是在對生物進化過程進行深入研究的基礎上提出來的一種具有隨機特性的全局尋優搜索算法,具有良好的全局優化性能和宏觀搜索能力。利用遺傳算法選擇SVM算法參數的流程如圖5所示,其具體步驟如下:
Step1:對參數進行編碼并產生初始種群;
Step2:用訓練樣本對該初始種群構成的SVM模型進行訓練,將樣本5折交叉檢驗精度折算成該模型的GA適應度;
Step3:根據GA適應度,對參數進行選擇、交叉及變異等操作,產生下一代參數種群;
Step4:用新一代的種群參數重新對SVM模型進行訓練,計算適應度:如果滿足停止準則,則轉步驟step5,否則,返回step3;
Step5:訓練結束,得到的參數即為SVM模型的參數。

圖4 GS網格搜索法選擇SVM參數Fig.4 SVM parameter selection by Grid Search Method
遺傳算法的參數選擇:
1)種群初始化。個體編碼方法采用實數編碼;種群數量設置為20。
2)適應度函數。把5折交叉檢驗的CV準確率作為適應度函數值。
3)選擇操作。選擇操作方法為輪盤賭法;個體i的選擇概率pi為:式中,fi為第i個基因對應的個體適應度; N為種群規模。

4)交叉操作。交叉概率取0.4;由于個體編碼采用的是實數編碼,所以交叉操作的方法采用的是實數交叉法,第k個染色體ak和第l個染色體al在j位的交叉操作方法如下:式中,b為[0,1]間的隨機數。

5)變異操作。變異概率選擇0.01;選取第i個染色體的第j個基因aij進行變異,其操作過程為

f(g) = (r2(1-g/gmax))m(19)式中,ci,di分別為基因ai的下界和上界; g為當前進化次數; gmax為最大進化次數; r1、r2為[0,1]間的隨機數; m為設定參數,它決定了變異結果對迭代次數的依賴程度。
6)終止條件。最大進化代數為100。

圖5 GA-SVM算法流程圖Fig.5 Flow diagram of GA-SVM algorithm
利用GA遺傳算法選擇SVM參數時所繪制的適應度曲線如圖6所示。
3.4.3PSO算法優化SVM參數
PSO算法為迭代尋優算法,通過與個體最優值和全局最優值的比較不斷更新自己的位置和速度,PSO算法優化SVM算法參數步驟如下:
Step1:初始化粒子群;
Step2:將5折交叉檢驗準確率的相反數作為適應度函數,并根據適應度函數計算每個粒子的適應度值;
Step3:對于每個粒子,將其自身適應度值與該粒子自身的最優適應度值進行比較,若較好,則更新粒子的當前最優位置;
Step4:對于每個粒子,將其自身適應度值與所有粒子的最優位置的適應度值進行比較,若較好,則更新全局最優位置;圖6給出了遺傳算法的適應度曲線。

Step5:按照如下規則對速度和位置進化并更新粒子的速度和位置,得到新的粒子位置式中,w為慣性權重,表明微粒原先的速度在多大程度上得到保留;下標“i”表示微粒i;“j”表示微粒的第j維;表示第七代; c1、c2為加速常數; r1~U(0,1)、r2~U(0,1)為兩個獨立的隨機函數。
Step6:判斷是否滿足終止條件(達到最大迭代次數或最小適應度閾值),若不滿足則返回step2重復上述過程,若滿足則輸出最優參數。

圖6 遺傳算法適應度曲線Fig.6 Fitness curve of genetic algorithm
PSO算法參數的選擇:
1)種群大小n。n較小使算法陷入局部最優,n較大優化能力較好,但計算時間增加,文中取n為20。
2)粒子維度的確定。粒子維度是由具體的優化問題所決定的,優化C和σ兩個參數,所以粒子維度為2,每一維粒子坐標范圍都單獨設定。
3) c1和c2的確定。加速度因子c1和c2代表了粒子向自身最優點和全局最優點推進的加速權值。文中取c1和c2為2。
4)慣性權重w的選擇。慣性權重w描述了上一代粒子速度對當前代粒子速度的影響。較大的w具有較好的全局收斂能力,較小的w有較好的局部收斂能力。因此,慣性權重w要隨著迭代次數增加而不斷減小,選擇如下更新方式

其中,t為當前迭代次數,T為最大迭代次數。文中取n為6,此時全局搜索時間和局部搜索時間都較長,w隨著迭代次數的增加從0.9到0.4變化。
5)將SVM的5折交叉檢驗精度的相反數作為粒子群算法的適應度函數(適應度函數值越小表示效果越好)。
6)終止條件。最大迭代次數為200。
利用PSO粒子群算法選擇SVM參數時所繪制的適應度相反數曲線如圖7所示。

圖7 粒子群算法適應度相反數曲線Fig.7 Fitness opposite curve of PSO
3.5SVM預報模型的測試
在對某鋼廠CSP連鑄生產線現場所采集3個月的歷史數據進行提取、分析并處理后,將包含正常模式、粘結模式的溫度序列作為測試樣本對該漏鋼預報模型進行測試。測試樣本共120組,包含正常樣本50組,偽報警樣本20組,報警樣本50組,測試樣本與訓練樣本不存在任何交叉與重復。
對GA優化的SVM算法模型、PSO優化的SVM算法模型和GS優化的SVM算法模型進行測試,并將測試結果比較,如表1所示。表1中所采用的預報模型的性能測試指標[12]為預報率ηp和報出率ηr式中,ηr為正確報警次數;ηf為錯誤報警次數; no為漏報次數。

從表1中可以看出,采用GA算法優化的SVM預報模型具有更好的預報精度,在測試過程中,共做出51次報警,包括對50組報警數據的正確報警和對偽報警數據的1次誤報,不存在漏報現象,其預報率為98.33%,報出率為100%。

表1 SVM預報模型訓練及測試結果Tab.1 Training and test results of SVM prediction model
利用PCA法,對某鋼廠CSP連鑄生產過程中結晶器熱電偶所采集的溫度數據進行降維預處理,抑制了噪聲,剔除了冗余數據,減小了模型復雜度;分別利用GS網格搜索法、PSO粒子群算法和GA遺傳算法,對以RBF核函數為映射函數的SVM算法參數進行了優化選擇;將優化后的SVM分類模型應用到漏鋼預報系統中,并對其進行了訓練和測試。測試結果表明,利用GA算法優化的SVM分類模型具有更好的預報效果,得到了98.33%的預報率和100%的報出率,提高了漏鋼預報系統對粘結漏鋼溫度模式的識別精度,降低了誤報率。
參考文獻
[1]Lee D,Moon C H,Moon S C,et al.Development of Healing Control Technology for Reducing Breakout in Thin Slab Caster[J].Control Engineering Practice,2009,17(1) : 3-13.
[2]張本國,李強,王葛,等.基于改進BP神經網絡的漏鋼預報[J].中國機械工程,2012,23(2) : 204-207.
[3]秦旭,朱光甫,高光河,等.板坯漏鋼機理及基于熱電偶檢測的漏鋼預報技術研究[J].鋼鐵研究學報,2011,23(1) : 7-14.
[4]Vapnik V.The Nature of statistical learning theory[M].New York: Springer,1999.
[5]Zhang Benguo,Zhang Ruizhong,Wang Ge,et al.Breakout prediction for continuous casting using genetic algorithm-based backpropagation neural network model[J].Modelling Identification and Control,2012,16(3) : 199-205.
[6]陳貴敏,賈建援,韓琪.粒子群優化算法的慣性權值遞減策略研究[J].西安交通大學學報,2006,40(1) : 53-56.
[7]王葛,李珊,張瑞忠,等.基于粒子群優化的神經網絡漏鋼預報模型研究[J].燕山大學學報,2014,38(3) : 221-225.
[8]Cortes C,Vpnik V.Support vector networks[J].Machine Learning,1995,20(3) : 273-297.
[9]Nello C,Hohn S.An introduction to support vector machines and other kernel-based learning methods[M].Delfing China Machine Press,2005: 7.
[10]韓成茂.基于類內加權平均值的模塊PCA算法[J].計算機工程.2009,35(22) : 194-196.
[11]奉國和.SVM分類核函數及參數選擇比較[J].計算機工程與應用,2011,47(3) : 123-124.
[12]史建聚.板坯漏鋼預報系統的研究[J].重慶科技學院學報,2008,10(1) : 66-68.
Breakout prediction model for continuous casting based on support vector machine method
WANG Ge1,YIN Shao-feng1,LI Shan1,ZHANG Rui-zhong2,AN Ling-jun2,LI Qiang1,3
(1.National Engineering Research Center for Equipment and Technology of cold Strip Rolling,Yanshan University,Qinhuangdao,Hebei,066004,China; 2.Hebei Iron&Steel Group Handan Iron&Steel Group Co.Ltd,Handan,Heibei 056015,China; 3.National Key Laboratory of Metastable Materials Science and Technology,Yanshan University,Qinhuangdao,Heibei 066004,China)
Abstract:The performance of the breakout prediction may largely depend on the performance of it's algorithm model.Support Vector Machine (SVM) method has a lot of preponderance for solving the small sample,nonlinearity and high-dimensional pattern recognition problems.SVM method has no local minima problem,but the algorithm parameters of SVM can largely influence on the performance of the algorithm model.Grid search (GS) method,particle swarm optimization (PSO) and genetic algorithm (GA) are introduced to optimize the parameters of SVM.The optimized SVM model by GA has better performance and is applied to the breakout prediction system of continuous casting.The optimized SVM model is trained and tested using the historical data of a CSP continuous casting production line.A prediction ratio of 98.33% and a quoted ratio of 100% are obtained.It is shown that the breakout prediction system based on the SVM algorithm is feasible and effective.
Key words:breakout prediction; support vector machine; genetic algorithm; particle swarm optimization
作者簡介:王葛(1975-),男,河北玉田人,博士,副教授,主要研究方向為連鑄過程漏鋼預報算法研究; *通信作者:李強(1962-),男,江蘇贛榆人,博士,教授,博士生導師,主要研究方向為連鑄坯凝固過程研究和漏鋼預報算法研究,Email: liqiang@ ysu.edu.cn。
基金項目:國家自然科學基金資助項目(51205342)
收稿日期:2014-09-12
文章編號:1007-791X(2015) 01-0022-08
DOI:10.3969/j.issn.1007-791X.2015.01.004
文獻標識碼:A
中圖分類號:TF345