暴子旗,盧才武,章 賽,宋思遠
(1.西安建筑科技大學資源工程學院,陜西 西安 710055;2.西安市智慧工業感知計算與決策重點實驗室,陜西 西安 710055)
焦炭在高爐內的作用主要有供熱劑、還原劑、骨架、滲碳劑等,除骨架作用不可替代外,其他作用均可被噴吹燃料所代替。隨著高爐煉鐵技術的進步,焦比不斷降低,焦炭作為料柱骨架的作用更加突出,反映焦炭作為骨架能力的抗碎強度(M40)、耐磨強度(M10)、反應性(CRI)、反應后強度(CSR)等四項焦炭質量指標的好壞對高爐冶煉過程有著極大的影響[1-2],在焦炭生產中如何穩定、優化焦炭質量,是企業面臨的重要課題[3-4]。
焦炭生產是一個具有多變量、非線性等復雜問題的大工業生產過程,在目前的焦炭生產中,焦爐的自動化程度仍然無法實現焦炭質量的穩定,生產現場也無法實現焦炭質量指標的在線測量,對于焦炭質量的人工分析則存在很大的滯后性與延遲性,因此,建立一個穩定、可靠的焦炭質量預測模型對煉焦生產進行指導具有十分重要的意義。
諸多學者針對焦炭質量預測問題進行了研究,周洪等[5]基于BP神經網絡對特大型焦爐焦炭質量進行預測,并對影響模型預測精度的因素進行了詳細分析,取得了較好的結果;崔慶安等[6]較早采用支持向量機預測焦炭質量,并將其與ANN模型進行對比,結果表明SVM模型具有更高的泛化性與預測精度;張偉峰等[7]建立了通過遺傳算法(GA)優化BP神經網絡的焦炭質量預測模型,實例證明該模型具有較好的準確度;都吉東等[8]構建了自適應差分進化算法優化的BP神經網絡預測模型并進行仿真,將該模型與BP神經網絡的預測結果進行對比分析,證明了ADE-BP神經網絡預測模型具有更好的適應性與精確度;張代林等[9]對配煤中焦炭質量指標進行了分析,基于GA-SVR模型對焦炭強度進行了預測,具有較好的準確性與可靠性。但在預測模型中,BP神經網絡存在難以選擇合適的網絡結構、易出現局部極值等問題,而在對預測模型進行優化的算法方面,GA算法收斂速度較慢,且參數交叉率和變異率等的選擇憑借于經驗,具有主觀性,影響參數尋優的結果。
綜上所述,本文采用具有較強泛化能力和學習能力的支持向量回歸機作為模型建立的基礎,引入Tent混沌映射改進的麻雀搜索算法(TSSA)對支持向量回歸機的參數進行優化,建立了基于TSSA-SVR模型的焦炭質量預測模型,提高了模型參數的搜索能力以及預測模型的精確度,并對實際生產中的焦炭質量進行預測,以驗證該模型的可行性與有效性。

f(x)=ωT×φ(x)+b
(1)
式中:φ(x)為原始特征數據的非線性映射函數;ω為權向量;b∈R為閾值。


(2)

(3)
引入拉格朗日函數和核函數K(xi,xj)=φ(xi)φ(xj),可轉化為對偶形式,見式(4)和式(5)。

(4)

(5)
式中,α為拉格朗日乘子。通過求解對偶優化問題,可以得到相應的決策函數,見式(6)。

(6)
仿生類算法在解決函數優化問題中,通常利用隨機產生的數據作為初始種群信息,而初始種群的分布會對算法的尋優精度與收斂速度產生很大的影響。
混沌序列具有隨機性、遍歷性和規律性等特點,通過其產生的初始種群可以具有較好的多樣性,并提高算法的全局搜索能力。現有的混沌映射有Tent映射、Logistic映射等。但是,不同的混沌映射對于提高函數優化能力不同。其中,單梁等[11]的研究表明,Tent映射相比Logistic映射具有更佳的遍歷性,可以生成更好的均勻序列。因此,本文引入Tent映射初始化種群,提高算法的全局搜索能力。
TENT混沌映射的表達式為式(7),即xi+1=(2xi)mod1。

(7)


(8)
變換后表達式見式(9)。

(9)
式中:N為混沌序列內粒子個數;rand(0,1)為在[0,1]之間取值的隨機數。
麻雀搜索算法(sparrow search algorithm,SSA)是受到生物界麻雀捕食和反捕食行為的啟發,由XUE等[13]于2020年提出的新型仿生類算法。其仿生學原理及抽象數學表達如下所述。
麻雀覓食過程可將群體抽象為三類:發現者、加入者以及偵察者。具有較高適應度的麻雀作為發現者,在廣泛范圍進行搜索,并引導種群搜索和覓食,加入者則會跟隨發現者進行覓食。而當作為預警者的麻雀意識危險時,會對整個種群發出信號,促使整個種群立即進行反捕食行為。
在SSA算法中,麻雀群體可表示為Xi=[xi1,…,xid,…xiD],i=1,2,…,N,N為麻雀的總數,其中,Xid為第i只麻雀在第d維的位置。
在種群的發現者位置更新公式見式(10)。

(10)
式中:t、T分別為當前迭代次數與最大迭代次數;α為(0,1)之間的隨機取值;Q為服從標準正態分布的隨機數;L為元素皆為1的矩陣,大小為1×d;R2(R2∈[0,1])為預警值;ST(ST∈[0.5,1])為安全值。以R2與ST的值進行判定,當R2 加入者的位置更新公式見式(11)。 (11) 偵查者一般從種群中隨機取10%~20%,其位置更新公式見式(12)。 (12) 式中:β為步長的調整參數,是服從均值為0,方差為1的正態分布隨機數;K為在[-1,1]之間取值的隨機數,表示麻雀移動的方向;e為一個極小的常數,避免出現分母為0的情況;fi為第i只麻雀的當前適應度值,fg、fw分別為在當前種群中的最優與最差適應度值。當fi≠fg時,表示該麻雀處于邊緣位置,正在受到捕食者的威脅;當fi=fg時,表示處于種群中心的麻雀意識到了危險,需要向其他麻雀靠攏。 在SSA模型的基礎上引入Tent混沌映射初始化種群,增加了種群的多樣性,提高了算法搜索全局最優的能力,混沌麻雀搜索算法的步驟如下所述。 Step1初始化參數,如種群數量N、最大迭代次數、發現者比例PD、偵察者比例SD、目標函數維度D,初始值上下界ub、lb,最大迭代次數T。 Step2基于Tent混沌序列初始化種群,生成N個D維向量Zi。 Step3計算各只麻雀的適應度值,找出當前最優適應度值fb和最差適應度值fw,以及相對應的位置xb、xw。 Step4從適應度值較優的麻雀中,選取部分麻雀作為發現者,并按照式(10)更新位置。 Step5余下麻雀作為加入者,并按照式(11)更新位置。 Step6從麻雀中隨機選擇部分麻雀作為偵查者,并按照式(12)更新位置。 Step7更新整個種群的最優位置xb和最優適應度fb,以及最差位置xw和其適應度fw。 Step8判斷是否達到結束條件,若是,則結束循環,輸出最優結果,否則跳轉Step4。 本文基于支持向量回歸機對焦炭質量進行預測,以配合煤中的水分Md、灰分Ad、揮發分Vdaf、硫分Std、黏結指數G,以及膠質層指數X和Y作為輸入變量,以焦炭質量的抗碎強度M40、耐磨強度M10、反應性CRI、反應后強度CSR等四項指標為輸出變量。 SVR模型中的核函數及其參數的選取模型的回歸效果起到重要影響,核函數中的徑向基函數(RBF)具有學習能力強、收斂范圍較寬等優點,故本文采用RBF作為核函數,見式(13)。 (13) 參數選擇對SVR模型的學習效果和泛化性能有直接的影響[14],在選取RBF作為核函數的情況下,影響SVR回歸性能的主要參數有懲罰系數c和RBF核函數的寬度參數g。c表示SVR預測模型中誤差與復雜度之間的權衡,c越小則對誤差的懲罰越輕,容易導致模型欠擬合;c越大,表示模型越不能容忍誤差,容易使模型對訓練數據過分學習,導致過擬合。g表示RBF核函數的寬度,g值過小,則支持向量影響范圍過小,會導致模型過擬合,g值過大,則支持向量影響過強,導致模型預測精度低[15]。 基于此,本文引入混沌麻雀搜索算法對SVR的參數進行優化,尋找最優的(cbest,gbest),而后對焦炭質量進行預測,其流程圖如圖1所示,具體步驟如下所述。 圖1 基于TSSA-SVR模型的焦炭質量預測總體流程圖Fig.1 The overall flow chart of coke quality predictionbased on TSSA-SVR model 1) 載入數據,并對數據進行歸一化,并把歸一化后的100個樣本按照8∶2的比例分為訓練集與測試集。 2) 初始化混沌麻雀搜索算法的各項參數,并基于Tent映射初始化種群。 3) 以式(14)的均方誤差作為適應度函數并計算適應度值,以均方誤差小為佳。 (14) 4) 運行混沌麻雀搜索算法,迭代尋優得出具有最小適應度值的(cbest,gbest)。 5) 將(cbest,gbest)代入到SVR模型中進行訓練,而后基于訓練好的TSSA-SVR模型對焦炭質量進行預測。 本文選取河南某焦化廠100組穩定生產的焦爐數據進行實例驗證,部分實驗數據見表1。這些生產數據存在維數高、量綱不統一、范圍較大的特點,所以為了消除不同指標間的量綱影響,并且保證數據間的可比性,需要對數據進行歸一化處理。本文將數據歸一化至[0,1]之間,利用的公式為式(15)。 表1 部分實驗數據Table 1 Partial experimental data (15) 式中:xi為數據的樣本值;xmax、xmin分別為每組樣本數據中的最大值、最小值;x*為數據的歸一化值。 對數據進行預處理后,將數據導入TSSA-SVM模型中進行訓練和預測。在TSSA算法中初始化設定種群大小N=30,最大迭代次數T=50,目標函數的維數D=2。通過TSSA算法獲得四組最優參數(cbest,gbest),見表2,將最優參數帶入預測模型進行計算。 表2 TSSA-SVR模型參數尋優結果Table 2 Parameter optimization results of TSSA-SVR model 式(14)的均方誤差(MSE)作為算法的適應度函數fitness,以CSR的參數尋優為例,求得適應度曲線如圖2所示。由圖2可知,TSSA-SVR模型的適應度值始終優于標準的SSA-SVR模型,并且迭代較快,誤差較小,證明該算法在全局搜索上具有較優的性能。 圖2 適應度曲線Fig.2 Fitness curves 為驗證模型預測結果的有效性,本文采用平均相對誤差(MRE)和均方誤差(MSE)兩個評價指標進行驗證。 平均相對誤差(MRE)見式(16)。 (16) 均方誤差(MSE)見式(17)。 (17) 本文選取標準SVR模型、SSA-SVR模型、TSSA-SVR模型等三種模型進行仿真實驗并對預測結果進行分析,預測指標結果見表3~表6;對比擬合曲線如圖3~圖6所示。 表3 M40預測結果Table 3 M40 prediction results 表4 M10預測結果Table 4 M10 prediction results 表5 CRI預測結果Table 5 CRI prediction results 表6 CSR預測結果Table 6 CSR prediction results 由表3~表6可知,TSSA-SVR預測模型相較于對比模型中效果較優的SSA-SVR預測模型,TSSA-SVR模型對焦炭質量各指標預測的MRE值分別下降了0.10%、0.23%、0.39%和0.29%,MSE值則分別下降了0.20、0.07、0.07和0.23。這表明TSSA-SVR預測模型的預測精度更高,可以更好地應用于焦炭質量的預測。 圖3~圖6為TSSA-SVR模型、SSA-SVR模型、標準SVR模型等三種模型對焦炭質量各指標的預測值與真實值之間的擬合圖。 由圖3~圖6可以看出,除個別點外,TSSA-SVR預測模型的預測值相比于另外兩個模型都更接近真實值,穩定性更好,擬合度更高。 圖3 M40預測擬合圖Fig.3 M40 prediction fitting diagram 圖4 M10預測擬合圖Fig.4 M10 prediction fitting diagram 圖5 CRI預測擬合圖Fig.5 CRI prediction fitting diagram 圖6 CSR預測擬合圖Fig.6 CSR prediction fitting diagram 針對焦炭質量預測問題,利用基于混沌映射改進的麻雀搜索算法(TSSA)對支持向量回歸機(SVR)的參數進行優化,建立了TSSA-SVR回歸預測模型,通過實驗證明了TSSA算法優化SVR參數的優越性。在實證中,采用某焦化廠實際生產數據進行預測,仿真結果表明,本文建立的TSSA-SVR模型對焦炭質量的預測精度更高,預測誤差更穩定,并驗證了TSSA-SVR模型在實際問題應用中的有效性和可行性。 煉焦生產過程較為復雜,影響焦炭質量的因素眾多,其中包括配合煤的各項指標,還包括生產中的各項參數,如何分析整合更多的焦炭質量影響因素,建立精度更高,效果更穩定的焦炭質量預測模型是今后研究的重點。


1.4 混沌麻雀搜索算法
2 焦炭質量預測模型的構建



3 實例研究
3.1 數據來源及預處理


3.2 仿真分析













4 結 論