吳榮強,李晉宏
(北方工業大學計算機學院 知識工程研究所,北京 100144)
本文采用的陽極壓降數據是某鋁廠利用新型的陽極壓降信號采集裝置采集到的陽極壓降。鋁電解槽中陽極導桿分為A,B兩側,A側和B側各有8塊陽極。每個位置的陽極導桿的壓降波動情況都有所差異,每個位置的陽極都要經歷換極,換極的周期大致為28天左右,換極質量的好壞會嚴重影響整個電解槽槽電壓的穩定。對陽極壓降進行聚類分析,能夠合理分析電壓波動情況,避免某次換極影響電解槽,并且對電解槽的有效生產和減少損耗有一定的益處[1-2]。
目前對電解槽陽極壓降的研究已經有了一些進展。林立明等在文獻中[3]通過提取在同一個電解槽中不同陽極導桿的電流的頻譜特征,分別利用功率譜估計方法和因子分析方法對其進行分析,得到同一電解槽中 A,B兩側磁場呈現不同分布狀態。但是未對時間序列的陽極電壓異常波動和分布特性進行挖掘。劉永強等在文獻中[4]分析了鋁電解槽在生產過程中陽極炭塊在出現脫落,偏流和陽極長包等異常情況下,電壓的波動狀態,并且給出了相應的異常處理方式。但這種方式只是發現異常情況下的電壓波動情況,并未進行陽極換極周期性電壓波動的分析。本文通過對電解槽A,B兩側16根陽極周期數據進行分析,提取陽極換極后的上升期長度,陽極壓降速升次數,速升平均幅度,速降次數,速降平均幅度,以及影響因子特征,并利用聚類方法對這6維數據進行聚類,挖掘不同位置陽極相似的電壓波動情況,在一定程度上對陽極換極后的質量進行評估。
本文的數據來源于某鋁廠的4622號電解槽A,B兩側的陽極導桿的壓降值,該數據是通過采集器每5s采集的一組數據。數據采集的頻率過高,隨著時間的增加,陽極壓降的數據量巨大,直接對陽極壓降原始數據進行歐式距離計算復雜度較高,需要對原始數據進行特征抽取,降低維度再進行距離計算會大大降低復雜度[5-6]。原始數據如圖1所示。

圖1 陽極壓降原始數據Fig.1 Anode voltage drop raw data
(1)陽極換極上升期長度
電解槽中每個陽極都有一定的生命周期,一般是在 28天左右,每次換極電壓值會下降到 50 mv左右,再經過一段時間的恢復期,電壓值會達到1500 mv左右的平穩期。所以需要從原始數據中自動獲取每次換極的時刻和到達平穩期的時刻,從而計算出陽極換極上升期跨度的時間值即長度。利用滑動窗口算法[7-9],每個窗口大小固定,每次滑動一格即5s并計算該窗口內電壓值的平均值將原始數據轉換為 ( C1, C2,...,Cm)。計算公式如下:

其中m表示窗口的大小,xk表示窗口中每個電壓值。得到降維后的數據 ( C1, C2,… ,Cm),利用陽極換極后的特性即換極時電壓下降至50 mv以下,平穩期電壓為1500 mv左右這兩個閾值分別判斷換極開始時刻 tstart和電壓恢復至平穩的時刻 tend,最后得到上升期長度。
(2)陽極壓降速升/速降次數
陽極電壓速升/速降是指在平穩期至下一次換極開始時這段時間內陽極電壓由 V1陡然上升/下降至 V2之后,并能夠保持上升/下降后的 V2值一段時間,這種情況就視作一次陽極壓降的速升/速降。將該數據作為一維特征的目的是電解槽在生產過程中陽極壓降會由于某些異常情況例如:陽極長包,偏流等導致電壓出現波動,但經過處理后又保持穩定。通過統計速升/速降的次數來判斷陽極全周期內電壓整體波動情況。
(3)陽極壓降速升/速降幅度
陽極壓降速升/速降幅度是指陽極每次發生速升/速降情況時都會產生一定的電壓差,統計這些壓降差并計算相應的平均值就得到了速升/速降幅度。
(4)影響因子
影響因子是由日報數據中的針振和擺動所決定的。針振和擺動是描述電解槽槽電壓是否平穩的兩個物理量,當某些陽極在換極結束后,由于換極質量較差會導致電解槽中電壓擺,使針振和擺動過大。影響因子的產生式如下:

本文采用的數據集是4622號電解槽A,B兩側陽極壓降的全周期數據,可以將數據集表示為C = { c1, c2,… ,cm},而利用k-means聚類算法最終得到的簇集合為 D = { d1, d2,… ,dk}[10-12]。假設有樣本X = ( x1, x2,… ,xn),樣本 Y = ( y1, y2,… , yn),則樣本X和Y之間的距離計算公式為:

該距離度量方法是最常用的明可夫斯基距離(Minkowski distance),其中 1p≥ 。本文使用的是歐式距離即 2p= 。
k-means算法需要提前確定樣本需要聚類的數目 k,本文利用了輪廓系數來評價在 k取不同值時k-means聚類的效果,輪廓系數的計算公式如下:

公式中aj表示在同一個簇中樣本j到該簇中其他樣本的距離的平均值,bj表示樣本j到其它簇包含的樣本的距離的平均值,在這些平均值中取最大值。K-means聚類算法所要達到的效果是同一簇內的樣本之間越緊密越好即距離越小越好,不同簇之間樣本的距離越大越好,這樣聚類出來的效果比較好。
本文中利用k-means算法對陽極壓降特征聚類過程如下:
1)輸入數據集 C = {c1, c2,...,cm}, ci=(上升期長度,速升次數,速升平均幅度,速降次數,速降平均幅度,影響因子),以及k;
2)為了防止陷入局部最優情況,隨機初始化k個中心 Oi;
3)計算數據集中每個樣本 ci分別與這 k個中心 Oi的歐氏距離,將樣本 ci歸入到聚類最近的類別中去;
4)利用劃分好的樣本重新計算類中心,更新 Oi;
5)重復第3)和4)步,直到迭代的次數達到指定的最大值n或者是k個聚類中心值 Oi不再發生變化;
6)輸出結果為簇集合 D = { d1, d2,… ,dk};
本實驗采用的數據是某鋁廠4622號電解槽A,B兩側16個位置陽極壓降數據,日期從2017年3月1日至2017年5月6日,每個位置取最后一次換極周期數據。并通過數據預處理得到每個位置陽極的完整周期數據,然后通過特征提取獲取陽極換極后的上升期長度,陽極電壓速升次數,速升平均幅度,速降次數,速降平均幅度,以及影響因子特征,對這6維數據進行聚類。
通過對6維特征進行聚類,聚類的個數分別取2,3,4,5,7,而輪廓系數的取值范圍在[-1,1],越接近于1聚類效果越好。如表1中可以看出當k=3時輪廓系數值最大,說明當類別確定為3時,電解槽陽極壓降數據聚類效果最好,表明4622號電解槽中陽極壓降波動的情況大致分為3類,而只需要觀察這三類的波動情況就可以得出整個電解槽的電壓穩定性情況。

表1 不同聚類類別k值下的輪廓系數對比Tab.1 Comparison of contour coefficients under different clustering category k values
本文通過對陽極壓降的k-means聚類分析得出當k=3時效果較好。聚類結果如圖2所示,相同形狀的為一類,圖中是類似于真實電解槽的示意圖。
不同類別下陽極壓降的波動情況如圖 3,4,5所示,可以看出類別1的陽極換極之后上升期長度在45小時左右,說明電壓很快回升至平穩,電解槽的針振和擺動幅度會相對較小;類別2的上升期為200小時左右,時間跨度很大因此會在很大程度上會影響整個電解槽的槽電壓,也會較大程度上增大針振和擺動;類別 3中陽極換極之后電壓變化較平穩,上升期為120小時左右。電解槽中每個陽極換極的質量好壞直接影響電壓的波動情況從而導致整個電解槽的槽電壓不平衡,增大能耗,影響生產效益。
鋁電解槽中陽極每次換極質量的好壞都會或多或少的影響整個槽的槽電壓,槽電壓過高或是過低一方面會增大能耗,減少電解槽的使用壽命[13];另一方面會降低出鋁量,進而影響生產效益[14-15]。通過對陽極壓降原始分布數據進行預處理,得到陽極周期數據,并對陽極周期數據進行聚類劃分,得到不同換極質量下陽極壓降的波動狀態。從而明確關鍵陽極,并有針對性地在換極過程中進行精細化作業,提高換極質量并對班組進行換極評價,考核,確保鋁電解槽穩定生產。

圖2 聚類結果示意圖Fig.2 Clustering results of the schematic

圖3 類別1陽極壓降波動曲線Fig.3 Category 1 anode voltage drop fluctuation curve

圖4 類別2陽極壓降波動曲線Fig.4 Category 2 anode voltage drop fluctuation curve

圖5 類別3陽極壓降波動曲線Fig.5 Category 3 anode voltage drop fluctuation curve
[1] 田慶紅. 合理利用鋁電解槽工作電壓[J]. 輕金屬, 2008.
[2] 田官官, 石良生. 淺析預焙陽極質量對鋁電解生產的影響及應對措施[J]. 世界有色金屬, 2014.
[3] 趙仁濤, 林立明, 張志芳等. 鋁電解槽陽極數據分析[J].有色金屬(冶煉部分), 2014.
[4] 劉永強, 李釗, 姬鳳武等. 鋁電解生產中陽極工作狀態的分析[J]. 云南冶金, 2011.
[5] 肖瑞, 劉國華, 陳愛東, 宋轉. 不確定時間序列統計降維方法[J]. 計算機科學, 2014.
[6] 謝福鼎, 李迎, 孫巖, 張永. 改進的符號化時間序列處理方法[J]. 計算機工程與設計, 2012.
[7] 余宇峰, 朱躍龍, 萬定生等. 基于滑動窗口預測的水文時間序列異常檢測[J]. 計算機應用, 2014, 34(5): 2217-2220,2226.
[8] 李峰, 肖建華. 在時間序列相似性問題中滑動窗口的確定[J]. 計算機應用, 2008.
[9] 翁小清, 沈鈞毅. 基于滑動窗口的多變量時間序列異常數據的挖掘[J]. 計算機工程, 2007, 33(12): 102-104.
[10] Cao Ge, Cheng Yuhu.K-means Clustering Algorithm Based on Initial Clustering Centre Selection and Points Division[J].The Journal of New Industrialization, 2011, 1(5): 90-94. [曹戈, 程玉虎. 基于初始聚類中心選取和數據點劃分的K均值聚類算法[J]. 新型工業化, 2011, 1(5): 90-94]
[11] XU Buyun, NI He.Comparative analysis of SOM and K-means clustering[J]. The Journal of New Industrialization,2014, 4(7): 63-65. [徐步云, 倪禾. 自組織神經網絡和K-means 聚類算法的比較分析[J]. 新型工業化, 2014, 4(7):63-69]
[12] Zhang Xiaohua, Wang Le.Change detection based on multiscale and clustering[J]. The Journal of New Industrialization. 2011,1(3): 72-79. [張小華, 王樂. 一種多尺度和聚類分析的變化檢測[J]. 新型工業化, 2011, 1(3): 72-79]
[13] 張報清, 雷霆, 余宇楠. 預焙槽陽極壓降影響因素研究[J].礦冶,2015.
[14] 單淑秀. 我國電解鋁工業的現狀及發展方向[J]. 輕金屬,2008(8): 3-6.
[15] 閆紹勇. 預焙陽極鋁電解技術研發進展[J]. 輕金屬, 2013.