張浪文 鄒培炯




摘要:直流輸電電流轉換過程中產生大量的熱量,閥冷系統的作用是對熱量進行及時消散,以保證系統穩定運行,是直流輸電工程的核心設備。膨脹罐是保證閥冷系統壓力穩定的關鍵,提前預測膨脹罐排氣、補氣閥狀態能提高系統運行效率。膨脹罐液位是反映其狀態的重要指標,該文建立基于隨機森林算法的閥冷系統膨脹罐液位預測方法。首先,采集閥冷系統重要參數數據,包括電極功率、環境溫度、內冷進(出)閥溫度等,分析關聯數據對膨脹罐液位的影響關系;其次,開發隨機森林回歸算法,利用訓練集數據對膨脹罐的液位進行預測建模,得到預測模型;最后,利用測試集數據對所建立的預測模型進行綜合仿真,結果表明模型預測數據能夠很好地與實測數據擬合,說明該文膨脹罐液位預測模型的有效性。
關鍵詞:閥冷系統膨脹罐隨機森林液位預測模型
中圖分類號:TM721.1文獻標識碼:A 文章編號:1672-3791(2022)03(b)-0000-00
Liquid Level Prediction Model of Expansion Tank in Valve Cooling System Based on Stochastic Forest Algorithm
ZHANG Langwen? ZOU Peijiong
(Yueyang Goaland Energy Conservation Equipment Manufacturing Co., Ltd., Yueyang, HunanProvince, 414000 China)
Abstract: A large amount of heat is generated in the process of DC transmission current conversion. The function of valve cooling system is to dissipate the heat in time to ensure the stable operation of the system. It is the core equipment of DC transmission project.Valve cooling system is the core equipment of DC transmission project. The function is to effectively dissipate the heat in the process of current conversion. Expansion tank is the key to ensure the pressure stability of valve cooling system. Predicting the exhaust and air makeup valve status of expansion tank in advance can improve the operation efficiency of the system. The liquid level of expansion tank is an important index to reflect its state. The liquid level prediction method of expansion tank in valve cooling system based on random forest algorithm is established in this paper. Firstly, important parameter data of valve cooling system is collected, including electrode power, ambient temperature internal cooling inlet (outlet) valve temperature. The influence relationship of the correlation data on the liquid level of the expansion tank is analyzed; Then, a random forest regression algorithm is proposed. A training dataset is used to predict and model the liquid level of the expansion tank. To this end, we get the prediction model; Finally, a test dataset is used to comprehensively simulate the established prediction model. The results show that the model prediction data can fit the measured data well, which shows the effectiveness of the liquid level prediction model of expansion tank in this paper.
Key Words: Valve cooling system; Expansion tank; Random forest; Liquid level; Prediction model
高壓晶閘管換流閥是大型高壓直流輸電系統的關鍵設備之一,晶閘管工作過程中會產生大量熱量,導致閥體過熱,損壞輸電的核心器件。因此,亟需對器件進行散熱,水冷是目前主要采取的降溫方式。水冷系統是換流閥的必要輔助設備,其作用主要是保證換流閥在安全的溫度下運行[1]。水冷系統穩定運行的核心是氮氣穩壓系統,由氮氣瓶、氮氣管路、膨脹罐等組成。
膨脹罐的作用是緩沖冷卻水因溫度變化而產生的體積變化,保證管路系統的壓力穩定[2]。膨脹罐的工作狀態對管路的安全穩定運行具有重要作用,為對膨脹罐進行有效的控制,需要預測其排氣、補氣閥的工作狀態,通過閥門的開關來實現管路的壓力調節,膨脹罐內冷卻水的壓力(液位)決定了閥門的開和關[3]。因此,對膨脹罐的液位進行建模預測對高壓直流輸電系統穩定運行與否十分關鍵。
目前,由于膨脹罐系統復雜,直接對液位或壓力進行建模較為困難,因此通常采用數據驅動的建模方式。隨機森林算法是一種通過輸入輸出數據進行擬合的機器學習方法,得到了較為廣泛的應用。劉琴等人針對斷路器分合閘線圈的故障電流預測問題,建立了基于隨機森林算法模型,對電流進行擬合[4]。方晨研究了一種基于隨機森林回歸算法的無人機邊坡破損辨識方法[5]。王仁明等人則在電能直流擾動識別中應用了分段改進S變換和隨機森林算法[6]。而針對變電站計量裝置全壽命,寇德謙開發了隨機森林算法,進行計量裝置管理和評估[7]。在體育領域,針對運動員損傷可能性監測,馬東開發了基于DWT和隨機森林算法[8]。
在換流站直流運行狀態下,該文建立基于隨機森林算法的閥冷系統膨脹罐液位預測模型,基于實際數據對模型進行驗證,對閥冷系統膨脹罐閥門的未來工作狀態進行預測。
1問題描述
換流站內水冷系統通過冷卻介質的循環帶走熱量,循環回路主要部件包括主循環泵、換流閥組、脫氣罐、過濾器等;外水冷系統組成包括軟化單元、反滲透處理單元、平衡水池、噴淋泵、高壓泵、工業泵、鹽池等。主回路中的一部分水將流過水處理回路,包括原水罐、補水泵、膨脹罐和離子交換器等,為避免系統最高點出現真空,導致系統不能正常循環,必須保證系統最高點壓力為正,因此裝有膨脹罐,膨脹罐與高壓氮氣瓶通過控制閥相連,在膨脹罐中形成高壓氣墊,確保內冷水系統的基準壓力。
控制系統通過監控膨脹罐中的水位變化來判斷內冷水系統泄漏的情況,實際應用中,如發生泄漏才對系統采取措施往往不能保證事故處理的及時性,為盡可能減少氮氣浪費及防止消缺,需要對膨脹罐補氣閥、排氣閥的工作狀態進行預測。
該文研究某換流站閥冷系統膨脹罐水位的隨機森林預測,經過分析實測數據,將以功率、高端閥廳環境溫度、高端閥冷內冷水進閥溫度、高端閥冷內冷水出閥溫度為輸入,以高端閥冷膨脹罐的液位為輸出,建立基于隨機森林算法的液位預測模型,為現場調控提供指導。
2基于隨機森林算法液位預測建模
隨機森林是一種集成的學習算法,有多顆決策樹組成而成的一個樹形分類器。通常隨機森林的構建過程有:(1)數據集抽取。即抽取每棵樹的測試集,從實際數據集中抽取測試子集,包括放回抽樣和不放回抽樣兩種,該文采用有放回Bootstrap重抽樣法;(2)根據子測試集構建每棵決策樹。決策樹的構建主要包括選擇特征變量和結點分裂兩個步驟;(3)組合所有決策樹,構建隨機森林模型。
給定輸入變量X與獨立同分布隨機變量 ,隨機森林預測器可表示為h(X,θ),根據不同的隨機變量 確定多顆決策樹,通過加權平均輸出結果得到預測結果。假設待測試的輸入( )輸出變量( )是獨立分布的,每個預測器的平均泛化誤差定義為EX,Y[Y-h(X)]2。
隨機森林是通過關于樹個數 的預測器[h(Xk,θ)]取平均值得到,當樹的個數 趨向無窮時,得到EX,Y[Y-ak(Xk,θ)]2→EX,Y[Y-Eθ(Xk,θ)]2,其中ak(Xk,θ)為預測器[h(Xk,θ)]的平均值,每一顆決策樹的平均泛化誤差值為:
隨機森林的泛化誤差表示為:
公式(2)的右邊部分是收斂的,可以表示為 ,其中 , 相互獨立 和 的相關系數,定義殘差 和 之間的加權相關系數為:
那么得到 ,如果對于所有 ,有 ,進而得到:
由(4)可以看出隨機森林的回歸預測精度得到提高,通過引入隨機變量 和 ,與樹的泛化誤差相比,隨機森林的泛化誤差下降了 倍。該文使用袋外數據估計模型的性能。
隨機森林回歸算法的步驟具體如下。
第一,從數據集中抽取 組訓練樣本數據,未被抽取到的 組數據作為 個袋外數據集。
第二,對抽取到的樣本集生成回歸樹,從 個特征集中隨機抽樣 個特征,從中選擇最優分支進行生長,訓練得到回歸決策樹的個數 和隨機選擇特征變量的數目 ,通常有: ;
第三,將 棵決策樹的預測結果取平均,即為最終預測值。
上述完成了隨機森林算法模型的構建,下一步將此模型應用到閥冷系統膨脹罐液位預測模型測試。
3閥冷系統膨脹罐液位預測模型測試
根據閥冷系統膨脹罐實測數據,將以功率、高端閥廳環境溫度、高端閥冷內冷水進閥溫度、高端閥冷內冷水出閥溫度為輸入,以高端閥冷膨脹罐的液位為輸出,構建關于膨脹罐液位隨機森林算法模型。本文使用均方誤差(Mean Squared Error, MSE)來定量的分析比較本文所建立的隨機森林閥冷系統膨脹罐液位的預測精度,來評價預測結果, 的定義如下:
式(7)中, 代表選取的樣本總數, 為的預測模型的輸出值(即預測值),? 為閥冷系統膨脹罐的液位的測量值。如果建立的模型越準確,MSE的數值將越小。
隨機森林算法需要調整的參數少,通過數據訓練得到預測模型后,可獲得特征的重要性程度。隨機森林模型需要給定決策樹數量和每棵樹的特征量,圖1為誤差比率和決策樹數量的關系,可知模型誤差比率隨著決策樹數量的增加而變小,從中可以選擇合適的決策樹數量。
圖2給出了訓練集對比圖,圖3展示了測試集對比圖,結果顯示,無論是訓練集和是測試集,該文建立的隨機森林算法模型輸出均能夠很好地擬合實際液位測量;訓練集得到的均方誤差MSE=0.003184,測試集的均方誤差MSE=0.003283,驗證說明了隨機森林模型預測結果的準確性。圖4是以實測數據為橫坐標,預測數據為縱坐標,建立的y=x擬合圖,可以看出,訓練集和測試集的數據都在斜率為1的直線左右分布,說明模型能夠較好地擬合實測輸出。
4結語
該文研究基于隨機森林算法的閥冷系統膨脹罐液位預測方法,采集閥冷系統重要參數數據,開發隨機森林回歸算法,利用訓練集數據對膨脹罐的液位進行預測建模,得到預測模型,結果表明模型預測數據能夠較好地擬合實測數據,說明該文膨脹罐液位預測模型的有效性,對閥冷系統安全穩定運行具有一定的參考意義。
參考文獻
[1]賴桂森,雷慶山,梁家豪,等.換流站閥冷系統壓力的滑動窗口LS-SVM預測模型[J].電子技術與軟件工程,2020(19):147-149.
[2]賴皓,雷慶山,尹海濤.換流站閥冷系統冷卻水進閥溫度預測方法研究[J].電工技術,2021(12 ):21-22,179.
[3]賴桂森,吳安兵,李劍芳,等.基于電去離子技術在換流站冷卻系統中的應用[J].廣東化工,2020,47(22):62-63.
[4]劉芹,彭在興,王頌,等.基于隨機森林算法的斷路器分合閘線圈故障電流曲線識別[J].高壓電器,2019,55(7):93-100.
[5]方晨曦.基于隨機森林算法與無人機在邊坡破損辨識中的應用[J].福建交通科技,2020(1 ):30-34.
[6]王仁明,汪宏陽,張赟寧,等.基于分段改進S變換和隨機森林的復合電能質量擾動識別方法[J].電力系統保護與控制,2020,48(7):19-28.
[7]寇德謙.基于隨機森林算法管理和評估變電站計量裝置全壽命[J].計算技術與自動化,2020,39(4):106-111.
[8]馬東.基于DWT和隨機森林算法的運動員損傷可能性監測系統研究[J].哈爾濱師范大學自然科學學報,2020,36(4):33-38.
作者簡介:張浪文(1986—),男,博士,助理研究員,研究方向為大數據建模與分析。
通信作者:鄒培炯(1983—),男,碩士,高級工程師,研究方向為機械制造工藝與設備,E-mail:zoupj@goaland.com.cn