王江坤,趙 晶,3*,查灑灑,王 劍,曲洺劍,3,張俊飛
(1.沈陽工業大學 機械工程學院,遼寧 沈陽 110870;2.沈陽盛世五寰科技有限公司,遼寧 撫順 110172;3.遼寧五寰特種材料與智能裝備產業技術研究院,遼寧 沈陽 118015)
大流量旋啟式止回閥是閥瓣繞固定軸做旋轉運動的單向閥。由于具備結構簡單、壓降低、經濟性好、密封可靠、維護維修相對方便、適用范圍廣等優點,大流量旋啟式止回閥被廣泛應用于工業生產中。
施熠徽等人[1]采用了有限元分析軟件對閥門的內流場進行了分析,通過引入場協同原理,提出了2種閥結構優化設計思路,并發現了在引入協同原理對閥結構進行優化后,減小了流體的有效黏性系數平均值,增大了有效黏性系數梯度。但閥門的內流場是變化的,怎樣對瞬態的流場進行優化是其需要改進的問題。
劉夢遙等人[2]采用有限元分析軟件,分析了高壓止回閥的應力分布及變形情況;采用流固耦合方法對止回閥進行了模擬,提出了閥口開度與止回閥變形量關聯模型,發現了止回閥變形量與閥口開度呈波動趨勢。但該模型只用于對閥門入口進行分析,缺失了對閥門整體的應力分布分析。余航等人[3]采用流固熱耦合仿真方法,研究了溫度快速變化對止回閥的影響;采用流體力學計算技術,對工況變換時止回閥的內部流場進行了仿真,提出了基于止回閥對溫度場的建模方法,發現了止回閥的等效應力和變形量隨溫度的降低而降低;但其沒有分析外界條件對止回閥的影響。竺盛才等人[4]采用有限元仿真軟件,研究了接觸面在工作中所受的沖擊效應,采用有限元分析方法,建立了各個部件之間的接觸關系和有限元分析模型,發現了切換閥速度與應力峰值產生部位分別為閥板、閥體擋臺距離轉軸最遠處;但其對于快速響應預測沒有進行研究。
大多數研究是對止回閥進行單獨分析,很少有研究人員對止回閥實驗平臺進行系統分析。所以需要建立實驗系統快速預測模型,從而快速預測整個實驗系統的狀態信息。
筆者利用機器學習算法建立閥門實驗系統快速預測模型。首先,利用有限元軟件對大流量止回閥實驗系統進行建模分析,并通過比對實驗數據和仿真數據,確保仿真數據的可靠性;然后,針對實驗系統,利用多種機器學習算法建立快速預測模型。
快速預測模型的技術路線分三部分:1)數據準備階段;2)模型訓練階段;3)結果分析階段。
快速預測模型技術路線如圖1所示。

圖1 快速預測模型技術路線
1)數據準備階段。搭建實驗臺架,并進行實驗,將實驗數據與有限元仿真數據進行對比,驗證數據的可靠性。通過對數據的歸一化處理,消除量綱影響,形成訓練數據集;
2)模型訓練階段。使用均方誤差指標(mean squ-ared error, MSE)、平均絕對誤差指標(mean absolute error, MAE)、R2指標對DNN、RF、GBDT[5-7]三種算法進行機器學習,選擇表現最好的隨機森林算法訓練數據,并采用粒子群算法[8]對快速預測模型的參數進行尋優;
3)結果分析階段。隨機選擇一組初始值,用訓練完成的快速預測模型進行預測,觀察預測的響應速度、預測準確率和誤差值并進行分析優化。
大流量止回閥實驗系統由閥門、管道、流量計、壓力表、循環水泵共同組成。
實驗系統示意圖如圖2所示。

圖2 實驗系統示意圖
由圖2可知:實驗系統由4條回路組成,第1條回路為主工作回路,主要測試實驗閥門的應力、應變和流量。因為不同流量對應的流量計不同,2、3和4這3條流量回路用于測試不同流量下實驗閥門的應力、應變。
在進行有限元分析時,3條流量回路可以通過有限元軟件的參數設置進行代替,不需要3條流量回路的輔助,所以可以將3條流量回路進行簡化,只留下主回路部分并進行有限元分析。同時,對于儲水罐和循環水泵的泵機部分一并進行簡化,用參數代替。
實驗臺架以AISI 321不銹鋼為材料,其彈性模量為193 GPa,泊松比為0.28,密度為7 900 kg/m3,屈服極限為205 MPa。
筆者選擇通用性較強的四面體網格,網格最小尺寸單元尺寸100 mm,節點數為663 693。
為了驗證仿真數據的可靠性,筆者選取實驗系統的關鍵點位與仿真數據進行對比,選取容易發生應力集中的點位作為實驗系統的關鍵點位。
實驗閥門應力如圖3所示。

圖3 實驗閥門應力
由圖3可知:應力較大的點主要在閥門頸部、閥門管道連接處。因此,筆者選擇這些點位作為關鍵點位。由于實驗數據會受到噪聲的影響,所以在進行數據驗證之前,需要先對實驗數據進行異常值清洗。筆者采用3sigma原則將實驗數據進行處理,然后將其與仿真數據進行對比分析。
應變數據對比如表1所示。

表1 應變數據對比
由表1可知:仿真數據的準確率最小值為96.42%,說明仿真數據滿足誤差要求,可以代替實驗數據構建訓練集。
由于大流量止回閥實驗系統應變數據區間為10-4~10-5,而應力的數據區間為0~100,因此筆者采用最大最小值歸一化法,消除應力應變的量綱差異。
對于應力應變的原始值y1、y2,具體表示如下:
y1_scaled=(y1-min)/(max-min)
(1)
y2_scaled=(y2-min)/(max-min)
(2)
式中:y1_scaled為歸一化后的輸出應力;y2_scaled為歸一化后的輸出。
筆者通過將原始值與最小值的差異除以最大值和最小值之間的范圍來進行歸一化,最小值會被映射到0,最大值會被映射到1,對于其他值,則在這個范圍內線性地進行縮放。
關鍵點位歸一化數據如表2所示。

表2 關鍵點位歸一化數據
由表2可知:歸一化后的數據消除了量綱的影響,應力、應變的數值范圍相近,解決了因數值差距過大而導致某些特征對模型訓練貢獻值小的問題。
快速預測模型是指用機器學習的方法進行大量數據訓練,訓練出響應速度快、預測準確率高的模型。快速預測模型技術針對給定的任意初始條件,能夠快速預測整個實驗系統的應力、應變變化。
DNN[9-12]在大數據機器學習中具有高度可擴展性和強大的表征學習能力,能夠處理大規模數據集和模型參數,通常具有較高的準確性。然而,訓練和調整DNN模型復雜且耗時,對小數據集容易過擬合,且對特征工程依賴較高。
隨機森林能夠并行處理大規模數據,具有良好的魯棒性,能夠處理異常值和噪聲,可以進行特征選擇,降低計算和存儲成本。但隨機森林可能占用較大內存空間。
GBDT[13]具有高準確性和可解釋性等特點,適用于高維稀疏數據,能夠處理大量特征變量。然而,GBDT訓練和預測速度較慢,對噪聲和異常值敏感,處理大數據集和高維數據時需要更多計算資源。
隨機森林算法[14-15]構建的預測模型在實驗系統的樣本訓練數據下,其均方誤差指標(root MSE)、平均絕對誤差指標(root MAE)、R2都明顯優于DNN模型以及GBDT模型。
應變損失值如表3所示。

表3 應變損失值
由表3可知,采用DNN和GBDT算法構建的模型有較低的均方誤差和平均相對誤差,結合歸一化后的數據值,這兩種算法應該有較好的擬合曲線[16-17]。但通過R2值可以發現,兩種算法的擬合效果并不好,說明這兩種算法構建的模型發生了過擬合。
因此,在對比了RMSE、RMAE、R2三種指標后,筆者選擇使用隨機森林算法構建快速預測模型。
隨機森林的構建預測模型過程可以簡述為:對整個訓練集進行Bootstrap重采樣,生成新的訓練集。
抽取n個樣本形成子集,每個子集對應一棵決策樹,重復m次,就構建了具有m棵決策樹的隨機森林快速預測模型。
隨機森林構建預測模型原理如圖4所示。

圖4 隨機森林構建預測模型原理圖
隨機森林算法的計算過程如下:
1)通過bootstrap重采樣,將樣本打亂,從抽取的樣本集中選擇合適的樣本,組成n個子集,每個子集對應一個決策樹訓練集;
2)子集中包含M個特征,隨機抽取m個特征的子集Ki。根據信息增益最大化的規則選擇決策樹分支結點,具體表示如下:
(3)
式中:Gain(Ki,a)為特征a對子集Ki屬性劃分獲得的信息增益;Ent(Ki)為子集Ki信息熵。
3)遍歷子集Ki各項特征數據,將找到的信息增益最大化的特征a作為決策樹分支結點,并將節點分裂為兩個分支,通過決策樹持續分支生長而不進行剪枝,使所有特征都完成分裂過程;
4)利用決策樹對特征集實施類別投票,根據投票結果,將得票數較多的類別作為診斷類型。
粒子群算法[18-21]是一種兼顧全局和局部最優的隨機搜索算法。所以,需要利用粒子群算法尋找隨機森林模型的最優參數。
筆者以群體最優值為基準,對每個粒子的位置x與速度v進行更新,更新公式為:
位置x更新公式為:
xi(k+1)=xi(k)+vi(k+1)
(4)
式中:xi,vi為粒子的位置與速度。
速度v更新公式為:
vi(k+1)=wvi(k)+a1r1(pbi(k)-xi(k))+a2r2(gbi(k)-xi(k))
(5)
式中:w為慣性因子;a1,a2為學習因子;r1,r2為(0,1)之間的隨機數。
筆者以損失函數為目標函數進行尋優,最終的搜索結果表明,決策樹的最優棵數為50棵,對應的預測準確率達到97.56%。
筆者利用隨機森林算法建立大流量止回閥實驗系統快速預測模型,并對所得實驗系統應力應變預測數據進行反歸一化;同時,將樣本節點映射至原始實驗系統節點中,得到實驗系統對應的預測數據。
快速預測模型的響應速度是一個很重要的評價指標。模型的響應速度與模型的復雜程度成反比,而模型的復雜程度又與模型的預測準確率成正比。因此,模型的響應速度與模型的預測準確率成反比,所以,筆者針對兩者相互影響情況進行實驗驗證。
實驗系統響應時間如表4所示。

表4 實驗系統響應時間表
由表4可知:隨著決策樹數量增加,預測模型響應時間和預測準確率都在增大;當決策樹數量從25增長到30時,預測模型響應時間提高2倍,預測準確率只增加了0.03%。
由此可知:當決策樹數量到達25棵以后,預測準確率提升所需要的成本太高。所以,筆者選取決策樹數量為25棵為預測模型的最優參數。
筆者隨機選取一組有限元分析結果進行預測,采用實驗系統快速預測模型所得應力應變預測結果和有限元分析結果吻合。結合評價模型和預測曲線得出結論:在大流量止回閥實驗系統的應用場景下,采用隨機森林算法能夠實現多目標同時準確輸出目的,適合實驗系統運行狀態下的快速預測。
應變和應力預測結果如圖5所示。

圖5 應變應力預測圖
由圖5可知:誤差值在前后兩部分發生跳動,這是因為閥門數據與管道數據一起訓練,閥門應力應變的變化比管道復雜,所以會導致閥門部分誤差比管道部分大。閥門部分單獨建模,可以減小誤差曲線的跳動。
實驗閥門響應時間如表5所示。

表5 實驗閥門響應時間
由表5可得到在決策樹數量為25時,實驗閥門快速預測模型的響應速度。
結果表明:模型的響應時間為0.32 s,實驗系統整體快速預測模型的響應時間為0.53 s。實驗閥門的數據量只有實驗系統數據量的1/6,說明采用閥門部件單獨構建快速預測模型,將大幅增加預測模型的響應時間。同時,實驗系統整體快速預測模型的誤差滿足預期誤差。
因此,筆者采用實驗系統整體快速預測模型。
實驗數據與預測模型之間存在雙向反饋機制。實驗系統在前文提到的關鍵點位放置應力和應變傳感器,采集實驗數據對預測模型的預測值進行實時驗證。采用預測模型能發現實驗系統的應力和應變異常點,并發出警告。
實驗系統實驗與仿真數據對比如表6所示。

表6 實驗系統實驗與仿真數據對比
由表6可知,在內壓為1.9 MPa時,實驗數據與預測數據對比的準確率均在95%以上,可以滿足預期誤差要求。
針對傳感器對于數據獲取的局限性,筆者對大流量止回閥實驗系統的快速預測模型技術進行了研究。
筆者通過搭建實體模型,并利用快速預測模型的關鍵技術,構建了實驗系統數據庫,完成了實驗系統的樣本采集;然后,通過比對不同機器學習算法的預測準確率,選擇利用隨機森林算法,建立了實驗系統的快速預測模型;最后,進行了快速預測模型的結果分析。
研究結論如下:
1)基于應力應變樣本數據庫中的數據,利用隨機森林算法建立大流量止回閥快速預測模型,擬合優度R2達到0.99;
2)隨機抽取一組樣本作為測試集,預測準確率達到97.43%,同時模型響應時間為0.53 s,驗證了快速預測模型的可靠性,這對于大流量止回閥實驗系統分析具有重要參考價值;
3)對比了整體預測模型和部件單獨預測模型的預測速度和精度。部件單獨預測模型的預測精度比整體預測模型高1%,但預測速度是整體預測模型的30%。
模型的預測精度還有提升空間,如何在不影響預測模型響應速度的前提下提升模型的預測精度,這是筆者接下來的研究重點。