









摘 要:針對氣液兩相流傳感器測量數據的強非線性和非平穩性導致流型識別困難的問題,提出一種基于混合神經網絡參數優化的流型識別方法.所提方法首先采用滑動窗口法將傳感器測得的不同流型電導率數據分割為若干子序列,再利用變分模態分解算法獲得各子序列的固有模態函數,通過提取固有模態函數的Hjorth特征數據集實現對各子序列非線性特征的描述.接著,將隨機森林算法引入卷積神經網絡的分類層,進而構建混合神經網絡,并采用鯨魚算法對混合神經網絡中3個超參數進行優化.最后,采用優化后的混合神經網絡對Hjorth參數特征向量數據集進行分類,進而實現流型識別.實驗結果表明,所提方法對4種流型的平均辨識準確率達到98.52%.
關鍵詞:氣液兩相流;Hjorth參數;混合神經網絡;隨機森林
中圖分類號:O359 文獻標志碼:A文章編號:1000-2367(2025)03-0121-07
氣液兩相流廣泛存在于石油、化工、核工業等眾多工程領域[1],其流型識別對提高工業生產經濟性和安全性具有重要意義[2].然而,受流動狀態的隨機性、時變性等因素影響,作用在流體上的力與參數之間的關系非常復雜,難以定量描述[3],導致流型的準確識別較為困難.
現有流型識別方法主要分為兩類[4]:一類是直接觀測高速攝像機拍攝的流體流動狀態圖片進行流型識別[5],此類方法僅能在透明管道情況下使用,具有較大的局限性[6];另一類則是根據傳感器采集的壓力信號、壓差信號、電導率信號等測量信號進行流型識別[7],該類方法具有適應性強、靈活性高、實時性好等優點,目前已成為流型識別的主流方法[8].通過傳感器采集信號進行流型識別的方法主要涉及特征信息的提取與流型分類兩個關鍵步驟.文獻[9]將得到的測量信號通過多尺度小波分析分解為6個尺度,然后提取每個尺度的平均值和標準差等統計特征信息并采用支持向量機(support vector machine,SVM)進行特征信息分類;文獻[10]基于傳感器測量的電阻率信息,提取每個流型的統計特征信息并采用人工神經網進行流型分類;文獻[11]在提取各流型統計特征信息基礎上,采用最小二乘支持向量機(least square-support vector machine,LS-SVM)對流型進行分類.然而,在特征信息提取方面,以上方法只提取信號的統計特征將遺失其非線性特征,造成流行識別準確率下降;在流型分類方面,以上方法受單一分類算法性能的限制,特征信息分類精度不高.基于以上問題,文獻[12]采用優化的范圍排列熵方法進行特征信息提取,可準確獲得測量信號的非線性特征;文獻[13]將CNN(convolutional neural network,CNN)和SVM結合構建混合分類算法并將其用于流型識別,獲得了較好的分類效果.
鑒于此,本文提出了一種基于混合神經網絡參數優化的氣液兩相流流型識別方法.首先,采用滑動窗口法將不同流型的電導率測量信號分割為若干子序列,并利用變分模態分解(variational mode decomposition,VMD)提取子序列的固有模態函數;然后,提取固有模態函數的Hjorth特征數據以描述各子序列的非線性特征;接著,將隨機森林算法作為卷積神經網絡的分類層構建混合神經網絡,并采用鯨魚算法對混合神經網絡中的小批量參數、初始學習率、正則化系數3個超參數進行優化;最后,采用優化后的混合神經網絡對Hjorth參數特征向量數據集進行分類,從而實現流型識別.
1 實驗數據的特征信息提取
1.1 實驗設置
采用氣液兩相流測量系統對兩相流動狀態進行檢測和數據采集,實驗中,氣相為空氣,液相為自來水.氣液兩相流測量系統示意圖如圖1所示.圖1中,首先將空氣和水注入混合罐,再將混合罐中的氣液混合物注入到傳感器管道進行在線測量,最后測量后的氣液混合物在分離罐中進行分離,將獲得的水流回水箱以重復使用.根據流量計數值,通過調節閥整氣、水流量,從而配比出不同的相含率進而獲得不同流型.實驗中采用環形電導傳感器對流型數據進行采集,其結構如圖2所示.
圖2中,E1和E2為激勵電極,C1和C2為上游相關電極,C3和C4為下游相關電極,C2和C3為相含率電極.環形電導傳感器的采集頻率為1 kHz,采集周期為20 s,對每個流型重復采集3次得到3組測量數據,將每組測量數據定義為1個樣本,1個樣本包含20 000個測量值.本實驗測量的4種流型分別為長塞流、短塞流、泡狀流、塞狀流.
1.2 數據預處理
為了減少樣本數據中異常值的影響,提高樣本數據的質量,采用max-min歸一化對采集的樣本進行歸一化處理,公式如下:x′i=(xi-xmin)/(xmax-xmin),i=1,2,3,…,n.式中,n為20 000,xi為樣本中的第i個數據,x′i為得到的新樣本中第i個數據,xmax為樣本中的最大值,xmin為樣本中的最小值.經過歸一化后得到的新樣本為無量綱數據,范圍為[0,1].
新樣本的長度與流型識別的實時性成反比,為此,采用滑動窗口法[14]將時間長度為20 s的新樣本分割為時間長度為4 s的子序列以保證流型識別的實時性.設定窗口大小為W,步長為S,樣本時間序列長度為L,得到的子序列長度等同于窗口大小,子序列個數的計算公式為:m=((L-W)/S)+1.設置窗口大小為4 000,步長為2 000,可知,每一個新樣本可以分割為9個子序列.取長塞流、短塞流、塞狀流各20個樣本和泡狀流15個新樣本,經過滑動窗口法處理后共得到675個子序列,組成原始數據集.
由于原始數據集具有較強的非平穩性,需對其進行平穩化處理再進行特征提取.VMD算法可以將原始數據集中的每條數據轉換為多個平穩的固有模態函數(intrinsic mode functions,IMFs),且相較于經驗模態分解算法,VMD算法可以避免模態混疊的現象[15],因此,本文采用VMD算法對原始數據集進行平穩化處理.需要注意的是,使用VMD算法進行數據處理時需要提前設定分解層數K,本文設定K=8.數據處理結果如圖3所示.
圖3中,VMD算法將4種流型的原始數據從高頻到低頻分解為8個IMFs,在高頻范圍內,因為該范圍內的成分變化較快,波動幅度較小,故信號的幅值相對較小.而隨著頻率降低,信號中的較低頻成分具有更大的幅值.可以看出,每個子序列經分解后可以得到8個固有模態函數,且該固有模態函數在時間上沒有明顯的趨勢和周期性,平穩性較好.然而,圖3中固有模態函數仍具有較強的非線性特性,還需要進一步提取合適的特征值以便準確獲得固有模態函數的非線性特征.
1.3 測量信號的非線性特征提取
相對于平均值、方差等統計特征,Hjorth參數綜合考慮了信號1階到3階的非線性特征,因此Hjorth參數可以更好地提取固有模態函數中的非線性信息,進而更為全面地反映信號特性.Hjorth參數包括活動度、移動度和復雜度3個參數,其中,活動度是指信號振幅變化程度,活動度越大,信號的振幅變化越大;移動度是指信號在一定時間范圍內的變化程度.移動度越高,信號具有的紋理或起伏越多;復雜度描述了信號在時間和振幅的變化程度,復雜度越大,信號在時間和幅度范圍內的變化越復雜,包含的不規則性越多.3個參數計算公式如下:活動度為σ2(x);移動度為σ′(x)/σ(x);復雜度為[σ″(x)/σ′(x)]1/2/[σ′(x)/σ(x)]1/2.式中,x表示原始信號,σ表示信號的標準差,σ′表示原始信號一階差分的標準差,σ″表示原始信號二階差分的標準差.
每個固有模態函數可以提取一組Hjorth參數,每條子序列可以得到8組Hjorth參數作為特征向量.因此,根據原始數據集可得到675個特征向量,組成4種流型的特征向量數據集.為了分析4種流型的非線性特性,分別隨機抽取特征向量數據集中各流型數據對應的1個特征向量,其Hjorth參數如圖4所示.
圖4(a)中泡狀流的活動度參數最高,這反映了其對應的泡狀流信號的振幅變化最劇烈,短塞流和塞狀流的活動度參數相近,對應的二者信號的振幅變化程度相近,長塞流的活動度參數最低,說明長塞流信號的振幅變化平緩;圖4(b)4種流型信號的移動度參數相近,代表4種流型信號的變化程度相近,且由于第7、第8個IMFs幅值高于前面的6個IMFs的幅值,故4種流型信號的后2個移動度參數要高于前6個移動度參數;圖4(c)泡狀流和塞狀流的復雜度參數相近,可以推斷出泡狀流和塞狀流信號的不規則程度相近,在時間和幅度范圍內的變化最為復雜.短塞流信號的不規則程度弱于泡狀流和塞狀流,長塞流復雜度參數最低,反映了長塞流信號在時間和幅度范圍內的變化最為簡單.因此,用Hjorth參數可以獲取不同流型固有模態函數的非線性特征,在此基礎上對非線性特征信息進行分類即可實現流型識別.
2 非線性特征分類算法
非線性特征提取獲得的一維數據可采用一維卷積神經網絡(1D convolutional neural network,1DCNN)對特征數據集進行分類[16].1DCNN將Softmax層作為分類層,其作用是將全連接層輸出的特征向量轉化為類別的概率分布.然而,特征向量在經過卷積等一系列運算后會包含更多的信息量,造成Softmax層對特征向量的計算不穩定,導致分類算法過擬合,影響流型識別的準確率,而隨機森林算法可以通過隨機抽樣和特征選擇生成多個不同的決策樹模型并進行集成學習,進而解決算法過擬合問題[17].基于以上原因,本文在1DCNN中引入隨機森林算法(random forest,RF)替代1DCNN中的Softmax層,進而構建混合神經網絡(1DCNN-RF),1DCNN-RF流程圖如圖5所示.
圖5中,首先,對輸入數據進行預處理操作,預處理包括規范化和格式轉換,經預處理后的輸入數據按4∶1的比例被分為訓練集和測試集,訓練集用于訓練網絡,利用測試集檢測網絡的分類性能;接著,將訓練集輸入卷積層和池化層,通過卷積層和池化層提取訓練集的主要特征信息;之后,將訓練集的主要特征信息分為n個子集,每個子集可以訓練一顆決策樹,每顆決策樹在訓練中生成兩個包含不同類別特征向量的支節點,計算每個支節點的基尼指數(Gini Index),在基尼指數小的支節點下生成2個新的支節點并計算基尼指數.當支節點內包含的特征向量僅為一類時,停止產生新的支節點,完成網絡訓練;最后,將測試集輸入到訓練后的1DCNN-RF中即可對混合神經網絡的分類性能進行驗證.
另外,為了使1DCNN-RF性能達到最優,本文采用鯨魚算法(whale optimization algorithm,WOA)對1DCNN-RF超參數進行優化,該算法在求解優化問題時具有較強的搜索能力和并行性.WOA的計算步驟如下:
1)選擇位置向量和搜索方向,計算公式如下:D=(|C1X*1(t)-X1(t)|,|C2X*2(t)-X2(t)|,…);X(t+1)=X*(t)-D·A.式中,D是當前搜索個體與當前解的距離向量,X*(t)是目前得到的最佳解的位置向量,X(t)是位置向量,t表示當前迭代次數,A和C是系數向量,計算公式為:A=2ar1-a;C=2r2,r1和r2是[0,1]中的隨機向量,在迭代過程中,a由2線性減小到0.
2)螺旋更新位置.計算公式如下:X(t+1)=X*(t)-D·A,p<0.5,
eblcos (2πl)D′+X*(t),p≥0.5,;D′=(|X*1(t)-X1(t)|,|X*2(t)-X2(t)|,…).式中,p是值域為[0,1]的隨機數,D′表示當前搜索個體與當前最優解的距離向量,b用于定義螺旋形狀參數,l為服從均勻分布的隨機數[0,1].
3)搜索全局解.當|A|≥1時,從當前解空間中隨機選擇一個解為目標進行位置更新,計算公式如下:D=(|C1X*rand,1(t)-X1(t)|,|C2X*rand,2(t)-X2(t)|,…);X(t+1)=Xrand(t)-D·A.式中,Xrand(t)表示從當前種群選擇的隨機位置向量.
在WOA算法中,首先將小批量參數(mini batch size)、初始學習率(initial learn rate)、正則化系數(L2Regularization)3個超參數隨機取值作為當前解;接著,根據步驟2更新3個超參數的最優解;最后,達到最大迭代次數后停止更新并將解返回1DCNN-RF.根據以上所述,所提基于Hjorth特征數據提取的WOA-1DCNN-RF流程圖如圖6所示.
圖6中,輸入數據為Hjorth參數特征向量數據集.首先,對特征向量數據集進行預處理操作,預處理包括規范化和格式轉換,經預處理后的數據集被分為訓練集和測試集,訓練集和測試集數據量之比為4∶1;接著,將訓練集輸入WOA,對1DCNN-RF中的超參數進行更新;然后,按照圖5的流程利用訓練集訓練1DCNN-RF;最后,將測試集輸入訓練好的1DCNN-RF中進行分類,獲得流型分類結果.
3 結果分析
為了驗證Hjorth參數對固有模態函數非線性特征的表征效果,分別提取每個樣本常規時域特征(conventional time-domain features,TF)和近似熵(approximate entropy,APEN)[18]作為2個特征向量數據集,采用WOA-1DCNN-RF算法進行分類,并與本文所提基于Hjorth特征數據提取的WOA-1DCNN-RF分類方法進行比較,其結果如表1所示.
對于長塞流來說,基于Hjorth參數特征向量數據集和近似熵特征向量數據集的分類效果優于基于常規時域特征所組成特征向量數據集的分類效果;對于短塞流和塞狀流,基于Hjorth參數特征向量數據集的分類效果要優于其他兩種特征向量數據集;對于泡狀流,由于其振幅相對于其他流型信號變化最為劇烈,故算法對3種特征向量數據集的分類效果均達到100%.從以上數據可以看出,相對于常規時域特征和近似熵,由于Hjorth參數可以更好地獲取固有模態函數的非線性特征,因此流型分類準確率最高.
為了評估所提算法性能,引入準確率、精確度、召回率和F1(F1 Score)作為性能評價指標.其中,準確率指算法分類正確樣本數占總樣本數的比例;精確度表示算法分類為正例的樣本正確率;召回率指算法正確分類為正例的樣本數占所有實際為正例樣本的比例;F1是精確度和召回率的加權調和平均值.準確率PAcc=(NTP+NTN)/(NTP+NTN+NFP+NFN);精確度PPre=NTP/(NTP+NFP);召回率PRec=NTP/(NTP+NFN);F1=2PPre(PRec/PPre)+PRec.式中,NTP為真正例(true positives,TP),指算法正確識別出的正例數量;NFP為假正例(1 positives,FP),指算法錯誤地將負例預測為正例的數量;NTN為真負例(true negatives,TN),指算法正確識別出的負例數量;NFN為假負例(1 negatives,FN),指模型錯誤地將正例預測為負例的數量.
為評估WOA的尋優能力,使用粒子群算法(particle swarm optimization,PSO)和麻雀搜索算法(sparrow search algorithm,SSA)優化1DCNN-RF構建PSO-1DCNN-RF和SSA-1DCNN-RF,再將Hjorth參數特征向量數據集分別輸入到1DCNN-SVM(hybrid network of 1DCNN and SVM)、1DCNN-LSTM(hybrid network of 1DCNN and long short-term memory network)、1DCNN-RF、PSO-1DCNN-RF、SSA-1DCNN-RF和WOA-1DCNN-RF算法中進行分類并計算性能指標評估算法性能,6種算法的性能指標結果如表2所示.
從表2中可以看出,1DCNN-SVM與1DCNN-LSTM的結果相近,1DCNN-RF算法的4個指標結果則略高于1DCNN-SVM和1DCNN-LSTM,SSA-1DCNN-RF的4個指標較1DCNN-RF算法有所提高,而PSO-1DCNN-RF的4個指標較SSA-1DCNN-RF均提升了0.5%左右,所提WOA-1DCNN-RF的4個性能指標均高于PSO-1DCNN-RF和SSA-1DCNN-RF算法.這是因為PSO和SSA在搜索最優解時易陷入局部最優,進而使1DCNN-RF的性能無法達到最優,而WOA算法易于實現對全局最優解的搜索,因此WOA-1DCNN-RF分類算法的性能優于其他5種算法,其精確度達到99.63%.圖7給出了所提基于Hjorth特征數據提取的WOA-1DCNN-RF分法分類結果混淆矩陣.所提算法對4種流型特征向量的分類有很高的準確率,36個短塞流特征向量中的1個被預測為長塞流,36個塞狀流特征向量中有1個被預測為短塞流.135個特征向量僅有2個被錯誤分類,證明了所提方法的有效性和可靠性.
4 結 論
針對傳感器測量電導波動信號強非線性和非平穩性造成流型識別困難的問題,提出一種基于Hjorth特征數據提取的混合神經網絡氣液兩相流流型識別方法.首先,采用滑動窗口法將時長20 s的測量數據處理成時長為4 s的子序列;接著采用VMD算法提取信號的模態函數,然后在模態函數中提取Hjorth特征數據集以獲取測量信號的非線性特征;之后,引入隨機森林算法對神經網絡的分類層進行優化,并采用鯨魚算法獲得混合神經網絡的超參數;最后,利用優化后的混合神經網絡模型對氣液兩相流流型進行分類預測.實驗結果表明,所提方法對4種流型分類預測的平均準確率達98.52%,證明了該方法的準確性和可行性,并得出以下結論:
1)Hjorth參數可以較好地獲取固有模態函數的非線性特征.
2)隨機森林算法可以有效降低分類算法的過擬合風險,提高泛化能力.
3)采用鯨魚算法優化網絡超參數可提升網絡預測精度,與1DCNN-SVM算法、1DCNN-LSTM算法和未優化的1DCNN-RF算法相比,WOA-1DCNN-RF算法的流型識別精度更高.
參 考 文 獻
[1] ZHANG L F,ZHANG S J.Gas/liquid two-phase flow pattern identification method using gramian angular field and densely connected network[J].IEEE Sensors Journal,2023,23(4):4022-4032.
[2]SHI Y Y,LIAO J J,WANG M,et al.Total fractional-order variation regularization based image reconstruction method for capacitively coupled electrical resistance tomography[J].Flow Measurement and Instrumentation,2021,82:102081.
[3]YANG C,LU H C,WANG B,et al.Flow regime identification using pressure fluctuation signals in an aerated vessel stirred[J].Chemical Engineering Science,2023,280:119058.
[4]DU M,JIN N D,GAO Z K,et al.Analysis of total energy and time-frequency entropy of gas-liquid two-phase flow pattern[J].Chemical Engineering Science,2012,82:144-158.
[5]RAFA?KO G,MOSDORF R,GóRSKI G.Two-phase flow pattern identification in minichannels using image correlation analysis[J].International Communications in Heat and Mass Transfer,2020,113:104508.
[6]ZHANG L F,ZHANG S J.Analysis and identification of gas-liquid two-phase flow pattern based on multi-scale power spectral entropy and pseudo-image encoding[J].Energy,2023,282:128835.
[7]XU Q,ZHOU H Z,ZHU Y S,et al.Study of identification of global flow regime in a long pipeline transportation system[J].Powder Technology,2020,362:507-516.
[8]ZHANG P,CAO X W,PENG F Y,et al.High-accuracy recognition of gas-liquid two-phase flow patterns:a Flow-Hilbert-CNN hybrid model[J].Geoenergy Science and Engineering,2023,230:212206.
[9]XU Q,JIA P,WANG X Y,et al.Flow regime recognition in a long pipeline-riser system based on signals at the top of the riser[J].Flow Measurement and Instrumentation,2021,80:101987.
[10]ROSA E S,SALGADO R M,OHISHI T,et al.Performance comparison of artificial neural networks and expert systems applied to flow pattern identification in vertical ascendant gas-liquid flows[J].International Journal of Multiphase Flow,2010,36(9):738-754.
[11]ZOU S F,GUO L J,XIE C.Fast recognition of global flow regime in pipeline-riser system by spatial correlation of differential pressures[J].International Journal of Multiphase Flow,2017,88:222-237.
[12]REN W K,ZHANG J C,JIN N D.Rescaled range permutation entropy:a method for quantifying the dynamical complexity of gas-liquid two-phase slug flow[J].Nonlinear Dynamics,2021,104(4):4035-4043.
[13]XU H,TANG T,ZHANG B R,et al.Identification of two-phase flow regime in the energy industry based on modified convolutional neural network[J].Progress in Nuclear Energy,2022,147:104191.
[14]YANG J,SHI Z P,WANG C X,et al.Design of optimized sliding-window BATS codes[J].IEEE Communications Letters,2019,23(3):410-413.
[15]LI C J,WU Y C,LIN H J,et al.ECG denoising method based on an improved VMD algorithm[J].IEEE Sensors Journal,2022,22(23):22725-22733.
[16]魏甫豫,張振宇,梁桂珍.基于卷積神經網絡下昆蟲種類圖像識別應用研究[J].河南師范大學學報(自然科學版),2022,50(6):96-105.
WEI F Y,ZHANG Z Y,LIANG G Z.Research on application of insect species image recognition based on convolutional neural network[J].Journal of Henan Normal University(Natural Science Edition),2022,50(6):96-105.
[17]DONG L F,DU H Q,MAO F J,et al.Very high resolution remote sensing imagery classification using a fusion of random forest and deep learning technique:subtropical area for example[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2020,13:113-128.
[18]SUN L T,WANG X,YANG A F,et al.Radio frequency fingerprint extraction based on multi-dimension approximate entropy[J].IEEE Signal Processing Letters,2020,27:471-475.
Flow pattern identification of two-phase flow based on an optimized hybrid neural network
Wang Meng, Zhang Song, Shi Yanyan, Yang Zhen, Shi Shuie
(Henan Key Laboratory of Optoelectronic Sensing Integrated Application, Henan Normal University, Xinxiang 453007, China)
Abstract: Accurate flow pattern identification is a great challenge due to strong nonlinearity and non-stationary of measurement data in gas-liquid two-phase flow. In this work, a new flow pattern identification method based on optimized hybrid neural network is proposed. In the proposed method, the measured conductivity data of different flow patterns is firstly segmented using the sliding window method. Then, the variational mode decomposition algorithm is utilized to obtain the intrinsic mode functions of each subsequence. The nonlinear features of each subsequence are described by extracting the Hjorth features from the intrinsic mode functions. Next, the random forest algorithm is introduced into the classification layer of the convolutional neural network to construct a hybrid neural network. The whale algorithm is employed to optimize the three hyperparameters in the hybrid neural network. Finally, flow pattern is identified by classifying the feature vector dataset of Hjorth parameters with the optimized hybrid neural network. The experimental results show that an average identification accuracy of 98.52% can be realized for the four flow patterns when the proposed method is used.
Keywords: gas-liquid two-phase flow; Hjorth parameters; hybrid neural network; random forest
[責任編校 楊浦 劉洋]