張 華,曲海旭
(吉林建筑大學城建學院,吉林長春130011)
ZHANG Hua,QU Hai-xu(The City College of Jilin Architectural And Civil Engineering Institute,Changchun,Jilin 130011,China)
基于偏二叉樹支持向量機的ERT系統流型識別研究*
張 華,曲海旭
(吉林建筑大學城建學院,吉林長春130011)
兩相流在工業中應用廣泛,它具有非常復雜的流動性和隨機性,準確識別流型是兩相流參數準確測量的基礎.該文首先用小波包分解方法提取ERT系統測量的壓差波動信號特征,然后構建偏二叉樹支持向量機多類分類模型,最后向分類模型中輸入特征數據進行流型識別.實驗結果表明偏二叉樹支持向量機多類分類算法較大提高了流型識別的準確度,是一種有效的流型識別方法.
電阻層析成像;流型識別;小波包;偏二叉樹支持向量機
廣泛存在于工業生產中的兩相流具有復雜的流動特性,其參數檢測難度很大.流型在影響兩相流的流動特性和傳熱性能的同時還會影響對兩相流的測量準確性.因此流型識別是兩相流參數檢測的一個重要研究方向.本文針對ERT系統和油/水兩相流的四種流型,提出一種基于小波包分解和偏二叉樹支持向量機的流型識別方法.該方法利用小波包分解提取ERT系統測量的壓差波動信號的特征數據,提高了支持向量機的訓練和測試效率.并利用偏二叉樹支持向量機算法解決了以往一對一和一對多支持向量機算法可能存在的不可分區域問題,提高了流型識別的準確率.

圖1 ERT系統組成結構圖
ERT系統主要組成部分是電阻傳感器陣列、數據采集系統、圖像重建計算機[1].系統組成結構如圖1所示.ERT系統采用電流激勵、電壓測量的工作原理,本文針對12電極ERT系統采集到的電導率波動信號進行處理,采用相鄰電極的激勵模式,一幅圖像共采集到12*(12-3)=108個測量數據.ERT系統工作原理圖如圖2所示.

圖2 ERT系統工作原理圖
2.1 小波包分解原理
小波包分解是一種較好的、針對非平穩信號進行特征提取的工具,它為信號提供了一種更加精密的分解方法.它以小波分析為基礎,將頻帶進行多層次劃分,進一步分解多分辨率分析沒有細分的高頻部分,并能依據被分析信號的特征,自動地選擇對應的頻帶,以匹配相應的信號頻譜,從而進一步提高時頻分辨率[2].
2.2 小波包特征提取過程
①對輸入信號S,進行三層小波包分解,其中采用db6小波濾波器和shanon熵值.提取第三層中從低頻到高頻的8個信號特征[3].
②獲得小波包的系數,即幅值,通過公式E3 j=|2計算出各個頻段的能量(其中E3 j是信號S3j所對應的能量,Xjk表示重構信號Sij離散點的幅值).
③通過公式T=?E3 j/E」 j=0,1,…,7 其中E滿足公式:
對第2步所求能量值做歸一化處理.
④構造以各頻段能量為特征值的特征向量,即T=[E30,E31,E32,E33,E34,E35,E36,E37]T.
3.1 支持向量機原理
支持向量機基于VC(Vapnik-Chervonenkis)理論[4]和結構風險最小化原理,能兼顧訓練錯誤和泛化性能,是適用于小樣本學習的通用學習算法,它為機器學習算法開辟了新天地.
根據支持向量機的定義,非線性最優超平面的構造問題轉化為一個二次規劃[5]:

訓練完成后,計算下列函數的符號:

3.2 建立偏二叉樹支持向量機多類分類模型
上述支持向量機原理僅限于解決兩類分類問題.而實際應用中通常是多類分類問題[6].常見的多類分類方法有一對一、一對多和二叉樹,其中一對一和一對多存在不可分區域.二叉樹多類支持向量機首先將所有的類別劃分成兩個大子類,再將每個大子類進一步劃分成兩個次級子類,以此類推,直到所有的葉子節點都只包含一個單獨的類別.二叉樹多類分類方法將原來的多類分類問題分解成了一系列的兩類分類問題,而兩類分類問題就可以用傳統的SVM解決.這種方法為K種類別分類,在訓練時只需要構造K-1個SVM兩類分類器,在測試時根據實際情況不一定需要計算所有的分類器判斷函數,可以大大節省訓練和測試的時間.并且可以有效避免一對一和一對多方法中存在不可分區域的情況.
二叉樹的拓撲結構分為兩種:偏二叉樹[7]和完全二叉樹,本文選用偏二叉樹構造SVM多類分類模型.過程分為兩個階段進行,分別是訓練階段和測試階段.
訓練階段:針對ERT系統中的四種流型,根據二叉樹算法需要訓練4-1=3個SVM兩類分類器.構造區分1類和2、3、4類的SVM1時,將屬于第1類的樣本標記為正類,屬于第2、3、4類的樣本標記為負類,訓練SVM1,即構造并求解上文提到的二次規劃,得到區分1類和2、3、4類的超平面H1:f(x)1+b.以此類推,依次構造區分2類和3、4類的SVM2,得到超平面 H2:f(x)2=+b,區分3、4類的SVM3,得到超平面H3:
測試階段步驟如下:
第一步:設給定的訓練集為 {(x1,y1),(x2,y2),…,(xl,yl)},l代表用l組樣本數據進行訓練.其中xi∈Rn,yi∈{1,2,3,4},i=1,2,…,l.
第二步:對于待求樣本X,求超平面H1:f1(x) =sgn(g(x)),其中g(x)yiaiK(x,xi)+b的值,若是1,則樣本X屬于第1類,此次判斷結束;若是-1,則樣本X屬于(2、3、4)類,進入右節點,繼續判斷.
第三步:重復第二步,直到到達葉子節點,此葉子節點所屬的類別就是待分樣本X所屬的類別.

圖3 偏二叉樹支持向量機多類分類模型
本實驗采用MATLAB進行仿真.實驗步驟如下:第一步,訓練:隨機選取已知流型的樣本:點滴流180個,核心流225個,層流270個,環狀流315個.根據ERT系統工作原理,測量到的每種流型是一個108維向量,經過特征提取降為8維向量.構造多類分類模型過程中,支持向量機算法采用最小二乘法[8],二次規劃的核函數采用徑向基核函數,選擇控制錯分樣本懲罰程度參數和徑向基核函數參數時,采用網格搜索法,找到最佳組合.第二步,測試:隨機選取每種流型,其中,點滴流20個,核心流25個,層流30個,環狀流35個.先提取樣本特征,然后選擇各個參數構造多類分類模型,最后將樣本輸入偏二叉樹支持向量機多類模型進行分類.第三步,比較:重復以上訓練步和測試步,在以往構造的一對多類、一對一類支持向量機多類模型上進行實驗對比.表1顯示各種分類模型下的測試精度和訓練時間.

表1 實驗結果統計分析
本文針對ERT系統中的油水兩相流流型識別,提出一種基于偏二叉樹支持向量機的流型識別方法.構造偏二叉樹支持向量機多類分類模型需要的支持向量機數量較少,提高了訓練速度,同時偏二叉樹策略避免了一對一和一對多策略的不可分區域.經過實驗結果對比,在同樣使用小波包分解進行特征提取的前提下,偏二叉樹支持向量機多類分類模型的識別精度和訓練時間要優于一對一模型和一對多模型.
[1]DICKIN F..J.,WANG M.Electrical Resistance Tomography for Process Application.Measurement Science and Technology[J].1996,7 (3):247-260.
[2]ELPERIN T,KLOCHKO M.Flow Regime Identification in a Two -Phase Flow Using Wavelet Transform[J].Springer-Verlag,2002,32: 674-682.
[3]WU M M,DONG F,QI G H.Feature Extraction Method for Gas/ Liquid Two-Phase Flow Based on Wavelets Transform[C].5th International Conference on Machine Learning and Cybernetics,2006:1422-1427.
[4]邊肇祺,張學工.模式識別[M].北京:清華大學出版社,2000.
[5]VAPNIK V N.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.
[6]Guo-hua Qi,Feng Dong,Yan-bin Xu,et al.Gas/Liquid Two -Phase Flow Regime Identification In Horizontal Pipe Using Support Vector Machines[C]//.Proceedings of the Fourth International Conference on Machine Learing and Cybernetics,2005:1746-1751.
[7]謝娟英,張兵權,汪萬紫.基于雙支持向量機的偏二叉樹多類分類算法[J].南京大學學報(自然科學),2011,47(4):354-363.
[8]Zhenrui Peng,Gensuo Mi.Voidage Measurement of Two-Phase Flow Based on Least Squares Support Vector Machine[C]//.Proceeding of the 6th World Congress on Intelligent Control and Automation,2006: 4900-4903.
(責任編輯:王前)
Study on Flow Regime Identification of Electrical Resistance Tomography System Based on Binary Tree Support Vector Machine
Two-phase fluid,which has complex flow characteristic and randomness,has been applied widely in the industrial production.The accurate identification of flow regime is the foundation of accurate measurement on two-phase flow's parameter.Firstly,the feature of differential pressure fluctuation signal,which is measured by electrical resistance tomography system,is extracted by wavelet packet analysis.Then,the multiclass model of binary SVM is constructed.Finally,the data about extracted feature is inputted into the multi-class SVM of binary.The experimental results show that the accuracy of twophase flow regime identification has been improved remarkably.Binary SVM is an effective method for regime identification.
electrical resistance tomography,flow regime identification,wavelet packet,Binary Tree Support vector machine
ZHANG Hua,QU Hai-xu
(The City College of Jilin Architectural And Civil Engineering Institute,Changchun,Jilin 130011,China)
TP391.4
A
1008-7974(2016)06-0063-03
10.13877/j.cnki.cn22-1284.2016.12.020
2016-10-09
張華,女,吉林龍井人,講師.