葛賽 趙濤 吳思 吳洋鋒
摘要:以矩形人工加糙渠道為研究對象,采用主成分分析支持向量機方法建立糙率系數預測模型。根據前期試驗研究成果,選取佛汝德數Fr、絕對粗糙度Δ、渠道平均水深h、底坡i這四個主要影響因素,采用主成分分析方法提取兩個主成分,獲得影響糙率系數大小的綜合性指標并用于支持向量機對數據的訓練、測試及預測。研究結果顯示:模型的訓練集均方根誤差RMSE為3.85×104、預測相關系數R為0.997,測試集均方根誤差RMSE為5.37×104、預測相關系數R為0.992、預測相對誤差小于5%。研究結果表明,基于主成分分析支持向量機所建模型適合人工渠道糙率系數的預測。
關鍵詞:人工渠道;糙率系數;預測;主成分分析;支持向量機
中圖分類號:TV135.3文獻標志碼:A文章編號:16721683(2018)03016906
Prediction model of roughness coefficient of artificially roughened channels based on
principal component analysissupport vector machine
GE Sai1,ZHAO Tao1,WU Si2,WU Yangfeng1
(1.College of Water Conservancy and Civil Engineering,Xinjiang Agricultural University,Urumqi 830052,China;
2.Yellow River Engineering Consulting Co.,Ltd.,Zhengzhou 450003,China)
Abstract:With the rectangular artificially roughened channel as the research object,we established a prediction model of roughness coefficient using the principal component analysissupport vector machine method.According to the preliminary experimental results,we selected four main influence factors: Froude number Fr,absolute roughness Δ,channel average water depth h,and bottom slope i.We used the principal component analysis method to obtain two main components,and obtained the comprehensive indexes influencing roughness coefficient,and used them for data training,testing,and prediction of the support vector machine.The research results showed that the RMSE and prediction correlation coefficient R of the training set were 385×104 and 0997 respectively,while those of the test set were and 0992 respectively.The relative error was less than 5%.The results showed that the model based on principal component analysissupport vector machine is suitable for predicting the roughness coefficient of artificial channels.
Key words:artificial channel;roughness coefficient;prediction;principal component analysis;support vector machine
明渠[1]以多種形式存在,明渠水流的水力計算廣泛應用于水利、航運、城建和環境保護等多種行業的工程計算中[2]。其中,糙率系數的取值問題一直是明渠水流水力計算向精準計算方向發展的最大阻礙。糙率就其本義而講,是衡量河床邊壁粗糙程度對水流影響的一個系數,在一般情況下,邊壁越粗糙,糙率系數就越大[35]。明渠根據其特性可分為天然渠道和人工渠道,人工渠道相對于天然渠道而言,過水斷面的形狀和尺寸以及表面的粗糙程度等沿程變化相對較小。采用人工加糙渠道進行糙率系數研究,進一步簡化天然渠道復雜多變的水力要素并完善人工渠道單一邊壁條件的不足,有助于客觀全面的分析問題。
目前,查表法和公式法得到的糙率系數應用到實際中還存在諸多的問題[68]。有許多學者[916]希望通過明晰糙率系數與關鍵水力要素的相關關系推求出更為精準的糙率值,而糙率系數是一個復雜的非線性系統,此方法得到的結論在某些情況下帶有一定的局限性。有學者通過建立模型進行糙率系數預測并取得一系列成果,Becker等[1718]將單純形法融入到數學模型進行糙率預測,金忠青等[19]采用復合形法構建河網糙率預測模型,董文軍等[20]通過參數辨識理論建立預測模型,程偉平等[21]構造帶參數的卡爾曼濾波糙率預測模型,漲潮[22]等采用基于數據挖掘的BP神經網絡構建預測模型。但是以上學者所使用的數學模型仍存在著一些不足,需要大量的樣本數據訓練,容易陷入局部最優,過度依賴初值的設置,微小變化都有可能引起數值的較大擺動導致預測精度較低。隨著人工智能技術的發展,作為處理小樣本結構風險最小化的數學模型工具支持向量機(Support Vector Machine,SVM)脫穎而出并在許多領域出色的完成任務[23]。在建立渠道糙率系數預測模型時,往往需要考慮多種因素,因素之間難免會出現信息重疊,這樣會對模型的預測精準度產生影響。主成分分析(Principal Component Analysis,PCA)通過提取特征信息去除冗余信息,將原始數據劃分為少數幾個具有綜合指標的主成分,為支持向量機模型進行精準可靠的預測提供保障[24]。
第16卷 總第96期·南水北調與水利科技·2018年6月葛賽等·基于主成分分析支持向量機的人工加糙渠道糙率系數預測模型本文通過對吳思矩形人工加糙渠道試驗數據[25]進行分析,對影響糙率系數的主要影響因素進行主成分分析并建立支持向量機預測模型。通過對模型預測結果進行精確度計算,得出模型擬合效果相關數據信息。此預測模型通過學習訓練掌握糙率系數的變化規律,可為實際中受試驗條件限制的試驗研究提供預測數據以彌補數據信息的不足,并可根據已建成模型對相應實例中糙率系數選取的合理性提供參考。
1試驗布置及方案
物理模型試驗在新疆農業大學水利與土木工程學院水工實驗室進行,試驗渠道采用長20 m、寬0.4 m、深0.3 m的矩形PVC材質人工渠道。試驗系統由供水裝置、靜水箱、可進行坡度調節的渠道、尾門、量水堰、回水裝置等組成,試驗系統見圖1。其中,渠道前后端分別安設的靜水箱和尾門,是用以平穩水流,保證上下游水位一致形成均勻流;調節支撐,可獲取不同底坡條件;量水堰采用矩形薄壁堰,測量得到渠道流量值。通過調節渠道坡度與過流量獲取不同試驗條件下的數據。
渠道底部及兩側分別用清漆將砂粒均勻粘貼,采用水準儀量測砂粒凸起度是否滿足要求。選取4種不同邊壁條件進行模型試驗,分別為光滑壁面條件、邊壁粘貼砂粒粒徑d為1~2 mm、2~3 mm、3~5 mm的邊壁條件,相應的絕對粗糙度Δ分別為0015 mm、15 mm、25 mm、4 mm。調節0004~003共8種不同底坡,每種底坡下選取10組流量進行試驗,流量變化范圍為12~41 L/s。取距進水口后3 m處、距出水口前3 m處分別作為測量段的起始點和終止點,在測量段每間隔1 m取為一個測量斷面,每個斷面上布設3個測點。當在某一邊壁條件下,利用水準儀測算得到渠道底坡,讀出量水堰此時流量值,當達到預設數值要求時,采用水位測針量測每個測點的水深從而得出渠道的平均水深,并由相關已知條件計算得出相應的佛汝德數及糙率系數值。物理試驗由4種邊壁條件、8種底坡及10組流量分別組合,共進行了320組試驗。
2基于PCASVM預測模型試驗結果及分析
2.1主成分分析PCA
主成分分析PCA通過特征分解法從變量中提取出主要影響因子即主成分因子,主成分因子間線性無關,綜合全面描述影響事物的本質因素。主要影響因素間存在相關性,數據信息具有重復性弊端,帶入模型可能會降低系統識別的準確率,并且輸入變量的個數也會影響模型的運算速度,故對數據先進行主成分分析做降維處理提取主成分。本試驗研究借助SPSS數據分析軟件對數據進行主成分分析。
數據標準化處理。共有320組樣本數據,每組樣本數據對應4個原始變量,數據矩陣A為,由于原始變量間量綱不同且數值之間存在較大差異,采用數據標準化處理來消除影響。
相關系數矩陣。判別原始變量間是否存在相關性,通過對標準化后數據計算相關系數,得到相關系數矩陣見表1。其中,X1、X2、X3、X4分別表示經標準化處理后的絕對粗糙度Δ、佛汝德數Fr、渠道平均水深h、底坡i。相關系數值存在大于03的情況,說明數據間存在相關性,適合進行主成分分析對數據進行處理。
mi=Miλi(1)
式中:mi表示第i個主成分的特征向量;Mi表示第i個主成分對應的成分向量;λi表示第i個主成分對應的特征值,其中λ1 =2.503,λ2=1.011(i=1,2)。
式中:Y1、Y2分別表示第一主成分、第二主成分。
2.2支持向量機SVM模型
支持向量機是一種基于統計學習理論(Statistical Learning Theory,SLT)VC維思想和結構風險最小化原理的數學模型[26]。在解決非線性回歸問題時,支持向量機通過引入核函數(kernel function)成功的克服了樣本數據線性不可分問題,將樣本數據映射到高維特征空間后變為線性可分,簡化在低維特征空間的非線性問題。在進行模型建立時,除應選擇合理的核函數外,還應對參數進行尋優以確保模型的準確性。支持向量機在模型預測時避免陷入局部最優,具有良好的泛化能力。本試驗中使用LIBSVM軟件包進行支持向量機模型預測。
2.3PCASVM 模型建立
為合理構建基于主成分分析支持向量機的糙率系數預測模型,需進行如下模型運算過程。
數據歸一化處理。將由主成分分析提取的2個主成分因子與所對應的糙率系數組成的矩陣B,對數據矩陣在[0,1]進行歸一化處理,減小因數值差異對模型的干擾,提高數據矩陣的整體性。
劃分測試集和訓練集。為保證模型的可靠性及說服性,將320組樣本數據隨機抽取240組作為訓練集進行模型訓練,余下80組作為測試集進行效果測試。
選擇核函數。核函數是支持向量機模型建立最為重要的部分,對模型的精確性起決定性作用。常見的核函數有線性核函數、多項式核函數、Sigmoid核函數和徑向基核函數(RBF)。其中,RBF在解決非線性問題時具有極強的優勢,其出色的表現被許多領域廣泛應用。本試驗將4種常見核函數代入模型后發現RBF更適合此試驗情況,故選擇RBF為核函數。
尋找最優參數。交叉驗證法搜索最優參數是目前應用最為廣泛、搜索效率極為快捷的一種參數尋優方法。對懲罰因子C與核函數參數g應用交叉驗證法進行尋優,最終得到最優的懲罰因子C為857419 ,核函數參數g為17.1484。
模型學習訓練。根據支持向量機前期的各種條件設置,分別對訓練集及測試集進行支持向量機模型訓練預測,并對數據進行反歸一化處理。為檢驗模型學習效果,計算訓練集與測試集的均方根誤差RMSE與相關系數R。其中均方根誤差RMSE是衡量預測值和觀測值之間偏差程度的一個量,其值越小代表模型誤差越小;相關系數R是模型經訓練學習后與真實數據趨勢擬合的優劣程度的評判參考,其值越接近1擬合效果越好。公式分別如下。
RMSE=1n∑ni=1(observedi-predictedi)2(4)
式中:observedi表示第i個觀測值;predictedi表示第i個預測值;n為預測樣本總個數。
R(X,Y)=Cov(X,Y)Var[X]Var[Y](5)
式中:Cov(X,Y)代表X與Y的協方差;Var[X]、Var[Y]分別表示X及Y的方差,此公式中X和Y分別代表觀測值與預測值。
2.4PCASVM模型試驗結果及分析
結合主成分分析提取主成分進行支持向量機建模,系統內部經過一系列黑箱處理掌握糙率系數的變化規律。模型對糙率系數進行預測,測試集預測效果圖見圖2。其中,訓練集與測試集的均方根誤差RMSE分別為、,訓練集與測試集的相關系數R分別為0997、0992。測試集的部分樣本糙率擬合結果見表5,相對誤差小于5%,最大為4930%,最小為0498%。由此可見,此模型對隨機抽取的樣本數據進行了出色的預測,可用此訓練模型進行糙率系數的預測。
通過對數據進行主成分分析提取主成分,減少自變量個數,綜合全面的對數據特性進行描述,將主成分因子融入到支持向量機模型建立中,降低模型的復雜程度,加快模型的運算速度。為考察支持向量機模型在糙率預測方面相對于其它計算模型是否更具優勢,對采用主成分分析的樣本數據進行支持向量機與神經網絡模型建立,測試集預測效果相應物理量見表6,糙率擬合效果見表5。由支持向量機與神經網絡預測模型的均方根誤差RMSE對比可以看出,前者在精度方面高出一個數量級;表征擬合優度的相關系數R值達到0992,高于神經網絡相關系數R值0843,在擬合優度評判上更具優勢;支持向量機預測相對誤差較小,模型擬合更為精準。綜上,支持向量機在糙率預測方面具備獨特的優勢條件,為糙率系數的研究提供一種可供參考的模型預測方法。
3結論
(1)本試驗結合前期試驗研究成果提取4個主要影響因素,并無對影響因素進行取舍,對糙率系數的變化規律描述得更為全面具體。影響因素間存在一定的相關性,數據信息具有重復現象,會影響模型的信息識別造成模型預測精確性下降。通過對影響因素進行主成分分析提取主成分因子,綜合全面的對影響糙率系數的因素進行描述,同時主成分分析降低數據維度還有利于提高模型的運算速度。主成分分析有助于支持向量機模型的預測效果及效率的提高。
(2)基于主成分分析進行支持向量機糙率預測模型建立,用均方根誤差RMSE及相關系數R進行模型預測誤差評判,結果顯示,訓練集與測試集的均方根誤差RMSE分別為、,訓練集與測試集的相關系數R分別為0.997、0.992,預測相對誤差小于5%。由均方根誤差的數量級、相關系數接近于1及較小的預測相對誤差,可印證此模型的精確性及可靠性。
(3)糙率系數的物理模型研究,經常會受到各種條件因素的限制,以至于不能獲得充足的研究數據,同時,在對長距離渠道進行糙率系數測算時可能會投入過多的工程量。結合主成分分析的支持向量機糙率系數模型可通過對小樣本數據學習訓練掌握規律,當模型經訓練后精度達到要求時可進行糙率系數的預測,為糙率系數的研究提供參考。
參考文獻(References):
[1]邱秀云.水力學[M].烏魯木齊:新疆電子出版社,2008.(QIU X Y.Hydraulics[M].Urumqi:Xinjiang Electronic Press,2008.(in Chinese))
[2]張志昌,魏炳乾,郝瑞霞.水力學[M].北京:中國水利水電出版社,2011.(ZHANG Z C,WEI B Q,HAO R X.Hydraulics[M].Beijing:China Water & Power Press,2011.(in Chinese))
[3]何建京.明渠非均勻流糙率系數及水力特性研究[D].南京:河海大學,2003.(HE J J.Roughness Coefficient and Turbulent Characteristics for nonuniform flow in Open Channels[D].Nanjing:Hohai University,2003.(in Chinese))
[4]張小峰,楊雯婷,陳建良,等.壅水情況下非均勻流糙率系數研究[J].泥沙研究,2014(5):6571.(ZHANG X F,YANG W T,CHEN J L,et al.Study on roughness coefficient of nonuniform flow in backwater[J].Journal of Sediment Research,2014(5):6571.(in Chinese)) DOI:10.16239/j.cnki.0468155x.2014.05.002.
[5]徐慧敏.關于水利工程中河道糙率的研究[J].水利科技與經濟,2010,16(11):12531256.(XU H M.Research on roughness of river in water conservancy projects[J].Water Conservancy Science and Technology and Ecomomy,2010,16(11):12531256.(in Chinese)) DOI:10.3969/j.issn.10067175.2010.11.023.
[6]李凌云,范北林,王家生,等.黃河下游河道河床阻力計算研究評述[J].水力發電學報,2015,34(6):144146.(LI L Y,FAN B L,WANG J S,et al.Study of riverbed resistance calculation for the lower Yellow River.A review[J].Journal of Hydroelectric Engineering,2015,34(6):144146.(in Chinese))
[7]張小琴,包為民,梁文清,等.河道糙率問題的研究進展[J].水力發電,2008,34(6):98100.(ZHANG X Q,BAO W M,LIANG W Q,et al.Recent studies and progress of the river roughness[J].Water Power,2008,34(6):98100.(in Chinese))
[8]楊克君,曹叔尤,劉興年.復式河槽綜合糙率計算方法比較與分析[J].水利學報,2002,36(7):780784.(YANG K J,CAO S Y,LIU X N.Comparison and analysis of calculation methods for comprehensive roughness of compound[J].Journal of Hydraulic Engineering,2002,36(7):780784.(in Chinese)) DOI:10.13243/j.cnki.slxb.2005.07.003.
[9]翟艷賓,吳發啟,王健,等.不同人工糙率床面水力學特性的試驗研究[J].水土保持通報,2012,32(6):3842.(ZHAI Y B,WU F Q,WANG J,et al.Experimental study on Hydraulic characteristics of artificial surfaces with different roughness[J].Bulletin of Soil and Water Conservation,2012,32(6):3842.(in Chinese)) DOI:10.13961/j.cnki.stbctb.2012.06.037.
[10]楊岑,路澤生,欒維功,等.矩形渠道人工加糙壁面阻力規律試驗研究[J].長江科學院院報,2011,28(1):3438.(YANG C,LU Z S,LUAN W G,et al.Experimental study on friction law of artificial roughwall rectangle channel[J].Journal of Yangtze River Scientific Research Institute,2011,28(1):3438.(in Chinese))
[11]馬吉明,史哲.南水北調典型寬淺渠道糙率系數研究[J].水力發電學報,2007,26(5):7679.(MA J M,SHI Z.Research on the absolute roughness of the typical channel of the south to north water diversion project[J].Journal of Hydroelectric Engineering,2007,26(5):7679.(in Chinese))
[12]張羅號.黃河河槽糙率異常原因及其解決途徑[J].水利學報,2012,43(11):12611264.(ZHANG L H.Yellow River Rivers Roughness Abnormal Reason and Its Solution[J].Journal of Hydraulic Engineering,2012,43(11):12611264.(in Chinese)) DOI:10.13243/j.cnki.slxb.2012.11.004.
[13]趙錦程,邱秀云,杜利霞,等.底坡對人工渠道糙率影響的試驗[J].水利水電科技進展,2013,33(6):4851.(ZHAO J C,QIU X Y,DU L X,et al.Experimental study on effect of bottom slope on the artificial channel roughness[J].Advances in Science and Technology of Water Resources,2013,33(6):4851.(in Chinese)) DOI:10.3880/j.issn.10067647.2013.06.010.
[14]齊鄂榮,羅昌.庫區河道非恒定流糙率的選取及特性[J].武漢大學學報(工學版),2003,36(2):14.(QI E R,LUO C.Method for Selecting roughness of reservoir′s river course with unsteady flow and its characteristics[J].Engineering Journal of Wuhan University,2003,36(2):14.(in Chinese))
[15]張靖,拾兵,薛旖云.糙率變化對明渠水深影響的探討[J].人民黃河,2012,34(9):121122.(ZHANG J,SHI B,XUE Y Y.Discussion on the influence of roughness variation to the open channel flows[J].Yellow River,2012,34(9):121122.(in Chinese))
[16]拜亞茹.人工渠道糙率系數影響因素的試驗研究[J].水資源與水工程學報,2014,25(4):230232.(BAI Y R.Experimetl on influence factors on roughness coefficient of artificial channel[J].Journal of Water Resources and Water Engineering,2014,25(4):230232.(in Chinese)) DOI:10.11705/j.issn.1672643X.2014.04.047.
[17]BECKER L,YEH W W G.Identification of parametersin unsteady open channel flows[J].Water Resources Research,1972,8(4):956965.
[18]BECKER L,YEH W W G.Identification of multiple reach channel parameters[J].Water Resources Research,1973,9(2):326335.
[19]金忠青,韓龍喜,張健.復雜河網的水力計算及參數反問題[J].水動力學研究與進展(A輯),1998,13(3):280285.(JIN Z Q,HAN L X,ZHANG J.Hydraulic calculation and inverse problem of complex river network[J].Journal of Hydrodynamics,1998,13(3):280285.(in Chinese))
[20]董文軍,姜亨余,喻文喚.一維水流方程中曼寧糙率的參數辨識[J].天津大學學報,2001,(2):201204.(DONG W J,JIANG H Y,YU W H.Parameter identification of manning roughness in one dimensional flow equation[J].Journal of Tianjin University,2001,(2):201204.(in Chinese)) DOI:10.3969/j.issn.04932137.2001.02.017.
[21]程偉平,毛根海.基于帶參數的卡爾曼濾波的河道糙率動態反演研究[J].水力發電學報,2005(2):123127.(CHENG W P,MAO G H.Study on channel friction parameter inversion based on Kalman filter with unknown parameter vector[J].Journal of Hydroelectric Engineering,2005(2):123127.(in Chinese)) DOI:10.3969/j.issn.10031243.2005.02.027.
[22]張潮,毛根海,張土喬,等.基于數據挖掘的河網糙率直接反演方法[J].水力發電學報,2009,28(1):108112.(ZHANG C,MAO G H,ZHANG T Q,et al.Direct inversion method of river network roughness based on data mining[J].Journal of Hydroelectric Engineering,2009,28(1):108112.(in Chinese))
[23]VAPINK V.The nature of statistical leaning theory[M].New York:SpringerVerlag,1995.
[24]王磊.基于主成分分析的支持向量機回歸預測模型[J].信息技術,2008(12):5859.(WANG L.Regression forecast model of support vector machine based on principal component analysis[J].Information Technology,2008(12):5859.(in Chinese)) DOI:10.13274/j.cnki.hdzj.2008.12.050.
[25]吳思.人工渠道糙率與明渠流態關系的試驗研究[D].烏魯木齊:新疆農業大學,2016.(WU S.Experimental study on the relationship between roughness of artificial channel and flow regime of open channel[D].Urumqi:Xinjiang Agricultural University,2016.(in Chinese))
[26]CORTES C,VAPNIK V.Support vector networks[J].Machine Learning,1995,20(3):273 297.