999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的含植被水流流速分布研究

2020-06-17 10:58:10劉家備劉曉東唐良川
中國農村水利水電 2020年6期
關鍵詞:測量模型

韓 宇,劉家備,穆 同,劉曉東,唐良川

(1.中國農業大學水利與土木工程學院,北京 100083;2.中國農業大學信息與電氣工程學院,北京 100083)

植被廣泛分布于天然河道中,洪水的產生,及水體生態修復都與河道中水生植被的存在有密切聯系。水生植被包括淹沒和非淹沒兩種情況,其對水流阻力,湍流特性和渦結構均造成顯著影響,因此對含植被水流的研究是有必要的。近年來,含植被水流的水力特性,流速分布結構和生態效應研究受到廣泛關注。本文采用機器學習及物理模型試驗的方法討論了水生植被對水流流速結構的影響。

Karman-Prandtl對數定律常被用來描述明渠豎向流速剖面。經Stephan和Gutknecht[1]修正后的速度剖面方程如下:

(1)

(2)

式中:u是順水流的時均流速;u*是摩阻流速;κ是卡門常數;z是縱坐標;ks是等效砂粒粗糙度;C是積分常數;he是有效植株高度。

雖然,式(1)和(2)可以較好地描述渠道豎向流速分布,但不利于估計河道過流流量。Chezy和Manning公式廣泛運用于估算渠道流速和流量:

(3)

(4)

式中:v是平均流速;Q是平均流量;A是過水斷面面積;R是水力半徑;S是水力梯度;n是Manning粗糙系數。

n的值由實驗數據估算得到,這導致該值可能不精確[2]。此外,這些阻力系數不是專門為含植被河道選取的,所以在應用時它們的值往往會被低估[3]。水生植被對水流阻力具有顯著影響,由圓柱繞流理論[4]可得:

(5)

式中:F為拖曳力;CD為拖曳力系數;Av為圓柱迎水面積;ρ為水黏度;U為平均縱向流速。

進一步的研究發現植被特征對水流結構有顯著影響。植被孔隙度和柔韌性的降低可能會導致過渡層高的減小[5]。模擬實驗表明,植被的密度和排列方式在一定程度上影響流速,阻力隨著密度的增加而增大[6]。雖然平均流速可能隨著植被密度的增加而減小,但湍流強度可能保持不變,甚至會增加[7]。此外,植被的長度、高度和柔韌性對水流結構的影響也存在不同[8]。

數值模擬是一種揭示水流結構與植被關系常規而有效的方法。其中最典型的是RANS模型和LES模型。RANS模型由一個或多個描述湍流各向異性的方程組成[9]。LES模型則是最近才發展起來,槐文信等[10]利用該模型研究了非淹沒植被下的明渠水流。與RANS模型相比,LES模型使用的網格數是前者的100多倍,限制了其在實際中的應用。但是LES模型可以提供更多關于三維湍流場和雷諾應力的信息。并且由LES模型計算的速度和雷諾剪切應力的垂直分布比RANS模型的計算結果更加合理。RANS模型反映了流體的質量守恒和動量守恒:

(6)

(7)

式中:xi(=x,y,z)分別為順水流、指向側壁和垂直水面的坐標軸方向;ui(=u,v,w)分別為x,y,z方向的時均速度分量;t是時間;vm是分子黏度;vs是網格尺度黏度;ρ是液體密度;p是靜態壓降;Fi(=Fx,Fy,Fz)為每單位體積內沿x,y,z方向的阻力分量;gi=(0,0,-9.8 m/s2)為重力加速度。

雖然RANS模型在數值模擬中得到了廣泛應用,但它的一個缺點是控制方程依賴網格的劃分精度,求解的收斂性較差。為了克服這個困難,常用LES方法對其進行局部修正。近年來,通過數值模擬得到了大量有用的結果。王超等[11]采用深度平均的二維水動力模型模擬了南四湖植被帶和非植被帶的流場?;蔽男诺萚12]應用混合摻長法,根據Karman相似理論改進了混合長度的表達,分析了含淹沒和非淹沒剛性植被的水流結構。他們將植被淹沒情況下的水流結構劃分為四個區域,而將植被非淹沒情況下的水流結構分成了二個區域。王沛芳等[13]利用三維水動力模型預測了淺水湖泊淹沒植被區水平速度的垂直分布。

目前大部分經驗公式和數值計算都來自對處于特定工況下特定類型植被的研究,試驗歷時長、經費投入大,引入機器學習的方法可以提高實測數據的利用效率,使結果在工程應用中更容易被獲得。機器學習能對具有一定內在關系的數據進行自適應建模,已在自然語言處理、計算機圖像識別等領域取得了巨大的成功,在水力學的相關領域亦表現不凡。Azamathulla等[14]利用基因編程,以水力半徑、特征粒徑和底坡為自變量建立的高梯度水流中曼寧粗糙系數的預測模型要優于傳統的經驗公式。Ghani等[15]基于遺傳規劃推導的天然河流縱向擴散系數的表達式包含了河寬、水深等幾何參數和平均剪切速度等水力參數,該表達式應用于寬幅河流時性能良好。Alexander等[16]將高斯回歸分析引入到徑流的概率預測中,開發了一種層次化的貝葉斯框架,用于推斷河流流量的后驗分布。顧峰等[17]通過隨機森林優選后的特征變量對研究區內的濕地信息進行提取,提高了運行的準確性和效率。

本文的研究目的是將機器學習的方法引入到含植被水流斷面流速的建模和預測中,使用四種不同的機器學習方法分析含植被明渠的流速分布,以物理模型試驗得到的實測數據為訓練集,分別建立數據驅動型模型,通過模型計算值與實際測量值間的比較評估每種模型的性能,確定最適合預測含植被明渠流速分布的機器學習模型。

1 模型介紹

1.1 神經網絡

BP神經網絡是一種多層前饋神經網絡,由Werbos[18]在1974年首次提出。Hornik等[19]在1989年證明了多層前饋神經網絡只需要一個有足夠數量神經元的隱含層就能以任意精度逼近任意復雜的連續函數。該網絡的主要特點是信號前向傳遞,誤差反向傳播。在前向傳遞中,輸入信號從輸入層經隱含層逐層處理,直至輸出層。每一層的神經元狀態僅影響下一層的神經元狀態。如果輸出層得不到期望輸出,則轉反向傳播,根據預測誤差調整網絡權值和閾值,從而使BP神經網絡預測輸出不斷逼近期望輸出。BP神經網絡的拓撲結構如圖1所示。

圖1 BP神經網絡的拓撲結構圖Fig.1 Topology diagram of BP neural network

圖1中X1,X2,…,Xn是BP神經網絡的輸入值,Y1,Y2,…,Ym是BP神經網絡的預測值,Wij和Wjk為BP神經網絡的權值。從結構圖中可以看出,BP神經網絡可以看成一個非線性函數,網絡輸入值和預測值分別為該函數的自變量和因變量。當輸入節點數為n、輸出節點數為m時,BP神經網絡就表達了從n個自變量到m個因變量的函數映射關系。BP神經網絡要通過訓練使網絡具有聯想記憶和預測能力。

1.2 支持向量回歸SVR

支持向量機由Cortes等[20]首先提出,常用于模式分類和非線性回歸。對于一個給定的樣本集D={(x1,y1),(x2,y2),…,(xm,ym)},求它的回歸曲線就是要找到一條曲線f(x)=wTx+b使其預測值f(x)與真實值y盡可能相近,w和b是待定的參數。在支持向量回歸SVR中,容許f(x)與y最多相差ε,即|f(x)-y|≤ε時,近似認為誤差為0。這樣就相當于在f(x)上下構造了一條寬度為2ε的間隔帶,在此間隔帶內的預測都是正確的。由此可得到SVR的基礎形式:

(8)

式中:C為正則化項;lε為損失函數,

(9)

(10)

至此,SVR轉化為了一個最優化問題。當優化問題存在不等式約束時,常使用拉格朗日乘子法與KKT條件進行求解。同時為便于后續處理,進一步將其轉化為對偶問題,最終解得一個線性的回歸函數。若要獲得更復雜的非線性回歸函數,還需引入核函數進行映射。

1.3 RBF神經網絡

RBF徑向基函數網絡是一種單隱含層前饋神經網絡,由Broomhead等[21]在1988提出。理論上可使用多個隱含層,但一般將RBF設置為單隱含層。它使用徑向基函數作為隱含層的神經元激活函數,而輸出層則是關于隱含層神經元輸出的線性組合。RBF的本質是把以低維模式輸入的數據變換到高維空間中,然后使在低維空間內線性不可分的數據集合在高維空間內實現線性可分。1991年,Park等[22]證明了RBF網絡只要包含足夠多的隱含層神經元,便能以任意精度逼近任意連續函數。RBF神經網絡可表示為:

(11)

式中:x為輸入向量;q為隱含層神經元的個數;wi和ci分別為第i個隱含層神經元的權值和中心;ρ(x,ci)是徑向基函數,它是關于中心點徑向對稱且衰減的非負非線性標量函數。常用的高斯徑向基函數為:

ρ(x,ci)=e-βi‖x-ci‖2

(12)

式中:βi為模型待定的參數。

1.4 隨機森林RF

2001年,Breiman[23]在隨機子空間的指導思想下提出了隨機森林算法,并從理論和實踐兩個層面系統地闡述了該算法。自此隨機森林算法得到迅速應用,被譽為“代表集成學習技術水平的方法”。隨機森林本質上是由多個決策樹組成的分類器,當其用于回歸時,取每棵決策樹結果的平均值作為最后預測的結果。隨機森林實現過程是這樣的:對于每一棵樹,都從N個訓練樣本中隨機且有放回地抽取n(n

2 試驗裝置與測量設備

本試驗在中國農業大學水利與土木工程學院的水力試驗大廳進行,試驗水槽主要由測流裝置、控制裝置、供水及循環裝置三部分組成。其中測流裝置主要包括三維超聲波多普勒流速儀(ADV)、電磁流量計和測壓管;控制裝置由尾門、穩流蜂巢、變頻器等組成;供水及循環裝置包括儲水池、進水箱,玻璃水槽和循環管道等。試驗裝置布置圖如圖2所示。

圖2 試驗裝置布置圖Fig.2 Layout of test equipment

主體水槽長6.3 m、寬0.8 m、高0.6 m。兩邊為玻璃壁面,在中間距進水口0.5 m處放置長5.3 m、寬0.8 m、厚0.01 m的硬質塑料底板。在底板上以梅花狀布置橫向和縱向間距均為0.06 m的插孔。水流通過渠首的進水閥門,經過穩流蜂巢充分紊動消能,穩定后以接近均勻流的流態進入水槽。尾水箱處設有尾門,旋轉把手調節尾門的相對開度可以控制水槽的水位。水槽的水深則由安裝在水槽一側的測壓管讀出。流量大小可通過變頻控制器調節,由電磁流量計直接讀出,可與測量流量進行比對校核。

無論是剛性還是柔性的天然水生植物,其自然特性復雜且不易固定,不適合直接用于測量試驗。本試驗采用高0.3 m、直徑為0.005 m的亞克力有機玻璃棒來模擬非淹沒剛性植物。圖3為渠道試驗實景圖。該試驗以植被的排數、間距和水流流速為試驗變量,不同試驗工況匯總于表1。Q是流量,H是對應的水深。

圖3 渠道試驗實景圖Fig.3 Channel experiment scene map

表1 試驗工況匯總
Tab.1 Summary of test conditions

試驗工況植被間距/m植被排數Q/(m3·h-1) H/m D10.061700.0900.061800.0990.061900.1060.0611000.1140.0611100.1210.0611200.128D20.181~270~1200.090~0.128D30.301~270~1200.090~0.128

流速的測量采用三維超聲波多普勒流速儀(ADV),將其安裝于水槽上方可以橫縱移動的導軌上,設置采樣頻率為25 Hz,量程為0.5 m,每處測點的采樣時間為3 min,每單點采集瞬時值約為3 000個。Takemurat等[24]在研究含植被河道的水力特征時發現測點的位置是一個非常重要的影響因素,且ADV是單點測速,故本試驗采用渠道中部流速測量結果來近似代表整體植被群對水流流速作用的平均水平。又因植株對水流存在擾動作用,植被內部的流場時空分布不均,同一測點在不同時刻測得的流速變化范圍較大,根據ADV的測量特點,對一處測點多次測得的瞬時值進行時均處理。

3 數據的分析及處理

將試驗得到的數據整理如表2。表2中Q(m3/h)是流量,l(cm)為測點沿流向距亞克力棒的縱向距離,y(cm)測點距槽底的垂直距離,V(cm/s)是速度時均值。

表2 試驗數據集的統計參數Tab.2 Statistical parameters of the test data set

注:負號表示與正向相反。

以Q,l,y為輸入參變量,V為輸出參變量,構成機器學映射關系f。

V=f(Q,l,y)

(13)

采取分層抽樣的方式,把數據集的80%用于機器學習模型的訓練,余下的20%,一半用于檢驗,一半用于測試。在對BP神經網絡和RBF神經網絡進行訓練前,原始數據需進行歸一化處理,把所有數據都轉化為[0,1]之間的數。歸一化的目的是消除數據間數量級的差別,避免因數據量級差別較大而造成誤差的積累;并去掉各項特征指標的量綱,便于綜合比較;同時可以加快求解的收斂速度,提高模型的精度。支持向量回歸SVR本身具有正交最小二乘優選的屬性,不需要對樣本數據進行訓練,但使用經過歸一化處理后的數據可以顯著減小其輸出結果的均方根誤差(RMSE)。是否對數據集進行歸一化處理對隨機森林RF的影響不大。綜上,對4個模型都使用歸一化后的數據。在本文中,數據歸一化采用最大最小法處理:

(14)

式中:x′為歸一化后的數據;x為原始數據;xmin為原始數據序列中的最小值;xmax為原始數據序列中的最大值。

4 模型的訓練情況

為了反映模型的訓練情況,將流速V(cm/s)的測量值與模擬值進行一次線性相關分析,并計算兩者的一次線性擬合函數和相關系數的平方R2,結果如圖4至圖7所示。圖中豎軸y和橫軸x分別代表流速V(cm/s)的模擬值和測量值。

圖4 BP不同數據集的相關系數Fig.4 Correlation coefficients of BP data sets

圖5 SVR不同數據集的相關系數Fig.5 Correlation coefficients of SVR data sets

圖6 RBF不同數據集的相關系數Fig.6 Correlation coefficients of RBF data sets

圖7 RF不同數據集的相關系數Fig.7 Correlation coefficients of RF data sets

測量值與模擬值一次擬合直線的斜率越接近1,相關系數越大,表明兩者的差別越小,即模型的訓練效果和測試效果越好。由上圖可知,效果最好的是BP神經網絡,其訓練集模擬值與測量值間的相關系數達到了0.95,驗證集達到了0.98,測試集達到了0.98,全集(所有數據)計算獲得的模擬值與測量值間的相關系數達到了0.95。需要注意的是,驗證集、測試集的樣本容量和訓練集、全集的樣本容量相比較小,且數據集具體的劃分選取有不同,導致它們之間擬合直線的斜率和相關系數存在一定差異,這一點在由SVR模型計算出的結果中尤為明顯:測試集和驗證集的相關系數分別達到了0.90和0.94,而訓練集和全集的相關系數分別只有0.74和0.76。這說明了SVR模型在全局和局部上的模擬能力具有差別。

5 模型結果及驗證

為驗證機器學習模型的正確性,將Q=160 m3/s,l分別等于11 cm,19 cm時的計算結果與試驗測量值進行對比,結果如圖8至11所示。

圖8 BP模型預測結果與試驗結果對比Fig.8 Comparison of velocity values between prediction and measurement using BP

圖9 SVR模型預測結果與試驗結果對比Fig.9 Comparison of velocity values between prediction and measurement using SVR

圖10 RBF模型預測結果與試驗結果對比Fig.10 Comparison of velocity values between prediction and measurement using RBF

圖11 RF模型預測結果與試驗結果對比Fig.11 Comparison of velocity values between prediction and measurement using RF

根據圖8至11結果顯示,對應相同的l值,由不同模型計算出的V值與測量值的擬合程度存在明顯差異。l=11 cm時,BP的預測值與測量值吻合良好,其余模型都存在局部失真的情況。l=19 cm時,BP和RBF的預測值除了在y=3 cm附近比實際值大,以上水深區域都與實際值擬合較好,而SVR的結果普遍偏大,RF則整體偏小。誤差的來源主要有兩個方面,一是用來訓練和學習的數據集,二是每個模型內在的算法原理。BP神經網絡是一個全局收斂和局本搜索優化的算法,具有很強的容錯能力和泛化能力,部分神經元受到數據擾動的破壞不會對全局的訓練結果造成很大影響,經過訓練后的網絡對新的或有噪聲污染的數據依然能夠進行正確的處理,所以BP整體的誤差較小。SVR算法的核心是將低維數據集在高維空間內用超平面進行劃分,使盡可能多的數據點到分劃超平面的距離最近,但其不能保證所有的數據點都達到理想的位置,尤其是在本文樣本容量大的情況下,更容易出現欠擬合的現象,進而導致誤差過大。RBF性能的表現依賴于初始樣本中心的選取,受病態數據干擾的影響較大。l越大,即距亞克力棒越遠,流速值測量的結果受棒后渦動區的影響就越小,病態數據也越少,所以從圖10可以看出,l=19 cm時的誤差要比l=11 cm時的誤差小很多。RF模型的誤差主要源于數據本身,因為實驗中難以保證在紊動強烈區所測數據的質量,所以使得RF的預測值與測量值相比偏差較大,并且這種誤差不會隨著決策樹設置的多少而得到顯著的降低。綜上,提高訓練數據的質量并合理選取機器學習的模型是確保預測結果可信度的有效方法。

6 模型的綜合評價

引入以下統計指標,對4種機器學習模型進行綜合評價。

均方根誤差(RMSE):

(15)

平均絕對誤差(MAE):

(16)

規范均方差(MNE):

(17)

相關系數(CC):

(18)

4個模型的RMSE值、MAE值、MNE值和CC值如表3所示。

表3 模型的統計指標評價Tab.3 Statistical index evaluation of the models

為了對各模型的性能做出綜合評價,此處采用模糊數學中模糊意見集中決策的方法[25]:設論域U={u1,u2,…,un},將U中元素進行排序。有專家組|M|=m人,發表m種意見,記為V={v1,v2,…,vm}。其中vi是第i種意見序列,即U中元素的某一個排序。令u∈U,定義Bi(u)表示第i種意見序列vi中排在u之后的元素個數,若u在第i種意見序列vi中排在第k位,則Bi(u)=n-k。稱為u的Borda數。論域U的所有元素可按Borda數的大小排序,Borda數越大,評價越高?,F以RMSE值、MAE值、MNE值和CC值為意見指標,列表4計算各模型的Borda數。

(19)

表4 模型的排序Tab.4 Ordering of the models

按Borda數的大小進行排序:B(BP)>B(RBF)>B(RF)>B(SVR),則綜合預測性能最優的是BP神經網絡,其次是RBF神經網絡,再次是隨機森林RF,最次的是支持向量回歸SVR。

7 結 論

(1)基于機器學習模型計算的含非淹沒剛性植被水流流速的垂向分布與實際測量值擬合良好,能夠較好地反映含植被水流層間的流速變化。

(2)根據流量、水深和縱向距離等變量便可結合機器學習方法對具體數據自適應建模,必要輸入參數較少,能對離散流速值間的空白進行預測和填補。

(3)BP神經網絡的綜合預測性能最優,而其余模型誤差較大。保證訓練數據的質量和合理選取機器學習的模型能夠有效提高預測值的可信度。同時在工程計算中可考慮綜合使用多種模型,進一步提高預測結果的使用價值。

猜你喜歡
測量模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
把握四個“三” 測量變簡單
滑動摩擦力的測量和計算
滑動摩擦力的測量與計算
測量的樂趣
3D打印中的模型分割與打包
測量
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 欧美精品1区| 日韩国产亚洲一区二区在线观看| 青青青草国产| 欧美乱妇高清无乱码免费| 无码综合天天久久综合网| 日韩亚洲综合在线| 国产高清无码第一十页在线观看| 国产一级毛片网站| 精品一区二区三区水蜜桃| 91国内在线视频| 免费观看精品视频999| 亚洲va欧美ⅴa国产va影院| 波多野吉衣一区二区三区av| 日本道中文字幕久久一区| 2020最新国产精品视频| 国产成人久视频免费 | 超清无码熟妇人妻AV在线绿巨人| 成人一级免费视频| 天天综合网在线| 不卡无码h在线观看| 国产欧美性爱网| 天天爽免费视频| 拍国产真实乱人偷精品| 最新国产在线| 国产欧美视频综合二区| 91精品专区国产盗摄| 国产色婷婷视频在线观看| 亚洲a免费| 一级毛片免费观看不卡视频| 国产尤物在线播放| 午夜日b视频| 日日摸夜夜爽无码| 国产精品嫩草影院视频| 老司机精品久久| 精品精品国产高清A毛片| 亚洲无码精彩视频在线观看 | 国产欧美日韩在线在线不卡视频| 国产亚洲精| 99久久国产综合精品2023| 亚洲人网站| 高h视频在线| 青青操国产视频| 一级一级一片免费| 亚洲天堂777| а∨天堂一区中文字幕| 国产91熟女高潮一区二区| 国产福利一区在线| www欧美在线观看| 91久久偷偷做嫩草影院精品| aaa国产一级毛片| 真实国产乱子伦高清| 亚洲侵犯无码网址在线观看| 色网站在线视频| 亚洲天堂伊人| 97超碰精品成人国产| 欧美精品一区二区三区中文字幕| 国产一级毛片在线| 99伊人精品| 台湾AV国片精品女同性| 国产在线高清一级毛片| 国产一区二区精品福利| 亚洲中文无码h在线观看| 99re经典视频在线| 亚洲国产日韩在线成人蜜芽| 久久99精品久久久久纯品| 欧美特级AAAAAA视频免费观看| 久久综合一个色综合网| 日韩欧美国产另类| 亚洲激情区| 欧美精品在线看| 九色免费视频| 中国丰满人妻无码束缚啪啪| 日韩亚洲综合在线| 97人妻精品专区久久久久| 18禁不卡免费网站| 亚洲成人免费在线| 怡春院欧美一区二区三区免费| 香蕉在线视频网站| 777午夜精品电影免费看| 热re99久久精品国99热| 国产一级特黄aa级特黄裸毛片| 露脸真实国语乱在线观看|