999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的河湖底泥機械脫水效果試驗

2023-11-20 09:44:00曾嘉辰嚴曉威郝宇馳
凈水技術 2023年11期
關鍵詞:符號模型

曾嘉辰,白 鶴,王 盛,郭 兵,嚴曉威,郝宇馳

(中交疏浚技術裝備國家工程研究中心有限公司,上海 200082)

隨著國家對于河湖整治工作的不斷推進,越來越多的河湖治理技術與設備投入使用,其重點難點均在于河湖底泥的脫水固化環節,了解泥質特性、脫水藥劑添加量與河湖底泥脫水固化效果之間的關系幾乎成為河湖整治工作中的必要前提[1-3]。

目前,有關泥質特性、脫水藥劑添加量與河湖底泥脫水固化效果之間關系的獲取方法主要有兩種。第一種是基于物理模型試驗的現場驗證方法[2,4],其在理論方法的基礎上通過室內試驗得到相關評價參數值,并依此來對各項試驗參數進行評價,能夠較為準確地評判各項試驗參數之間的內在聯系,但是該過程需要設計合理的試驗參數范圍,且存在誤差的情況,具有周期長、效率低的劣勢[5]。第二種是基于大數據的機器學習預測模型[6-7]。機器學習作為人工智能中最具智能特征、最前沿的研究領域之一,可以依據已有的數據或經驗,得到某種模型,并利用此模型對未來進行預測。機器學習已在大氣監測[8]、水污染監測[9-10]以及加藥控制等多領域得到廣泛應用[11]。但利用機器學習技術在河湖整治技術過程中的研究較少。除此之外,近年來諸如BP神經網絡[12]、符號回歸等方法成為在解決實際工程領域相關問題的熱點。以往針對藥劑投放量的預測模型大多基于多元線性回歸方程,此種方法需要給定擬合變量及公式,使得經驗公式的預測性能往往要受限于人為主觀因素,不利于全面準確地評估泥漿含水率、藥劑投放量等參數對泥漿脫水固化性能的影響。而神經網絡模型是一種具有非線性適應性信息處理能力的算法,可克服傳統人工智能方法對于直覺,如非結構化信息處理方面的缺陷,具有較強的非線性映射能力[13]。符號回歸作為一種監督學習方法,試圖發現某種隱藏的數學公式,以此利用特征變量預測目標變量,可以不用依賴先驗的知識或者模型來為非線性系統建立符號模型。

本文根據試驗相關數據,采用BP神經網絡和符號回歸兩種方法對不同藥劑投放量對泥漿機械脫水性能進行系統地評估,以得到更加科學準確的泥漿脫水固化性能的預測方程。

1 材料與方法

1.1 數據來源

本研究數據依托廈門某湖綜合整治項目,如表1所示,樣品源自絞吸船及氣動泵船施工區域不同深度的柱狀取樣器。取樣區域1、區域2、區域3分別為廈門某湖由西向東的3個不同片區,S1-1、S1-2、S2-1、S2-2、S3-1、S3-2分別為各區域取的平行樣品,泥質呈現黃褐色、黑灰色、深黑色3種,伴有陳腐氣味。針對底泥脫水干化廠區中初沉池中的泥漿,即經過稀釋的原狀土,含水率在10%~15%,開展的污泥比阻試驗及模擬板框壓濾試驗,得到不同加藥量下的各類經驗數據(表2)。

1.2 研究方法

1.2.1 BP神經網絡模型

BP神經網絡模型[7]是目前為止應用最為廣泛的模型之一,其網絡結構如圖1所示。

注: β即代表最終值,x4~x5為其他可對含水率產生影響的參數,本次試驗未涉及。

BP神經網絡模型是一種誤差反向傳播訓練的多層前饋網絡,其算法稱為BP算法,基本思想是梯度下降法,即利用梯度搜索技術,不斷調節權值與閾值,使預測值與實際值間的誤差達到最小[11]。輸入層和輸出層的神經元個數要分別與輸入和輸出變量個數相同,選取的輸入參數有泥漿含水率A、藥劑投加量B和污泥比阻C,選取的輸出參數為泥餅含水率D。對于BP神經網絡,其輸入和輸出層的節點數是由輸入與輸出參數決定的;而隱藏層的神經元個數則受輸出結果的精度控制。隱藏層中神經元數量太少會產生欠擬合現象,而太多則會導致過擬合。確定隱藏層神經元個數時,通常先根據經驗公式[式(1)~式(2)]來確定隱藏層神經元個數的大致取值范圍,然后通過對不同神經元個數下神經網絡的訓練效果進行比較,找到誤差最小的神經元個數[12]。

(1)

(2)

其中:nI——輸入層神經元個數;

m——輸出層的神經元的個數;

nh——隱藏層神經元個數[12];

a——[1,10]的常數;

k——訓練樣本數量。

綜合本文研究內容,設置nI=3,m=1;最終確定隱藏層神經元個數為9,激活函數采用Tansig函數,可以較好地解決Sigmoid函數收斂變慢的問題[13],相對于Sigmoid函數而言提高了收斂的速度。輸出層神經元個數為1,激活函數采用線性函數。訓練算法選取Levenberg-Marquardt算法,該收斂速度較快[14],能夠有效處理冗余參數問題[15]。

1.2.2 符號回歸模型建立

遺傳編程的運行流程如圖2所示,首先要用戶給定函數符集和終止符集,隨后由函數符集和終止符集隨機產生初始種群。其次,基于適應度評價標準,對種群中個體的適應度進行評估。最后,初始種群通過執行遺傳操作(交叉、變異及復制等)產生新種群,直至滿足預設的終止條件。作為回歸分析的一種,符號回歸(symbolic regression)也稱為函數建模或函數辨識,是遺傳編程最早的一類應用之一。它搜索數學表達式的空間,找到最適合給定數據集的模型,無論是在精確性還是簡單性方面,能夠針對目標問題進行自主建模[16],無需主觀假設公式形式;其通過訓練給定樣本數據集,來探索隱藏在試驗數據隨機性背后的內在規律,從而確定和分析目標問題中各變量之間的函數關系。搜索過程遵循達爾文的自然選擇原理,利用計算機程序模擬基因復制、交叉和突變等操作,在初始群體數量較大且設置合理交叉、變異概率的情況下,最終結果不會陷入局部最優解。該模型不需要模型的先驗規范,因此,不會受到人為偏差的影響,也不會受到領域知識空白的影響。

2 結果與討論

2.1 試驗分析

2.1.1 泥質分析

廈門某湖各階段底泥的沉降性能和濾過性能均較差,特別表現在SV30指標和CST指標。SV30在69%~99%,屬于沉降性較差,自由水含量低的泥漿。但含水率情況來看,區域1含水率約為38%,區域2含水率約為46.98%,區域3含水率平均值為48.61%,表明底泥成分中可能含有大量砂質。3個區域的底泥CST在92~236.7 s,CST值越小,污泥脫水性能就越好,屬于較易脫水的泥性。絮凝物的表面電荷是影響絮體聚集和脫水性能的關鍵因素之一。通常用Zeta電位來表征底泥的表面電荷,根據DLVO理論,Zeta電位的絕對值越大,絮體間的靜電斥力就越大,污泥就越難以絮凝和沉降[6]。經化學調理后,隨著絮體間的靜電斥力急劇減小,污泥就更容易絮凝和沉降,脫水性能顯著提升。廈門某湖各階段底泥的Zeta電位完全呈負電性,且除區域3-3外絕對值均偏大,最高絕對值為區域1-1(3.56 mV),表明底泥的沉降性能和過濾性能都較好。

2.1.2 脫水效果分析

通過污泥比阻試驗及模擬壓榨試驗對疏浚泥漿進行最優投加量選型。選取泥漿濃度為常規生產濃度,即15%左右,試驗使用的藥劑為陰離子PAM,相對分子質量為1 500萬Da。PAM是分子所帶電荷能夠能起到中和污泥顆粒所帶電荷的作用,使污泥顆粒與水分子分離,絮凝成大顆粒污泥,改善污泥性能[6]。結果顯示,隨著藥劑量的提升結合污泥比阻、泥漿調理情況及泥餅含水率來看,藥劑最優添加量并非完全受泥漿濃度控制,受泥質影響,總體呈現隨著濃度梯度上升,加藥量升高趨勢,但也存在含固率15%泥漿濃度(質量分數)下,加藥量翻倍的情況,在低濃度情況下,最佳加藥量在0.04‰~0.08‰。如表2所示,在15%的泥漿濃度(質量分數)下,污泥比阻和泥餅含水率并非呈現正比關系,隨著PAM藥劑濃度上升,污泥比阻值與泥餅含水率總體趨勢為下降狀態,污泥比阻值在1.0‰和1.1‰下有明顯下降,泥餅含水率在1.0‰、1.1‰以及1.2‰ PAM投加量下有明顯下降。總的來說,受泥漿含水率和泥漿內部成分影響,泥漿在2.0‰ PAM的投加量下比阻值和含水率(36.49%)最低,要獲取泥漿含水率、污泥比阻、加藥量與泥餅含水率之間的關系需要進一步的科學建模來進行預測。

2.2 模型建立

2.2.1 BP神經網絡

現將所獲得數據經過試驗結果分析,劃分特征值與標簽值,通過劃分函數隨機切分為訓練數據集與測試數據集,隨機選取80%作為訓練數據集,20%作為測試數據集。訓練集的輸入參數代入已建立的BP神經網絡模型中。圖3給出了BP神經網絡預測結果和實測結果之間的對比。當濾餅含水率處于32%~53%時,BP神經網絡的預測值離散誤差相對較大,但是基本都均勻分布在理想線y=x兩側,并大部分在±20%的誤差線以內;當濾餅含水率大于53%時,訓練集數據基本分布在±10%的誤差線以內。由此可以看出,訓練集的預測值和實測值有較高的相關性,BP神經網絡對該訓練集有較好的預測效果[17]。

圖3 BP神經網絡預測結果和實測結果之間的對比

為進一步驗證上述模型預測的濾餅含水率的能力,現將未參與訓練的測試集數據帶入上述建立好的BP神經網絡模型,圖4給出了測試集的預測值與實測值之間的對比圖。由圖4可知,大部分數據點均在±20%的誤差線以內,90%的數據處于±10%的誤差線以內。以上測試集數據的驗證表明本節構建的泥漿脫水固化后濾餅含水率的BP神經網絡模型具有較高的精度。

圖4 BP神經網絡測試集的預測值與實測值之間的對比

基于BP算法建立的模型,得到上述預測值與實測值的對比結果,可以得到較好的預測結果,但是無法得知各輸入變量敏感性的強弱。因此,本文引入平均影響值(mean impact value,MIV)來評估模型輸入參數對輸出結果的影響程度。MIV的計算方法是:基于訓練好神經網絡模型,將某個輸入參數的樣本量分別增加和減少10%(其他輸入參數保持不變),將兩組數據輸入模型,然后通過對比兩組數據的輸出結果求得該參數的MIV。為更加直觀地評估每個輸入參數對出的貢獻程度,圖5給出了各輸入參數MIV占比的餅狀圖。污泥比阻參數的MIV占比最高,達到48%;其次是泥漿含水率為46%,藥劑投放量占最小比重,為6%。根據結果表明,泥漿污泥比阻特性對脫水固化效果影響最大。

圖5 不同參數MIV分布

2.2.2 符號回歸模型結果

借鑒前人研究[2]中符號回歸方法的成功應用案例,本文利用基于遺傳編程算法[3-4]的進化搜索來確定以相對簡潔形式描述數據集內在規律的函數關系式的符號回歸計算機程序。首先將訓練集數據輸入,代入公式進行評估后,共有16個候選方案經過“優勝劣汰”的自然選擇后得到。表3給出了各候選方案的公式表達式,各公式所對應的最小和最大復雜度分別為1和53,對應公式的適應度函數評價指標平均相對誤差(MAE)、均方誤差(MSE)和相關系數(R2)同時在表中給出。隨著公式復雜度的增加,MAE、MSE相應減小,R2增大。公式形式最復雜的方案(即復雜度為53)應該是預測濾餅含水率最好的公式,但其過于復雜,故不予過多考慮。最終選定復雜度為26[式(14)]的為最優方案。

圖6給出了描述候選方案誤差MAE和復雜度之間關系的帕累托前沿圖,通常利用帕累托前沿圖評估各候選方案的MAE和復雜度之間的關系,進而確定最優方案。由圖6可知,當復雜度在[1,16],隨著復雜度的增加,候選個體的MAE值相應減小;而當復雜度在[15,26],MAE衰減速率逐步變緩;且當復雜度大于26時,候選方案復雜度的大幅增加只會導致MAE的小幅減小,即增加公式復雜度并不會大幅提升模型預測精度。

圖6 誤差MAE和復雜度之間關系帕累托前沿圖

將訓練集數據輸入參數代入上述選定的符號回歸模型進行計算,得到的預測值與實測值如圖7所示。由圖7可知,在濾餅含水率為35%~55%時,預測值與實測值誤差較小,模型的預測精度較高;總體上,80%以上的數據相對誤差小于20%,說明模型預測結果在一定范圍內是可靠的。

圖7 符號回歸模型訓練集實測值與預測值對比

為進一步驗證復雜度26[式(14)]的預測精度,將未參與訓練試集數據代入所選定的模型公式,圖8給出了測試集的預測值與實測值對比。可以發現,大部分測試集數據均在10%的誤差以內,90%的數據誤差均在20%以內,預測值與實測值之間總體吻合較好,結果相對可靠,說明所選的模型公式具有一定的參考意義。

圖8 符號回歸模型測試集實測值與預測值對比

對于符號回歸模型中各輸入參數的重要程度,通常通過某一輸入參數在所有候選方程中出現次數與出現該因素的候選方程數來評估該參數重要性。由圖9可知,其中泥漿含水率出現的次數最多,隨后是污泥比阻,藥劑投放量最少。這與上述神經網絡得到的結果較為相似,影響濾餅含水率的重要參數為含水率和污泥比阻,同時根據試驗也能發現,投放藥劑能夠加速泥漿脫水,最終濾餅的含水率主要由泥漿自身特性控制。

圖9 符號回歸模型中各參數重要性評估

2.3 BP神經網絡和符號回歸方法分析對比

兩種模型對比為進一步定量評估3種模型的預測性能,本節引入4種常用的誤差評價指標,包括MAE、平均相對誤差(mean relative error,MRE)、MSE及均方根誤差(root mean square error,RMSE)。

表4給出了BP神經網絡和符號回歸模型間不同誤差指標的大小。兩種模型的各項誤差指標存在一定的差異,BP神經網絡模型預測結果的所有誤差指標均小于符號回歸。BP神經網絡方法下,MRE和RMSE值分別為0.088 2和0.035 4,符號回歸方法下,MRE值和RMSE值分別為0.089 7和0.047 2。因此,對于本項研究,BP模型對未知數據具有更好的模型選擇能力以及對未知數據具有更好的泛化能力和魯棒性[18-19],而符號回歸模型在此方面的能力較弱。

表4 BP神經網絡和符號回歸模型間不同誤差指標

3 結果與討論

本文基于機器學習方法(BP神經網絡和符號回歸方法),建立了泥餅含水率的預測模型,得到以下結論。

(1)本文以現場室內試驗數據為研究基礎,采用隨機選取的方法將樣本數據劃分為訓練集以及測試,模型構建與驗證。結果發現兩種機器學習方法所建立的預測模型的精確度良好,具有一定的可信度。總的來說,80%以上的數據相對誤差小于20%。

(2)基于BP神經網絡和符號回歸方法建立的預測模型后,對兩種模型的輸入參數對輸出參數貢獻程度進行比較發現,兩種預測模型結果相似。其中泥漿含水率和污泥比阻對泥餅含水率影響程度差異不大且均較大,加藥量影響較小。這是由于加藥量能夠加速泥漿脫水固化,對最終的泥餅含水率影響較小。

(3)針對MAE、MRE、MSE及RMSE 4種常用的誤差評價指標,對3種預測模型進行定量分析對比,發現BP神經網絡預測精度高,神經網絡預測精度高,MRE值在0.088 2,RMSE為0.035 4,并且在泛化能力和魯棒性上也表現良好。

猜你喜歡
符號模型
一半模型
學符號,比多少
幼兒園(2021年6期)2021-07-28 07:42:14
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
“+”“-”符號的由來
變符號
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
倍圖的全符號點控制數
圖的有效符號邊控制數
主站蜘蛛池模板: 亚洲欧美另类日本| 狠狠做深爱婷婷综合一区| 国产99在线观看| 伊人国产无码高清视频| 国产色婷婷视频在线观看| 色亚洲成人| 2021天堂在线亚洲精品专区| 亚洲人成影视在线观看| 国产精品55夜色66夜色| 久久www视频| 国产区精品高清在线观看| 九九这里只有精品视频| A级全黄试看30分钟小视频| 香蕉伊思人视频| A级全黄试看30分钟小视频| 日韩在线观看网站| 99热这里只有精品5| 欧美国产成人在线| aⅴ免费在线观看| 亚洲人成网站色7777| 国产精品亚洲一区二区三区在线观看| 亚洲国产欧美目韩成人综合| 国产免费羞羞视频| 91精品国产自产91精品资源| 欧洲av毛片| 国产第一福利影院| 久久香蕉国产线| 伊人久久精品无码麻豆精品| 国产一区二区三区精品欧美日韩| 亚洲精品国产精品乱码不卞| 国产在线第二页| 精品一区二区无码av| 国产人成在线视频| 久久人体视频| 国产成人福利在线| 在线视频亚洲色图| 亚洲av无码片一区二区三区| 四虎亚洲国产成人久久精品| 91久久精品国产| 思思热在线视频精品| 亚洲视频黄| 亚洲免费黄色网| 国产在线视频欧美亚综合| 又黄又爽视频好爽视频| 欧美黄色a| 国内精品91| 国产一区二区网站| 亚洲色无码专线精品观看| 精品视频一区二区三区在线播| 58av国产精品| 国产拍揄自揄精品视频网站| 久久免费精品琪琪| 精品视频免费在线| 国产精品吹潮在线观看中文| 中文字幕乱码二三区免费| 人妻丰满熟妇av五码区| 亚洲天堂免费| 美女免费精品高清毛片在线视| 蜜桃视频一区二区| 91色在线视频| 五月婷婷精品| 国产毛片不卡| 成人福利一区二区视频在线| 久久久久中文字幕精品视频| 亚洲欧美日本国产专区一区| 日韩第九页| 2021国产v亚洲v天堂无码| 在线国产你懂的| 亚洲第七页| 欧美www在线观看| 538国产视频| 99久久国产精品无码| 香蕉视频在线精品| 第一区免费在线观看| 成人夜夜嗨| 亚洲精品老司机| 国产黄色片在线看| 免费人成网站在线高清| 国产麻豆福利av在线播放| 日韩精品一区二区三区中文无码| 亚洲av日韩av制服丝袜| 97视频在线观看免费视频|