施 珮,匡 亮,袁永明,張紅燕,李光輝
基于改進極限學習機的水體溶解氧預測方法
施 珮1,2,匡 亮3,袁永明1,張紅燕1,李光輝2
(1. 中國水產科學研究院淡水漁業研究中心,無錫 214081;2. 江南大學物聯網工程學院,無錫 214122;3. 江蘇信息職業技術學院物聯網工程學院,無錫 214153;
為了有效地指導水產養殖生產,提高溶解氧濃度預測的精度,提出了基于因子篩選和改進極限學習機(Extreme Learning Machine,ELM)的水產養殖溶解氧預測模型。首先,利用皮爾森相關系數法計算各影響因子與溶解氧濃度間的相關系數,提取強關聯因子,降低預測模型的輸入量維度;采用偏最小二乘算法(Partial Least Square, PLS)優化傳統ELM神經網絡,避免網絡中隱含層共線性問題,保障輸出權值的穩定性;然后,結合新型激活函數,構建水體溶解氧濃度預測模型。最后,將SPLS-ELM(Selection Based Partial Least Square Optimized-Extreme Learning Machine)預測模型應用到江蘇省無錫市南泉基地某試驗池塘的水體溶解氧預測中。試驗結果表明:該模型的預測均方根誤差為0.323 2 mg/L,與最小二乘支持向量機(Least Square Support Vector Machine,LSSVM)、BP神經網絡、粒子群(Particle Swarm Optimization,PSO)優化LSSVM和遺傳算法(Genetic Algorithm, GA)優化BP神經網絡相比分別降低40.98%、44.48%、34.73%和44.18%。且該模型的運行時間僅0.623 1s,預測精度和運行效率明顯優于其他模型。該模型的溶解氧預測曲線接近真實溶解氧變化曲線,能夠滿足水產養殖實際生產對水體溶解氧預測的要求。
養殖;水質;溶解氧預測;因子篩選;偏最小二乘法;ELM神經網絡
工廠化水產養殖中,在線水質監測系統能夠實時獲取水體中的水質參數信息,捕捉水產養殖水質參數的時變規律。溶解氧作為養殖水體的重要參數,關系著養殖品種的存活率。利用智能算法對溶解氧變化趨勢進行有效地預測,能夠有效地降低養殖生產過程中的風險[1],對水產養殖水質監測和調控具有重要的現實意義。
目前,國內在水體溶解氧預測方法上的研究雖為數不多,但也取得了一定的成果[2-7]。劉雙印等[2]構建了一種蟻群算法優化最小二乘支持向量回歸機的河蟹養殖溶解氧預測模型對小樣本數據集進行試驗。龔懷瑾等[3]運用變尺度混沌量子粒子群優化算法優化偏最小二乘支持向量機,對水質溶解氧情況進行預測。陳英義等[4]提出一種基于主成分分析和長短時記憶神經網絡的溶解氧預測模型。肖金球等[5]在太湖水質監測和評價過程中,提出通過建立多隱含層改進型的GA-BP神經網絡辨識復雜水質模型,從而建立基于pH值、溶解氧、氨氮等數據的水質評價模型。上述研究方法雖然取得了較好的預測效果,但在實際預測應用過程中仍存在模型預測效果不穩定、預測算法計算復雜度高,模型訓練速度慢等問題。
在溶解氧的預測研究中,極限學習機(Extreme Learning Machine,ELM)作為一種快速學習算法逐漸得到了廣泛的關注和應用[8-12]。宦娟等[10]通過對歷史日樣本進行劃分,提出一種基于-means聚類和ELM神經網絡的溶解氧預測模型。然而,當ELM實現多因子的溶解氧預測時,無法避免因輸入量冗余和因子間的高度相關性引起的傳統ELM隱含層產生共線性問題。Ozgur等[11]使用BMA(Bayesian Model Averaging)和ELM等不同的預測算法估算每小時溶解氧濃度值,并對比這些算法的性能差異。但在各個預測算法中對各影響因子之間的關聯性未做探究,各影響因子的冗余性更是未做分析。在溶解氧的預測研究中,一般選用傳統神經網絡算法和固定的幾項水質因子作為預測模型的輸入項。而多影響因子之間的關系和適宜的預測方法是預測精度和運行效率的重要保障。極限學習機雖然具有高效的學習效率和較強的泛化能力。但是,目前的研究大多是對傳統ELM的簡單應用,對水體多因子的溶解氧預測的很多問題仍未解決。
針對上述問題,本文選取水質監測系統和自動氣象站監測數據作為輸入量,使用新型激活函數下的極限學習機對溶解氧濃度進行預測。基于因子篩選過程降低預測模型輸入量的維度。考慮到預測模型中隱含層存在的共線性問題,運用偏最小二乘算法優化ELM網絡,構建SPLS-ELM神經網絡的預測模型。同時,選擇不同的預測模型進行對比試驗,分析提出的SPLS-ELM預測模型的合理性和可靠性。
本研究選擇江蘇省無錫市南泉水產養殖基地(120.18°E、31.34°N)為試驗區域。試驗池塘面積約40 000 m2(長265 m,寬150 m),水深1.5 m,池塘中水體來源于太湖,水質清澈。養殖池塘配備高標準的現代化養殖設備,其中包括全自動增氧機、投料機、微孔增氧設備、自動氣象站和遠程水質無線監控系統等。試驗池塘通過管道排水換水裝置實現養殖水體更換,同時,使用污水處理系統實現養殖污水的處理和循環利用。
水質在線監測系統中,使用水質參數采集節點實現水質數據的采集,通過自動氣象站實現氣象數據的采集。采集的主要數據包括溶解氧、pH值、水溫、CO2濃度、氣壓、溫度、濕度、風速、風向、照度、光合有效輻射和輻射照度。本文以試驗池塘的水體溶解氧為研究對象,數據采集頻率為10 min/次。水質參數采集節點放置在集裝盒內,位于水下0.8 m處,水面上放置浮筒,并通過太陽能板收集電能。自動氣象站搭建在池塘的岸邊,所有采集的數據經ZigBee無線傳輸至漁業物聯服務中心,其系統架構圖如圖1所示。該系統每天間隔采集水質數據和氣象數據,其試驗周期為2019年7月1日至2019年7月30日。試驗周期30 d內,共采集到4 320組數據,并將數據集分成訓練集和測試集2部分。其中,前3 888組(共27 d)數據作為訓練學習樣本,后432組(共3d)數據作為測試樣本。限于文章篇幅,現列出2019年7月6日采集的部分原始數據信息如表1所示。

圖1 監測系統架構圖
1.3.1 基于新型激活函數的極限學習機
ELM是一種具有較強非線性處理能力的單隱藏層神經網絡學習算法[13]。在ELM中,假設存在個樣本數據(x,t)(=1,2,…,),其中,x=[x1, x2,…, xn]表示第個樣本的維特征, t=[t1, t2,…, tn]表示目標量。對于含有個隱含層單元的ELM網絡,其ELM網絡模型可以表示為

式中w=[w1, w2,…, wn]T和=[b1, b2,…, bn]分別表達第個隱含層單元的權值和偏置,=[1,2,…,n]為第個隱含層單元與輸出層間的輸出權值。:→為激活函數,w·為向量w和樣本在R中的內積。式(1)中任意個互異樣本{(x,t)}=1∈R·R,則個等式可以按照矩陣的形式表達如下:

式中代表隱含層單元的輸出矩陣。通過最小二乘法求解輸出權重值,其最小二乘解為

式中+是的廣義逆,+=(H)-1。
Sigmoid函數作為ELM網絡中使用范圍最廣的激活函數,具有嚴格的單調性[14]。然而,在很多強化學習問題中,為了更簡單地獲得集合中的狀態值函數,在未達到目標狀態前,對達到目標時的反饋結果設為0,其他動作下的反饋結果為負(正)。因此,很多時候值函數的值結果均為負或正。舉例來說,在廣義Hop-world問題中,值函數的逼近值為單調的[15]。由于Sigmoid函數在實現數值判別時采用雙側抑制,這種抑制方式會使得很多運算變得多余。事實上,在此類問題中單邊抑制的運算方式更為合適。Softplus函數是分段函數ReLU函數[16]的近似平滑,它采用單邊抑制的運算方式,是非線性連續可微函數。它不僅擁有ReLU函數的高效運算速度和強泛化性,還能避免ReLU函數強制性稀疏的缺點。該函數相較于Sigmoid函數更接近生物學激活模型,其網絡的平均性能更好。因此,本文使用Softplus函數作為ELM的激活函數。在文獻[17]中,該函數被驗證具有良好的泛化性,能夠有效改善ELM網絡性能,提高運算效率,減少ELM運行時間成本。
Softplus函數的運算表達式為

式中為樣本數據,()為激活函數。該函數和上述2種函數的圖像如圖2所示。
1.3.2 偏最小二乘極限學習機
在ELM網絡訓練中,一般使用最小二乘算法實現輸出權重值的求解。然而,當輸入節點冗余或隱含層單元數大于樣本個數時,可能存在強共線性使得在+的求解中(H)-1不存在,進而導致輸出權重值的求解不穩定,影響結果輸出和網絡性能。為了避免這種問題的發生,PLS被引用到ELM網絡框架中,用以替代最小二乘算法,實現輸出權值的求解。

圖2 3種激活函數
PLS是一種新型多元統計數據相關分析方法,能有效地處理多輸入變量、小樣本和冗余輸入變量的回歸問題[18]。本文中,利用PLS算法將多元回歸問題轉化為多個一元回歸,則PLS-ELM基本原理,如圖3所示。

注:圖中X為網絡輸入;Y為網絡輸出;H為隱含層單元輸出矩陣;n為輸入單元個數,m為輸出單元個數;l為隱含層個數;h為潛在變量個數;E1為第1組潛在變量隱含層的殘差;E2為第2組潛在變量隱含層的殘差;t1為第1組潛在變量隱含層單元的得分;t2為第2組潛在變量隱含層單元的得分;th為第h組潛在變量隱含層單元的得分;u1為第1組潛在變量輸出層的得分;u2為第2組潛在變量輸出層的得分;uh為第h組潛在變量輸出層的得分;F1為第1組潛在變量輸出層的殘差;F2為第2組潛在變量輸出層的殘差。
該算法通過正交特征投影在隱含層單元和ELM網絡輸出之間建立線性關系。

式中β代表PLS-ELM的輸出權值矩陣,代表系統噪聲。對式(5)進行雙線性分解可得輸出和隱含層單元輸出的分解表達式


式(7)的矩陣的表達式如下
=(8)
式中=diag[b], b為對角線元素。由此,在PLS-ELM中,若保留PLS中個潛在變量,則模型輸出權值β可求解如下

水質的在線監測過程中,由于傳輸故障、設備故障、斷電以及惡劣天氣等因素,數據在采集和傳輸過程中會經常發生丟失和異常等情況[19]。這些丟失和異常數據會極大程度影響溶解氧預測誤差,增加數據處理的時間成本。因此,有必要對這些數據進行預處理。本文使用線性差值法[20]對短時間內丟失數據進行插補,計算方式如式(10)所示。當丟失數據時間間隔較大或異常跳動明顯時,則依據綜合天氣指數[21]對這些數據進行填補和校正。為了避免不同量綱數據對預測模型產生的影響,采用式(11)對原始數據和插補數據進行標準化處理。



2.2.1 相關因子篩選
在水質監測中,溶解氧的變化具有一定的變化規律。不僅受水體質量因素影響,還受到外界天氣和環境因素的影響。在眾多影響溶解氧濃度變化的因素中,如何有效地篩選相關性強的因素,剔除冗余數據,實現輸入變量的降維,對溶解氧的準確預測具有重要意義。
針對多因子的預測輸入量,本文采用皮爾森相關系數[22]對多變量之間的相關性進行計算,其計算表達式如式(12)。因子篩選的主要步驟為:1)構建預處理后的標準化矩陣;2)對標準化矩陣計算各因子與溶解氧濃度之間的Pearson相關系數值;3)剔除相關系數值小于0.1的因子,獲得篩選后的影響因子。


本文中,溶解氧、pH值和水溫為水下傳感器采集的數據,CO2濃度、氣壓、溫度、濕度、風速、風向、照度、光合有效輻射、輻射照度等為自動氣象站采集的數據。經過Pearson相關系數計算,獲得與溶解氧濃度相關系數如表2所示。
表2顯示,溶解氧與水溫、pH值、溫度、濕度、風速、照度、光合有效輻射、輻射照度等因子均具有相對較強的相關性,因此確定這8項指標來體現溶解氧變化特征,并作為溶解氧預測模型的輸入變量。

表2 各影響因素與溶解氧的相關系數
注:所有統計結果的Sig.值均在<0.005水平。
Note: All Sig. values of statistical results are in<0.005.
2.2.2 水產養殖溶解氧預測模型的設計
在溶解氧的預測研究中,預測模型的輸入變量水溫、pH值、溫度、濕度、風速、照度、光合有效輻射、輻射照度等因子之間存在較高程度的相關性。當使用傳統ELM神經網絡模型進行預測時,輸入變量的高相關性和冗余會使得ELM網絡的隱含層存在高度共線性。傳統ELM網絡中Moore-Penrose廣義逆方法不再適用于求解此類共線性問題,需要使用新的方法來解決問題。因而,本文嘗試使用PLS代替Moore-Penrose廣義逆,建立隱含層單元輸出和ELM網絡輸出之間的線性關系從而獲得β,求解計算表達如式(5)。
在水產養殖中,對于傳感器采集樣本,當進行溶解氧預測時,首先需要采用式(10)~(11)進行數據插補和標準化處理。然后,利用基于因子篩選和構建的SPLS-ELM混合預測模型實現預測,其算法基本流程圖如圖4所示。該預測模型的主要步驟包括水質參數和氣象數據的采集、數據的預處理、關鍵因子篩選、建立SPLE-ELM網絡模型和驗證SPLE-ELM網絡模型的預測效果等。

圖4 溶解氧預測模型算法流程圖
步驟一,數據的預處理:針對水質監測系統和自動氣象站采集的數據進行預處理,主要完成水質數據和自動氣象站數據中丟失數據的插補和異常數據的校正,再進行數據標準化處理。
步驟二,關鍵因子篩選,確定SPLS-ELM網絡結構:通過本文中相關因子篩選過程和結果可知,利用Pearson相關系數可從影響溶解氧濃度變化的11個因子中剔除相關性低的因子,最終獲得水溫、pH值、溫度、濕度、風速、照度、光合有效輻射、輻射照度等8個影響因子作為構建的SPLS-ELM預測模型的輸入變量。以溶解氧濃度作為預測模型的輸出變量。
步驟三,建立SPLS-ELM網絡模型
1)確定SPLS-ELM網絡中隱含層節點的激活函數為Softplus函數;
2)在訓練集中,使用“試錯法”不斷改變隱含層節點數進行試驗。基于5-折交叉驗證法均方根誤差RMSE確定ELM的隱含層節點數。隨機初始化隱含層單元的參數權值w和偏置b(=1,…,)
3)輸入層與隱含層初始權值和偏置為隨機生成的。當RMSE最小時,獲得隱含層節點數。
4)計算隱含層輸出矩陣和輸出權值β。
步驟四,驗證SPLS-ELM網絡模型預測效果,并進行對比分析當構建的預測模型得到的訓練集中溶解氧預測值與實際測量值的誤差滿足條件時,則訓練集預測模型構建完畢。則此時,在測試集中進行溶解氧預測。
2.2.3 溶解氧預測模型的評價
為了評估SPLS-ELM溶解氧預測模型的預測性能,本文選擇均方根誤差(Root Mean Square Error,RMSE)、效能系數(Nash Sutcliffe efficiency Coefficient, NSC)[23]、平均絕對誤差(Mean Absolute Error,MAE)和模型估測值與真實值之間相關系數[24]等指標作為預測模型的評價標準。
在這些評估指標中,當NSC效能系數越高,模型的預測效率越高;值越高,模型的估測值與真實值之間的關聯性越強;RMSE值越大,模型的估測值與真實值之間的偏差越大;MAE值越大,模型的估測值誤差越大。反之,NSC效能系數越低,模型的預測效率越低;值越低,模型的估測值與真實值之間的關聯性越弱;RMSE值越小,模型的估測值與真實值之間的偏差越小;MAE值越小,模型的估測值誤差越小。
本文以無錫市南泉水產養殖基地的養殖池塘中水質監測過程為研究背景,以水體中溶解氧濃度的預測為研究目標。在監測周期的30 d內,以溶解氧濃度為模型輸出變量,因子篩選后的8項指標為模型輸入變量,包括:水溫、pH值、溫度、濕度、風速、照度、光合有效輻射、輻射照度。在每間隔10 min采集的4 320組數據中分別確定訓練集和測試集樣本,采用預處理方法構建標準化后的數據,完成模型輸入量的處理。
SPLS-ELM預測模型的參數包括輸入層節點數為8,輸出節點數為1,殘差的范圍限度值和迭代收斂容限值設置為1e-10。利用5-折交叉驗證法和驗證RMSE值,經多次運行后,確定隱含層節點數=66。為了直觀地評估SPLS-ELM預測模型中因子篩選、新型激活函數和PLS算法優化操作的效果,將PLS-ELM(PLS優化的極限學習機)和ELM預測模型作為對比模型。它們均使用Sigmoid函數作為激活函數,輸入節點為11,輸出為1,確定的隱含層節點數分別為37和28。同時,選擇前人研究的預測模型LSSVM、PSO-LSSVM、GA-BP和BP神經網絡最為參照預測模型,參照模型的輸入節點數為11,輸出節點數為1。所有預測模型均采用MATLAB 8.3語言完成預測模型的程序開發,參照對比算法LSSVM和PSO-LSSVM使用libsvm-mat-3.23工具箱完成編程。
基于上述試驗參數設計過程,分別在3 888組訓練集和432組測試集上進行試驗,獲得預測結果并進行對比分析。上述7種預測模型的溶解氧預測值與真實值相關關系值和各預測模型的NSC系數值對比結果如表3所示。

表3 7種預測模型的預測相關系數r和NSC系數對比
注:SPLS-ELM為因子篩選后的偏最小二乘優化極限學習機算法; PLS-ELM為偏最小二乘改進極限學習機算法;ELM為傳統極限學習機;LSSVM為最小二乘支持向量機;PSO-LSSVM為粒子群算法優化最小二乘支持向量機、GA-BP 為遺傳算法優化BP神經網絡。
Note: SPLS-ELM is selection based partial least square optimized extreme learning machine; PLS-ELM is partial least square improved extreme learning machine; ELM is the extreme learning machine; LSSVM is least Square support vector machine; PSO-LSSVM is particle swarm optimization optimized least square support vector machine; GA-BP is the genetic algorithm optimized BP.
表3顯示,SPLS-ELM預測模型的效能系數NSC值為0.964 7,溶解氧預測值與真實值的相關系數值為0.983 3,高于PLS-ELM預測模型的效能系數和相關系數值。PLS-ELM預測模型的效能系數NSC值和相關系數值也遠高于ELM的NSC系數和相關系數值。這一結果表明,提出的SPLS-ELM在PLS-ELM的基礎上提高了模型的預測效率以及預測值與實際值之間的關聯性,PLS優化操作也提高了傳統ELM的預測效率以及預測值與實際值之間的關聯性。
SPLS-ELM預測模型的效能系數NSC值和溶解氧預測值與真實值的相關系數值不僅高于PLS-ELM,也高于其他5種預測模型的NSC系數值和溶解氧預測值與真實值的相關系數值。LSSVM預測模型的相關系數值與SPLS-ELM預測模型最接近。綜合兩項指標結果,SPLS-ELM預測模型的溶解氧預測值與實際觀測值之間的關聯性在各對比預測模型中最強,且預測模型的預測效率最高,模型的預測效能性優于其他對比預測模型。
為了分析SPLS-ELM模型的實際預測效果,獲得該模型的溶解氧估測值曲線并與實際觀測值曲線進行對比,其對比效果圖如圖5所示。從圖5中可以清晰地發現,SPLS-ELM模型的估測值曲線接近真實值,曲線變化趨勢與真實值變化趨勢較為一致。該模型能夠有效地實現水體溶解氧數據的估測。

圖5 SPLS-ELM預測模型的溶解氧預測值曲線
為了分析不同預測模型的預測結果與真實值之間的偏差程度,分別對各預測模型的最大預測誤差Errormax、最小預測誤差Errormin、誤差波動范圍Errorrg和平均誤差(Mean Error,ME)進行計算,其結果如表4。

表4 7種預測模型的溶解氧預測誤差對比
由表4可以發現,SPLS-ELM預測模型的最大預測誤差Errormax低于其他對比模型,最小預測誤差Errormin大于其他對比模型,誤差波動范圍Errorrg和平均誤差ME在所有對比模型中最小。由此可知,SPLS-ELM預測模型的估測值與真實值之間的偏差最小,且偏差波動程度也最緩慢,預測結果較為穩定。
為了分析各預測模型性能之間的差異,分別對7種預測模型的預測性能MAE值、RMSE值和運行時間T進行分析和比較。表5列出了7種預測模型的預測精度指標結果。

表5 7種預測模型的預測性能結果
由表5可知,SPLS-ELM的預測精度MAE值為0.265 1,較PLS-ELM和ELM分別降低了27.39%和49.32%。SPLS-ELM的預測精度RMSE值為0.323 2,較PLS-ELM和ELM分別降低了27.24%和46.82%。由此表明,SPLS-ELM的預測性能明顯優于PLS-ELM和ELM的預測性能,提出的SPLS-ELM在PLS-ELM的基礎上提高了模型的預測精度。同時,PLS-ELM的預測精度MAE值和RMSE值明顯小于ELM的MAE值和RMSE值,PLS-ELM的預測性能明顯優于ELM的預測性能。PLS優化操作能夠有效地提高傳統ELM的預測精度。在預測模型的運行時間上,SPLS-ELM低于PLS-ELM。這些試驗結果表明,因子篩選能有效篩選出關聯性強的因子,剔除關聯性弱的因子,降低預測模型的輸入量維度,從而提高算法運行速度。但SPLS-ELM和PLS-ELM兩種算法相較于ELM,分別多耗時0.330 s和0.395 s。這是由于因子篩選、新型激活函數和PLS算法等優化操作雖然能提高ELM網絡的泛化性,避免強共線性問題,但也損耗了預測過程的時長。
SPLS-ELM模型的MAE和RMSE值比PSO-LSSVM優化模型分別降低了36.38%和34.73%,比GA-BP優化模型分別降低了47.19%和44.18%。相比較于LSSVM和BP模型,在MAE和RMSE值上均有明顯的優勢,其MAE值分別降低了41.32%和43.55%,RMSE值則分別降低了40.98%和44.48%。由此表明,該模型的預測精度比其他預測模型的預測精度更高。另外,在運行時間上,PSO-LSSVM和GA-BP優化模型是SPLS-ELM模型的3倍和10倍。SPLS-ELM模型相比LSSVM和BP模型有更快的運行速度。試驗結果表明,SPLS-ELM模型的預測性能好、泛化性強、運行速度快,能夠高效準確地捕捉養殖水體中溶解氧的變化信息,獲得滿足實際需求條件的預測效果。
本文對養殖水體中溶解氧濃度進行分析和研究,提出一種基于因子篩選的SPLS-ELM溶解氧預測模型。得出結論如下:
1)本文采用Pearson相關系數計算各影響因子與溶解氧之間的相關系數,篩選相關性強的因子作為預測模型的輸入量。使用Softplus函數作為ELM網絡的激活函數,提高ELM網絡泛化性。同時,利用PLS算法求解ELM權值,避免強共線性問題。最終,構建SPLS-ELM模型對未來3天養殖水體中溶解氧濃度進行預測。
2)與PLS-ELM和傳統ELM網絡預測模型進行對比。提出的SPLS-ELM模型的NSC效能系數為0.964 7,溶解氧預測值與真實值之間的相關系數值達到0.983 3,明顯高于PLS-ELM和傳統ELM。
3)本文提出的SPLS-ELM模型與PSO-LSSVM和GA-BP優化模型相比,其評估指標MAE和RMSE值分別為0.265 1和0.323 2 mg/L,預測精度得到很大程度的提高。同時,該模型的預測精度更優于LSSVM和BP神經網絡模型。SPLS-ELM模型的運行速度快,有較高的性能優勢。
本文提出的新型溶解氧預測模型能切實地為水產養殖水質監測和調控提供指導性建議,并且可以推廣到未來其他水質參數的預測研究中。
[1] 劉興國,劉兆普,王鵬祥,等. 基于水質監測技術的水產養殖安全保障系統及應用[J]. 農業工程學報,2009,25(6):186-191.
Liu Xingguo, Liu Zhaopu, Wang Pengxiang, et al. Aquaculture security guarantee system based on water quality monitoring and its application[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2009, 25(6): 186-191. (in Chinese with English abstract)
[2] 劉雙印,徐龍琴,李道亮,等. 基于蟻群優化最小二乘支持向量回歸機的河蟹養殖溶解氧預測模型[J]. 農業工程學報,2012,28(23):175-183.
Liu Shuangyin, Xu Longqin, Li Daoliang, et al. Dissolved oxygen prediction model of eriocher sinensis culture based on least squares support vector regression optimized by ant conlony algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(23): 175-183. (in Chinese with English abstract)
[3] 龔懷瑾,毛力,楊弘. 基于變尺度混沌QPSO-LSSVM的水質溶氧預測建模[J]. 計算機與應用化學,2013,30(3):95-98.
Gong Huaijin, Mao Li, Yang Hong. Modeling of water dissolved oxygen forecasting based on LS-SVM by variable scale chaos QPSO [J]. Computers and Applied Chemistry, 2013, 30(3): 95-98. (in Chinese with English abstract)
[4] 陳英義,程倩倩,方曉敏,等. 主成分分析和長短時記憶神經網絡預測水產養殖水體溶解氧[J]. 農業工程學報,2018,34(17):183-191.
Chen Yingyi, Cheng Qianqian, Fang Xiaomin, et al. Principal component analysis and long short-term memory neural network for predicting dissolved oxygen in water for aquaculture[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(17): 183-191. (in Chinese with English abstract)
[5] 肖金球,周翔,潘楊,等. GA-BP優化TS模糊神經網絡水質監測與評價系統預測模型的應用:以太湖為例[J]. 西南大學學報:自然科學版,2019,41(12):110-119.
Xiao Jinqiu, Zhou Xiang, Pan Yang, et al. Application of a GA-BP optimized TSFNN water quality monitoring and evaluation system prediction model: A case study of Taihu lake[J]. Journal of Southwest University: Natural Science Edition, 2019, 41(12): 110-119. (in Chinese with English abstract)
[6] 朱成云,劉星橋,李慧,等. 工廠化水產養殖溶解氧預測模型優化[J]. 農業機械學報,2016,47(1):273-278.
Zhu Chengyun, Liu Xingqiao, Li Hui, et al. Optimization of prediction model of dissolved oxygen in industrial aquaculture[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(1): 273-278. (in Chinese with English abstract)
[7] 鄒志紅,王學良. BP模型在河流水質預測中的誤差分析[J]. 環境科學學報,2007,27(6):1038-1042.
Zou Zhihong, Wang Xueliang. The error analysis for river water quality prediction based on BP modeling[J]. Acta Scientiae Circumstantiae, 2007, 27(6): 1038-1042. (in Chinese with English abstract)
[8] Huang G B, Wang D H, Lan Y. Extreme learning machines: A survey[J]. International Journal of Machine Learning and Cybernetics, 2011, 2(2): 107-122.
[9] 孫娜,周建中. 基于正則極限學習機的非平穩徑流組合預測[J]. 水力發電學報,2018,37(8):20-28.
Sun Na, Zhou Jianzhong. Non-stationary runoff hybrid forecasting model based on regularized extreme learning machine[J]. Journal of Hydroelectric Engineering, 2018, 37(8): 20-28. (in Chinese with English abstract)
[10] 宦娟,劉星橋. 基于K-means 聚類和ELM神經網絡的養殖水質溶解氧預測[J]. 農業工程學報,2016,32(17):174-181.
Huan Juan, Liu Xingqiao. Dissolved oxygen prediction in water based on K-means clustering and ELM neural network for aquaculture[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(17): 174-181. (in Chinese with English abstract)
[11] Ozgur Kisi, Meysam Alizamir, AliReza Docheshmeh Gorgij. Dissolved oxygen prediction using a new ensemble method[J]. Environmental ence and Pollution Research, 2020, 27(2).
[12] 李彬,李貽斌. 基于ELM學習算法的混沌時間序列預測[J]. 天津大學學報,2011,44(8):701-704.
Li Bin, Li Yibin. Chaotic time series prediction based on ELM learning algorithm[J]. Journal of Tianjin University (Science and Technology), 2011, 44(8): 701-704. (in Chinese with English abstract)
[13] 王權,陳松燦. 基于1-正則化的ELM回歸集成學習[J]. 計算機研究與發展,2012,49(12):2631-2637.
Wang Quan, Chen Songcan. Ensemble learning of ELM regressors based on1-regressization[J]. Journal of Computer Research and Development, 2012, 49(12): 2631-2637. (in Chinese with English abstract)
[14] 孫艷豐,楊新東. 基于Softplus激活函數和改進Fisher判別的ELM算法[J]. 北京工業大學學報,2015,41(9):1341-1347.
Sun Yanfeng, Yang Xindong. ELM algorithm based on Softplus activation function and improved Fisher discrimination[J]. Journal of Beijing University of Technology, 2015, 41(9): 1341-1347. (in Chinese with English abstract)
[15] 徐圓,黃兵明,賀彥林. 基于改進ELM的遞歸最小二乘時序差分強化學習算法及其應用[J]. 化工學報,2017,68(3): 916-924.
Xu Yuan, Huang Bingming, He Yanlin. Recursive least-squares TD (λ) learning algorithm based on improved extreme learning machine[J]. CIESC Journal, 2017, 68(3): 916-924. (in Chinese with English abstract)
[16] 張順,龔怡宏,王進軍. 深度卷積神經網絡的發展及其在計算機視覺領域的應用[J]. 計算機學報,2019,42(3):453-482.
Zhang Shun, Gong Yihong, Wang Jinjun. The development of deep convolution neural network and its application on computer vision[J]. Chinese Journal of Computers, 2019, 42(3): 453-482. (in Chinese with English abstract)
[17] Glorot X, Bordes A, Bengio Y. Deep sparse rectifier networks[J]. Journal of Machine Learning Research, 2011, 15: 315-323.
[18] 齊海軍,李紹穩,Arnon K,等. 基于PLS-BPNN算法的土壤速效磷高光譜回歸預測方法[J]. 農業機械學報,2018,49(2):166-172.
Qi Haijun, Li Shaowen, Arnon K, et al. Prediction method of soil available phosphorus using hyperspectral data based on PLS-BPNN[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(2): 166-172. (in Chinese with English abstract)
[19] 匡亮,華馳,鄧小龍,等. 一種優化極限學習機的果園濕度預測方法[J]. 傳感技術學報,2019,32(3):418-423.
Kuang Liang, Hua Chi, Deng Xiaolong, et al. The orchard humidity prediction method based on optimized Extreme Learning Machine[J]. Chinese Journal of Sensors and Actuators, 2019, 32(3): 418-423. (in Chinese with English abstract)
[20] 丁泉,李帥. 智能變電站重采樣應用研究及其線性插值法誤差分析[J]. 電力系統保護與控制,2015,43(23):132-136.
Ding Quan, Li Shuai. Application study on resampling in smart substation with error analysis of linear interpolation [J]. Power System Protection and Control, 2015, 43(23): 132-136. (in Chinese with English abstract)
[21] 施珮,袁永明,匡亮,等. 基于EMD-IGA-SELM的池塘養殖水溫預測方法[J]. 農業機械學報,2018,49(11):312-319.
Shi Pei, Yuan Yongming, Kuang Liang, et al. Water temperature prediction in pond aquaculture based on EMD-IGA-SELM neural network[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(11): 312-319. (in Chinese with English abstract)
[22] 彭令,梅軍軍,王娜,等. 工礦業城市區域水質參數高光譜定量反演[J]. 光譜學與光譜分析,2019,39(9):2922-2928.
Peng Ling, Mei Junjun, Wang Na, et al. Quantitative inversion of water quality parameters in industrial and mining cities from hyperspectral remote sensing[J]. Spectroscopy and Spectral Analysis, 2019, 39(9): 2922-2928. (in Chinese with English abstract)
[23] Benyahya L, Hilaire A S, Quarda B M J T, et al. Modeling of water temperatures based on stochastic approaches: case study of the Deschutes River[J]. Jour nal of Environmental Engineering and Science, 2007, 6: 437-448.
[24] Elham, Fijani, Rahim, et al. Design and implementation of a hybrid model based on two-layer decomposition method coupled with extreme learning machines to support real-time environmental monitoring of water quality parameters.[J]. The Science of the total environment, 2019(648): 839-853.
Dissolved oxygen prediction for water quality of aquaculture using improved ELM network
Shi Pei1,2, Kuang Liang3, Yuan Yongming1, Zhang Hongyang1, Li Guanghui2
(1.,,214081,; 2.,,214122,; 3.,,214153,)
Highly accurate monitoring of water quality can efficiently provide scientific data to intensive aquaculture production. One of the most important parameters, dissolved oxygen (DO) content can be used to determine the fish survival rate in aquaculture water quality monitoring. However, the dissolved oxygen content can greatly vary in complex conditions, thereby to make it difficult to gain the high precision prediction. In this study, an improved extreme learning machine (ELM) neural network based on factor selection (SPLS-ELM) was proposed to forecast dissolved oxygen. First, Pearson correlation coefficient method was used to calculate the weights of other factors on dissolved oxygen. The strong correlation factors were extracted according to the obtained weights. The strong correlation factors were selected as the input data for a prediction model with reduced dimension. The key factors included water temperature, pH, temperature, humidity, illuminance, photosynthetically active radiation, irradiance and wind speed. Partial least-squares (PLS) was utilized to optimize the ELM neural network, in order to avoid high collinearity when the redundant data was input into traditional ELM, further to ensure the stability of output weight coefficients. Then, the dissolved oxygen prediction model SPLS-ELM was constructed based on the new activation function with good generalization. Finally, to verify the proposed SPLS-ELM prediction model, various experiments were performed on the monitoring of built-in water quality in Nanquan Aquaculture Base, Jiangsu Province, from July 1st, 2019 to July 30th, 2020. The prediction models were used to compare, including Least squares support vector machine (LSSVM), BP, particle swarm optimized LSSVM (PSO-LSSVM) and genetic algorithm optimized BP neural network (GA-BP) models. The experimental results showed that the error of root mean square (RMS) of SPLS-ELM was 0.323 2 mg/L, indicating the increase by 40.98%, 44.48%, 34.73% and 44.18%, compared with LSSVM, BP, PSO- LSSVM and GA-BP prediction model, respectively. The RMS error of SPLS-ELM improved by 27.24% and 46.82%, respectively, compared with PLS-ELM and ELM prediction model. The accuracy of the presented SPLS-ELM model was obviously higher than that of the counterpart models. The run time of SPLS-ELM prediction model was just 0.6231s. The efficiency of SPLS-ELM improved by about 3 times and 10 times, compared with than of LSSVM and BP, respectively. Meanwhile, the prediction curve of dissolved oxygen was closed to the real observed values. A better prediction performance was achieved by the improved operations of factor section, PLS algorithm and new activation function. The proposed SPLS-ELM can overcome the problem of collinearity in redundant input for the reliable prediction. SPLS-ELM can be expected to serves as the prediction of dissolved oxygen for water quality monitoring in real aquaculture.
aquaculture; water quality; dissolved oxygen prediction; factor selection; partial least-squares; ELM neural network
施 珮,匡 亮,袁永明,等. 基于改進極限學習機的水體溶解氧預測方法[J]. 農業工程學報,2020,36(19):225-232.doi:10.11975/j.issn.1002-6819.2020.19.026 http://www.tcsae.org
Shi Pei, Kuang Liang, Yuan Yongming, et al. Dissolved oxygen prediction for water quality of aquaculture using improved ELM network[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(19): 225-232. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.19.026 http://www.tcsae.org
2020-03-18
2020-06-28
中央級公益性科研院所基本科研業務費資助(2019JBFM09);現代農業產業技術體系專項(CARS-46);國家自然科學基金項目(61174023)
施珮,助理研究員,博士,主要研究方向為農業信息技術和機器學習。Email:njxk_sp@sina.cn
10.11975/j.issn.1002-6819.2020.19.026
TP39; TP212; TP274.2
A
1002-6819(2020)-19-0225-08