李祥銅,曹 亮,李湘麗,劉雙印,4,徐龍琴,呼 增,黃運茂,尹 航
(1.仲愷農業工程學院信息科學與技術學院,廣東 廣州 510225;2.廣東省高校智慧農業工程技術研究中心/廣州市農產品質量安全溯源信息技術重點實驗室,廣東 廣州 510225;3.仲愷農業工程學院圖書館,廣東 廣州 510225;4.石河子大學機械電氣工程學院,新疆 石河子 832000)
【研究意義】我國是對蝦養殖大國,養殖面積和產量均位居世界第一[1]。養殖水體溫度是影響對蝦健康生長的關鍵因素之一,易受溶解氧、空氣溫度和濕度、風速、風向、降雨量、太陽輻射等主要因素影響,其非線性、非穩定和大時滯特點顯著。水溫突變會引起養殖水體其他物理化學反應,如果預防措施采取不及時很容易造成水質惡化與疾病暴發[2],因此研究對蝦養殖水溫預測方法,獲得水體溫度的變化規律,對預測預防水質災害、提高水產品質量和促進漁業現代化具有重要意義[3]。
【前人研究進展】國內外對水質預測模型已進行了大量研究,并取得了一些研究成果[4-7]。施珮等[8]提出基于EMD-IGA-SELM 的池塘養殖水溫預測模型用于水產養殖過程中的水溫預測;柳海濤等[9]建立了人工神經網絡預測模型對水電站下游魚類產卵場水溫進行預測分析;徐龍琴等[10]基于EMD 和ELM 組合模型對對蝦工廠化育苗水溫進行預測;劉雙印等[11-12]通過改進粒子群算法優化LSSVM 的水產養殖溶解氧預測模型,并提出了基于粗糙集融合SVM 的水產養殖水質預警方法。上述模型對于小樣本水溫預測均取得了較好的預測精度,但由于長時間序列數據缺少魯棒性和平穩性,影響了預測性能。
近年來,伴隨計算機硬件的發展,深度學習性能不斷提升[13],基于深度學習的預測方法在各個領域取得了不斷的創造性發展[14]。其中循環神經網絡(Recurrent neural network,RNN)在神經網絡中引入了時序的概念,以序列數據為輸入,對于時序數據的挖掘表現出強大的性能[15]。長短時記憶神經網絡(Long short-term memory,LSTM)能解決長序列訓練過程中的梯度消失和梯度爆炸等問題,能提高RNN 網絡的準確性。彭文等[16]提出了基于Attention-LSTM 的電力市場中短期負荷預測方法,得到了很好的預測精度和算法魯棒性;陳英義等[17]提出了基于主成分分析和LSTM 的水產養殖水體溶解氧預測模型,實現了對水體溶解氧的精準預測;Li 等[18]提出了一種基于稀疏自編碼器和LSTM 的混合模型,提高了水產養殖中溶解氧的預測精度;王鑫等[19]利用LSTM神經網絡對故障時間序列數據進行預測,模型具有良好的預測性能和泛化能力。目前,運用LSTM 研究對蝦水體水溫預測的有關文獻并不多見。
【本研究切入點】長期以來,信號分析方法與人工智能算法組合預測模型一直是預測領域的重點,常用的有經驗模態分解(Empirical mode decomposition,EMD)[8,10,20]、變分模態分解(Variational mode decomposition,VMD)[21]和小波變換(Wavelet transform,WT)[22]等。其中,小波理論由于其良好的時頻特性備受專家學者們的青睞,在去噪領域也備受矚目,且小波閾值降噪(Wavelet threshold denoising,WTD)從提出至今,對其優化和改進一直都有相關研究[23],但將其應用于水質領域預測的研究還較少。在前人研究基礎上,利用WTD 和LSTM 的組合優勢,提出基于WTD-LSTM 的對蝦養殖水體溫度組合預測模型。【擬解決的關鍵問題】首先通過WTD 對采集的對蝦養殖水溫關鍵影響因子進行降噪并做歸一化處理,然后在Keras 框架下搭建LSTM 對蝦養殖水溫預測模型,通過Adam 算法找到最優模型參數,最后得到測試數據樣本的預測結果。將該模型應用于廣東省廣州市海鷗島對蝦養殖綜合試驗基地的水溫預測中,并展開試驗及驗證,一定程度上提高了對蝦養殖水溫預測精度,并取得了較理想的預測效果,可以為水產養殖水質精準調控提供技術支持。
研究試驗地點為廣東省廣州市海鷗島(113°5′E、22°97′N),位于廣州市番禺區東郊,屬于東亞季風區氣候,降水量充沛,年平均氣溫22.3℃。該島水源為河道水,對蝦養殖規模大,產量豐富。本研究選取的1.3 hm2對蝦培育池塘,水深1.5 m,配備有抽水泵、增氧機、水溫控制器、燈光調控設施、pH 檢測儀等多種水質參數傳感器以及對蝦養殖物聯網平臺。
采用中國農業大學研制的水產養殖物聯網平臺采集對蝦養殖池塘水質參數數據,養殖基地系統拓撲結構如圖1 所示。該系統主要由數據采集模塊、網絡傳輸模塊、監控模塊和智能控制模塊4 個部分組成,依靠現代物聯網技術開發的一套集水質環境參數在線采集、智能組網、決策支持等功能于一體的物聯網平臺。數據采集模塊是整個系統的基礎,該模塊負責采集氣象和水質參數等信息,其中所使用的設備為水下監控、溶解氧、pH 和溫度傳感器。網絡傳輸模塊是整個系統數據的傳輸通道,通關網關接收數據并傳送到現場監控中心,最后通過GPRS 傳入監控中心。監控模塊用戶可以通過各種終端實時了解養殖場的信息,包括服務器和應用平臺及數據庫。智能控制模塊主要包括溫度控制、增氧泵控制、給排水控制等智能處理手段和設備。試驗數據為采集系統所采集的對蝦養殖水溫數據,每10 min 對對蝦養殖水質參數和當地氣象參數時序數據采集1 次。采樣周期為2018 年7 月20 至8 月19 日,共采集了4464 個樣本,分別將前30 d 共4320 條數據和最后1 天的144 個數據作為訓練集和測試集。

圖1 養殖基地系統拓撲結構Fig.1 Topology structure of breeding base system
1.3.1 小波閾值降噪 小波理論日益完善,其以自身良好的時頻特性在長時間序列去噪領域取得一定效果,并開辟了用非線性方法去噪的先河[24]。其中WTD 方法近年來得到了廣泛應用,本研究應用小波變換閾值去噪對水溫時間序列數據進行降噪處理,主要分為以下3 個過程:
(1)小波分解:根據不同的變量數據特征選用不同的小波函數進行噪聲信號的分解,得到小波分解后的尺度系數和小波系數。
(2)閾值函數選擇:閾值處理函數分為硬閾值和軟閾值。當小波系數的絕對值小于給定閾值時令其為0,而大于閾值時則保持其不變,此時表示為硬閾值,該閾值采用應用最廣泛的Sqtwolog 閾值[25];當小波系數的絕對值小于給定閾值時令其為0,大于閾值時令其減去閾值,這樣的閾值即為軟閾值。閾值的選擇是離散小波去噪中最關鍵的一步,小波閾值λ 起決定性作用:如果閾值太小,則施加閾值后的小波系數將包含過多的噪聲分量,達不到去噪效果;反之,閾值太大,則去除了有用的成分,造成失真。硬閾值函數在ω=λ 處是不連續的,容易造成去噪后數據在奇異點附近出現明顯的偽吉布斯現象。因此本研究采用軟閾值去噪。
(3)小波重構:通過軟閾值處理后,根據前面層的高頻系數和最后一層的低頻系數進行小波重構,最終獲得小波閾值降噪后信號。
1.3.2 長短時記憶神經網絡 LSTM 是一種特殊的RNN,能夠有效解決信息的長期依賴,避免梯度消失或爆炸,其出現就是專門解決信息長期依賴問題的。與傳統RNN 相比,LSTM 巧妙地設計了循環體結構[26],其內部單元結構如圖2 所示。
LSTM 使用兩個門來控制單元狀態Ct的內容,一個是遺忘門(forget gate),它決定了上一時刻單元狀態Ct-1有多少數據保存在當前時刻Ct;另一個是輸入門(input gate),它決定此時網絡的輸入xt有多少保存到單元狀態Ct。LSTM 使用輸出門(out put)來控制單元狀態Ct有多少輸出到LSTM 的當前輸出值ht。相關計算公式如下:

圖2 LSTM 模型結構Fig.2 Structure of LSTM model

式中,ft、it、C′t、Ct、ot分別代表遺忘門、輸入門、更新細胞的輸入狀態、更新后的細胞狀態和輸出門;W和b分別為對應的權重系數矩陣和偏置項;σ和tanh 分別表示sigmoid激活函數和雙曲正切激活函數
1.3.3 預測模型構建 基于WTD-LSTM 的對蝦養殖水體溫度組合預測模型構建過程如圖3 所示。
(1)通過水質檢測傳感器系統和小型氣象站獲取水產養殖水環境數據和當地氣象數據,并對數據進行修復和預處理;
(2)對修復和預處理后的數據進行特征相對重要性計算,最后篩選出相對重要的水體水溫預測關鍵因子,利用WTD 對篩選后的對蝦養殖水溫關鍵影響因子進行處理,降低噪聲數據對于模型預測的干擾,降低參數相互的關聯性以及冗余成分,提取更有利于對蝦養殖水溫預測的時間序列數據,將數據分為對應訓練集和測試集樣本并進行歸一化處理;
(3)對預測模型參數和權重進行初始化,并且將訓練集作為輸入對模型進行訓練,使用Adam算法連續對模型權重和參數進行優化處理,以得到所需要的精度,并對基于和LSTM 的對蝦養殖水溫預測模型進行構建;

圖3 基于WTD-LSTM 的對蝦養殖水體溫度預測流程Fig.3 Flowchart of water temperature prediction of prawn culture based on WTD-LSTM
(4)將已構建出的預測模型在測試集上進行性能測試,將預測向量輸出進行反歸一化得到水溫預測結果,同時使用標準的傳統預測模型進行比對,準確高效地實現對今后某一時間段的對蝦養殖水體水溫預測;
(5)選擇平均絕對百分比誤差MAPE、均方根誤差RMSE和平均絕對誤差MAE等評價指標對基于WTD-LSTM 的對蝦養殖水溫預測組合模型預測性能進行性能評價,相關計算公式如下:

式中,MAPE、RMSE、MAE分別為平均絕對百分比誤差、均方根誤差和平均絕對誤差;yi、?i分別為實際值和預測值,N為測試樣本集數量。
本研究以廣州市海鷗島對蝦養殖基地水溫為研究對象,采用水產養殖物聯網平臺和小型氣象站采集了31 d 共4464 個水溫樣本。由圖4 可以看出,對蝦養殖水溫時序數據周期性和非線性特征明顯。

圖4 水溫原始數據變化曲線Fig.4 Variation curve of the original water temperature data
由于設備故障等因素氣象站和水質傳感器采集的數據存在部分異常值,利用拉依達法則進行處理,如果存在參數與其平均值之差的絕對值大于其標準差的3 倍,會被斷定為異常值并用其兩側數據的平均值替換,計算公式如下:

式中,Pt為水質或氣象參數采集值,為異常數據處理后的值,為水質或氣象參數數據序列均值。
為了提高預測準確率減少誤差,本研究將異常數據處理和WTD 后的數據進行歸一化處理,計算公式如下:

式中,Nmax為最大值,Nmin為最小值,N"為歸一化值。
WTD 和LSTM 組合預測方法中的步驟,對對蝦養殖水體原始水溫時序數據進行小波分解降噪與重構,其過程如圖5 所示。由圖5 可知,原始養殖水溫時序數據表現出不平穩性和大時滯性,經過WTD 后,水溫數據被擴展到一定閾值范圍,降低了噪聲的干擾,不僅更能反映原始數據變化信息,數據整體趨勢變得更加明顯,并且在波峰波谷表現更為平滑。對對蝦養殖水體原始水溫及風速、風向、太陽輻射、空氣溫度、空氣濕度、大氣壓力和溶解氧等水溫影響因子原始數據進行WTD,降噪后的數據更能反映水質參數和氣象參數按一定趨勢有規律變化的特點。
利用WTD 和LSTM 模型對未來一天對蝦養殖水溫進行預測,將WTD 后的6 個氣象影響因子和水體溶解氧、水溫共8 個參數作為輸入,全部選取31 d 的采集數據,同時將水溫時間序列數據作為輸出對LSTM 模型進行訓練,使用Adam算法對預測模型參數不斷進行優化和調整,為進一步驗證本研究提出的組合模型的預測性能,分別采用BP 神經網絡[27]、標準ELM[10]、標準LSTM 和小波降噪的LSTM 等4 種模型對同樣的對蝦養殖水溫時序數據進行預測。其中BP 神經網絡結構采用7-15-1 結構,學習因子φ=0.75,最大誤差=0.0001,激勵函數采用sigmoid 函數;標準ELM 模型隱含層神經元節點數為10,激活函數采用sigmoid 函數;標準LSTM 隱含層節點數、批尺度和時間步分別為30、60、30。上述4 種模型預測曲線對比如圖6 所示,相應預測精度結果統計如表1 所示。
從圖6 可以看出,BP 神經網絡、標準ELM預測模型的單項預測誤差較大,兩者在拐點附近偏離實測值最大;LSTM 則相比前兩者有很大提升,雖然與真實值曲線形似,但是在波谷處存在較大偏差。本研究提出的基于WTD-LSTM 的組合模型預測曲線貼近真實值曲線,能較好地擬合養殖水溫非線性時間序列變化曲線,取得很好的預測效果。
由表1 可知,本研究所采用的基于WTDLSTM 的組合模型預測結果及其性能相比其他方法有相當大的提升,很大程度上強于傳統的標準ELM 和BP 神經網絡;并且比沒有經過WTD的LSTM 模型預測精度更高。針對同樣的水質和氣象參數,將WTD 的LSTM 預測模型和標準BP 神經網絡兩種模型進行對比分析,評價指標MAPE、RMSE、MAE分別降低了64.85%、59.62%、64.62%;WTD-LSTM 預測模型和標準ELM 相比,評價指標MAPE、RMSE、MAE分別降低了63.64%、61.18%、60.12%;WTD-LSTM 預測模型和標準LSTM 相比,評價指標MAPE、RMSE、MAE分別降低了47.48%、37.07%、46.27%。WTD 具備了多分辨率的特性,對時間序列信號分解后會有更多的小波基系數趨于0,時間序列數據信號主要集中于某些小波基,WTD 便可更好地保留原始信號;而且WTD擁有去相關性,可以對信號進行去相關,噪聲在變換后有白化趨勢,因此小波閾比時域更利于去噪。可見,WTD 對于對蝦養殖中的水溫影響因子時間序列去噪具有很好的性能。LSTM 模型對于歷史時間序列數據信息能夠高效利用,在時間序列預測中具有很理想的效果。基于WTDLSTM 的組合預測模型進一步提升了對蝦養殖水溫的預測精度。

圖5 降噪后的養殖水體水溫影響因子數據Fig.5 Impact factor data of aquaculture water temperature after noise reduction

圖6 4 種模型的水溫預測結果Fig.6 Water temperature prediction results of four models

表1 4 種模型的預測結果精度Table 1 Accuracy of prediction results of four models
WTD 是一種基于時間和多尺度的分析方法,其本身具備多分辨率的優點,WTD 擅長處理如水溫數據這種時序性和頻域性強的數據,相比其他傳統的降噪方法,具有去相關性,因此WTD 可以將非連續的高斯白噪聲從連續的信號在時間閾上分離,同時由于WTD 有低熵性的特點,采取閾值去噪后的信號具有較高的信噪比[28],可以很好地保留原始信號。由于水溫數據變化呈連續性,本研究選擇使用軟閾值降噪,可以保證降噪后的水質和氣象參數的連續性和準確性。
長短時記憶神經網絡能夠處理數據長期依賴的問題,并且解決了RNN 存在梯度消失和爆炸的問題,針對傳統預測模型對擁有時間間隔的長時序非線性和非平穩的多尺度特征對蝦養殖水溫預測,所產生的預測精度低、泛化性差等問題,提出了基于WTD-LSTM 的水溫組合預測模型,并應用于對蝦養殖水溫預測中,最后總結得到該模型對于對蝦養殖水體水溫具有良好的預測效果,提高水溫預測精度和魯棒性,為對蝦養殖水質自動化、數字化監測提供了一種新的思路和解決辦法。