施 珮 袁永明 匡 亮 李光輝 張紅燕
(1.中國水產(chǎn)科學(xué)研究院淡水漁業(yè)研究中心, 無錫 214081; 2.江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院, 無錫 214122;3.江蘇信息職業(yè)技術(shù)學(xué)院物聯(lián)網(wǎng)工程學(xué)院, 無錫 214153)
水溫是水產(chǎn)養(yǎng)殖中影響魚類生長狀況、生長質(zhì)量的關(guān)鍵因素之一,在工廠化養(yǎng)殖中水溫的作用更為突出[1]。高密度的養(yǎng)殖環(huán)境、大量的餌料和狹小的養(yǎng)殖空間對水質(zhì)、水溫的要求更為嚴(yán)格。水溫的突變會(huì)對水體中pH值、溶解氧、氨氮等產(chǎn)生影響,影響魚類適宜的生存環(huán)境[2]。
為了對水體溫度進(jìn)行準(zhǔn)確預(yù)測,近年來很多學(xué)者進(jìn)行了相關(guān)研究[3-6,8-12],其預(yù)測方法包括傳統(tǒng)數(shù)理統(tǒng)計(jì)法和人工智能方法。基于水溫機(jī)理的數(shù)理方法對影響水溫變化的機(jī)理和因素進(jìn)行了分析,研究不同水層條件、時(shí)空分布、流速、流量等對水溫的影響[3-4],利用傳熱傳質(zhì)理論、水文氣象理論、二維和三維模型等構(gòu)建水溫預(yù)測模型[5-6],這些方法雖然能夠?qū)λ畮臁⑺鄣乃疁剡M(jìn)行有效預(yù)測,但預(yù)測模型復(fù)雜,參數(shù)多且難獲取,在水產(chǎn)養(yǎng)殖上難以應(yīng)用。基于數(shù)據(jù)挖掘的非機(jī)理方法一般通過大量數(shù)據(jù)構(gòu)建數(shù)學(xué)模型,獲得水溫與相關(guān)影響因子的關(guān)系,捕捉水溫變化規(guī)律。而針對大量數(shù)據(jù)樣本構(gòu)建的數(shù)學(xué)模型較多使用機(jī)器學(xué)習(xí)算法,包括貝葉斯算法、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等[7]。貝葉斯算法能夠處理不確定性的信息數(shù)據(jù),但需要有處理目標(biāo)的先驗(yàn)知識(shí),獲取目標(biāo)的先驗(yàn)分布[8-9];支持向量機(jī)(SVM)能夠較好地?cái)M合處理非線性系統(tǒng)問題,且泛化性能較強(qiáng),但算法復(fù)雜,參數(shù)較多且難以確定[10-11]。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)與SVM相似,適用于處理非線性問題,其缺陷也表現(xiàn)在算法復(fù)雜度和參數(shù)設(shè)置及核函數(shù)確定等問題上[12]。極限學(xué)習(xí)機(jī)(ELM)不同于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)較為簡單,擁有快速學(xué)習(xí)能力和強(qiáng)泛化能力[13],已廣泛應(yīng)用于各類預(yù)測、分類和識(shí)別問題中[14-16]。然而單一的ELM預(yù)測精度有限,在初始參數(shù)和激活函數(shù)上仍有優(yōu)化和改進(jìn)的空間。
在前人研究的基礎(chǔ)上[12,17-18],本文提出基于EMD(經(jīng)驗(yàn)?zāi)B(tài)分解)-IGA(改進(jìn)遺傳算法)-SELM(改進(jìn)極限學(xué)習(xí)機(jī))的池塘水溫預(yù)測模型。該模型利用EMD對水溫原始數(shù)據(jù)進(jìn)行不同尺度的分解,挖掘數(shù)據(jù)特征,利用改進(jìn)的遺傳算法獲取最優(yōu)初始參數(shù),避免組合優(yōu)化算法的抖振問題和尋優(yōu)過程的早熟問題,使用模型新的激活函數(shù),在EMD分量中進(jìn)行模型訓(xùn)練和預(yù)測,疊加后最終獲得水溫預(yù)測結(jié)果。
實(shí)驗(yàn)地點(diǎn)無錫市位于東經(jīng)120.18°、北緯31.34°。在該養(yǎng)殖區(qū)域內(nèi)選取長110 m、寬45 m、水深約1.5 m的池塘作為實(shí)驗(yàn)池塘。在池塘內(nèi)搭建3個(gè)高密度水泥槽,每個(gè)水槽長9 m、寬3 m,投放5 000尾羅非魚魚苗,魚苗長度約3 cm。在高密度水泥槽中使用工廠化循環(huán)水養(yǎng)殖技術(shù),并采用微孔曝氣增氧和氣提式推水裝置進(jìn)行增氧。
實(shí)驗(yàn)數(shù)據(jù)采集裝置使用淡水漁業(yè)研究中心智能漁業(yè)物聯(lián)服務(wù)中心研制的水產(chǎn)物聯(lián)服務(wù)遠(yuǎn)程監(jiān)控系統(tǒng)平臺(tái)采集工廠化池塘養(yǎng)殖中的水質(zhì)數(shù)據(jù)和自動(dòng)氣象站監(jiān)測數(shù)據(jù),其系統(tǒng)架構(gòu)圖如圖1所示。該系統(tǒng)對溶解氧含量、水溫、pH值、氣溫、氣壓、濕度、雨量等水產(chǎn)養(yǎng)殖的水質(zhì)環(huán)境數(shù)據(jù)進(jìn)行在線監(jiān)測。通過系統(tǒng)的感知層采集數(shù)據(jù),經(jīng)系統(tǒng)傳輸層傳輸至系統(tǒng)應(yīng)用層。水下傳感器放置深度為0.5 m,氣象環(huán)境監(jiān)測傳感器集成在自動(dòng)氣象站中,所有獲取的數(shù)據(jù)在應(yīng)用層進(jìn)行分析和處理,為用戶的控制決策提供依據(jù)。

圖1 系統(tǒng)架構(gòu)圖Fig.1 Structure diagram of monitoring system1.服務(wù)器 2.監(jiān)測系統(tǒng) 3.防火墻 4.DTU數(shù)據(jù)傳輸單元 5.池塘水質(zhì)傳感器節(jié)點(diǎn) 6.自動(dòng)氣象站 7.PLC控制器 8.手機(jī)終端 9.PC終端
1.3.1經(jīng)驗(yàn)?zāi)B(tài)分解
EMD通過將信號(hào)分解成一系列簡單的本征模態(tài)分量(Intrinsic mode function,IMF)和殘量r,各IMF分量之間相互獨(dú)立,從而獲取信號(hào)的特征,并廣泛地應(yīng)用在非平穩(wěn)信號(hào)的分析處理中[19]。在實(shí)際應(yīng)用中,對池塘水溫序列{x(t)|t=1,2,…,T}(t表示時(shí)間序號(hào))的EMD算法步驟如下:
(1)對于x(t)序列,首先獲得它的極大值點(diǎn)和極小值點(diǎn)。利用三次樣條插值法將所有極大、極小值連接,形成上包絡(luò)線xmax(t)和下包絡(luò)線xmin(t)。
(2)計(jì)算xmax(t)和xmin(t)的均值m(t)和差值h(t)。將h(t)作為一個(gè)獲取的新數(shù)據(jù)序列,重復(fù)k次步驟(1),計(jì)算得到hk(t),當(dāng)滿足Rk小于設(shè)定閾值時(shí),則hk(t)成為一個(gè)IMF,公式為
(1)
(3)計(jì)算得到第1個(gè)IMF分量后,從原始水溫序列x(t)中減去它,獲得差值序列r1(t)。重復(fù)上述步驟,依次獲得各IMF分量和余項(xiàng)rn(t)。rn(t)為一個(gè)單調(diào)函數(shù),且小于設(shè)定的閾值,公式為
(2)
式中Fi(t)——各IMF分量
1.3.2改進(jìn)的遺傳算法
遺傳算法(Genetic algorithm, GA)是一種模擬自然界遺傳機(jī)制和生物進(jìn)化論而形成的并行隨機(jī)搜索最優(yōu)化方法[20]。該算法主要通過選擇、交叉、變異等遺傳操作,使群體逐代進(jìn)化,直到滿足進(jìn)化終止條件才結(jié)束。傳統(tǒng)的遺傳算法在全局尋優(yōu)過程中都是基于交叉操作和變異操作,且變異操作是在交叉操作的基礎(chǔ)上進(jìn)行的。本文將混沌系統(tǒng)的隨機(jī)性[21]引入交叉和變異操作中,將生物進(jìn)化看作為隨機(jī)性和反饋?zhàn)饔玫慕Y(jié)果,提出改進(jìn)的遺傳算法(Improved genetic algorithm, IGA),改進(jìn)內(nèi)容如下,以期避免遺傳算法的早熟問題。
(1)交叉操作

(2)變異操作
本文中,根據(jù)設(shè)定的變異率,隨機(jī)獲取2~p-1之間的兩個(gè)正整數(shù)c、d。對c、d對染色體上相應(yīng)位置的基因進(jìn)行變異操作,利用混沌序列把c、d位置上的基因換成新的基因值,獲得新的染色體。
改進(jìn)的遺傳算法將變異操作與交叉操作撥離開,使二者獨(dú)立并列進(jìn)行,并在具體遺傳操作中,引入混沌序列來確定交叉點(diǎn),利用單點(diǎn)交叉的低改動(dòng)性,削弱和避免遺傳算法組合優(yōu)化問題中的尋優(yōu)抖振問題。利用混沌序列完成染色體中的多基因變異過程,進(jìn)而避免遺傳算法的尋優(yōu)早熟問題。
1.3.3改進(jìn)激活函數(shù)的極限學(xué)習(xí)機(jī)
ELM是一種前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,算法具有很好的全局搜索能力[22],且算法的參數(shù)一經(jīng)確認(rèn),則訓(xùn)練過程中無需調(diào)整。與其他機(jī)器學(xué)習(xí)算法相比,ELM具有學(xué)習(xí)效率高、泛化性能好等優(yōu)點(diǎn)。
在本文的池塘水溫訓(xùn)練樣本(xi,yi)中,設(shè)ELM有u個(gè)輸入節(jié)點(diǎn),L個(gè)隱含層節(jié)點(diǎn),q個(gè)輸出節(jié)點(diǎn),激活函數(shù)為g(x),則xi=[xi1xi2…xiu], 網(wǎng)絡(luò)輸出可表示為
(3)
式中wj——第j個(gè)隱含層節(jié)點(diǎn)與輸入節(jié)點(diǎn)的權(quán)值向量
bj——第j個(gè)隱含層節(jié)點(diǎn)的閾值
βj——第j個(gè)隱含層節(jié)點(diǎn)與輸出節(jié)點(diǎn)間的權(quán)值向量
N——樣本個(gè)數(shù)
激活函數(shù)g(x)是ELM中影響網(wǎng)絡(luò)性能的關(guān)鍵因素,適宜的激活函數(shù)能夠提高ELM的精準(zhǔn)度和泛化性。Sigmoid函數(shù)是ELM中傳統(tǒng)的隱含層激活函數(shù),它是一種采用雙側(cè)抑制的判別函數(shù)。然而當(dāng)遇到廣義Hop-world問題時(shí),其函數(shù)逼近值為單調(diào)的,則雙側(cè)抑制方式會(huì)增加廢運(yùn)算[23],此時(shí)則需要單邊抑制來完成值的判別。修正線性函數(shù)作為一種新型激活函數(shù)正在被廣泛地應(yīng)用于深度學(xué)習(xí)領(lǐng)域[24]。其產(chǎn)生的修正線性單元(Rectified linear units, ReLU)被定義為
g(x)=max(0,x)
(4)
ReLU函數(shù)為分段函數(shù),該函數(shù)形式簡單、運(yùn)算快,泛化性較Sigmoid更好,但函數(shù)的稀疏性會(huì)減小函數(shù)的預(yù)測能力,降低網(wǎng)絡(luò)平均性能[25]。文獻(xiàn)[26]中提出了Softplus函數(shù),該函數(shù)為ReLU的非線性平滑表示。Softplus函數(shù)是非線性連續(xù)可微的,且相比較于Sigmoid函數(shù)更接近生物學(xué)激活模型,能較好地避免ReLU的強(qiáng)制稀疏性,提高網(wǎng)絡(luò)的平均性能。在本研究中,選用Softplus函數(shù)作為ELM的激活函數(shù),函數(shù)定義為
g(x)=ln(1+ex)
(5)
由于水質(zhì)傳感器常年放置在水下環(huán)境中,受到水體腐蝕作用和其他環(huán)境因素作用,會(huì)使得傳感器在數(shù)據(jù)采集過程中發(fā)生偏差,傳感器精度受到影響。同時(shí),網(wǎng)絡(luò)的傳輸也會(huì)產(chǎn)生數(shù)據(jù)的延遲和丟失,這些問題都會(huì)使得采集到的數(shù)據(jù)發(fā)生丟失和數(shù)據(jù)異常,針對這類問題,需要進(jìn)行數(shù)據(jù)預(yù)處理來提高數(shù)據(jù)質(zhì)量。
2.1.1數(shù)據(jù)校正
對短時(shí)間內(nèi)發(fā)生丟失問題的數(shù)據(jù),使用線性插值法[27]來完成缺失數(shù)據(jù)的插補(bǔ),公式為
(6)
式中xk、xk+j——第k和第k+j時(shí)刻采集的傳感器數(shù)據(jù)
xk+i——第k+i時(shí)刻傳感器丟失數(shù)據(jù)
基于相似時(shí)間段內(nèi)天氣條件相似概率較高,水體的溫度在相似天氣條件下也具有一定規(guī)律,故以相似時(shí)間相似天氣為評價(jià)對象,將監(jiān)測系統(tǒng)采集的氣象指標(biāo):大氣壓強(qiáng)、空氣相對濕度、空氣溫度、空氣中CO2濃度、照度、光合有效輻射度、輻射照度、風(fēng)速和風(fēng)向等9項(xiàng)指標(biāo)建立評估體系,采用因子分析法評估綜合天氣指數(shù)
(7)
其中
Fij=∑xiMaMj
式中Windex——綜合天氣指數(shù)
Wj——因子分析中提取的公共因子的方差貢獻(xiàn)率
Fij——各公共因子得分系數(shù)
xiM——第i個(gè)公共因子在第M個(gè)天氣指標(biāo)上的實(shí)際值
aMj——第M個(gè)天氣指標(biāo)在第j個(gè)公共因子上的得分系數(shù)
利用水質(zhì)監(jiān)測數(shù)據(jù)和氣象環(huán)境數(shù)據(jù)在時(shí)間上的連續(xù)性,設(shè)定這些采集數(shù)據(jù)任意時(shí)刻前后差值超過10%時(shí),判定傳感器發(fā)生偏差,數(shù)據(jù)需要進(jìn)行誤差校正[28]。遵循綜合天氣指數(shù)臨近原則,將這些發(fā)生偏差的數(shù)據(jù)替換為綜合天氣指數(shù)相近條件下對應(yīng)的水質(zhì)數(shù)據(jù),并保證替換后的數(shù)據(jù)前后差值不超過10%。另外,對長時(shí)間丟失的數(shù)據(jù),選擇相似時(shí)刻、天氣指數(shù)臨近的對應(yīng)水質(zhì)數(shù)據(jù)插補(bǔ)丟失數(shù)據(jù),同時(shí)確保插補(bǔ)數(shù)據(jù)滿足差值不超過10%的條件。
2.1.2數(shù)據(jù)歸一化
為了消除不同度量標(biāo)準(zhǔn)的數(shù)據(jù)間的量綱差異問題,對所有經(jīng)過校正的數(shù)據(jù)進(jìn)行歸一化處理,在M個(gè)指標(biāo)的數(shù)據(jù)集中,利用Z-score數(shù)據(jù)標(biāo)準(zhǔn)化方法對N組數(shù)據(jù)進(jìn)行對應(yīng)標(biāo)準(zhǔn)化處理,即
(8)
式中Zmn——?dú)w一化后數(shù)據(jù)
xMN——校正數(shù)據(jù)

SN——xMN的數(shù)據(jù)標(biāo)準(zhǔn)差值
2.2.1預(yù)測指標(biāo)體系構(gòu)建
由于水體環(huán)境因子和氣象環(huán)境因子對水溫的變化均具有一定的影響,本文選擇監(jiān)測指標(biāo)中水溫、pH值、大氣壓強(qiáng)、空氣相對濕度、空氣溫度、空氣中CO2濃度、照度、光合有效輻射度、輻射照度、風(fēng)速和風(fēng)向等11項(xiàng)指標(biāo)進(jìn)行關(guān)聯(lián)分析。在實(shí)驗(yàn)的1008組數(shù)據(jù)中,采用Person相關(guān)分析對這些指標(biāo)與水溫的相關(guān)性進(jìn)行分析。經(jīng)計(jì)算后可得,水溫與pH值、大氣壓強(qiáng)等10項(xiàng)指標(biāo)的相關(guān)系數(shù)分別為0.512、0.597、-0.445、0.601、0.435、0.112、0.181、0.105、0.203和-0.134。由此可知水體環(huán)境因子和氣象環(huán)境因子與水體溫度均具有一定的關(guān)聯(lián)性,故選擇這10項(xiàng)指標(biāo)構(gòu)建池塘水溫的預(yù)測模型。
2.2.2預(yù)測模型設(shè)計(jì)
由于傳統(tǒng)的ELM網(wǎng)絡(luò)模型的初始參數(shù)存在隨機(jī)性,且在激活函數(shù)的選擇上并未考慮適宜性,而改進(jìn)的遺傳算法能夠解決尋優(yōu)抖振和早熟問題,確定最佳權(quán)值、閾值,Softplus函數(shù)提高ELM泛化性。同時(shí),針對原始監(jiān)測數(shù)據(jù)構(gòu)建的預(yù)測模型易同質(zhì)化監(jiān)測數(shù)據(jù)的不同尺度信息特征,不能充分發(fā)現(xiàn)時(shí)序數(shù)據(jù)的時(shí)頻特征,影響預(yù)測模型的性能。本文將EMD、IGA和ELM 3種算法結(jié)合起來,提出基于EMD-IGA-SELM的池塘養(yǎng)殖水溫預(yù)測模型。
在建模的過程中首先采用EMD對池塘水溫時(shí)序序列進(jìn)行自適應(yīng)地多尺度分解,獲得不同頻率的信號(hào)分量和余項(xiàng);然后在分解后的各分量中采用IGA-SELM進(jìn)行建模預(yù)測;最后將各分量預(yù)測模型的預(yù)測值進(jìn)行疊加獲取最終預(yù)測值。其預(yù)測流程圖如圖2所示,基于EMD-IGA-SELM的池塘水溫預(yù)測步驟如下:

圖2 EMD-IGA-SELM預(yù)測流程圖Fig.2 Flow chart of EMD-IGA-SELM prediction model
(1)池塘水溫時(shí)序數(shù)據(jù)分解。利用EMD對x(t)進(jìn)行分解,獲得n個(gè)IMF分量和一個(gè)余項(xiàng)rn。
(2)構(gòu)建訓(xùn)練、測試樣本集。在IMF分量中,構(gòu)建各分量訓(xùn)練樣本集、測試樣本集的輸入量和輸出量。
(3)構(gòu)建各分量的優(yōu)化極限學(xué)習(xí)機(jī)訓(xùn)練、預(yù)測模型。在改進(jìn)的遺傳算法中,計(jì)算改進(jìn)遺傳算法中的適應(yīng)度函數(shù);設(shè)置初始種群規(guī)模size和最大進(jìn)化代數(shù)maxgen,對種群中的個(gè)體進(jìn)行選擇、改進(jìn)的交叉和變異等遺傳操作,最終確定全局最優(yōu)的適應(yīng)度;利用最優(yōu)適應(yīng)度獲得最優(yōu)權(quán)值abest和閾值bbest;設(shè)定ELM網(wǎng)絡(luò)的激活函數(shù)為Softlus,由abest和bbest計(jì)算ELM的輸出矩陣H和輸出權(quán)值β,確定SELM網(wǎng)絡(luò)結(jié)構(gòu);利用IGA方法對每個(gè)SELM模型參數(shù)迭代尋優(yōu),在每個(gè)IMF分量和余項(xiàng)rn內(nèi)建立最優(yōu)參數(shù)的SELM擬合預(yù)測模型,獲得各分量的預(yù)測結(jié)果,公式為
(9)

(10)
(11)
式中yi(t)——t時(shí)刻的實(shí)際值
H+——輸出矩陣H的廣義逆

Y——輸出矩陣
(4)預(yù)測結(jié)果輸出。對各IMF分量和余項(xiàng)rn的預(yù)測結(jié)果進(jìn)行累加求和,獲得池塘水溫的最終預(yù)測結(jié)果。
2.2.3模型參數(shù)設(shè)置
在EMD-IGA-SELM預(yù)測模型中,分別對改進(jìn)的遺傳算法部分和ELM神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行如下設(shè)置。
(1)遺傳算法部分。設(shè)置IGA算法的初始種群規(guī)模為10,迭代次數(shù)為50。依據(jù)多次運(yùn)行均方誤差最小的原則,確定交叉概率為0.1,變異概率為0.1。
(2)ELM神經(jīng)網(wǎng)絡(luò)部分。對ELM參數(shù)進(jìn)行設(shè)置,輸入節(jié)點(diǎn)數(shù)為10,輸出節(jié)點(diǎn)數(shù)為1。為了避免出現(xiàn)“欠適配”、“過適配”的問題,依據(jù)“試錯(cuò)法”,最終設(shè)置各IMF分量ELM網(wǎng)絡(luò)的隱含層節(jié)點(diǎn)數(shù)分別為28、19、23、31、29、31,由此獲得各分量ELM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)模型。
以無錫市南泉羅非魚養(yǎng)殖基地的池塘水溫為研究對象,基于1.2節(jié)中物聯(lián)服務(wù)水質(zhì)監(jiān)控系統(tǒng),每10 min采集一組數(shù)據(jù),將獲取的所有氣象站數(shù)據(jù)和水體環(huán)境數(shù)據(jù)作為預(yù)測模型的數(shù)據(jù)樣本。實(shí)驗(yàn)數(shù)據(jù)起始時(shí)間為2016年7月1—7日,將前6 d的864組數(shù)據(jù)作為水溫預(yù)測的訓(xùn)練集,最后1 d的144組數(shù)據(jù)組成預(yù)測集。在構(gòu)建的預(yù)測體系中,確定pH值、大氣壓強(qiáng)、空氣相對濕度、空氣溫度、空氣中CO2濃度、照度、光合有效輻射度、輻射照度、風(fēng)速和風(fēng)向?yàn)檩斎胱兞浚疁貫檩敵隽浚到y(tǒng)運(yùn)行環(huán)境為Matlab 2014a Microsoft Windows 7, 處理器為3.4 GHz Core(TM), 內(nèi)存為4.0 GB。
3.2.1基于EMD的水溫多尺度分解
按照2.2.2節(jié)的EMD-IGA-SELM模型的步驟,以1 008組水溫時(shí)序數(shù)據(jù)為對象進(jìn)行EMD分解,獲得5個(gè)IMF分量和1個(gè)余項(xiàng),分解圖如圖3所示。

圖3 水溫EMD分解圖Fig.3 Decomposition of water temperature by EMD
從圖3可以發(fā)現(xiàn),池塘水溫時(shí)序序列有明顯的多尺度特征,5個(gè)IMF分量呈現(xiàn)高低變化不同波動(dòng)尺度的信息。其中,IMF1的頻率較高,能體現(xiàn)出原始時(shí)序數(shù)據(jù)的隨機(jī)噪聲信息;rn余項(xiàng)頻率較低,變化平穩(wěn),體現(xiàn)水溫時(shí)序的周期性和趨勢性信息,反映水溫總體變化特征。
3.2.2預(yù)測結(jié)果分析
在EMD分解的基礎(chǔ)上,采用IGA-SELM分別對各IMF分量和余項(xiàng)構(gòu)建預(yù)測模型,得到EMD-IGA-SELM的池塘水溫預(yù)測結(jié)果。同時(shí),為了對預(yù)測模型的性能有清晰的了解,本文設(shè)置了對照實(shí)驗(yàn)。將IGA-SELM、GA-SELM和GA-ELM作為參照模型,分析和對比EMD、IGA和SELM對預(yù)測性能的影響。在IGA-SELM中設(shè)置其隱含層節(jié)點(diǎn)數(shù)為28,激活函數(shù)為Softplus,IGA算法的參數(shù)設(shè)置同2.2.3節(jié)中遺傳算法部分;GA-SELM和GA-ELM均使用標(biāo)準(zhǔn)遺傳算法,GA-ELM中激活函數(shù)設(shè)置為Sigmoid,其他參數(shù)設(shè)置相同。各模型的預(yù)測值與實(shí)際值對比結(jié)果如圖4所示。

圖4 各模型預(yù)測值與實(shí)際值對比Fig.4 Comparison of original data and predictive values of three models
圖4顯示,各預(yù)測模型均能在不同程度上較好地實(shí)現(xiàn)池塘水溫的預(yù)測,水溫的預(yù)測變化趨勢與實(shí)際值變化趨勢較為一致,但預(yù)測效果存在一定的差異。就整體預(yù)測結(jié)果而言,EMD-IGA-SELM的預(yù)測結(jié)果比其他3種模型的擬合效果更好,變化起伏更小,預(yù)測效果更穩(wěn)定,全局看來無較大起伏的波動(dòng)點(diǎn)。EMD-IGA-SELM與IGA-SELM的預(yù)測趨勢較為相近,二者曲線變化方向較一致,這兩個(gè)預(yù)測模型均使用IGA優(yōu)化算法,且激活函數(shù)相同。而GA-SELM與GA-ELM也有較大程度的一致趨勢,二者在ELM均使用標(biāo)準(zhǔn)算法,但激活函數(shù)不同。從圖中還可以發(fā)現(xiàn),各預(yù)測模型均不同程度的在08:00—13:00和18:00—22:00時(shí)段內(nèi)呈現(xiàn)相對較大的起伏,聯(lián)系實(shí)際情況可知,這兩個(gè)時(shí)段分別為光合作用變化較大的時(shí)間段,池塘內(nèi)浮游植物和微生物發(fā)生光合作用,水溫的變化幅度最大。由于水溫隨空氣溫度的變化具有延時(shí)性,在變化幅度較大的時(shí)間段中,水溫預(yù)測的難度相對較大。
為了對這4個(gè)模型進(jìn)行綜合的性能對比,本文選擇均方根誤差(Root mean square error,RMSE)、平均絕對百分比誤差(Mean absolute percent error,MAPE)、平均絕對誤差(Mean absolute error,MAE)和運(yùn)行時(shí)間[22]4項(xiàng)指標(biāo)進(jìn)行比較,其預(yù)測性能結(jié)果如表1所示。

表1 預(yù)測模型的預(yù)測性能對比Tab.1 Performances comparison of four predictive models
從表1可以發(fā)現(xiàn),4個(gè)模型的預(yù)測準(zhǔn)確率達(dá)到了99%以上(MAPE均小于0.01)。EMD-IGA-SELM模型的精度指標(biāo)MAE、MAPE、RMSE分別為0.123 3℃、0.004 3和0.147 8℃。該模型預(yù)測精度與其他方法相比有很大的改進(jìn),僅MAPE相比另外3個(gè)模型分別降低12.25%、20.37%和39.44%。在運(yùn)行時(shí)間上,EMD-IGA-SELM較其他3種模型分別多耗時(shí)4.55、3.43、1.88 s。水溫時(shí)序數(shù)據(jù)的EMD分解降低了不同尺度特征信息間的相互干擾,提高了預(yù)測模型的精度,但是數(shù)據(jù)EMD分解的過程也消耗了時(shí)間。改進(jìn)的遺傳算法可以有效地避免遺傳算法的早熟問題,提高算法的效率。Softplus激活函數(shù)能提高ELM的精度和效率,適宜使用在水溫的預(yù)測模型中。
為了驗(yàn)證本文EMD-IGA-SELM的預(yù)測性能,分別采用已經(jīng)被應(yīng)用的EMD-ELM和GA-BP模型對池塘水溫進(jìn)行預(yù)測。其中,GA-BP中BP的網(wǎng)絡(luò)結(jié)構(gòu)為10-6-1,訓(xùn)練次數(shù)為1 000,訓(xùn)練目標(biāo)為0.1,激活函數(shù)為Sigmoid;EMD-ELM中,ELM的神經(jīng)元設(shè)置、EMD分解后的ELM網(wǎng)絡(luò)設(shè)置同2.2.3節(jié),激活函數(shù)為Sigmoid。由此獲得3個(gè)預(yù)測算法的性能,如表2所示。

表2 不同水溫預(yù)測模型的預(yù)測性能對比Tab.2 Performances comparison of three existing models
由表2可以發(fā)現(xiàn),EMD-IGA-SELM的預(yù)測精度與EMD-ELM、GA-BP相比有明顯的提升,在MAE指標(biāo)上,EMD-IGA-SELM比EMD-ELM和GA-BP分別降低了33.46%、35.58%;在MAPE上,EMD-IGA-SELM比EMD-ELM和GA-BP分別降低了32.81%、35.82%;EMD-IGA-SELM的RMSE比EMD-ELM和GA-BP分別降低了29.62%、37.16%。EMD-IGA-SELM的運(yùn)行時(shí)間較EMD-ELM慢了3.51 s,較GA-BP快了9.99 s。
綜上所述,EMD-IGA-SELM的綜合性能較好,有一定的優(yōu)勢,能夠解決ELM模型中參數(shù)隨機(jī)的問題,可以充分發(fā)掘水溫?cái)?shù)據(jù)的多尺度特征。將EMD與IGA、SELM結(jié)合在一起可以有效地提高水溫預(yù)測模型的精度,克服單一模型存在的低精度問題,為工廠化的池塘養(yǎng)殖提供水溫預(yù)測的方法,為實(shí)際生產(chǎn)中的水質(zhì)監(jiān)控和管理提供依據(jù)。并且在實(shí)際生產(chǎn)過程中,可以根據(jù)系統(tǒng)預(yù)測精度和響應(yīng)時(shí)效要求選擇符合生產(chǎn)需求的預(yù)測模型完成水溫的預(yù)測。
(1)采用改進(jìn)的遺傳算法對ELM的輸入權(quán)值和隱含層閾值進(jìn)行優(yōu)化,建立IGA-SELM預(yù)測模型,在多次實(shí)驗(yàn)的基礎(chǔ)上確定預(yù)測模型的隱含層節(jié)點(diǎn)數(shù)。改進(jìn)的遺傳算法引入混沌序列,有效地解決了ELM優(yōu)化模型中尋優(yōu)抖振,避免出現(xiàn)早熟問題。獲得的最佳權(quán)值和閾值能夠避免ELM隨機(jī)參數(shù)的不穩(wěn)定性,提高預(yù)測模型的準(zhǔn)確性。
(2)使用Softplus激活函數(shù)替換傳統(tǒng)ELM中的Sigmoid函數(shù),不僅提高了ELM泛化能力,還提高了預(yù)測精度和效率。
(3)采用經(jīng)驗(yàn)?zāi)B(tài)分解對水溫時(shí)序數(shù)據(jù)進(jìn)行多尺度分解,獲得多個(gè)IMF分量和余項(xiàng),構(gòu)建各分量中的預(yù)測模型,捕捉到水溫?cái)?shù)據(jù)特征,雖增加了一定的時(shí)間成本,但提高了水溫預(yù)測模型的精度,可根據(jù)需求供不同系統(tǒng)選擇使用。