金 武,何 奇,杜興偉,朱新艷,聞海波,馬學艷,何義進,邴旭文
(1中國水產科學研究院淡水漁業研究中心,江蘇無錫 214081;2常熟市水產技術推廣站,江蘇常熟 215500)
中國河蟹養殖主要集中在長江中下游、黃河口、遼河口等地區,目前中國河蟹養殖總面積在4.67×104hm2左右,其中江蘇的養殖面積約2.47×104hm2[1]。由于養殖技術[2-4]和養殖模式[5-7]的不斷突破創新,在河蟹總產量穩中有升的形勢下,河蟹的品質不斷提高。近年來,全國河蟹總體產量平均在7×108kg左右,但由于受到氣候等因素的影響,各地河蟹產量常常有起伏波動[1]。
作為河蟹養殖主要方式之一的池塘生態系統是一個多因素耦合的復雜生態系統,生態要素間的關系錯綜復雜表現出極大的隨機性、不確定性和非線性,這與湖泊生態系統的特點類似[8-9]。在這些生態要素中,氣象因子在其中起到了重要作用,特別是氣溫、光照、降水等與河蟹產量之間存在顯著的相關性[10-13]。BP神經網絡(Back Propagation Neural Networks)是基于誤差反傳算法的多層前饋神經網絡,與傳統的線性回歸模型相比,具有自學習和自適應、非線性、魯棒性和容錯性等特點[14],對于提高河蟹產區多個氣象因子與產量之間非線性數學模型的精確性有顯著優勢。本研究利用2013—2017 年江蘇省河蟹主產區的氣象數據和產量數據建立數學模型并開展河蟹產量預測,以期為河蟹生產流通、制定江蘇省河蟹發展方向及極端氣象條件下的應急處理提供參考。
氣象數據來自中國氣象數據網在河蟹主產區附近設立的7個觀測臺站,氣象數據包括極大風速、最低氣壓、最低氣溫、最高氣壓、最高氣溫、8:00—20:00 時降水量、平均氣壓、平均2 min風速、平均氣溫、平均水氣壓、平均相對濕度、平均最低氣溫、平均最高氣溫、日降水量≥0.1 mm 日數、月日照百分率、日照時數、最大風速、最大日降水量18個氣象因子。江蘇省河蟹主產區產量數據(2013—2017 年)來自原江蘇省海洋與漁業局計劃財務處。
1.2.1 數據標準化 對原始數據做的標準化處理以消除各項指標數據量綱和數量級對算法的影響,見公式(1)。

式中,Y表示得到的標準化矩陣,yij為標準化后的數值,xij為各項指標的數值,各項指標的均值與標準差分別表示為和sj。
1.2.2 PCA 主成分分析 通過主成分分析對數據進行降維處理,將原始數據中線性相關的變量轉化為少數幾個線性不相關的主成份,使得處理之后的數據既能包含原始數據的絕大部分信息,又能降低維度,簡化算法。按照主成份的選定規則,通常情況下最終選定的主成份,其特征值大于1,并且累計貢獻率達在85%以上。
1.2.3 BP 神經網絡分析 神經網絡處理的都是非線性問題,為了達到BP神經網絡處理非線性問題的效果,隱含層與輸出層還需要用到激活函數。為使神經網絡在處理非線性數據時更能把握隱藏在數據中的抽象邏輯關系,激活函數一般選取非線性函數,比較常用的有Sigmoid 函數、tan 函數等。本研究中采用Sigmoid 函數進行神經網絡分析,計算見公式(2)。

2013—2015 年的氣象數據和產量數據用于訓練數據,2016 年數據用于測試模型,2017 年數據用于檢驗預測結果。該神經網絡有1 個隱含層,神經元個數為12個,輸出層為1個。對神經網絡進行參數設置并代入樣本進行訓練,并將訓練好的神經模型進行數據計算與預測。
通過對標準化之后的極大風速、最低氣壓等18個指標數據和產量數據做主成分分析,取累計貢獻率達到85%的主成份。共選取5 個主成份,累計貢獻率為87.128%,分析結果顯著減少了原始數據之間的相關性,又充分概括了原始數據的主要特性。
2.2.1 BP神經網絡訓練結果BP神經網絡的性能圖如圖1,隨著神經網絡迭代次數的增加,均方誤差在逐漸減小,最終均方誤差穩定在0.0248左右,得到了一個穩定的BP神經網絡。

圖1 BP神經網絡的性能圖
從圖2可以看出,第7~21個數據之間的曲線貼合得比較緊密,說明神經網絡對這部分數據之間的關系,擬合得比較準確,而其他數據之間的曲線貼合得不是很緊密,說明神經網絡對其余數據之間的關系擬合還有一定誤差。

圖2 訓練數據的神經網絡預測效果對比
2.2.2 BP 神經網絡 從圖3 可以看出,第5~8 組之間的曲線,貼合的較為緊密,有一致地增減關系,而兩邊的數據,曲線貼合得不夠緊密,有一定的誤差,這一特點和訓練數據曲線相一致,均是中間數據擬合預測較為準確,兩側數據具有相對大些的誤差。

圖3 測試數據的神經網絡預測效果對比
從圖4 以看出,在訓練數據中,數據落在y=x這條線兩側。結果說明大部分數據距離這條回歸線較近,個別數據距離回歸線較遠,相關系數為0.82267,說明BP神經網絡學到了大部分數據的特點,能在一定誤差上模擬氣象因子數據與產量之間的關系。

圖4 神經網絡輸出數據與實際值回歸圖
氣象因子與河蟹產量的關系主要表現在對河蟹生長、成活率[15]的影響,起主要作用的因子包括:降水、溫度、日照、蒸發、風速、氣壓、生長期高溫天數、自然生長期間積溫、生長關鍵期降水[10-11,13,15-17]。高溫(>35℃)天數、自然生長期間積溫和關鍵期降水的年際變化分別與河蟹個體品質、成熟期、河蟹產量的波動密切相關[13]。水溫升至15℃時,攝食開始增加。20~26℃時攝食最旺盛[18]。氣溫達到35℃時,河蟹基本進入休眠狀態,攝食停止,持續高溫3~4 天,河蟹出現死亡。自然生長期積溫和氣溫顯著相關,氣溫高的年份一般對應成熟期較早的年份,生長期積溫低的年份一般對應成熟期較晚的年份。過于集中的降水容易造成湖水上漲,河蟹逃逸,且持續降水期間的陰雨寡照易引發河蟹病害,甚至死亡,從而直接影響收獲量[13,19]。
河蟹養殖過程中,水草可為中華絨螯蟹提供天然餌料、凈化水質、增加溶氧,并營造良好的生態環境,同時也可起到夏季降溫遮光的作用,是提高中華絨螯蟹品質和產量的重要因子[20]。在水草的培育和生長過程中,日照起決定性作用[18]。
BP 神經網絡在水產中的應用目前多集中在工廠化養殖系統水質指標方面,包括溶氧[21]、溫度[22]、pH[23]、氨氮[24]等,在宏觀尺度利用氣象數據預測池塘河蟹產量的報道仍較少。采用逐步回歸法也可以進行河蟹產量的預測,但僅能包括2~3個氣象因,因此模型的預測準確性仍較低[15]。養成后期平均氣溫(影響池塘水溫)及同期雨量這2 個因子也可用于河蟹氣象產量預報[15,25-26]。以生長期高溫天數、自然生長期間積溫、生長關鍵期降水3個因子對江西軍山湖區河蟹產量進行擬合也取得了不錯的效果[13]。但與中華絨螯蟹生長相關的氣象因素遠遠不止溫度[27]、日照和降水,氣壓、風4項[10],氣壓的高低和風的大小都會改變水體中的溶解氧含量等[28],而溶解氧含量又是影響水產動物生長的一個重要因素[29]。各氣象因素之間是相互依存的,存在復雜的非線性關系,因此單純用2~3 個因子來預測河蟹產量很難達到對生產過程中的所有氣象信息準確描述并提高模型預測準確性的目的。本研究中對氣象觀測站采集的絕大多數因子和光照因子與河蟹主產區產量進行了建模,盡最大可能反應河蟹養殖環境系統的復雜性。今后仍可以繼續積累氣象、產量、水環境等方面的數據,改進BP神經網絡算法等角度進一步提高模型的精度。
本研究中BP 神經網絡在訓練數據和測試數據分析中表現出相似的規律,BP神經網絡對兩側的部分數據的擬合存在一定的誤差。BP 神經網絡能夠學到了大部分數據的特點,神經網絡輸出值和真實值之間的相關系數R=0.82267。對河蟹主產區的氣象因子、光照數據利用該神經網絡能夠較準確地預測江蘇省河蟹主產區的產量。