李志剛 袁蕾



摘要:針對赤潮災害受多種影響因素綜合作用的問題,采用灰度關聯算法對所有影響因素進行關聯分析。選取關聯性強的50%因素作為徑向基神經網絡的輸入,用葉綠素a作為輸出,來執行赤潮預測任務。實驗結果表明,該模型具有良好的赤潮預測能力。
關鍵詞:赤潮;影響因素分析;預測;灰度關聯分析; 徑向基神經網絡
中圖分類號:TP391? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)06-0004-02
Abstract: Aiming at the problem that red tide disaster is affected by multiple factors, the gray relation analysis algorithm is used to analyze the correlation of all influence factors. Furthermore, 50% factors with strong correlation are selected as the input of radial basis neural networks, and chlorophyll a is used as the output to perform the red tide prediction task. The experimental results show that the proposed model has good red tide prediction ability.
Key words: red tide; influence factors analysis; prediction; grey relation analysis; radial basis function network
1 引言
赤潮的暴發會破壞海洋生態平衡,阻礙海洋漁業和養殖業的發展,給海洋環境,人體健康和社會經濟發展帶來危害[1-2]。赤潮的發生是多種海洋因素綜合作用的結果[3]。這些因素使得赤潮具有季節性、空間異質性和復雜非線性等特點,給赤潮預防工作帶來了巨大的挑戰。因此,對海洋數據進行關聯分析,進而提取并預測影響赤潮發生的主要因素對預防赤潮、保護海洋環境具有重要意義。傳統的經驗預測和數理統計方法難以解析多因素、不規則、不穩定的海洋數據,致使赤潮影響因素特征分析不全面,容易出現誤差,不利于后期的數據挖掘與融合。灰度關聯算法(Grey Relation Analysis, GRA) 彌補了上述方法的缺陷,是一種可以有效處理不精確不完整數據的相關分析方法[4]。此外,人工智能技術的發展使研究人員開始將基于數據驅動的神經網絡模型應用于赤潮預測研究中[5]。徑向基函數(Radial Basis Function, RBF)神經網絡由于其高度的非線性映射能力、較快的收斂速度和強大的噪聲修復能力,使其在時間序列預測中得到廣泛的關注[6],可以用于解決多元赤潮影響因素預測問題。鑒于上述分析,本文充分結合GRA算法和RBF神經網絡的優勢,提出了一種GRA-RBF數據分析與預測框架,并應用于海洋環境數據赤潮影響因素分析和預測中。實驗結果表明該框架可以充分分析海洋數據與赤潮之間的內在聯系,實現多元赤潮影響因素預測功能。
2 多元赤潮影響因素預測模型
2.1 灰度關聯分析
2.2 RBF神經網絡
徑向基(Radial Basis Function, RBF)神經網絡是一種前饋神經網絡。它包括輸入層,隱藏層和輸出層,層與層之間為全連接模式。在海洋環境數據預測任務中,徑向基函數將每個輸入映射到高維對應不同的感知域中,使低維不可分的數據轉變為高維可分數據,使RBF網絡可以逼近任意非線性函數,具有良好的泛化能力和較快的學習速度。一般地,常采用高斯核函數作為徑向基函數,輸出向量可以表示為:
其中w為隱層到輸出層的權值,P為隱層神經元數量,?為高斯核函數。訓練中,我們采用均方根誤差(Root Mean Square Error, RMSE)來衡量預測性能。
3 實驗
3.1 實驗數據
本實驗采用的數據為國內某海域每隔半小時采集的海洋環境數據,涵蓋水文、氣象、營養鹽、水質四種類型,包括有效波高、1/10波浪高度、1/10波浪周期、最大波浪高度、海浪方向、平均波浪周期、氣溫、氣壓、風速、雨量、最大風速、風向、相對濕度、亞硝酸鹽、磷酸鹽、硝酸鹽、氨氮、鹽度、電導率、溶解氧、葉綠素a、濁度、藍綠藻、總溶解性固體、溶解氧飽和度、水溫、pH,標號分別為1至27。選取與赤潮關聯度高的前50%的影響因素作為RBF的輸入,葉綠素a作為模型的輸出。將數據的60%用于模型訓練,40%用于模型測試。
3.2 實驗驗證
本文結合GRA算法和RBF神經網絡,建立了GRA-RBF數據分析與預測框架來執行多元赤潮影響因素分析與預測任務。首先,采用GRA算法對不同類型的海洋數據進行了關聯度評價。圖1給出了27種因素的標號按關聯度降序排列。從圖中可以看出,不同的海洋環境因素對于赤潮的影響程度有明顯區別。因此,進行關聯度評價是有意義的。從圖1可以看出,葉綠素a的關聯度最高,值為0.1034。而最大波浪高度則為影響最小的因素,關聯度值僅為0.0049。然后,按比例選取高關聯度赤潮影響因素用于預測赤潮,即葉綠素a,濁度,水溫,亞硝酸鹽,藍綠藻,氣溫,pH值,鹽度,氨氮,磷酸鹽,硝酸鹽,溶解氧,相對濕度。
圖2給出了RBF的測試結果。從圖中可以明顯地看出,真實值與預測值的變化趨勢大致相同,證明了模型的擬合度較高,可以用于赤潮的多因素預測。模型的預測誤差RMSE為0.1008。為進一步說明模型性能,本文采用散點圖進行驗證。圖中黑色線表示標準的葉綠素a真實值基準線。灰色散點表示每個真實值在模型輸出中對應的預測值。當灰色線與黑色線越接近時,表明模型的性能越好。從圖3可以看出,大部分的預測值趨近于標準線,即RBF可以在較小的誤差下實現多因素赤潮預測。
4 結論
本文基于灰度關聯算法和徑向基神經網絡提出了一種GRA-RBF數據分析與預測框架用于分析和預測多元赤潮影響因素。通過灰度關聯算法提取影響赤潮程度高的因素,再用徑向基神經網絡進行預測,該模型可以有效地處理赤潮數據,并對赤潮數據進行準確的預測。本文采用該模型對赤潮數據進行了預測。實驗結果表明,該模型可以高效地用于多種影響因素分析,并對赤潮進行預測。
參考文獻:
[1] 張曉冉,龐雨寧.海水赤潮的危害及防治對策[J].河北漁業,2017(4): 59-60.
[2] Zohdi E, Abbaspour M. Harmful algal blooms (red tide): a review of causes, impacts and approaches to monitoring and prediction[J]. International Journal of Environmental Science and Technology, 2019, 16(3): 1789-1806.
[3] 齊慶華,蔡榕碩,顏秀花.氣候變化與我國海洋災害風險治理探討[J].海洋通報,2019(4).
[4] Cornejo-Bueno L, Nieto-Borge J C, García-Díaz P, et al. Significant wave height and energy flux prediction for marine energy applications: A grouping genetic algorithm-extreme learning machine approach[J]. Renewable Energy, 2016, 97:380-389.
[5] 李海濤,劉泰麟,邵澤東,黃海廣.基于決策樹與二分分割算法的BP神經網絡在赤潮等級預測中的應用研究[J].海洋科學,2019,43(9):34-40.
[6] 曹嘉杰, 楊猛, 徐新宇. 基于RBF神經網絡的數據挖掘方法探究[J].電腦知識與技術,2016,12(7):151-153.
【通聯編輯:王力】