








摘要: 基于鄰域粗糙集對影響蝦塘水溫變化的氣象因子進行選擇,并選取模型預測蝦塘水溫,為南美白對蝦養殖趨利避害提供科學參考。首先,將平均氣溫、最高氣溫、最低氣溫、降水量、氣壓、2 min風速、10 min風速和瞬時風速等8個氣象因子組合輸入SFNN模型(單隱層前饋神經網絡模型)、高斯回歸模型和嶺回歸模型進行蝦塘水溫預測,選取預測效果最好的SFNN模型為本研究預測模型。然后,運用鄰域粗糙集和熵理論,考慮氣象因子和蝦塘水溫之間的相關性、冗余性和交互性,選出影響蝦塘水溫變化的主要氣象因子。最后,利用選出的主要氣象因子和SFNN模型實現蝦塘水溫預測。將基于鄰域粗糙集選出的5個氣象因子組合與8個氣象因子組合,以及8個氣象單因子分別輸入SFNN模型,預測結果表明:鄰域粗糙集選出的5個氣象因子組合預測結果最好,其預測均方根誤差、均方誤差、平均絕對誤差最小,分別為1.121 1、1.256 9和0.893 8,決定系數(R2)為0.791 6;在氣象單因子中,氣壓對蝦塘水溫的預測結果較好。因此,基于鄰域粗糙集選出的5個氣象因子組合,通過SFNN模型進行蝦塘水溫預測結果最好,此方法在南美白對蝦養殖趨利避害、防災減災中具有一定的實用價值。
關鍵詞: 蝦塘水溫;氣象因子;鄰域粗糙集;SFNN模型
中圖分類號: S966.12 文獻標識碼: A 文章編號: 1000-4440(2023)03-0732-09
Application of meteorological factor selection based on neighborhood rough set in shrimp pond water temperature prediction
HU Jing-jing1, LUO Yong-ming2, ZHANG Gang-qiang3, KUANG Zhao-min2, XIE Ying2, ZENG Xing-ji4
(1.College of Electronic Information, Guangxi Minzu University, Nanning 530006, China;2.Guangxi Zhuang Autonomous Region Institute of Meteorological Sciences, Nanning 530022, China;3.School of Artificial Intelligence, Guangxi Minzu University, Nanning 530006, China;4.Guangxi Zhuang Autonomous Region Meteorological Information Center, Nanning 530022, China)
Abstract: Based on the neighborhood rough set, the meteorological factors affecting the change of shrimp pond water temperature were selected. A model was selected to predict the water temperature of shrimp pond, which provided a scientific reference for shrimp culture to seek advantages and avoid disadvantages. Firstly, eight meteorological factors, including average temperature, highest temperature, lowest temperature, amount of precipitation, barometric pressure, two-minute wind speed, ten-minute wind speed, and instantaneous wind speed, were combined into the single hidden layer feed forward neural network (SFNN) model, Gaussian regression model, and bridge regression model to predict the water temperature of shrimp ponds. SFNN model with the best prediction effect was selected as the prediction model. Then considering the correlation, redundancy and interaction between meteorological factors and shrimp pond water temperature, the main meteorological factors affecting the shrimp pond water temperature were selected by using neighborhood rough set and entropy theory. Finally, the water temperature of the shrimp pond was predicted by using the selected meteorological factors and SFNN model. Combination of five meteorological factors selected based on neighborhood rough set, the combination of eight meteorological factors, and eight single meteorological factors were input into the SFNN model, respectively. The prediction results showed that, the combination of five meteorological factors selected by neighborhood rough set had the best prediction results, and its root mean square error, mean square error and mean absolute error were the smallest, which were 1.121 1, 1.256 9 and 0.893 8, respectively. And the determination coefficient was 0.791 6. Among single meteorological factors, atmospheric pressure predicted best on shrimp pond water temperature. Therefore, the combination of five meteorological factors selected based on the neighborhood rough set had the best prediction in shrimp pond water temperature by the SFNN model. This method had practical value in seeking advantages and avoiding disadvantages, and disaster prevention and reduction in prawn breeding.
Key words: shrimp pond water temperature;meteorological factors;neighborhood rough set;single hidden layer feed forward neural network (SFNN) model
近年來,廣西水產養殖面積不斷增大,南美白對蝦因其個體大、生長快、營養需求低、抗病能力強等優點[1],已經成為廣西對蝦養殖的一個主要養殖品種,并成為養殖戶收入增長的主要來源。南美白對蝦又名凡納濱對蝦(簡稱:對蝦),其生長發育與蝦塘的水環境密切相關[2],其中水溫起伏變化直接影響其生長發育,或引發疾病,甚至導致死亡。由于廣西南美白對蝦基本是露天海水養殖,觀測水溫儀器易被腐蝕,成本高,無法在生產中大量應用。然而,蝦塘水溫與氣象條件息息相關[3-4]。因此,構建蝦塘水溫預測模型,通過氣象因子實現水溫預測,應用于生產,對廣西南美白對蝦養殖趨利避害、防災減災具有重要的現實意義。國內外關于水溫預測研究多集中在海水[5-6]、水庫[7-8]及河流[9-10]中。鄧愛娟等[9]利用逐步回歸法對養殖魚塘水溫進行了預測。韋耀國等[10]分析了氣溫、相對濕度、地溫、太陽輻射等因素,建立了基于BP神經網絡的南水北調中線水溫預報模型。施珮等[11]基于EMD-IGA-SELM方法預測了養殖池水溫。陳英義等[12]針對池塘水溫小樣本,提出了基于GA-BP神經網絡預測養殖塘短期水溫。柳海濤等[13]根據水文與氣象數據,基于人工神經網絡建立了魚類產卵場水溫預測模型。朱森林等[14]根據高斯過程回歸建立了密蘇里河水溫預測模型。此外,還有許多學者以氣溫作為影響水溫的主要氣象因子,提出水溫預測模型[15-18]。由于粗糙集理論[19]在處理信息不確定性方面的巨大優勢,Hu等[20]將鄰域的概念引入粗糙集理論,研究并提出了鄰域粗糙集,并進行數據挖掘,近年來在群體決策[21]、屬性選擇[22-23]、不確定性推理[24]等領域得到了成功應用。同時,結合鄰域粗糙集與熵理論的屬性選擇方法在信息熵[25],條件信息熵[26]、互信息[27]和自信息[28]等方面都取得了顯著進展。前人在利用氣象因子預測水溫方面已經開展了大量有價值的研究,但現有蝦塘水溫預測模型沒有充分考慮氣象因子之間相互作用對蝦塘水溫變化的影響,且缺乏對氣象因子進行選擇的有效工具。為了彌補這一方面研究的缺失,鄰域粗糙集能有效刻畫影響蝦塘水溫變化的關鍵氣象因子,為氣象因子選擇提供了新的視角。本文選取了平均氣溫、最高氣溫、最低氣溫、降水量、氣壓、2 min風速、10 min風速和瞬時風速共8個氣象因子,度量各個氣象因子對蝦塘水溫變化的不確定性,對8個氣象因子進行選擇,得到影響蝦塘水溫預測的關鍵氣象因子,分析其對蝦塘水溫的預測效果,實現蝦塘水溫預測功能,為南美白對蝦養殖過程中趨利避害提供科學參考。
1 材料和方法
1.1 研究區域
廣西北部灣沿海地處亞熱帶季風氣候區,氣候溫和,降水充沛,具有得天獨厚地理優勢,是農業農村部指定的重點南美白對蝦產業帶,2020年廣西南美白對蝦產量3.3×105 t,占中國總產量27.67%,產量排名中國第2。
1.2 數據來源與試驗環境
選取廣西欽州市犀牛腳鎮沙角村的一個露天南美白對蝦養殖水塘作為水溫數據的采集點(東經108.84°,北緯21.65°),采集點位于廣西南美白對蝦產區較中心位置。采用美國YSI ProDSS多參數水質分析儀,每隔1 min采集水溫、pH值、溶解氧等數據,共采集數據61 676條。采集時間:2021年10月13日至11月25日,采集數據期間有3次明顯降溫過程。借鑒前人研究經驗[3-4,18],選取平均氣溫、最高氣溫、最低氣溫、降水量、氣壓、2 min風速、10 min風速和瞬時風速共8個氣象因子作為影響蝦塘水溫的因素,其中氣象數據來自離觀測點最近的合浦西場國家自動氣象觀測站,東經108.95°,北緯21.14°,觀測得到的8個氣象因子的小時數據共1 004條。根據時間,將蝦塘觀測的水溫與氣象數據匹配成小時數據樣本集。
本研究使用深度學習框架Tensorflow2.0和Python3.6搭建試驗環境。試驗數據集在所有模型中劃分為訓練集和測試集,劃分比例為9∶1,以1 h為單位的100條測試數據來預測蝦塘水溫的每小時變化。
1.3 數據預處理
采用美國YSI ProDSS多參數水質分析儀采集水溫數據,試驗過程中,儀器運行相當穩定,無缺失值和異常值;采用的氣象觀測站數據屬于氣象業務數據,質量穩定可靠,8個氣象因子數據僅存在極少的缺失值,針對個別缺失的氣象小時數據,在數據樣本集中進行了刪除。為了減少不同維度數據之間由于量綱造成的差異,加速模型擬合速度,使用最大最小歸一化方法將數據映射到[0,1]范圍內。歸一化公式如下:
其中,xnew為歸一化后的值,xmin為最小值,xmax為最大值。
1.4 模型構建
1.4.1 單隱層前饋神經網絡 單隱層前饋神經網絡(Single hidden layer feedforward neural network, SFNN)模型[29]是神經網絡模型中最簡單的拓撲結構,由輸入層、隱藏層和輸出層構成。由圖1可知SFNN的拓撲結構:其各神經元分層排列,每個神經元與前一層的神經元相連,接受前一層的輸出,并輸出給下一層。神經網絡的能力主要取決于隱藏層,包括隱藏層節點數和所使用的激活函數類型。其核心原理是通過激活函數將輸入層數據進行非線性組合生成非線性決策邊界,從而提高網絡的學習能力。
2 結果
2.1 SFNN模型預測結果
為了分析不同模型對蝦塘水溫預測的效果,將8個氣象因子組合作為高斯回歸模型、SFNN模型和嶺回歸模型的輸入,進行蝦塘水溫預測。結果由表1和圖3可知,SFNN模型預測效果最好,RMSE、MSE和MAE最小,分別為1.326 1、1.758 6和1.028 8;決定系數(R2)最大為0.708 4,比高斯回歸模型和嶺回歸模型分別高出0.314 2和0.258 6。整體來看,SFNN模型預測蝦塘水溫效果好于其他兩種預測模型。因此,本試驗選擇SFNN模型作為蝦塘水溫預測模型。
2.2 不同氣象單因子預測效果分析
為了探究利用氣象單因子預測蝦塘水溫的效果,將氣象單因子:平均氣溫、最高氣溫、最低氣溫、降水量、氣壓、2 min風速、10 min風速和瞬時風速等分別輸入SFNN模型對蝦塘水溫進行預測。氣象單因子對蝦塘水溫預測結果誤差見表2所示,其中,利用氣壓預測蝦塘水溫與實測蝦塘水溫變化趨勢擬合度較好,詳見圖4e,RMSE和MSE最小,分別為1.868 6和3.491 8;利用最高氣溫、最低氣溫和平均氣溫預測蝦塘水溫的效果次之,詳見圖4a~圖4c,處在同一水平;利用2 min風速、10 min風速和瞬時風速預測效果較差,詳見圖4f、圖4g和圖4h,處于同一水平;降水量對蝦塘水溫預測效果最差,詳見圖4d,在57~60 h時段內,降水量對蝦塘水溫預測效果波動較大,其余時段基本保持平穩,RMSE、MSE和MAE最大,分別為3.086 7、9.528 1和2.054 7。
2.3 不同氣象因子組合預測效果分析
本研究設計的基于鄰域粗糙集的氣象因子選擇算法,充分考慮了氣象因子與蝦塘水溫的相關性、冗余性和交互性,選擇的氣象因子組合為最低氣溫、最高氣溫、氣壓、降水量和10 min風速等5個氣象因子,從表2和圖5可知,同樣是用SFNN模型對蝦塘水溫進行預測,選擇的5個氣象因子組合預測效果最好,比8個氣象因子組合預測誤差都小,RMSE、MSE和MAE分別小了0.201 9、0.493 4和0.135 9。
另外,8個氣象因子組合預測效果又好于氣象單因子的預測效果。從RMSE、MSE和MAE上看,降水量和10 min風速分別作為氣象單因子預測水溫的效果并不理想,但是在選擇的5個氣象因子組合中,降水量和10 min風速與其他氣象因子相互作用后,表現出了良好的預測效果,這充分證明了氣象因子之間相互作用對蝦塘水溫預測是有影響的。
3 討論
鄧愛娟等[9]使用逐步回歸法建立了洪湖地區春夏季魚塘水溫預報,研究水溫與氣溫的相關性,分析了水溫與當日以及前1~3 d的氣溫關系顯著,選取當日、前1~3 d氣象因子平均氣溫、最高氣溫和最低氣溫作為水溫的影響因子,模型預測效果在5月較好,7月較差。朱森林等[14]利用機器學習高斯回歸建立了密蘇里河水溫-氣溫模型,并與線性、非線性和隨機回歸模型進行了比較,論證了隨機回歸模型的精度高于線性和非線性模型;受水庫調節溫度的影響,水溫-氣溫模型在3個站點的預測精度并不都是較高的。楊青青等[18]采用多元線性回歸法建立稻蝦種養模式的蝦溝水溫預報模型,以平均氣溫、平均水溫以及遷移1 d平均氣溫為預測因子,構建了日平均水溫、日最高水溫、日最低水溫預報模型,水溫模型預測精度較高,由于在篩選與水溫相關要素時主要集中在氣溫,范圍較小,僅通過相關分析無法準確判斷出氣溫對蝦塘水溫變化的真實影響。以上研究都是基于氣象因子的日數據。
本研究借鑒各領域專家經驗[20,27,33-36],選取8個氣象因子(小時數據)作為影響蝦塘水溫的氣象因子,充分考慮氣象因子與蝦塘水溫之間的相關性、冗余性和交互性,基于鄰域粗糙集和熵理論,引入鄰域互信息和條件互信息度量了它們之間的不確定性,并利用構建的評價函數得到影響蝦塘水溫的氣象因子組合。從原來的8個氣象因子中得到5個氣象因子組合,即最低氣溫、10 min風速、氣壓、降水量、最高氣溫。通過對測試集均方根誤差、均方誤差、平均絕對誤差的綜合分析,一方面論證了氣象因子與蝦塘水溫之間存在相關性、冗余性和交互性;另一方面也表明了基于鄰域粗糙集的氣象因子選擇的有效性。本試驗獲得了SFNN模型、高斯回歸模型、嶺回歸模型預測蝦塘水溫的效果。它們的預測由好到差排序為:SFNN模型、嶺回歸模型和高斯回歸模型。本研究從氣象因子對蝦塘水溫影響的角度出發,預測了蝦塘水溫的變化,但在實際生產中,除了本研究討論的氣象因子,可能還有其他因素對蝦塘水溫預測產生影響。在之后的工作中,將進一步考慮其他有關因素的影響,以進一步提高蝦塘水溫預測效果。
4 結論
本研究基于鄰域粗糙集構造了蝦塘水溫預測模型,該模型考慮了氣象因子之間的相互作用對蝦塘水溫變化的影響。結果表明:
(1)將8個氣象因子組合作為SFNN模型、高斯回歸模型和嶺回歸模型的輸入,進行蝦塘水溫預測。結果是SFNN模型預測效果最好,RMSE、MSE和MAE誤差最小,分別為1.326 1、1.758 6和1.028 8;決定系數(R2)最大為0.708 4。
(2)不同氣象單因子對蝦塘水溫預測結果表明:氣壓對蝦塘水溫的預測效果較好,預測誤差RMSE和MSE最小,分別為1.868 6和3.491 8。降水量和10 min風速分別作為氣象單因子預測蝦塘水溫的效果并不理想,但是在選出的5個氣象因子組合中與其他氣象因子相互作用后,表現出了良好的預測效果。
(3)將5個氣象因子組合(最低氣溫、最高氣溫、氣壓、降水量、10 min風速)輸入SFNN模型進行蝦塘水溫預測,比8個氣象因子組合的預測效果要好,預測誤差RMSE、MSE和MAE最小分別為1.121 1、1.256 9和0.893 8,決定系數(R2)最大為0.791 6。因此,在南美白對蝦養殖中,基于鄰域粗糙集選擇的5個氣象因子組合,利用SFNN模型進行蝦塘水溫預測的技術具有很好的應用前景。
參考文獻:
[1] 陳美佳,孔 杰,譚 建,等. 凡納濱對蝦育種基礎群體收獲體重的未知親本組效應分析[J]. 中國水產科學, 2021, 28(7): 863-870.
[2] 張志東,陳愛華,吳楊平,等. 不同飼料投喂模式對脊尾白蝦生長、消化酶、體成分及養殖水環境的影響[J]. 中國水產科學, 2020, 27(9): 1075-1084.
[3] 農成萬,張 幸,李斌喜,等. 欽州對蝦養殖災害性天氣分析和氣象服務要領[J]. 氣象研究與應用, 2013, 34(1): 60-63.
[4] 王立超,申子彬,周溥佳. 南美白對蝦養殖氣象指數預報方法[J]. 浙江農業科學, 2017, 58(7): 1254-1256.
[5] 楊 棟,姚日升,金志鳳,等. 不同類型海水養殖水體溫度日變化諧波分析[J]. 中國農業氣象, 2017, 38(9): 558-566.
[6] 吳迪生,張 娟,劉增宏,等. 赤道西太平洋暖池次表層水溫與熱帶氣旋的關系[J]. 熱帶氣象學報, 2010, 26(2): 242-249.
[7] 葉 舟,龔夢園. 基于下游生境水溫需求的水庫分層取水調度研究[J]. 人民長江, 2022,53(6): 105-110.
[8] 劉杏紅,韓云童,常曉林,等. 考慮淤沙影響的高拱壩水庫水溫數值分析[J]. 水利學報, 2010, 31(2): 6-8.
[9] 鄧愛娟,劉 敏,劉志雄,等. 洪湖地區養殖魚塘春夏季水溫變化及預報研究[J]. 中國農學通報, 2013, 29(29): 61-68.
[10]韋耀國,趙海鏡,楊國華,等. 神經網絡在南水北調中線冬季水溫預測中的應用[J]. 水利水電技術(中英文), 2021, 52(S2): 335-338.
[11]施 珮,袁永明,匡 亮,等. 基于EMD-IGA-SELM的池塘養殖水溫預測方法[J]. 農業機械學報, 2018, 49(11): 312-319.
[12]陳英義,程倩倩,成艷君,等. 基于GA-BP神經網絡的池塘養殖水溫短期預測系統[J]. 農業機械學報, 2017, 48(8): 172-178.
[13]柳海濤,孫雙科,鄭鐵剛,等. 水電站下游魚類產卵場水溫的人工神經網絡預報模型[J].農業工程學報, 2018, 34(4): 185-191.
[14]朱森林,吳時強. 高斯過程回歸模型在河流水溫模擬中的應用[J]. 華中科技大學學報(自然科學版), 2018, 46(10): 122-126.
[15]程海燕,脫友才,許維忠,等. 氣候變暖對穩定分層型供水水庫水溫影響研究[J]. 人民長江, 2022,53(10):22-30.
[16]楊開林. 冰期明渠水溫模型[J]. 水利學報, 2022, 53(1): 20-30.
[17]鄒 琳,劉 偉,蔣定國. 基于數值方法的大型水庫水溫結構影響因素分析[J]. 中國農村水利水電, 2022(9): 113-119.
[18]楊青青,曾 月,鄧艷君, 等. 稻蝦共作模式蝦溝水溫預報模型研究[J]. 江蘇農業科學, 2021, 49(5): 194-199.
[19]PAWLAK Z. Vagueness and uncertainty: A rough set perspective[J]. Computational Intelligence, 1995, 11(2): 227-232.
[20]HU Q H, YU D, LIU J F, et al. Neighborhood rough set based heterogeneous feature subset selection[J]. Information Sciences, 2008, 178(18): 3577-3594.
[21]SUN B Z, MA W M, XIAO X. Three-way group decision making based on multigranulation fuzzy decision-theoretic rough set over two universes[J]. International Journal of Approximate Reasoning, 2017, 81: 87-102.
[22]DONG L J, CHEN D G, WANG N L, et al. Key energy-consumption feature selection of thermal power systems based on robust attribute reduction with rough sets[J]. Information Sciences, 2020, 532: 61-71.
[23]ZHANG P F, LI T R, WANG G Q, et al. Multi-source information fusion based on rough set theory: A review[J]. Information Fusion, 2021, 68: 85-117.
[24]ZHANG X Y, YAO H, LU Z Y, et al. Class-specific information measures and attribute reducts for hierarchy and systematicness[J]. Information Sciences, 2021, 563: 196-225.
[25]CHEN H M, LI T R, FAN X, et al. Feature selection for imbalanced data based on neighborhood rough sets[J]. Information Sciences, 2019, 483: 1-20.
[26]DAI J H, WANG W T, XU Q. An uncertainty measure for incomplete decision tables and its applications[J]. IEEE Transactions on Cybernetics, 2012, 43(4): 1277-1289.
[27]WAN J H, CHEN H M, ZHONG Y, et al. A novel hybrid feature selection method considering feature interaction in neighborhood rough set[J]. Knowledge-Based Systems, 2021, 227: 107167.
[28]WANG C Z, HUANG Y, SHAO M W, et al. Feature selection based on neighborhood self-information[J]. IEEE Transactions on Cybernetics, 2019, 50(9): 4031-4042.
[29]SUGANTHAN P N, KATUWAL R. On the origins of randomization-based feedforward neural networks[J]. Applied Soft Computing, 2021, 105: 107239.
[30]李亞茹,張宇來,王佳晨. 面向超參數估計的貝葉斯優化方法綜述[J].計算機科學,2022,49(S1):86-92.
[31]張慧春,張 萌,邊黎明,等. 基于YOLO v5的植物葉綠素含量估測與可視化技術[J]. 農業機械學報, 2022, 53(4): 313-321.
[32]YUAN Z, CHEN H M, ZHANG P F, et al. A novel unsupervised approach to heterogeneous feature selection based on fuzzy mutual information[J]. IEEE Transactions on Fuzzy Systems, 2021,39(9) 3395-3409.
[33]施 珮,袁永明,匡 亮,等. 基于GA-SELM算法的工廠化水產養殖水溫預測方法研究[J]. 傳感技術學報, 2018, 31(10): 1592-1597,1612.
[34]任 妮,鮑 彤,劉 楊,等. 基于粒子群優化算法和長短時記憶神經網絡的蟹塘溶解氧預測[J]. 江蘇農業學報, 2021, 37(2): 426-434.
[35]李祥銅,曹 亮,李湘麗,等. 基于WTD-LSTM的對蝦養殖水溫組合預測模型[J]. 廣東農業科學, 2021, 48(2): 153-160.
[36]袁紅春,王 敏,劉 慧,等. 基于特征交互與卷積網絡的漁場預測模型[J]. 江蘇農業學報, 2021, 37(6): 1501-1509.
(責任編輯:成紓寒)
收稿日期:2022-07-21
基金項目:廣西壯族自治區自然科學基金項目(2 ̄0 ̄2 ̄0 ̄G ̄X ̄N ̄S ̄F ̄A ̄A ̄2 ̄38046);廣西壯族自治區氣象局氣象科研計劃重點項目(桂氣科2020Z03);廣西民族大學軟件工程重點實驗室項目(2022-18XJSY-03)
作者簡介:胡晶晶(1996-),女,江蘇淮安人,碩士研究生,主要從事粗糙集理論、數據挖掘與知識發現研究。(E-mail)jingjinghu_star304@163.com
通訊作者:羅永明,(E-mail) mingyongluo858@163.com