




摘 要 水質環境對對蝦的健康生長具有重要影響,然而傳統蝦養殖技術在水質控制方面存在能力不足的問題,導致疾病傳播風險較高?;诖?,提出一種基于大數據挖掘的對蝦養殖水質預測系統,并通過對廣東省湛江市某對蝦養殖基地的水質數據進行深入分析,提出基于小波閾值降噪(Wavelet Threshold Denoising,WTD)和支持向量回歸(Support Vector Regression,SVR)的水質預測模型,對對蝦養殖水質數據進行預測。結果表明,WTD-SVR模型在準確預測水質參數方面具有良好的效果。
關鍵詞 對蝦養殖;水質預測;小波閾值降噪(WTD);支持向量回歸(SVR)
中圖分類號:S968.22 文獻標志碼:A DOI:10.19415/j.cnki.1673-890x.2024.17.057
對蝦養殖業是我國海水養殖的支柱產業。隨著國內沿海城市廣泛養殖對蝦,對蝦養殖業已成為我國養殖業中發展最快的產業之一,對蝦因含有豐富的優質蛋白而深受廣大消費者的喜愛。對蝦養殖的水質環境是影響對蝦健康生長的重要因素之一,不同養殖階段對蝦所需要的溫度、溶解氧及pH值等水質指標范圍均不同。如果對蝦養殖水質環境調整不當,將導致病害產生,影響對蝦的食用安全性[1-2]。因此,為降低病害發生率,確保對蝦食用安全,實時監測對蝦養殖水質環境至關重要[3]。
傳統的對蝦養殖水質環境監測方式主要依賴人工定期抽樣檢測,水質控制能力較弱,難以做到實時監控和及時規避疾病傳播風險,且伴隨著高昂的人工成本[4]。近年來,準確、實時、高效的對蝦養殖監測方式更受青睞。隨著數字化智能化的時代發展趨勢,此次研究提出一個基于大數據挖掘的對蝦養殖水質預測系統,用于實現對蝦養殖水質環境的實時監控,以針對性調控水質環境,進一步提升對蝦養殖的存活率。該系統將助力傳統人工對蝦養殖技術向數字信息化方向發展,結合大數據挖掘技術與人工智能技術,收集并分析養殖水質的相關數據,包括溫度、溶解氧和pH值等因素。通過建立預測模型和算法,系統可以實時監測和預測對蝦養殖水質的變化趨勢,為養殖人員提供數據分析和決策支持,進一步實現對蝦養殖產量增收,對推動我國對蝦養殖數字化管理具有指導意義[5]。
1" 系統設計
系統主要由數據自動采集模塊、數據管理模塊、水質預測模塊和系統可視化模塊構成,系統功能架構圖如圖1所示。系統采用瀏覽器/服務器(Browser/Server,B/S)結構,遵循低耦合高內聚的軟件設計和架構原則,基于Spring Boot框架進行系統開發,前端開發選擇CSS、HTML等語言及ECharts可視化庫,以實現用戶可視化界面,從而提供水質預測數據供用戶參考。
1)數據自動采集模塊。此次研究使用的水質數據來源于廣東省湛江市某對蝦養殖基地的物聯網技術水質監測平臺。通過在養殖池中部署的多種水下傳感器和監測設備,每隔10 min自動在線采集一次對蝦養殖水體中的關鍵參數,包括溫度、pH值、濁度、溶解氧和氨氮含量等。以2022年8月25日至9月26日自動在線采集的4 472個樣本作為研究的數據源。
2)數據管理模塊。MySQL數據庫擁有較高的擴展性及較強的實時數據處理能力。系統主要采用MySQL數據庫存放以下4類數據:數據自動采集模塊所采集的實時數據,包括溫度、溶解氧、鹽度、pH值等水質數據;系統錄入的對蝦養殖池號、對蝦種類、養殖數量、養殖階段等相關數據;對蝦在不同生長時期的各種水質環境指標安全閾值;通過網絡爬蟲技術在對蝦養殖技術網站爬取的對蝦養殖防治技術等相關數據,以便后續進行數據處理及分析。
3)水質預測模塊。該模塊主要利用數據挖掘算法構建對蝦養殖水質預測模型,將數據自動采集模塊中得到的原始水質數據進行預處理后,采用基于小波閾值降噪(Wavelet Threshold Denoising,WTD)和支持向量回歸(Support Vector Regression,SVR)的WTD-SVR預測模型對水質關鍵指標的未來變化趨勢進行預測,有助于提前預測養殖水質可能出現的問題,從而預警養殖人員提前干預,確保養殖環境穩定和對蝦健康生長。
4)系統可視化模塊。該模塊利用已建立的水質預測模型對養殖水質進行實時預測與分析。該模塊可記錄水質監測數據,為養殖人員提供參考,有助于開展長期水質趨勢的分析與評估。其主要功能是將預測結果通過圖表和趨勢圖等可視化方式展示給養殖人員,進一步生成水質分析報告,同時可在對蝦養殖水質數據超過指定安全閾值時,發出預警通知和提供對應防治方案。此外,養殖人員可通過用戶界面可查看水質實時情況、歷史參數變化趨勢和針對性的防治方案,以便于及時采取相應措施,確保養殖水質環境健康良好。
系統可視化模塊中的水質預警功能具體如下。用戶在設定好水質指標安全閾值后,系統即可在監測到異常水質參數時在界面中向養殖人員發出預警通知,并提供特定養殖階段適宜的水質參數范圍、常見問題解決方案和水質調節方法等專業信息。養殖人員可根據系統提供的建議及時采取有效措施,防止水質惡化,從而避免對蝦發生病害等。
2" WTD-SVR水質預測模型建立
由于獲取的參數之間存在比較復雜的非線性關系,如溫度、pH值等參數與水質指標之間的關系。SVR通過使用核函數可處理非線性問題,能捕捉到更為復雜的模式和關系,同時在數據中存在異常值或噪聲的情況下,SVR模型表現良好,十分適用于解決對蝦養殖水質參數監測問題[6]。因此,此次研究采用WTD-SVR的組合模型對對蝦養殖水質參數進行回歸預測,預測流程如圖2所示。
鑒于水下傳感設備可能存在故障及傳輸信號干擾等因素的影響,所獲取的數據中不可避免地包含異常值和缺失值。而SVR模型對于數據噪聲較為敏感,因此研究通過數據預處理篩選出異常值,并利用相鄰值的平均值替換缺失值和異常值。在此基礎上,采用小波閾值降噪方法,在保留數據主要特征的同時,降低數據噪聲對模型性能產生的影響[7]。WTD過程具體分為小波分解、閾值處理和小波重構3個步驟。先選用小波函數對預處理后的數據進行小波分解,得到各層的小波系數;選擇軟閾值函數對數據進行去噪;根據前面多層的高頻系數和最底層的低頻系數進行小波重構,最后生成降噪后的數據[8]。
為提升模型泛化能力并縮短訓練時間,此次研究將數據進行歸一化處理,使其統一映射范圍在[0,1][9]。隨機設置數據集的80%作為訓練集,20%作為測試集。核函數選擇適用于擬合此次研究中非線性數據的高斯徑向核函數(Radial Basis Function,RBF),RBF核函數包含2個重要的依賴參數,分別為核參數gamma(g)與懲罰系數cost(c)[10]。其中,c表示對誤差值的容忍度,若c值過大易導致過擬合,若c值過小則易出現欠擬合。而g值越大支持向量越少,g值越小支持向量越多,易影響模型的訓練與預測時長。為獲取最有利于水質環境檢測的依賴參數,采用交叉驗證尋找c和g的最優參數組合。然后,通過SVR模型對測試集數據進行預測,將預測所得數據進行反歸一化處理,并計算模型評價指標以評估預測效果。
為評估模型預測性能,此次研究選取決定系數R2、平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Squared Error,RMSE)作為衡量模型預測準確性的關鍵指標。其中,R2用于評估模型的擬合程度,具體公式如(1)所示,其取值范圍在0~1,R2越接近1,說明模型擬合效果越好。MAE與RMSE的數值可反映模型誤差程度,其值越小表示模型預測的精確度越高,具體表達式為
[R2=1-iyi-yi2iyi-yi2]" " "(1)
[EMAE=1mi=1myi-yi]" " (2)
[ERMSE=1mi=1myi-yi2]" " " "(3)
式中:m表示樣本點數量;[yi]表示第i個樣本的真實值;[yi]表示第i個樣本的模型預測值;[y]表示真實值的平均值。
為驗證WTD-SVR水質預測模型的預測性能,將WTD降噪前的水質數據進行SVR預測,并比較了2種預測方法在測試集數據上所得的評價指標,結果如表1所示。由表1可知,WTD-SVR模型的EMAE和ERMSE相較于SVR模型分別降低了44.61%和40.28%,而R2提高了7.35%,表明建立的WTD-SVR模型在預測精度上優于SVR模型,能夠有效消除噪聲對數據產生的影響,對蝦養殖水質預測效果顯著提升。
3" 結論與展望
對蝦水質參數是影響對蝦養殖的重要因子,此次研究利用WTD-SVR模型預測對蝦水質數據未來變化趨勢,構建了基于大數據挖掘技術的對蝦養殖水質預測系統,為對蝦養殖人員實時監測預警水質狀態,從而實現對水質數據的動態分析,以及及時預防和解決水質惡化問題。在后續的研究中,仍需要繼續提升預測模型的精確度和健壯性,并進一步優化系統功能。例如,在水質預警模塊中增設增氧決策功能,在對蝦養殖池中安裝增氧設備,一旦水質超出安全范圍,養殖人員可通過系統及時啟動增氧設備。這一舉措將滿足養殖人員的需求,有助于推動人工智能技術在水產養殖領域的推廣應用。
參考文獻:
[1] 高鳳強,紀藝娟,陳俊仁.基于物聯網的對蝦養殖監測預警研究[J].電子器件,2021,44(3):753-760.
[2] 段青玲,劉怡然,張璐,等.水產養殖大數據技術研究進展與發展趨勢分析[J].農業機械學報,2018,49(6):1-16.
[3] 丁向美,董靜霆.基于物聯網的水產養殖智能監測系統研究[J].物聯網技術,2023,13(5):22-24.
[4] 代成,袁躍峰,沈健,等.大數據水產養殖監測系統研究[J].農村經濟與科技,2021,32(1):44-47.
[5] 李道亮,劉暢.人工智能在水產養殖中研究應用分析與未來展望[J].智慧農業(中英文),2020,2(3):1-20.
[6] 陳榮,梁昌勇,謝福偉.基于SVR的非線性時間序列預測方法應用綜述[J].合肥工業大學學報(自然科學版),2013,36(3):369-374.
[7] 劉潔,陳劼,韓冰,等.基于改進小波閾值去噪的深度學習水下目標分類[J].聲學技術,2023,42(1):25-33.
[8] 李曉梅,楊健浩,李俐,等.基于多維數據的WTD-GA-BP海參養殖水溫預測[J].河南師范大學學報(自然科學版),2023,51(6):30-38.
[9] 張啟宇,李興佐,劉峰,等.海參育苗水質預測預警系統的研究[J].江蘇農業科學,2018,46(2):166-169.
[10] 孟滔.改進粒子群算法優化SVR水質預測模型研究[J].農業與技術,2021,41(3):33-36.
(責任編輯:劉寧寧)
基金項目:廣東白云學院校級科研項目(2022BYKY10);廣東省教育廳創新強校工程青年創新人才項目(2018KQNCX296);廣州市科技計劃項目(202002030230)。
作者簡介:鄭祉盈(1995—),碩士,助教,研究方向為人工智能。
*為通信作者,E-mail:670680274@qq.com。