張啟宇, 李興佐, 劉 峰, 陳英義, 呂冬偉, 李永芹
(1.中國農業大學煙臺研究院,山東煙臺 2647670;2.中國農業大學信息與電氣工程學院,北京 100083)
海參肉質酥脆、滑潤,高蛋白質,低脂肪,營養豐富,味道鮮美,是“海味八珍”之一的佳肴和滋補保健品,素有“滋補靠海參、搶救靠人參”的說法[1]。海參種類較多,其中刺參的營養價值和經濟價值最高[2]。山東和遼寧兩省大力發展刺參養殖業,短短幾年內已成為我國北方沿海水產養殖的重要新興產業之一,取得了巨大的經濟效益和社會效益[3]。2014年,我國養殖海參產量200 969 t,比2013年增長3.75%,海參養殖面積214 180 hm2,比2013年降低0.36%,培育海參苗種745.55億頭,比2013年增長1.05%[4]。海參苗種質量的優劣,決定海參的生長速度和產量的高低,影響海參的經濟效益。因此,要提高海參的產量和質量,參苗的培育顯得非常重要[5]。海參育苗需要一個特定適宜的環境,以刺參為例,一般來說溶解氧含量≥6 mg/L、溫度22~24 ℃、pH值8.1~8.3、鹽度3.0%~3.3%為最適宜,但不同地區也存在一定差異。海參育苗期間,溶解氧、溫度、pH值、鹽度最理想狀態是在適宜范圍內,若超出范圍過大,會影響其生長發育,甚至造成死亡。因此,準確預測預警溶解氧含量、溫度、pH值、鹽度具有重要意義,可以保證海參苗種健康成長。本研究以刺參為研究對象,探究海參育苗水質預測預警系統。
目前,常用的水質預測方法有水質模擬法、專家評估法、基于數理統計的多元回歸法、灰色理論法等[6],這些方法適合大樣本、低維數的數據預測,但對非線性、小樣本、高維數等特點的數據預測效果不理想。神經網絡法能夠解決非線性預測問題,但存在易陷于局部最優值、過學習、不適合高維數等缺陷,制約了其發展[7-8]。支持向量機(support vector machines,SVM)由Vapnik和Corinna Cortes等于1995年首次提出,SVM在解決非線性、小樣本及高維數識別中表現出很多特有的優勢,并且可以推廣到函數擬合等其他機器學習問題中[9]。SVM被應用于文本識別[10]、手寫字體識別[11]、人臉圖像識別[12]、基因分類[13]及時間序列預測[14]等領域,并取得了很好效果。因此,本研究采用支持向量機方法進行溶解氧含量、溫度、pH值、鹽度的預測。
基于SVM的水質預測模型的流程見圖1[15]。

1.2.1 數據 以蓬萊市老參灣科技有限公司育苗場某育苗池水質為研究對象,采用在線監控系統獲取海參育苗養殖水質因子數據。在線監控系統每間隔10 min對溶解氧含量、溫度、pH值、鹽度等海參育苗養殖水質因子數據在線采樣1次,以2015年4月26日至6月3日在線采集的5 411個樣本數據作為研究的數據源,即5 411×4的矩陣。利用SVM建立的回歸模型對上述數據進行回歸擬合。
由于數據是連續在線采樣獲取的,因此假設下一次采樣獲取的數據與之前采樣的全部數據是相關,即把下一次采樣獲取的數據作為因變量,之前采樣的全部數據作為自變量。通過對自變量建立模型來對因變量進行預測。
1.2.2 數據歸一化 為提高模型的泛化能力、減少程序訓練的時間,在用SVM建模時,對數據進行歸一化處理[16],即將自變量和因變量的取值范圍變換為[1,2]區間。 歸一化公式[15]為:
Y=(Ymax-Ymin)×(X-Xmin)/(Xmax-Xmin)+Ymin。
(1)
式中:Xmin和Xmax分別是原始數據X的最小值和最大值;Ymin和Ymax是映射的范圍參數。
[1,2]歸一化就是把Ymin置為1,把Ymax置為2。
1.2.3 選擇最佳參數c和g關于SVM參數c和g的優化選取,目前沒有一個公認統一最好的方法,常用方法是讓c和g在一定范圍內取值,對于取定的c和g,把訓練集作為原始數據集并利用交叉驗證方法(K-CV方法)得到在此組c和g下訓練集驗證擬合準確率,最終取使訓練集驗證擬合準確率最高組的c和g作為最佳參數[15]。核函數選擇徑向基函數。
1.2.4 訓練與回歸預測 以溶解氧含量為例進行訓練和回歸預測,溫度、pH值、鹽度的預測過程與之類似。
設S為自變量,V為因變量。對于5 411×4的數據矩陣,V的取值范圍為(m×4的矩陣)~(n×4的矩陣),S的取值范圍為[(m-1)×4的矩陣]~[(n-1)×4的矩陣],其中 2≤m (2) R2[18]的計算公式為: (3) 由表1可知,當n≥1 500時,MSE和R2的綜合表現很好,相互之間的差異不明顯;當n=3 000時,MSE最小,即誤差最小;當n=5 000,R2最大,即擬合最好;當n=10時,MSE最大,R2最小,回歸預測效果不是很好。但由圖2可知,預測值和真實值之間的差值在0.2之內,所以SVM模型對小樣本數據有著很好的預測效果。隨著n的增大,預測效果還是很理想的。但并不是隨著n的增大,效果就一定很好。在實際應用時,可以靈活選擇n的大小。若采樣的數據量<10時,n=采樣到的數據數量;若監測的數據量<100時,n=10,即最新的10個數據;若監測的數據量<1 500時,n=100,即最新的100個數據;若監測的數據量>1 500時,n=1 500,即最新的1 500個數據。這樣既能保證精確度,又能保證運算效率。或者為了提高運算速度,若采樣的數據量<10時,n=采樣到的數據數量;若監測的數據量<100時,n=10,即最新的10個數據;若采樣的數據量>100,n=100,即最新的100個數據。100個數據的計算量要少于1 500個的,但精度有欠缺。 預警一般要經過確定警情、尋找警源、分析警兆、預報警度、排除警患5個過程[19]。 表1 不同樣本大小的SVM模型的預測結果 2.1.1 確定警情 警情是指事物發展過程中出現的極不正常的情況,也就是已經出現或將來可能出現的問題,明確警情是預警的前提[17]。海參育苗期的水質預警的警情為溶解氧含量、溫度、pH值、鹽度。 2.1.2 尋找警源 警源就是警情出現的源頭或者原因。尋找警源就是要找出是什么原因產生的警情。 2.1.3 分析警兆 預警的關鍵是分析警兆。警情產生于警源,警源只有經過一定的量變與質變過程,才能導致警情的暴發[17]。 2.1.4 預報警度 警度的劃分需要根據具體情況來確定。通常把警度劃分為4個等級即輕警、中警、重警和巨警,也可以劃分為3個等級即輕警、中警和重警,還可以采用類似交通管制的信號燈比如綠燈、藍燈、橙燈、黃燈和紅燈等的標志來表示不同等級的警度,并根據不同信號指示采取相應的對策[20]。 2.1.5 排除警患 根據上述信息把警情排除,使海參能夠正常生長和發育。 水質預警是根據預測的溶解氧含量、溫度、pH值、鹽度來進行預警。通過調研,獲取海參育苗時生長發育最適宜的溶解氧含量、溫度、pH值、鹽度的區間范圍,并以此來確定警情、劃分警度,并進行相關值的預警。 2.2.1 水質預警模型的警度及分析 根據育苗期海參生長發育的實際情況,水質預警模型把警度劃分為無警、輕警、中警和重警4個級別,見表2。 表2 水質預警模型的警度級別 對應4個警度級別,需要相應的水質參數范圍。通過海參育苗場調研和文獻查閱,得出海參育苗期生長發育的最佳、一般、差、惡劣的水質條件,不同地區、不同狀態的區間范圍存在差異,可以根據實際情況進行設定[21-23],見表3。 表3 海參育苗期生長環境參數分析 2.2.2 水質預警模型警度判別算法 水質預警模型警度判別的算法是對當前溶解氧含量、溫度、pH值、鹽度,根據表3判斷其各自警度,再綜合4個因子的警度判定當前的警度A1;對預測的溶解氧含量、溫度、pH值、鹽度的值根據表3判斷其各自的警度,再綜合4個因子的警度判定預測警度A2;最后綜合當前的警度A1和預測警度A2,作為最終的警度A。設當前溶解氧含量、溫度、pH值、鹽度的警度分別為D、T、P、S,預測的溶解氧含量、溫度、pH值、鹽度的警度分別為D′、T′、P′、S′,無警、輕警、中警、重警的取值分別為0、1、2、3。 水質預警模型警度判別算法如下: 輸入:當前溶解氧含量、溫度、pH值、鹽度值d、t、p、s,當前溶解氧含量、溫度、pH值、鹽度值d′、t′、p′、s′。 輸出:水質預警的警度A。 過程: (1)當前溶解氧含量、溫度、pH值、鹽度根據表3判斷其各自的警度D、T、P、S; (2)預測的溶解氧含量、溫度、pH值、鹽度根據表3判斷其各自的警度D′、T′、P′、S′; (3)當前的警度A1的判定: if(D==3 |T==3 |P==3 |S==3) thenA1==3; else if ((D==2∧T==2∧P==2∧S==2) | (D==2∧T==2∧P==2) |(D==2∧T==2∧S==2)| (D==2∧P==2∧S==2) | (T==2∧P==2∧S==2)) thenA1==3; else{ i=(D+T+P+S)/4.0; i上取整; A1==i; } (4)預測的警度A2的判定: if(D′==3 |T′==3 |P′==3 |S′==3) thenA2==3; else if ((D′==2∧T′==2∧P′==2∧S′==2) | (D′==2∧T′==2∧P′==2) |(D′==2∧T′==2∧S′==2)| (D′==2∧P′==2∧S′==2) | (T′==2∧P′==2∧S′==2)) thenA2==3; else{ i=(D′+T′+P′+S′)/4.0; i上取整; A2==i; } (5)水質預警的警度A的判定: if(A1==3 |A2==3 ) thenA==3; else if (A1==2∧A2==2) thenA==3; else{ i=(A1+A2)/4.0; i上取整; A==i; } 在水質實時在線監控系統的基礎上建立水質預測模型和水質預警模型,采用C#和libsvm 3.20(支持C#的libsvm版本最高為3.20)實現。下一步的工作是在實踐應用中進行大規模測試和反饋,通過測試和反饋,進一步提高預測和預警的準確性,還要進一步提高性能和效率,使之更實用,更好地滿足海參育苗的水質預測和預警的需求,為海參育苗的生態養殖和健康養殖打下堅實的基礎。 [1]郭文場,于 艷,王守本,等. 中國的海參(1)[J]. 特種經濟動植物,2007,10(4):24-25. [2]車元忠,田春良,舒世平. 人參的親“姊妹”——海參[J]. 中國民兵,1985(11):17. [3]王印庚,榮小軍. 我國刺參養殖存在的主要問題與疾病綜合防治技術要點[J]. 齊魯漁業,2004,21(10):29-31. [4]農業部漁業漁政管理局. 2015中國漁業統計年鑒[M]. 北京:中國農業出版社,2015. [5]李曉霞. 把好海參育苗生產關[J]. 科學養魚,2013(3):44-45. [6]Dellana S, West D. Predictive modeling for wastewater applications:linear and nonlinear approaches[J]. Environmental Modelling and Software, 2009(24): 96-106. [7]Sattari M T, Yurekli K, Pal M. Performance evaluation of artificial neural network approaches in forecasting reservoir inflow[J]. Applied Mathematical Modelling, 2012, 36(6): 2649-2657. [8]Nieto P, Torres J M, Fernández M A, et al. Support vector machines and neural networks used to evaluate paper manufactured using Eucalyptus globulus[J]. Applied Mathematical Modelling, 2012, 36(12): 6137-6145. [9]Yu P S, Chen S T, Chang I F. Support vector regression for real-time flood stage forecasting[J]. Journal of Hydrology, 2006, 328(3/4): 704-716. [10]劉曉亮,丁世飛. SVM用于文本分類的適用性[J]. 計算機工程與科學,2010,32(6):106-108. [11]林開標,王周敬. 基于支持向量機的傳真收件人識別方法[J]. 計算機工程與應用,2006,42(7):156-158. [12]謝塞琴,沈福明,邱雪娜. 基于支持向量機的人臉識別方法[J]. 計算機工程,2009,35(16):186-188. [13]李穎新,阮曉鋼. 基于支持向量機的腫瘤分類特征基因選取[J]. 計算機研究與發展,2005,42(10):1796-1801. [14]高 偉,王 寧. 淺海混響時間序列的支持向量機預測[J]. 計算機工程,2008,34(6):25-27. [15]王小川,史 峰,郁 磊,等. MATLAB神經網絡43個案例分析[M]. 北京:北京航空航天大學出版社,2013. [16]楊錫運,孫寶君,張新房,等. 基于相似數據的支持向量機短期風速預測仿真研究[J]. 中國電機工程學報,2012,32(4):35-41. [17]于輝輝. 日光溫室溫度極值預測預警模型及系統研究[D]. 北京:中國農業大學,2015. [18]Chang C C, Lin C J. LIBSVM: A library for support vector machines[J]. ACM Transactions on Intelligent Systems and Technology, 2011, 2(3): 389-396. [19]鄭榮寶,劉毅華,董玉祥. 廣州市土地資源安全預警及耕地安全警度判定[J]. 資源科學,2009,31(8):1362-1368. [20]吳延熊,郭仁鑒,周國模. 區域森林資源預警的警度劃分[J]. 浙江林學院學報,1999,16(1):70-75. [21]董云偉,董雙林. 刺參對溫度適應的生理生態學研究進展[J]. 中國海洋大學學報(自然科學版),2009,39(5):908-912. [22]陳愛華. 環境因子對刺參的影響及對策[J]. 河北漁業,2007(3):22. [23]邢殿樓,李 強,曲健鳳,等. 刺參苗種越冬期水環境因子變化及對刺參急性效應的研究[J]. 漁業現代化,2011,38(2):6-9.

2 水質預警模型
2.1 預警模型理論概述



2.2 水質預警模型的構建


3 結語