楊曉峰



摘 要: 漁業水質評價智能化對提高漁業生產水平起到關鍵促進作用。本文針對漁業水質評價設計了基于LBFGS優化的神經網絡模型,深入討論選取特征的有效性并優化了特征選擇,實現了模型壓縮,更適合前端嵌入式環境。實驗表明,本文設計模型能夠有效提供水質評價信息。
關鍵詞: 水質; 評價; LBFGS; 神經網絡
文章編號: 2095-2163(2021)03-0134-05 中圖分類號: TP183 文獻標志碼:A
【Abstract】The intelligent evaluation of water quality plays a key role in increasing the fishery production. In this paper, a neural network model based on LBFGS optimization is designed for fishery water quality evaluation. The effectiveness of features is discussed, and the model is compressed. This mode is more suitable for the front-end embedded environment. Experiments show that the model designed in this paper can effectively provide water quality evaluation information.
【Key words】 water quality; evaluation; limited-memory Broyden-Fletcher-Goldfarb-Shanno; artificial neural network
0 引 言
漁業水質評價是對漁業養殖池塘內水體的情況做出的量化判斷的一種評價標準。由于漁業養殖池塘內水體的微生物以及浮游動植物的數量需要保持一定的比例,微生物以及浮游動植物的數量會影響水體顏色,通常需要通過觀測水體顏色來判別水質情況,準確的水質智能化評價對提高漁業生產水平起到關鍵促進作用。由于帶有主觀性的人工觀測會造成一定的偏差,因此有必要將專家漁業養殖水色判斷經驗轉化為可以量化的評價標準,結合專家經驗和計算機視覺分析模型,在前端攝像機內采集水體圖像以及分析水色等級,實現快速準確的判斷水質情況。目前基于可見光圖像判斷水色的模型特征主要方法有如下2種:采用多種顏色空間分布特征的方法[1]和采用顏色矩特征的方法[2-3]。目前,胡朝瑩等人[1]研究了多種顏色空間分布特征對水色判斷的穩定性;許新華[2]利用RGB空間的顏色矩特征,建立了LM算法優化的神經網絡,實現水質等級評價。
采用顏色空間分布特征的方法多采用顏色直方圖方法計算圖像特征,通過顏色直方圖可以統計不同顏色在圖象中出現的頻率,但是顏色直方圖無法描述顏色的空間分布位置信息,并且顏色直方圖特征維數較高,例如:將32位色圖像的所有顏色都進行直方圖統計將會有232維特征,特征維度非常高。
顏色矩特征[4]根據概率統理論利用隨機變量的矩表示圖像中顏色分布特征。在一幅圖像中,顏色信息具有一定的概率分布,而顏色信息分布就可以用矩的方法來描述。顏色矩將圖像中的顏色通道信息分別進行一階矩、二階矩和三階矩統計,一幅圖像RGB信息可以使用9個維度的顏色矩信息表示,相比顏色直方圖特征,特征維度大幅降低,帶來的好處是特征處理的計算量將大幅降低,所以最近的水質評價研究[2]中多使用顏色矩特征。但是文獻[2]在水質評價研究中并未對顏色矩的各階特征的有效性做出分析,并且水質檢測準確率較低(小于90%)。
針對文獻[2]不足,本文對顏色矩各階特征做了有效性分析,提高了水質檢測的準確率,并且優化了模型,使模型更適合在前端嵌入式環境下使用。
1 數據準備
本文使用的漁業養殖池塘水體數據集來源于文獻[5],水樣圖像通過相機拍攝采集,采集到的圖像樣本中包含了玻璃容器,由于玻璃容器的高亮度反光會影響水體樣本圖像顏色的分布,因此對圖像進行了裁剪,只保留了圖像中央101×101像素的部分,用于顏色矩特征的提取。數據集中不同類型水質樣本數量統計如圖1所示。從圖1中可以看出數據集中各種水質樣本分布是不均勻的。訓練樣本和測試樣本隨機選取,比例為8∶2,訓練集中的水質樣本數量統計如圖2所示,測試集中的水質樣本數量統計如圖3所示。
2 特征提取
本文選用顏色的一階矩、二階矩以及三階矩分別提取水體樣本圖像特征,顏色矩特征計算過程可闡釋表述如下。
(1)顏色的一階矩。表示圖像整體的亮度,具體數學公式為:
(2)顏色的二階矩。表示圖像色域的廣度,具體數學公式為:
(3)顏色的三階矩。表示圖像顏色分布對稱性,具體數學公式為:
對預處理后的圖像提取顏色矩特征,提取的顏色矩特征見表1。
3 模型建立與分析
在神經網絡優化算法中,最常見的是隨機梯度下降法以及其改進方法。梯度下降法是一階最優化算法,優化思想是在當前空間點位置的負梯度方向進行搜索,該方向被認為是尋找最優解的最佳方向。梯度下降法簡單,適用于凸函數,但是應用于非凸函數時很容易落入局部最優解。
針對一階最優化算法,牛頓法利用了目標函數的一階導數信息和二階偏導信息,相對于一階優化算法有更快的收斂速度,更容易從局部最優解中逃逸。但是在迭代過程中,牛頓法每次迭代都需要計算目標函數的海森矩陣Hessian的逆矩陣,計算復雜度很高,并且如果海森矩陣不可逆的時候出現無法計算的情況。
擬牛頓法是對牛頓法的改進方法,是目前非線性問題求解最佳方法之一。擬牛頓法避免了海森矩陣逆矩陣的復雜求解過程,通過正定矩陣近似海森矩陣的逆,簡化運算復雜度。LBFGS優化算法就是一種擬牛頓法。本文采用LBFGS算法優化神經網絡,保證了網絡快速優化并能夠最大程度接近全局最優解,這也是本文后續特征有效性分析的理論基礎。
本文采用的神經網絡模型,輸入層為9個節點,兩個隱藏層分別為20個節點和8個節點,輸出層為5個節點。模型訓練,最大訓練次數設為3 000,優化器參數設為lbfgs,random_state設為1。模型評價采用混淆矩陣,訓練結果如圖4所示,測試結果如圖5所示。圖4、圖5中,True label表示真實的分類信息,Predicted label表示模型預測的分類信息,矩陣中對角線上元素表示各個分類預測正確數量,其他元素表示預測錯誤的數量。模型訓練準確率為100%,測試準確率為95.43%,與文獻[2]結果對比見表2。本文模型相對于文獻[2]準確率提高了7個百分點,說明方法有效。
本文設計的模型采用了9個顏色矩特征,其中三階顏色矩特征表示顏色分布的對稱性,參見公式(3)。經過進一步樣本分析發現,預處理后的不同類別水質樣本圖像中顏色分布都很均勻(方框內),三階顏色矩特征在水質分類中貢獻度很小,后續實驗中也證明這一點,水質分析中只需要利用一階顏色矩和二階顏色矩、共6種特征即可,文章后續實驗對顏色信息的一階矩、二階矩和三階矩三組圖像特征有效性進行了分析。5種水質樣本如圖6所示。圖6中方框表示數據預處理后保留的部分。
4 模型優化
(1)補充實驗1。特征選取一階顏色矩和二階顏色矩兩組特征,模型選用2層隱藏層,節點數分別是9和5,最大訓練次數設為3 000,優化器參數設為lbfgs,random_state設為1。實驗結果如圖7、圖8所示。
(2)補充實驗2。特征選取一階顏色矩一組特征,模型選用2層隱藏層,節點數分別是9和3,最大訓練次數設為3 000,優化器參數設為lbfgs,random_state設為1。實驗結果如圖9、圖10所示。
(3)補充實驗3。特征選取二階顏色矩一組特征,模型選用2層隱藏層,節點數分別是8和4,最大訓練次數設為3 000,優化器參數設為lbfgs,random_state設為1。實驗結果如圖11、圖12所示。
補充實驗1訓練準確率為100%,測試準確率為95.43%,與本文實驗結果相同,充分證明了上一節的實驗分析結論。因此本文方法可以優化,減少特征數量,壓縮模型規模,提高模型運行效率。由于壓縮后的模型與原始模型準確率相同,所以相對于原模型,則更符合邊緣計算的要求,更適合在嵌入式環境下運行。補充實驗2的測試準確率為87.81%,補充實驗3的測試準確率為51.22%,詳見表3,結果說明在水質評價中一階顏色矩特征提供了主要信息,也就是水樣的明暗程度對水質評價有至關重要的作用;二階顏色矩特征提供相對次要的信息,顏色的分布范圍信息對水質評價也有一定幫助;三階顏色矩特征貢獻度幾乎為零,顏色分布的對稱性對水質評價不起作用。因此,一階顏色矩特征和二階顏色矩特征可以提供水質評價的所有信息。
5 結束語
本文針對漁業水質評價設計了基于LBFGS優化的神經網絡模型,并對特征選取進行了深入討論,進一步壓縮水質評價模型,并使得準確率保持不變,因此更適合在前端嵌入式環境下運行。實驗表明,本文設計模型能夠有效提供準確的水質評價信息。
參考文獻
[1] 胡朝瑩,謝駿,余德光,等. 幾種顏色空間在池塘水色圖像識別中的穩定性研究[C]//大宗淡水魚類產業技術可持續發展學術研討會. 銀川:中國水產科學研究院, 2009:17.
[2] 許新華. 基于LM神經網絡水色圖像識別技術的水質評價研究[J]. 科學技術創新, 2019(6):99-100.
[3] 王海英,曹晶,謝駿,等. 基于L-M神經網絡優化算法的池塘水色判別系統的初步建立[J]. 漁業現代化, 2010,37(5):19-21,37.
[4] STRICKER M A, ORENGO M. Similarity of color images[C]//Proceedings of SPIE-The International Society for Optical Engineering 2420 . SAN JOSE, CA, USA:SPIE,1995:381-392.
[5] 張良均,王路,譚立云,等. Python數據分析與挖掘實戰[M]. 北京:機械工業出版社, 2016.