李 路 黃漢英 涂群資 趙思明 熊善柏 馬章宇
(1.華中農(nóng)業(yè)大學工學院, 武漢 430070; 2.農(nóng)業(yè)部長江中下游農(nóng)業(yè)裝備重點實驗室, 武漢 430070;3.華中農(nóng)業(yè)大學食品科技學院, 武漢 430070)
魚類數(shù)量估計是漁業(yè)資源調(diào)查和水產(chǎn)養(yǎng)殖監(jiān)測的重要內(nèi)容。傳統(tǒng)的魚類數(shù)量估計手段主要有基于圖像處理的魚群計數(shù)[1-2]和基于主動聲納的魚類生物量評估[3-4]。前者具有信息直觀、技術(shù)成熟的特點,主要用于魚苗繁育、工廠化養(yǎng)殖等場合,但其監(jiān)測范圍小,在水質(zhì)渾濁時使用受限;后者具有探測范圍廣、不受能見度限制的特點,主要用于湖泊、海洋等大范圍水域,但其設(shè)備昂貴,在小尺度水體中的混響嚴重,難以在普通魚塘中推廣應(yīng)用。而以水聽器為主要代表的被動水聲傳感器成本適中,能在渾濁水體中直接獲取魚聲信號,非常適于進行塘養(yǎng)淡水魚的狀態(tài)監(jiān)測。
目前,各國學者主要使用被動聲學手段研究各種發(fā)聲魚類的發(fā)聲機制[5-7]、發(fā)聲特點[8-11]和典型行為下的發(fā)聲規(guī)律[12-14],針對常見淡水魚的研究較少。文獻[15]利用低信噪比的被動水聲信號建立了3種常見淡水魚的種類識別模型,為淡水活魚的狀態(tài)監(jiān)測提供了一種思路。但使用被動水聲信號實現(xiàn)淡水魚數(shù)量的估計具有較大難度,相關(guān)研究鮮見報道。
本文就單品種淡水活魚數(shù)量估計問題,以被動水聲信號處理技術(shù)為理論基礎(chǔ),使用短時平均能量、短時平均過零率和小波包分解頻段能量作為備選信號特征,采用回歸分析方法建立淡水魚數(shù)量估計模型,為自動監(jiān)測淡水魚數(shù)量提供一種手段。

圖1 魚類被動聲學信息采集裝置Fig.1 Fish passive acoustic signal acquisition system1.試驗水箱 2.數(shù)據(jù)處理計算機 3.聲學記錄儀 4. 1號水聽器 5. 2號水聽器 6.對照水箱 7.隔音棉
在市場隨機選取鳊魚、鯽魚作為試驗材料。鳊魚每尾0.6~0.9 kg,鯽魚每尾0.2~0.5 kg。
使用如圖1所示的魚類被動聲學信息采集裝置獲取魚聲信號。該裝置主要包括:2個HTI-96-MIN型標準水聽器、1臺SM2+聲學記錄儀、1臺數(shù)據(jù)處理計算機和2個覆蓋了隔音棉的水箱。其中試驗水箱進行魚聲信號采集,對照水箱同步采集背景噪聲,以便獲取環(huán)境噪聲特性。
1.2.1信號采集
試驗環(huán)境參數(shù):水箱水量500 L,水溫10~15℃,溶氧量7~8 mg/L,pH值7.2~7.5。
傳感器參數(shù):水聽器位于水面下20 cm,采樣頻率4 000 Hz。
信號樣本采集方法:分別將1~50尾鯽魚或1~30尾鳊魚放入試驗水箱中,靜置5 min,待魚類狀態(tài)穩(wěn)定后進行采集,每個樣本的采集時長為60 s。使用不同的試驗材料反復(fù)進行上述采集過程,每種數(shù)量的淡水魚各采集10~30個樣本,共采集鯽魚聲音信號樣本1 363個,鳊魚聲音信號樣本294個。
1.2.2特征提取
與語音信號類似,魚聲信號本質(zhì)上也是一種非平穩(wěn)隨機信號,采用短時處理技術(shù)來提取魚聲信號特征較為可行。因此,本文使用短時平均能量、短時平均過零率作為魚聲信號的兩種特征。短時平均能量能反映魚聲信號在不同時段的能量特征,其計算方法見文獻[16]。過零率可以在一定程度上反映信號的頻率特性。當離散時間信號相鄰的2個樣本點的正負號不同時,則認為信號穿過了“0”值,稱為“過零”。統(tǒng)計單位時間內(nèi)樣點值改變符號的次數(shù)既可以得到短時平均過零率[17]。
由于魚聲信號本質(zhì)上是一種持續(xù)時間較短的、具有突變性的、非平穩(wěn)隨機信號。使用傳統(tǒng)的基于傅里葉變換的信號分析方法對魚聲信號進行處理有較大的局限。而小波包分解能獲取信號時頻局部特征的分析方法,能根據(jù)信號特性和分析要求自適應(yīng)地選擇相應(yīng)頻帶與信號頻譜相匹配,是一種比小波分解更為精細的分解方法,適用于魚聲信號特征的提取。本文采用小波包分解與重構(gòu)算法提取魚聲信號的頻段能量[18]。具體步驟:①選取合適的分解層數(shù)和小波基函數(shù),對魚聲信號進行分解,為控制計算量,分解層數(shù)定為4、5、6,小波包基函數(shù)為db1小波。②利用分解后的節(jié)點系數(shù)對信號進行重構(gòu),得到各頻段內(nèi)的小波包重構(gòu)信號。③求小波包分解各頻段內(nèi)重構(gòu)信號的能量。
采用Z-score標準化對上述3類特征進行標準化處理,使其方差為1,均值為0,從而可將不同量綱的特征放在相同范圍進行比較[19]。然后,利用標準化后的特征構(gòu)建魚聲信號特征向量X=(x1,x2,…,xn),當小波包分解層數(shù)為4、5、6時,n分別為18、34、66。特征向量中x1為短時平均能量,x2為短時平均過零率,x3~xn對應(yīng)小波包分解頻段能量。
1.2.3樣本集劃分
訓練集和驗證集的劃分比例為4∶1。首先使用傳統(tǒng)的SPXY(Sample set partitioning based on joint X-Y distance)法[20]進行樣本集劃分,但由于算法原理的局限,導致淡水魚數(shù)量較少(1尾)和較多(30或50尾)的水聲信號樣本更多地被劃分為訓練集,而中等數(shù)量淡水魚的水聲信號樣本則更多地進入驗證集。為使每種數(shù)量的淡水魚水聲信號樣本中訓練集和驗證集的比例一致,本文提出了一種劃分樣本集的新方法:Rank-SPXY法。該方法由2部分組成,首先是Rank部分,即將樣本按因變量(活魚尾數(shù))的升序排序,然后將樣本等分為m份;其次是SPXY部分,即在等分的每個區(qū)間內(nèi)采用SPXY法選取出訓練集,其余的樣本自動歸為驗證集。當m=1時,此方法即為SPXY法;當m較大時,得到的訓練集更加均勻,但特征值的代表性有所下降。為了對比不同m取值對劃分效果的影響,m分別取5和10對聲音信號樣本集進行劃分,并建立估計模型,通過比較模型的性能,確定哪種取值更佳。
1.2.4特征篩選

圖2 不同數(shù)量鯽魚和鳊魚聲音信號的時域和頻域波形圖Fig.2 Time domain waveform diagram and spectrum analysis of acoustic signals produced by crucian carp and bream
采用競爭自適應(yīng)重加權(quán)采樣(Competitive adaptive reweighted sampling,CARS)法對魚聲信號特征進行篩選。在篩選過程中,每次通過CARS技術(shù)保留偏最小二乘回歸(Partial least squares regression,PLSR)模型中偏回歸系數(shù)絕對值大的特征,而將絕對值小的偏回歸系數(shù)默認為零,從而去除偏回歸系數(shù)小的特征,獲得一系列的魚聲信號特征子集,并對每個子集進行10折交叉驗證建模,選擇模型交叉驗證均方差(Root mean square error of cross validation,RMSECV)最小的信號特征子集。
1.2.5模型的建立及驗證
在不同的特征提取和樣本集劃分方法條件下,根據(jù)訓練集中樣本的信號特征,采用多元線性回歸(Multiplelinear regression,MLR)和PLSR建立若干個淡水魚的數(shù)量估計模型,并對模型性能進行比較,確定合理的建模方案。
MLR是用來確定2個及2個以上變量間相互聯(lián)系的定量關(guān)系的一種統(tǒng)計分析方法,其利用線性來擬合多個自變量和一個因變量之間的關(guān)系,從而得到MLR模型的各個參數(shù)[21]。PLSR是一種多元統(tǒng)計分析方法,常用于多因變量對多自變量回歸建模中,特別是在觀察值數(shù)量少以及存在多重相關(guān)性等問題時,該方法具有良好的性能[22]。
使用驗證集樣本,對選定的兩種淡水魚的數(shù)量估計模型進行檢驗,采用復(fù)相關(guān)系數(shù)R、定標標準差(Root mean square error of calibration,RMSEC)、校驗標準差(Root mean square error of prediction,RMSEP)和相對分析誤差(Relative percent deviation,RPD)來評價模型的性能。
圖2為經(jīng)過濾波消噪后不同數(shù)量鯽魚和鳊魚水聲信號樣本的典型時域、頻域波形[15]。可見,不同種類、不同數(shù)量的淡水魚,其水聲信號的時域、頻域波形都有較大區(qū)別。因此,不同種類淡水魚的數(shù)量估計模型有一定差異,模型的品種適應(yīng)性和準確性相矛盾。
圖3為提取出的鯽魚水聲信號特征隨數(shù)量的變化趨勢。圖中的信號特征共66個,包括短時平均能量、短時平均過零率、6層小波包分解頻段能量,每條曲線代表了一個特征變化規(guī)律。從圖3可看出,隨著鯽魚數(shù)量的增加,信號特征值總體呈現(xiàn)上升趨勢,但并不是嚴格單調(diào)遞增,說明信號特征與鯽魚數(shù)量間存在一定的相關(guān)性,但定量關(guān)系較復(fù)雜,需要使用合理的建模方法才能得到兩者準確的函數(shù)關(guān)系。

圖3 鯽魚水聲信號特征隨數(shù)量的變化趨勢Fig.3 Characteristics of crucian carp acoustic signals varied with quantity
表1、2為不同樣本集劃分方法所獲得的兩種淡水魚水聲信號樣本集的劃分結(jié)果。可見,采用SPXY法的劃分結(jié)果中,訓練集和驗證集的平均值和標準差均相差較大,第29~50條鯽魚的聲音樣本全部劃分為訓練集,樣本集劃分不均勻。而Rank-SPXY法所劃分的驗證集的數(shù)據(jù)范圍包含在訓練集的數(shù)據(jù)范圍內(nèi),并且驗證集平均值與訓練集十分接近,因此選擇Rank-SPXY法劃分樣本集更加合理。在采用Rank-SPXY法對樣本集進行劃分時,通過比較m=5和m=10時驗證集的標準差可知,采用m=10對樣本集的劃分更加均勻,但m較大也會影響特征的代表性。
表3為不同小波包分解層數(shù)和不同樣本集劃分方法的情況下,信號特征篩選結(jié)果和淡水魚數(shù)量估計模型的R值對比。總體上來看,CARS能減少水聲信號特征數(shù)量,有效降低模型復(fù)雜度。從所建模型的R值來看,MLR模型比PLSR模型的性能略好。對于鯽魚數(shù)量估計模型,6層+Rank-SPXY(m=10)得到的樣本集建立的MLR估計模型的R最高。對于鳊魚數(shù)量估計模型,6層+Rank-SPXY(m=5)得到的樣本集建立的MLR估計模型的R最高。因此,兩種淡水魚水聲信號的小波包分解層數(shù)都為6;鯽魚聲音信號樣本集劃分方法為Rank-SPXY(m=10);鳊魚聲音信號樣本集劃分方法為Rank-SPXY(m=5);兩種淡水魚數(shù)量估計模型的建模方法均選用MLR。

表1 鯽魚水聲信號樣本集劃分結(jié)果Tab.1 Sample set partitioning division results of crucian carp

表2 鳊魚水聲信號樣本集劃分結(jié)果Tab.2 Sample set partitioning division results of bream

表3 信號特征篩選結(jié)果和估計模型的R值Tab.3 Selecting results of signal characteristics and correlation coefficient of estimation model
按照上述模型構(gòu)建方案方程,分別建立鯽魚和鳊魚的數(shù)量估計模型。鯽魚模型的參數(shù)見表4,其中回歸常數(shù)項b=40.071,xi為鯽魚聲音信號特征經(jīng)Z-score標準化預(yù)處理和特征篩選后的特征值,ai為各特征值的偏回歸系數(shù)。模型的R值為0.835,RMSEC為10.096,說明模型具有較好的穩(wěn)定性和預(yù)測性。由表4可知,短時平均能量(即x1)沒有參與建模過程,因為該特征與鯽魚數(shù)量的相關(guān)性較小,在特征篩選環(huán)節(jié)已經(jīng)被剔除。而x35、x47、x503個特征的偏回歸系數(shù)絕對值較大,其t值相對較大,P值均為零,說明它們對估計模型的影響比較顯著,其對應(yīng)的鯽魚聲音信號特征頻段為256~264 Hz、352~360 Hz、376~384 Hz。

表4 鯽魚數(shù)量估計模型的參數(shù)Tab.4 Parameters of crucian carp number estimation model
鳊魚數(shù)量估計模型的參數(shù)見表5,其中回歸常數(shù)項b=4.384。模型的R值為0.893, RMSEC為3.83,說明模型的穩(wěn)定性和預(yù)測性較好。由于短時平均能量和短時平均過零率(即x1和x2)已經(jīng)被CARS法剔除,故它們沒有參與建模過程,由表5可知,x14、x24兩個特征的偏回歸系數(shù)絕對值較大,其t值相對較大,x18的P值最大為0.034,小于0.05,說明它們對估計模型的影響比較顯著。x14、x24對應(yīng)的鳊魚聲音信號特征頻段為88~96 Hz、168~178 Hz。

表5 鳊魚數(shù)量估計模型的參數(shù)Tab.5 Parameters of bream number estimation model
使用驗證集樣本,對上述兩種淡水魚的數(shù)量估計模型進行檢驗。鯽魚數(shù)量估計模型驗證的R為0.816,RMSEP為8.015,RPD為1.79;鳊魚數(shù)量估計模型驗證的R為0.865,RMSEP為4.54,RPD為2.01。結(jié)果表明,所建立的模型能對兩種淡水魚的活體數(shù)量進行較準確的估計。
(1)鯽魚水聲信號特征的提取方案為短時平均過零率+6層小波包分解頻段能量,鳊魚為只需提取6層小波包分解頻段能量作為其信號特征。
(2)鯽魚樣本集劃分方法為Rank-SPXY(m=10),鳊魚為Rank-SPXY(m=5)。
(3)經(jīng)過特征篩選,鯽魚水聲信號特征為18個,其中256~264 Hz、352~360 Hz、376~384 Hz頻段能量對鯽魚的數(shù)量估計起到關(guān)鍵作用;鳊魚水聲信號特征為5個,其中88~96 Hz、168~178 Hz頻段能量對鳊魚的數(shù)量估計起到關(guān)鍵作用。
(4)MLR法所建立的模型性能較好。鯽魚數(shù)量估計模型的R為0.835,RPD為1.79;鳊魚數(shù)量估計模型的R為0.893,RPD為2.01。
1FAN L Z, LIU Y. Automate fry counting using computer vision and multi-class least squares support vector machine[J]. Aquaculture, 2013, 380-383: 91-98.
2王文靜,徐建瑜,杜秋菊. 基于計算機視覺的魚苗自動計數(shù)系統(tǒng)研究[J]. 漁業(yè)現(xiàn)代化,2016, 43(3):34-38,73.
WANG Wenjing,XU Jianyu,DU Qiuju. Study on a computer vision based automatic counting system of fries[J]. Fishery Modernization,2016, 43(3):34-38, 73. (in Chinese)
3DJEMALI I, GUILLARD J, YULE D L. Seasonal and diel effects on acoustic fish biomass estimates: application to a shallow reservoir with untargeted common carp (Cyprinuscarpio)[J]. Marineand Freshwater Research, 2017, 68(3): 528-537.
4楊志,唐會元,朱迪,等. 三峽水庫175 m試驗性蓄水期庫區(qū)及其上游江段魚類群落結(jié)構(gòu)時空分布格局[J]. 生態(tài)學報,2015,35(15):5064-5075.
YANG Z, TANG H Y, ZHU D, et al. Spatiotemporal patterns of fish community structures in the Three Gorges Reservoir and its upstream during the 175-m-deep impoundment[J].Acta Ecologica Sinica, 2015, 35(15): 5064-5075. (in Chinese)
5PARMENTIER E, FINE M L, MOK H K, et al. Sound production by a recoiling system in the pempheridae and terapontidae[J].Journal of Morphology, 2016, 277(6): 717-724.
6PARMENTIER E, TOCK J, FALGUIERE J C. Sound production in sciaenopsocellatus: preliminary study for the development of acoustic cues in aquaculture[J].Aquaculture,2014, 432: 204-211.
7KAATZ I M, STEWART D J. Bioacoustic variation of swimbladder disturbance sounds in Neotropical doradoid catfishes (Siluriformes: Doradidae, Auchenipteridae): Potential morphological correlates[J].Current Zoology, 2012, 58(1): 171-188.
8TELLECHEA J S, FINE M L, NORBIS W. Passive acoustic monitoring, development of disturbance calls and differentiation of disturbance and advertisement calls in the Argentine croaker Umbrinacanosai (Sciaenidae)[J].Journalof Fish Biology, 2017,90(4): 1631-1643.
9CASARETTO L, PICCIULIN M, HAWKINS A D. Seasonal patterns and individual differences in the calls of male haddock Melanogrammus aeglefinus[J].Journal of Fish Biology, 2015, 87(3): 579-603.
10FINE M L, WAYBRIGHT T D.Grunt variation in the oyster toadfish opsanus tau: effect of size and sex[J]. PeerJ, 2015, 3(Supp.):1-b1.
11陳功, 王平波, 常睿, 等. 稀疏特征在微弱被動魚聲檢測中的應(yīng)用[J]. 熱帶海洋學報, 2015, 34(4): 48-53.
CHEN Gong, WANG Pingbo, CHANG Rui, et al. Research on detection of weak passive fish acoustic by sparse decomposition feature[J]. Journal of Tropical Oceanography, 2015, 34(4): 48-53. (in Chinese)
12MONTIE E W,HOOVER M,KEHRER C, et al. Acoustic monitoring indicates a correlation between calling and spawning in captive spotted seatrout (Cynoscionnebulosus) [J]. PeerJ, 2017, 5:2944.
13SCHARER M T, NEMETH M I, ROWELL T J, et al. Sounds associated with the reproductive behavior of the black grouper (Mycteropercabonaci)[J]. Marine Biology, 2014, 161(1):141-147.
14FINE M L, THORSON R F. Use of passive acoustics for assessing behavioral interactions in individual toadfish[J].Transactions of the American Fisheries Society, 2008, 137(2): 627-637.
15李路, 涂群資, 黃漢英, 等. 基于被動水聲信號的淡水魚種類識別[J/OL]. 農(nóng)業(yè)機械學報, 2017, 48(8): 166-171.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20170818&flag=1.DOI:10.6041/j.issn.1000-1298.2017.08.018.
LI Lu, TU Qunzi, HUANG Hanying,et al.Freshwater fish identification using passive underwater acoustic signals[J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2017,48(8): 166-171.(in Chinese)
16馬莎莎,戴曙光,穆平安. 基于短時能量的循環(huán)AMDF基音檢測算法[J]. 計算機仿真,2014, 31(7):278-282.
MA Shasha,DAI Shuguang, MU Ping’an. Circular AMDF pitch detection algorithm based on short-time energy[J]. Computer Simulation,2014, 31(7):278-282.(in Chinese)
17尹巖巖,殷業(yè),羅漢文,等. 基于短時能零熵的端點檢測方法[J]. 計算機仿真,2012, 29(11):408-411.
YIN Yanyan, YIN Ye, LUO Hanwen, et al. Endpoint detection algorithm based on short-term energy-zero spectral entropy[J]. Computer Simulation,2012, 29(11):408-411.(in Chinese)
18杜偉東, 李海森, 魏玉闊, 等. 基于SVM的多方位聲散射數(shù)據(jù)協(xié)作融合魚分類與識別[J/OL]. 農(nóng)業(yè)機械學報, 2015, 46(3): 268-275. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20150339&flag=1.DOI:10.6041/j.issn.1000-1298.2015.03.039.
DU Weidong, LI Haisen, WEI Yukuo, et al.Multi-azimuth acoustic scattering data cooperative fusion using SVM for fish classification and identification[J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(3): 268-275.(in Chinese)
19吳利敏. 近紅外光譜法快速檢測某些中藥及中成藥品質(zhì)的應(yīng)用研究[D]. 重慶: 西南大學, 2013.
WU Limin. Study on rapid detection for the quality of some herbal medicines and chinese patent medicines by near infrared spectroscopy[D]. Chongqing: Southwest University, 2013.(in Chinese)
20展曉日, 朱向榮, 史新元, 等. SPXY樣本劃分法及蒙特卡羅交叉驗證結(jié)合近紅外光譜用于橘葉中橙皮苷的含量測定[J]. 光譜學與光譜分析, 2009, 29(4): 964-968.
ZHAN Xiaori, ZHU Xiangrong, SHI Xinyuan,et al. Determination of hesperidin in tangerine leaf by near-infrared spectroscopy with SPXY algorithm for sample subset partitioning and montecarlo cross validation[J]. Spectroscopy and Spectral Analysis, 2009, 29(4): 964-968.(in Chinese)
21付勇, 汪立今, 柴鳳梅, 等. 多元線性回歸和逐步回歸分析在白石泉Cu-Ni硫化物礦床研究中的應(yīng)用[J]. 地學前緣, 2009, 16(1): 373-380.
FU Yong, WANG Lijin, CHAI Fengmei,et al. The application of multi-variate linear regression combined with stepwise regression analysis for Cu-Ni sulfide deposit of Baishiquan[J]. Earth Science Frontiers, 2009, 16(1): 373-380.(in Chinese)
22王海江, 張花玲, 任少亭, 等. 基于高光譜反射特性的土壤水鹽狀況預(yù)測模型研究[J/OL]. 農(nóng)業(yè)機械學報, 2014, 45(7): 133-138.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20140721&flag=1.DOI:10.6041/j.issn.1000-1298.2014.07.021.
WANG Haijiang, ZHANG Hualing, REN Shaoting, et al. Prediction model of soil water-salt based on hyperspectral reflectance characteristics[J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2014, 45(7): 133-138.(in Chinese)