















摘要:
為解決高密度養(yǎng)殖加州鱸攝食強(qiáng)度識(shí)別難的問題, 實(shí)現(xiàn)加州鱸的精準(zhǔn)投喂, 提出了一種基于被動(dòng)水聲信號(hào)的加州鱸魚群攝食強(qiáng)度識(shí)別方法。 該方法以高密度養(yǎng)殖條件下的加州鱸為研究對(duì)象, 采用攝食聲信號(hào)采集裝置獲取加州鱸魚群的攝食聲信號(hào), 經(jīng)預(yù)處理后提取攝食聲信號(hào)的多種特征, 通過隨機(jī)森林、 皮爾遜(Pearson)相關(guān)性分析及主成分分析篩選出較為重要的特征, 基于粒子群算法(particle swarm optimization, PSO)和多層感知機(jī)(multi-layer perceptron, MLP)建立PSO-MLP魚群攝食強(qiáng)度識(shí)別模型。 結(jié)果表明: 基于PCA特征選擇的PSO-MLP識(shí)別模型的分類識(shí)別效果更好, 其準(zhǔn)確率達(dá)到97.88%, 識(shí)別時(shí)長為6.24 s, 與基于隨機(jī)森林和基于皮爾遜相關(guān)性分析的模型相比, 識(shí)別準(zhǔn)確率分別提高2.61%和1.02%, 識(shí)別時(shí)長縮短1.04 s和1.09 s。 說明基于被動(dòng)水聲信號(hào)的加州鱸魚群攝食強(qiáng)度識(shí)別方法有效提高了魚群攝食強(qiáng)度識(shí)別的準(zhǔn)確率和效率, 可為智能投喂系統(tǒng)的開發(fā)提供技術(shù)支持。
關(guān)" 鍵" 詞:
水產(chǎn)養(yǎng)殖; 魚類攝食強(qiáng)度; 被動(dòng)水聲信號(hào); 加州鱸; 特征提取
中圖分類號(hào):
S969.3
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):16739868(2025)02000116
DOI: 10.13718/j.cnki.xdzk.2025.02.001
李路, 周玉凡, 孫超奇, 等. 基于被動(dòng)水聲信號(hào)的加州鱸攝食強(qiáng)度識(shí)別 [J]. 西南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2025, 47(2): 1-16.
收稿日期:20240320
基金項(xiàng)目:
國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2022YFD2001700); 湖北省科技重大項(xiàng)目(2023BBA001); 中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金資助項(xiàng)目(2662023GXPY006)。
作者簡(jiǎn)介:
李路, 博士, 副教授, 主要從事農(nóng)業(yè)電氣化與自動(dòng)化領(lǐng)域研究。
Identification of Feeding Intensity of Micropterus salmoides
Based on Passive Underwater Acoustic Signals
LI Lu1,2," ZHOU Yufan1," SUN Chaoqi1," ZHOU Chengyu1,
ZHU Ming1,2," TAN Hequn1,2," WAN Peng1,2
1. College of Engineering, Huazhong Agricultural University, Wuhan 430070, China;
2. Key Laboratory of Agricultural Facilities Engineering, Ministry of Agriculture and Rural Affairs, Wuhan 430070, China
Abstract:
To solve the problem of identifying the feeding intensity of high-density cultured Micropterus salmoides and achieve precise feeding of M. salmoides, this paper proposed a method for identifying the feeding intensity of school of M. salmoides based on feature of passive underwater acoustic signals. This method took the school of M. salmoides as the research object and used a feeding sound signal acquisition device to obtain the feeding sound signal of the school of M. salmoides. After preprocessing, multiple features of the underwater sound signal were extracted. The important features were selected through Random Forest, Pearson Correlation Analysis, and Principal Component Analysis, and a PSO-MLP fish school feeding intensity recognition model was established based on Particle Swarm Optimization and Multi-Layer Perceptron. The results showed that the PSO-MLP recognition model based on Principal Component Analysis feature selection had better recognition performance, with a classification recognition accuracy of 97.88% and a recognition time of 6.24 seconds. Compared with the RF and the Pearson correlation analysis based PSO-MLP recognition model, the recognition accuracy was increased by 2.61% and 1.02%, and the recognition time was shortened by 1.04 seconds and 1.09 seconds, respectively. This method effectively improved the accuracy and efficiency of fish feeding intensity recognition, and can provide technical support for the development of intelligent feeding systems.
Key words:
aquaculture; fish feeding intensity; passive underwater acoustic signal; Micropterus salmoides; feature extraction
隨著水產(chǎn)養(yǎng)殖業(yè)的快速發(fā)展, 集約化養(yǎng)殖規(guī)模逐漸擴(kuò)大, 人工合成飼料在水產(chǎn)養(yǎng)殖中處于不可或缺的地位。 2020年產(chǎn)業(yè)報(bào)告數(shù)據(jù)顯示, 在水產(chǎn)養(yǎng)殖中飼料成本占總成本的67.35%[1]。 在工廠化養(yǎng)殖以及池塘圈養(yǎng)模式中, 魚類養(yǎng)殖密度高, 投喂采取機(jī)械投喂的方式定時(shí)定量投喂, 無法根據(jù)養(yǎng)殖魚群的實(shí)際需求進(jìn)行投喂, 容易造成投喂不足或投喂過量的問題, 使得飼料利用率不高, 增加了養(yǎng)殖成本。 根據(jù)魚類實(shí)際攝食量來精準(zhǔn)投喂可以提高飼料利用率、 降低養(yǎng)殖成本, 其關(guān)鍵在于養(yǎng)殖魚群攝食強(qiáng)度的準(zhǔn)確識(shí)別。 目前, 實(shí)現(xiàn)養(yǎng)殖魚群攝食強(qiáng)度準(zhǔn)確識(shí)別的方法主要有計(jì)算機(jī)視覺技術(shù)和被動(dòng)聲學(xué)技術(shù)。 計(jì)算機(jī)視覺技術(shù)雖能自動(dòng)化、 非入侵地分析魚群攝食行為, 但受水質(zhì)渾濁、 光照及魚群密度影響, 難以識(shí)別高密度加州鱸的攝食強(qiáng)度[2]。 相比之下, 被動(dòng)聲學(xué)技術(shù)可能更具優(yōu)勢(shì), 并且不會(huì)對(duì)監(jiān)測(cè)目標(biāo)產(chǎn)生危害[3], 能夠?qū)崿F(xiàn)24 h攝食監(jiān)測(cè), 可實(shí)時(shí)反映魚群在攝食過程中的狀態(tài), 彌補(bǔ)視覺監(jiān)測(cè)的不足。 目前, 許多研究者在試驗(yàn)環(huán)境下初步探究了魚類攝食聲信號(hào)和魚類攝食強(qiáng)度及飽食度的相關(guān)性。 文獻(xiàn)[4]在試驗(yàn)環(huán)境下分析了加州鱸喂食期間的時(shí)域和頻域特征, 認(rèn)為吞食間隔、 振幅極差及功率積分值均可以作為攝食活躍度的量化指標(biāo), 而共振峰與梅爾倒譜系數(shù)可作為攝食聲識(shí)別參數(shù); 文獻(xiàn)[5]在試驗(yàn)環(huán)境下結(jié)合圖像和聲音對(duì)大口黑鱸攝食過程進(jìn)行研究, 發(fā)現(xiàn)攝食聲壓級(jí)與養(yǎng)殖密度相關(guān)性較強(qiáng), 且呈正相關(guān); 文獻(xiàn)[6]在試驗(yàn)環(huán)境下通過水聽器采集了大菱鲆攝食期間發(fā)出的聲音并對(duì)其進(jìn)行研究, 結(jié)果表明聲學(xué)信號(hào)與飼料需求量之間存在線性關(guān)系; 文獻(xiàn)[7]對(duì)采集到的羅非魚在攝食過程中產(chǎn)生的聲信號(hào)進(jìn)行研究, 研究結(jié)果顯示羅非魚的攝食聲音頻率在0~6 kHz, 且攝食聲的功率與攝食活力呈正相關(guān)。 但上述研究未對(duì)魚類的攝食強(qiáng)度進(jìn)行量化, 并且僅在試驗(yàn)環(huán)境下開展了研究, 難以直接應(yīng)用于高密度加州鱸養(yǎng)殖情況下的攝食強(qiáng)度識(shí)別。
針對(duì)上述問題, 本文提出一種基于被動(dòng)水聲信號(hào)的魚群攝食強(qiáng)度識(shí)別方法, 采用被動(dòng)聲學(xué)技術(shù)獲取高密度養(yǎng)殖的加州鱸魚群的攝食聲信號(hào), 提取并篩選可衡量攝食強(qiáng)度的聲學(xué)特征參數(shù), 從而建立粒子群算法優(yōu)化—多層感知機(jī)(PSO-MLP)識(shí)別模型, 以期實(shí)現(xiàn)高密度養(yǎng)殖下的加州鱸攝食強(qiáng)度的分類識(shí)別。
1" 材料與方法
1.1" 材料與儀器
試驗(yàn)地點(diǎn)為華中農(nóng)業(yè)大學(xué)水產(chǎn)學(xué)院教學(xué)實(shí)訓(xùn)(二)基地。 試驗(yàn)材料為高密度養(yǎng)殖狀態(tài)下的加州鱸, 單尾魚的重量在300~500 g, 養(yǎng)殖密度為65~70尾/m3。 日常投喂飼料來自唐人神集團(tuán)湖北省分公司的膨化浮料5號(hào)。
攝食聲信號(hào)采集裝置示意圖如圖1所示, 其主要包括SM2+型聲學(xué)記錄儀、 HTI-96-MIN型水聽器和攝像機(jī)。 聲學(xué)記錄儀和水聽器用于采集和存儲(chǔ)攝食聲信號(hào), 攝像機(jī)同步采集攝食過程中的視頻, 用于標(biāo)記及驗(yàn)證魚群的攝食狀態(tài)。
1.2" 方法
1.2.1" 信號(hào)采集
如圖1所示, 水聽器分別置于兩個(gè)養(yǎng)殖桶水面下50 cm處。 為盡量減少噪聲的影響, 提高信噪比, 對(duì)兩桶內(nèi)的攝食聲信號(hào)采取先后采集的方式。 采用一輪多次投喂模式: 單次飼料投喂量為250±50 g, 每次投喂后等待至水面無漂浮飼料且水面基本平靜后再進(jìn)行下一次投喂, 根據(jù)加州鱸魚群實(shí)際攝食情況調(diào)整投喂次數(shù), 直至大部分魚不攝食或水面長時(shí)間有殘余飼料時(shí)停止。 投喂前錄制3 min背景噪聲, 用于預(yù)處理時(shí)的采樣降噪。 水聲信號(hào)的采樣頻率為4 000 Hz, 每次采集時(shí)長6~10 min。 加州鱸一餐中的攝食聲信號(hào)和在投喂前錄制的背景噪聲共同構(gòu)成了一條攝食聲信號(hào), 通過多次采樣共采集了200條加州鱸攝食過程的水聲信號(hào)和200條同步視頻信號(hào)。 所采集的攝食聲包括水體波動(dòng)的聲音、 咀嚼吞咽飼料的聲音、 魚類搶食的聲音、 魚類身體拍打水面的聲音。
1.2.2" 信號(hào)預(yù)處理
信號(hào)預(yù)處理主要包括降噪濾波和信號(hào)分段。
本文采用頻譜減法來降低攝食聲信號(hào)的背景環(huán)境噪聲。 首先對(duì)帶噪聲的音頻信號(hào)進(jìn)行頻譜分析; 然后估計(jì)噪聲的頻譜, 并從帶噪聲信號(hào)的頻譜中減去估計(jì)的噪聲頻譜, 得到降噪后的攝食聲信號(hào)。 為了進(jìn)一步提高攝食聲信號(hào)信噪比, 在降噪后通過巴特沃斯濾波器來對(duì)攝食聲信號(hào)進(jìn)行濾波, 其中濾波器的階數(shù)為4, 截止頻率為1 000 Hz[8]。 由于采集的聲信號(hào)中會(huì)存在不同強(qiáng)度的攝食聲段和無效聲段, 需要對(duì)原始信號(hào)進(jìn)行分段, 得到用于分類識(shí)別的有效聲段。 在音頻處理軟件Adobe Audition 2020的多軌模式下對(duì)聲像進(jìn)行同步處理, 通過同步視頻中的攝食情況來確定攝食聲信號(hào)所對(duì)應(yīng)的攝食狀態(tài)并進(jìn)行切分, 將不同強(qiáng)度的攝食聲信號(hào)截取成時(shí)長為3 s的信號(hào)樣本, 共得到9 600個(gè)信號(hào)樣本。
1.2.3" 樣本標(biāo)注與劃分
如圖2所示, 參照同步視頻將攝食聲樣本標(biāo)注為強(qiáng)、 中、 弱、 無4類, 每類包含2 400個(gè)信號(hào)樣本。 其中攝食聲樣本為強(qiáng)表示魚群迅速聚集于投餌區(qū)并進(jìn)行搶食; 為中表示魚群游至投餌區(qū)并進(jìn)食, 聚集面積減小; 為弱表示魚群進(jìn)食緩慢; 為無表示魚群不再攝食, 開始有剩余餌料。
使用SPXY(sample set partitioning based on joint X-Y distance)法[9]進(jìn)行樣本劃分, 使攝食強(qiáng)度相同的樣本為一組, 每組內(nèi)用SPXY法按4∶1將數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集, 得到訓(xùn)練樣本7 680個(gè), 測(cè)試樣本1 920個(gè)。
1.2.4" 特征參數(shù)提取
相關(guān)研究證明特征提取是識(shí)別模型進(jìn)行有效識(shí)別的關(guān)鍵[10]。 本文主要提取加州鱸攝食聲的短時(shí)平均能量、 短時(shí)平均過零率[11]、 梅爾頻率倒譜系數(shù)[12-13]、 基于功率譜的主峰頻率和主峰值[14]、 小波包分解的頻段能量以及時(shí)頻圖的顏色和紋理等特征[15]。
梅爾頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient, MFCC)作為聲音信號(hào)的重要頻譜特征, 廣泛應(yīng)用于語音識(shí)別領(lǐng)域且效果顯著[12-13]。 本文提取了12維梅爾頻率倒譜系數(shù)。 小波包分解能夠捕捉信號(hào)的時(shí)頻局部特征, 依據(jù)信號(hào)特性與分析需求靈活地選擇與信號(hào)頻譜匹配的頻帶, 適用于提取魚聲信號(hào)特征[11]。 本文通過4層小波包對(duì)信號(hào)樣本進(jìn)行分解, 提取16維攝食聲頻段能量特征。 小波時(shí)頻圖能夠?qū)⑿盘?hào)的時(shí)間、 頻率和能量表示在一張圖中。 相比于一維信號(hào), 其攜帶的信息更為豐富, 具有更好的識(shí)別穩(wěn)定性和準(zhǔn)確率[16-18]。 因此, 本文采用連續(xù)小波變換生成小波時(shí)頻圖。 通過觀察發(fā)現(xiàn), 不同攝食狀態(tài)小波時(shí)頻圖的顏色和紋理特征差異較大。 針對(duì)顏色特征, 提取HSV分量色彩的平均強(qiáng)度、 顏色方差和色彩偏移性[17], 共9個(gè)HSV分量特征。 對(duì)于紋理特征, 提取灰度共生矩陣的能量、 熵、 慣性矩、 相關(guān)性, 計(jì)算這4個(gè)紋理參數(shù)的均值和標(biāo)準(zhǔn)差, 形成8維紋理特征。
將上述特征提取出來后, 建立魚聲信號(hào)特征向量X=(x1, x2, …, x49), 其中x1為短時(shí)平均能量, x2為短時(shí)平均過零率, x3為功率譜主峰頻率, x4為功率譜主峰值, x5-x16為梅爾頻率倒譜系數(shù), x17-x32為小波包分解頻段能量, x33-x41為小波時(shí)頻圖顏色特征, x42-x49為小波時(shí)頻圖紋理特征。
1.2.5" 特征選擇
特征提取是攝食狀態(tài)識(shí)別的關(guān)鍵, 其為識(shí)別提供了數(shù)據(jù)支撐, 但過多的特征會(huì)導(dǎo)致數(shù)據(jù)冗余、 增加計(jì)算時(shí)間。 所以要選擇與攝食強(qiáng)度較為相關(guān)的特征, 以提升分類模型識(shí)別效率與識(shí)別精度[19]。 因此本文對(duì)比了3種特征選擇方法: 基于隨機(jī)森林(Random Forest, RF)算法[20-21]的特征選擇、 基于皮爾遜(Pearson)相關(guān)性分析 [22]的特征選擇以及基于主成分分析(Principal Component Analysis, PCA)[23]的特征選擇。 通過模型識(shí)別準(zhǔn)確率評(píng)估不同的特征選擇方法在攝食強(qiáng)度識(shí)別問題上的性能差異, 從而找出最適合本文研究對(duì)象的特征選擇方法, 以提高后續(xù)識(shí)別模型的可靠性和準(zhǔn)確性。
1.2.6nbsp; 識(shí)別模型的建立
本文主要以粒子群優(yōu)化算法PSO和多層感知機(jī)MLP為基礎(chǔ)建立攝食強(qiáng)度識(shí)別模型。 將PSO與MLP相結(jié)合, 利用PSO的全局優(yōu)化能力來優(yōu)化MLP的參數(shù), 從而提高模型的識(shí)別精度和穩(wěn)定性。 改進(jìn)后的算法既可以利用PSO來優(yōu)化MLP的參數(shù), 避免局部最優(yōu)解的問題, 又可以利用MLP的強(qiáng)大映射能力來建立攝食強(qiáng)度與相關(guān)特征之間的復(fù)雜關(guān)系, 從而實(shí)現(xiàn)對(duì)攝食強(qiáng)度的準(zhǔn)確識(shí)別。
PSO粒子群算法是一種基于群體智能的優(yōu)化算法。 它模擬了鳥群或魚群等群體的行為, 通過個(gè)體之間的協(xié)作和信息共享來搜索最優(yōu)解[24-25]。 該算法在n維解空間中啟動(dòng), 初始化種群規(guī)模為m。 每個(gè)粒子的位置代表一個(gè)可能的解, 同時(shí)也決定了由目標(biāo)函數(shù)計(jì)算出的適應(yīng)度。 通過適應(yīng)度的大小即可判斷解的優(yōu)劣。 每次迭代中, 粒子通過適應(yīng)度大小找到自身最優(yōu)解(即個(gè)體極值pi)和整個(gè)種群中的最優(yōu)解(即全局極值G)來更新速度和位置。
PSO算法位置和速度更新公式為:
vi+1=w×vi+c1×r1×(pi-xi)+c2×r2×(G-xi)
xi+1=xi+vi+1(1)
其中: vi, vi+1分別為第i, i+1代粒子的速度; xi, xi+1分別為第i, i+1代粒子的位置; c1為個(gè)體加速因子; c2為全局加速因子; w為慣性因子; r1和r2是(0, 1)上的隨機(jī)數(shù); pi 為粒子i的極值; G為全體粒子的極值。
慣性因子的確定, 目前采用較多的是線性遞減權(quán)值, 公式如下:
w(g)=wini-(wini-wend)×gGk(2)
其中: Gk是最大選代次數(shù); g為當(dāng)前迭代次數(shù); wini為初始慣性權(quán)值; wend是迭代至最大進(jìn)化代數(shù)時(shí)的慣性權(quán)值。
MLP是一種基于神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)分類器, 主要由輸入層、 隱藏層和輸出層構(gòu)成, 層與層之間通過全連接的方式進(jìn)行連接, 中間的隱藏層可以是多層[26-27]。 其中, 輸入層進(jìn)行信號(hào)的輸入, 隱藏層將輸入值按照一定權(quán)重進(jìn)行大小調(diào)整并組合為隱藏層的輸入值, 之后通過隱藏層的激活函數(shù)對(duì)輸入值進(jìn)行變換得到隱藏層輸出結(jié)果, 輸出層將最后一個(gè)隱藏層的輸出值接收, 將它們轉(zhuǎn)化為輸出值, 其過程如圖3所示。
每一層的輸入與輸出的關(guān)系為:
hj=f(∑ixiwij+lj)(3)
其中: hj為隱藏層第j(j=1, 2, …, m, m為隱藏層節(jié)點(diǎn)數(shù))個(gè)節(jié)點(diǎn)輸出值; wij為輸入層第i(i=1, 2, …, n, n為輸入層節(jié)點(diǎn)數(shù))個(gè)節(jié)點(diǎn)到隱藏層第j個(gè)節(jié)點(diǎn)的權(quán)重; xi為第i個(gè)輸入節(jié)點(diǎn); lj為隱藏層第j個(gè)節(jié)點(diǎn)的閾值。
基于PSO-MLP模型建立流程如圖4所示。
2" 結(jié)果與分析
2.1" 特征提取與分析
2.1.1" 時(shí)域特征
圖5是魚群不同攝食狀態(tài)下典型攝食聲樣本的時(shí)域波形, 可見不同狀態(tài)下的波形差異較為明顯: 強(qiáng)攝食強(qiáng)度下的信號(hào)強(qiáng)度最大, 隨著攝食強(qiáng)度的減弱, 攝食聲的強(qiáng)度也有明顯的降低。
短時(shí)能量代表了每一幀內(nèi)信號(hào)的能量值, 反映了信號(hào)的動(dòng)態(tài)能量特性[11]。 圖6是4類典型信號(hào)樣本的短時(shí)平均能量變化趨勢(shì)。 強(qiáng)攝食強(qiáng)度下此特征值最大, 很容易與其他攝食強(qiáng)度的短時(shí)能量區(qū)分; 無攝食狀態(tài)的短時(shí)平均能量幾乎為0; 中攝食強(qiáng)度的短時(shí)能量比弱攝食強(qiáng)度稍強(qiáng)。 圖7是不同攝食強(qiáng)度下短時(shí)平均能量范圍分布圖。 隨著攝食強(qiáng)度的依次減弱, 短時(shí)平均能量不斷減小且分布更加集中。 不同攝食強(qiáng)度下的攝食聲信號(hào)短時(shí)平均能量的差異較大, 能將不同強(qiáng)度的攝食狀態(tài)顯著區(qū)分。
短時(shí)平均過零率能夠在一定程度上反映出聲音信號(hào)的頻率特性, 是較為重要的頻域特征之一[11]。 圖8是不同攝食狀態(tài)下的4類典型信號(hào)樣本的短時(shí)平均過零率變化趨勢(shì)。 圖9是不同攝食強(qiáng)度下短時(shí)平均過零率范圍分布。 當(dāng)攝食強(qiáng)度為強(qiáng)和無時(shí), 該特征值都較小, 但當(dāng)攝食強(qiáng)度為無時(shí)特征值波動(dòng)更加平穩(wěn), 分布在10上下。 同時(shí), 由圖9可知, 4類信號(hào)樣本的短時(shí)平均過零率分布范圍有較多重合, 差異不明顯, 不能將不同攝食強(qiáng)度的攝食狀態(tài)顯著區(qū)分。
2.1.2" 功率譜
功率譜反映了信號(hào)在不同頻率下的功率分布情況。 功率譜的主峰值是功率譜上功率的最大值, 主峰頻率為主峰值對(duì)應(yīng)的頻率。 圖10為4類典型信號(hào)樣本的功率譜, 信號(hào)的頻率范圍主要集中在0~250 Hz, 且在此頻率范圍有功率重疊現(xiàn)象。 隨著攝食強(qiáng)度的減弱, 攝食聲的功率也明顯減小, 不同攝食狀態(tài)下的功率譜主峰值有較大差異。 圖11、 圖12是功率譜主峰頻率和主峰值的范圍分布圖, 由圖可知: 不同攝食強(qiáng)度下的主峰頻率范圍重合度較高, 差異并不明顯; 但主峰值的差異較大, 且隨著攝食強(qiáng)度的減弱不斷降低。
2.1.3" 梅爾頻率倒譜系數(shù)
MFCC標(biāo)度模擬人耳頻率感知的非線性, 大致遵循實(shí)際頻率的對(duì)數(shù)分布, 廣泛應(yīng)用于語音與動(dòng)物發(fā)聲識(shí)別[12-13]。 圖13為每類攝食強(qiáng)度各20個(gè)樣本的MFCC(共12個(gè))變化趨勢(shì)。 由圖13可以看出, 隨著序列號(hào)的增加, MFCC的絕對(duì)值逐漸趨近于0。 魚群不攝食時(shí), 信號(hào)樣本的MFCC分布較集中, 變化規(guī)律相似。 所有信號(hào)樣本的前3個(gè)MFCC變化趨勢(shì)基本一致, 第二個(gè)系數(shù)都為峰谷, 第三個(gè)系數(shù)為峰頂。 當(dāng)魚群有攝食時(shí), 后9個(gè)MFCC的分布并不集中, 規(guī)律不明顯。 顯著性分析表明, 不同攝食強(qiáng)度下第二個(gè)MFCC的差異性顯著, 能將不同攝食狀態(tài)顯著區(qū)分。
2.1.4" 小波包分解頻段能量
小波包分解通過計(jì)算信號(hào)在不同頻率和時(shí)間尺度上的變換系數(shù), 得到信號(hào)在不同頻率上的能量分布情況[16]。 將4類信號(hào)樣本在0~1 000 Hz范圍內(nèi)不同頻段上的平均能量占比繪制成柱狀圖(圖14)。 在0~250 Hz上能量分布最多, 接近90%。 不同攝食強(qiáng)度的攝食聲信號(hào)在同一頻率范圍上的能量分布也有一定差異, 其中: 攝食強(qiáng)度為中的攝食聲能量在0~250 Hz上的占比最高, 接近95%; 攝食強(qiáng)度為無的攝食聲能量在0~250 Hz上的能量占比達(dá)到90%, 說明了不攝食情況下的環(huán)境噪聲能量大多也集中在0~250 Hz; 強(qiáng)攝食強(qiáng)度和弱攝食強(qiáng)度的攝食聲能量在0~250 Hz上的能量占比在80%~90%之間。 這與功率譜分析得到的結(jié)果一致, 攝食聲信號(hào)的能量大多集中在低頻頻段上。
2.1.5" 小波時(shí)頻圖的顏色特征和紋理特征
不同攝食狀態(tài)下典型水聲信號(hào)的小波時(shí)頻圖如圖15所示, 其中: 冷暖顏色代表小波能量值, 越暖表示能量越大, 橫軸和縱軸分別表示時(shí)間和頻率。 隨著攝食強(qiáng)度的減弱, 圖像的顏色和紋理變化逐漸減弱。 所有樣本的時(shí)頻圖HSV分量特征值分布規(guī)律如圖16所示。 隨著攝食強(qiáng)度的減弱, x33、 x40、 x413個(gè)顏色特征的均值呈增大趨勢(shì), 而x34、 x35、 x36的均值逐漸減小且分布更加集中。 不同攝食強(qiáng)度下x37、 x38、 x393個(gè)特征的分布范圍有較多重疊, 差異較小。 顯著性分析表明, 顏色特征中, x33、 x34、 x35、 x36、 x41有顯著差異, 即在不同攝食強(qiáng)度下, 時(shí)頻圖的色調(diào)特征、 飽和度的平均強(qiáng)度以及亮度的偏移性差異顯著, 能將不同的攝食強(qiáng)度顯著區(qū)分。
所有樣本的時(shí)頻圖紋理特征值分布規(guī)律如圖17所示。 隨著攝食強(qiáng)度的減弱, 所有紋理特征的均值都呈逐漸減小的趨勢(shì), 說明攝食聲時(shí)頻圖的紋理信息在能量、 熵、 慣性矩和相關(guān)性上有一致的變化趨勢(shì)。 同時(shí), 隨著攝食強(qiáng)度減弱, x42、 x47、 x48的分布更加集中, 而x49的分布范圍則逐漸擴(kuò)大。 各攝食強(qiáng)度下x43、 x44、 x45的均值差異較小, 分布范圍也有較大程度的重疊。 顯著性分析表明: 在時(shí)頻圖的紋理特征中x42、 x46、 x47差異顯著, 即小波時(shí)頻圖共生矩陣能量的均值及慣性矩的均值和方差有較為顯著的差異, 說明不同攝食狀態(tài)下的攝食聲時(shí)頻圖的復(fù)雜集中程度以及紋理清晰度差異較大, 能將不同的攝食強(qiáng)度顯著區(qū)分。
2.2" 特征選擇
通過RF算法計(jì)算的各個(gè)特征的重要性如圖18所示。 重要性排在前15的特征為x36、 x4、 x47、 x23、 x41、 x9、 x40、 x35、 x33、 x13、 x27、 x46、 x6、 x43、 x42。 基于Pearson的特征重要性排序如圖19所示。 圖19展示了較為重要的前20個(gè)特征。 本文取其中的前15個(gè)特征作為輸入分類模型的最終特征, 這些特征是x33、 x35、 x47、 x49、 x48、 x36、 x41、 x44、 x4、 x34、 x46、 x42、 x6、 x43、 x40。 對(duì)所有49個(gè)特征進(jìn)行主成分分析, 其貢獻(xiàn)率分布如圖20所示: 前2個(gè)主成分貢獻(xiàn)率較高, 分別為23.55%和22.17%; 第3至第15個(gè)主成分, 貢獻(xiàn)率急劇下降; 之后貢獻(xiàn)率變化趨于穩(wěn)定; 第37及其之后的主成分貢獻(xiàn)率接近于0。 前15個(gè)主成分組成的累計(jì)貢獻(xiàn)率達(dá)到87.54%, 代表了原始數(shù)據(jù)的大部分信息, 因此本文用前15個(gè)主成分構(gòu)造攝食強(qiáng)度識(shí)別的特征向量。
2.3" 攝食強(qiáng)度識(shí)別
將測(cè)試集輸入訓(xùn)練好的分類模型中, 得到的結(jié)果如表1所示。 將提取的信號(hào)全特征輸入分類模型進(jìn)行分類識(shí)別時(shí), PSO-MLP分類模型的平均識(shí)別準(zhǔn)確率為96.76%, 比優(yōu)化前的MLP分類模型準(zhǔn)確率提高3.65個(gè)百分點(diǎn); 1 920個(gè)測(cè)試集樣本的分類時(shí)長(以下簡(jiǎn)稱“分類時(shí)長”)為8.23 s, 比優(yōu)化前MLP模型減少0.48 s。 將提取出的信號(hào)特征篩選后再進(jìn)行分類識(shí)別時(shí), 基于不同特征選擇方法的PSO-MLP模型的對(duì)比結(jié)果表明: 特征選擇能在盡量保證準(zhǔn)確率的情況下有效縮短分類時(shí)長; PCA對(duì)模型的準(zhǔn)確率和運(yùn)行速度的提升作用最顯著, 其準(zhǔn)確率高達(dá)97.88%, 分類時(shí)長為6.24 s。
2.4" 模型驗(yàn)證
為驗(yàn)證基于PCA特征選擇的PSO-MLP分類模型的有效性及普適性, 建模完成后, 另外獨(dú)立采集了一段時(shí)長為480 s的攝食聲信號(hào), 使用滑動(dòng)窗口對(duì)攝食聲信號(hào)進(jìn)行輸入, 每次滑動(dòng)距離為1 s。 使用已有的分類模型對(duì)驗(yàn)證樣本進(jìn)行識(shí)別, 識(shí)別模型MLP、 PSO-MLP、 RF-PSO-MLP、 Pearson-PSO-MLP、 PCA-PSO-MLP的平均識(shí)別準(zhǔn)確率分別為81.25%、 84.36%、 87.5%、 85%、 92.5%。 識(shí)別模型PCA-PSO-MLP的識(shí)別準(zhǔn)確率最高, 能夠通過攝食聲信號(hào)準(zhǔn)確識(shí)別不同的攝食強(qiáng)度。 圖21為模型驗(yàn)證結(jié)果, 在不同攝食狀態(tài)銜接的過程中, 識(shí)別準(zhǔn)確率有所下降。 該現(xiàn)象在由中攝食強(qiáng)度到弱攝食強(qiáng)度的切換過程中尤為明顯。 這是因?yàn)樵谙噜彅z食強(qiáng)度的切換中, 攝食聲是逐漸變化的, 其特征差異不顯著, 導(dǎo)致模型識(shí)別準(zhǔn)確率有所下降。 但總體來看, 本文所使用的方法能夠較準(zhǔn)確地識(shí)別4種攝食狀態(tài)變化, 且具有一定程度的普適性。
3" 結(jié)論
本研究采用被動(dòng)聲學(xué)技術(shù)獲取高密度養(yǎng)殖加州鱸在攝食過程中的水聲信號(hào), 結(jié)合不同的特征提取方法和特征選擇方法建立了基于被動(dòng)水聲信號(hào)的魚群攝食強(qiáng)度識(shí)別模型, 進(jìn)而實(shí)現(xiàn)對(duì)高密度養(yǎng)殖加州鱸攝食強(qiáng)度的識(shí)別。 結(jié)果顯示:
1) 不同的水聲信號(hào)特征在魚群攝食強(qiáng)度識(shí)別中的貢獻(xiàn)度有較大差異。 功率譜的主峰值、 梅爾頻率倒譜系數(shù)中的第二個(gè)系數(shù)、 在750~1 000 Hz上攝食聲信號(hào)的能量占比、 水聲信號(hào)時(shí)頻圖的色調(diào)平均強(qiáng)度、 偏移性、 飽和度的平均強(qiáng)度以及亮度的方差和偏移性、 水聲信號(hào)時(shí)頻圖共生矩陣的能量和慣性矩的均值和標(biāo)準(zhǔn)差對(duì)攝食強(qiáng)度識(shí)別的貢獻(xiàn)度較大, 在多種特征選擇方法下其貢獻(xiàn)度都排在前15位。 其中, 貢獻(xiàn)度較大的大部分特征來源于攝食聲信號(hào)時(shí)頻圖, 這是由于攝食聲信號(hào)時(shí)頻圖能將時(shí)間、 頻率和能量在一張圖中表示出來, 攜帶了較為豐富有效的信息, 且能將局部特征較好地表現(xiàn)出來。
2) 從識(shí)別模型的準(zhǔn)確率來看, 基于PCA特征選擇的PSO-MLP識(shí)別分類模型的識(shí)別準(zhǔn)確率最好, 達(dá)到97.88%, 效率最高, 識(shí)別時(shí)長為6.24 s, 識(shí)別準(zhǔn)確率和識(shí)別效率均優(yōu)于基于Pearson和PCA特征選擇的PSO-MLP分類模型。 此分類模型在驗(yàn)證試驗(yàn)中能夠較為準(zhǔn)確地識(shí)別4種攝食狀態(tài)的變化, 具有一定的普適性。 本研究表明: 被動(dòng)聲學(xué)技術(shù)能快速有效地識(shí)別高密度養(yǎng)殖狀態(tài)下加州鱸的攝食強(qiáng)度, 準(zhǔn)確率較高, 相比于計(jì)算機(jī)視覺技術(shù), 可不受水體能見度、 光照強(qiáng)度的影響, 具有較好的穩(wěn)定性。
參考文獻(xiàn):
[1]
國家特色淡水魚產(chǎn)業(yè)技術(shù)體系. 中國淡水鱸產(chǎn)業(yè)發(fā)展報(bào)告 [J]. 中國水產(chǎn), 2021(3): 40-48.
[2]" LIU Z Y, LI X, FAN L Z, et al. Measuring Feeding Activity of Fish in RAS Using Computer Vision [J]. Aquacultural Engineering, 2014, 60: 20-27.
[3]" CHEN G, CAI L, ZONG L, et al. Survey of Marine Organisms Based on Passive Acoustic Technology [J]. International Journal of Design amp; Nature and Ecodynamics, 2020, 15(5): 729-737.
[4]" 曹曉慧, 劉晃, 戚仁宇, 等. 循環(huán)水養(yǎng)殖大口黑鱸攝食顆粒飼料的聲學(xué)特征 [J]. 農(nóng)業(yè)工程學(xué)報(bào), 2021, 37(20): 219-225.
[5]" 曲蕊, 劉晃, 劉俊文, 等. 大口黑鱸攝食過程的聲信號(hào)特征及養(yǎng)殖密度的影響 [J]. 漁業(yè)現(xiàn)代化, 2021, 48(6): 55-63.
[6]" MALLEKH R, LAGARDRE J P, ENEAU J P, et al. An Acoustic Detector of Turbot Feeding Activity [J]. Aquaculture, 2003, 221(1-4): 481-489.
[7]" 湯濤林, 唐榮, 劉世晶, 等. 羅非魚聲控投餌方法 [J]. 漁業(yè)科學(xué)進(jìn)展, 2014, 35(3): 40-43.
[8]" 黃漢英, 楊詠文, 李路, 等. 基于被動(dòng)水聲信號(hào)的淡水魚混合比例識(shí)別 [J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2019, 50(10): 215-221.
[9]" 毛博慧, 孫紅, 劉豪杰, 等. 基于正交變換與SPXY樣本劃分的冬小麥葉綠素診斷 [J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2017, 48(S1): 160-165.
[10]楊詠文, 黃漢英, 馮婉嫻, 等. 基于被動(dòng)水聲信號(hào)的淡水魚混合數(shù)量預(yù)測(cè) [J]. 華中農(nóng)業(yè)大學(xué)學(xué)報(bào), 2020, 39(5): 147-152.
[11]陳劍, 徐庭亮, 黃志, 等. 基于聲信號(hào)的滾動(dòng)軸承故障診斷研究 [J]. 振動(dòng)與沖擊, 2023, 42(21): 237-244.
[12]張少康, 田德艷. 水下聲目標(biāo)的梅爾倒譜系數(shù)智能分類方法 [J]. 應(yīng)用聲學(xué), 2019, 38(2): 267-272.
[13]KIM S, KIM J. Sound-Based Abnormal Combustion Classification Model for High Compression Ratio, Spark-Ignition Engines Using Mel-Frequency Cepstrum Coefficients and Ensemble Learning Algorithms [J]. International Journal of Automotive Technology, 2023, 24(3): 873-881.
[14]虞逸航, 胡海林, 陳迪俊, 等. 極低本底單頻激光相對(duì)強(qiáng)度噪聲測(cè)試方法研究 [J]. 中國激光, 2023, 50(22): 22-29.
[15]劉子昌, 白永生, 李思雨, 等. 基于小波時(shí)頻圖與Swin Transformer的柴油機(jī)故障診斷方法 [J]. 系統(tǒng)工程與電子技術(shù), 2023, 45(9): 2986-2998.
[16]杜偉東, 李海森, 魏玉闊, 等. 基于SVM的多方位聲散射數(shù)據(jù)協(xié)作融合魚分類與識(shí)別 [J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2015, 46(3): 268-275.
[17]MALIK F, BAHARUDIN B. Features Analysis for Content-Based Image Retrieval Based on Color Moments [J]. Research Journal of Applied Sciences, Engineering and Technology, 2012, 4(9): 1215-1224.
[18]SAROJA G A S, SULOCHANA C H. Texture Analysis of Non-Uniform Images Using GLCM [C] //2013 IEEE Conference on Information amp; Communication Technologies. New York: IEEE, 2013: 1319-1322.
[19]陳明, 張重陽, 馮國富, 等. 基于特征加權(quán)融合的魚類攝食活動(dòng)強(qiáng)度評(píng)估方法 [J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2020, 51(2): 245-253.
[20]SMITH A, STERBA-BOATWRIGHT B, MOTT J. Novel Application of a Statistical Technique, Random Forests, in a Bacterial Source Tracking Study [J]. Water Research, 2010, 44(14): 4067-4076.
[21]閆星光, 李晶, 閆蕭蕭, 等. 一種快速修復(fù)Landsat影像條帶色差的方法 [J]. 光譜學(xué)與光譜分析, 2023, 43(11): 3483-3484, 3486-3491.
[22]商立群, 李洪波, 侯亞東, 等. 基于特征選擇和優(yōu)化極限學(xué)習(xí)機(jī)的短期電力負(fù)荷預(yù)測(cè) [J]. 西安交通大學(xué)學(xué)報(bào), 2022, 56(4): 165-175.
[23]肖勇, 趙云, 涂治東, 等. 基于改進(jìn)的皮爾遜相關(guān)系數(shù)的低壓配電網(wǎng) 拓?fù)浣Y(jié)構(gòu)校驗(yàn)方法 [J]. 電力系統(tǒng)保護(hù)與控制, 2019, 47(11): 37-43.
[24]吳澎, 賈朝爽, 范蘇儀, 等. 櫻桃品種果實(shí)品質(zhì)因子主成分分析及模糊綜合評(píng)價(jià) [J]. 農(nóng)業(yè)工程學(xué)報(bào), 2018, 34(17): 291-300.
[25]ZHANG S, HU Y P, WANG C M. Evaluation of Borrowers Credit of P2P Loan Based on Adaptive Particle Swarm Optimisation BP Neural Network [J]. International Journal of Computational Science and Engineering, 2019, 19(2): 197.
[26]肖白, 李道明, 穆鋼, 等. 基于SA-PSO算法優(yōu)化CNN的電能質(zhì)量擾動(dòng)分類模型 [J]. 電力自動(dòng)化設(shè)備, 2024, 44(5): 185-190.
[27]段雙明, 王恩吉, 朱微, 等. 基于鋰電池電壓片段的退役電池快速篩選重組 [J]. 電網(wǎng)技術(shù), 2024, 48(10): 4264-4274.
[28]陳東陽. 基于PSO-MLP神經(jīng)網(wǎng)絡(luò)的遙信插件質(zhì)量識(shí)別方法研究 [J]. 電力系統(tǒng)保護(hù)與控制, 2020, 48(3): 164-170.
責(zé)任編輯" 張栒