王鑫玉 王姝蒙 李文順
關鍵詞: YOLOv5 圖像識別 人工智能 注意力機制
中圖分類號: TP391 文獻標識碼: A 文章編號: 1672-3791(2024)01-0230-04
黑龍江省大小興安嶺、老爺嶺、完達山等林區分布著數量不等的馬鹿群,為保護馬鹿種群正常的生存繁衍[1],相關領域的工作人員付出了大量的心血,如運用野外觀測法等方法評估馬鹿種群數量,從而確保馬鹿種群的多樣性等。對鹿種群數量進行研究,有助于了解鹿的種群生態和生活史,也有利于動物的管理和保護。記錄瀕危物種或狩獵物種在一段時間內種群數量的變化,有助于保護區或管理人員對該物種的保護措施做出相應的調整。
目前,對于野生鹿的種群數量、種群結構等的調查方法有樣線法、微衛星標記、紅外相機、直接觀察法、無線電相圈法等,但這些方法實施難度大、準確度低[2]。
近年來,計算機視覺技術不斷發展,神經網絡用于分類識別也比較成熟,目前,有些學者將這些先進的技術應用到了植物細胞壁識別分類方面,并進行全面研究,解決了利用顯微鏡人工辨認對糞便顯微組織植物表皮角質碎片進行分析效率較低下的問題。但鹿食植物細胞分類是一個很繁瑣的問題,由于客觀因素太多,且植株經動物咀嚼消化后,已經不可能具備有完整的葉片形態,導致鹿食植物的分類等問題遲遲未能得到有效解決。未解決這一問題可以通過植物殘渣的細胞壁形態來進行鑒定和分類,例如:糞便顯微分析法是根據鹿排泄的糞便中植物表皮角質形成細胞在被消化后仍然具有細胞壁結構這一特征,來鑒定鹿食植物的種類和數量與成分組成。
根據這種情況,本文提出了一種“基于深度學習的鹿食植物細胞與種群數量關系的分析方法”,采用計算機視覺技術將馬鹿糞便中各類植物細胞壁的特征提取出來,并通過建立卷積神經網絡模型,將所有輸入的數據進行識別與分類。并通過植物殘渣細胞壁形態來研究鹿攝食習性,從而鑒定鹿食植物的種類、數量與成分組成。提高分析效率和鹿種群監測的準確率,為鹿種群監測提供一種新的手段和方法。
1 實驗樣本處理方法
1.1 鹿食植物葉片樣本處理方法
本文研究建立的數據集有十幾種樹木葉片,這些葉片具有十分復雜的相似性。為了最大限度地豐富葉片數據集[3],從而使利用數據集進行訓練的神經網絡模型能可以更加充分地學習葉片上各種不同的特征,因此本文建立葉片圖像數據集時不僅僅局限于拍攝單一背景的圖片,而是進行了更有復雜背景下的圖片處理。
在收集原始材料的過程中,首先需要摘取葉片較為完整的、葉面紋路較為清晰的植物葉片,然后將這些采集到的葉片樣本放置在純白色的背景板上。為了能夠獲取不同角度下的葉片圖像,本文使用了索尼數碼相機,在盡可能保證光照、溫度、濕度等外界環境因素不變的前提下,進行了全方位的拍攝,而后在獲取葉片紋路細節圖像時,本文采用科密掃描儀對葉片進行了圖像掃描,并導出了掃描結果[4]。
復雜環境葉片數據的采集工作主要是通過索尼照相機在野外拍攝完成的。在此過程中,盡量尋找完整的樹木葉片,但并不設特定拍攝的背景。采集人員根據樹木葉片的長勢隨機拍攝,確保拍攝圖片是葉片最真實生長環境。但是這種采集方法由于野外環境的復雜,經常導致獲取的樹木葉片圖像有光照不均、雜亂背景、顯示不全、細節不清晰等問題。這些干擾因素也給模型的訓練增加了一定的難度。
本文研究建立的數據集有十幾種樹木的葉片樣本,部分樣本如圖1 所示。根據圖可知,不同種類樹木的葉片具有十分復雜的相似性,具有很多相似的特征,故而葉片在野外環境下顯得十分相似。這也對卷積神經網絡的性能提出了更高的要求。
1.2 糞便樣本處理方法
在開始制作糞便顯微片前,需要對采集到的糞便進行預處理,首先將采集的馬鹿糞便樣本取出3粒放置在事先準備的干燥容器中,組成一份復合樣本,而后將容器放置在烘箱之中,將烘箱溫度調整至70 ℃,連續烘干48 h,保證樣本中水分全部蒸發,而后將樣本從烘箱中取出,去除容器,使用80 目或100 目的篩子對其中的樣本進行過濾,最終保留小于80 目和大于100 目的樣本。
每種樣本取0.5 g 放入相應培養皿中,向培養皿中注入10% 的次氯酸鈉溶液,直至溶液浸沒培養皿2/3。使用玻璃杯將樣本攪拌均勻。密封培養皿8~10 h,打開培養皿,用鑷子將溶液上層透明較薄的薄膜放置于載玻片上,而后用濾紙吸取載玻片上多余次氯酸鈉溶液,用蒸餾水清洗載玻片2~3 遍。將載玻片放在顯微鏡下觀察,若圖像不清晰則繼續使用蒸餾水沖洗,若圖像清晰則使用甘油封片。鹿食植物細胞樣本圖像見圖2。
本文采用頻率轉換法對制作的馬鹿糞便樣本進行分析,首先將糞便纖維片放置在100 倍的光學顯微鏡下做鏡檢,在每張纖維片的視野中,按照從上到下由左到右的順序選取15~20 個視野,并記錄每個視野中出現的植物表皮碎片,該方法可以計算出每種植物碎片出現的頻率,其數學表達式為
F = 100(1 - e -D) (1)
式(1)中,D 為一種植物表皮碎片的平均密度。
2 網絡模型
2.1 YOLO 模型
YOLO 模型由Joseph Redmon 等于2016 年首次提出,并分別于2017 年、2018 年、2020 年提出了YOLOv2~YOLOv4 這3 個改進版本;2020 年,Glenn Jocher等提出YOLOv4 的改進模型YOLOv5。
與YOLOv1~YOLOv4 相比,YOLOv5[5]增加了自適應錨框計算、矩形推理等功能。同時,可以通過寬度系數與深度系數這兩個參數來控制模型網絡的大小,得到YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x 這4 個模型,從s~x 模型的網絡深度與寬度逐漸增加,網絡結構逐漸復雜,這樣的設計可以便捷地選擇模型大小來權衡目標檢測速度與精度,并在模型推理時采用矩形推理進一步提高目標檢測速度。最重要的是,將YOLOv1~YOLOv4 中一直沿用的“物體由中心點坐標所在的單元格負責預測”思想改進為“物體由中心點坐標所在的單元格與最近的兩個單元格負責預測”,這一改進增加了正負樣本數量,加快了網絡訓練的收斂速度。
本文采用YOLOv5 模型6.0 版本中的YOLOv5s 模型進行實驗,其網絡模型結構如圖3 所示。
2.2 注意力機制
注意力機制早期應用于圖像領域,其原理是通過模擬人類的視覺中注意力的處理方式,篩選出圖像中重要的部分,從而更好地對圖像做出判斷。隨著圖像識別技術的不斷發展,注意力機制被廣泛應用于自然語言處理、目標檢測、語義分割等諸多圖像識別方向[6]。在目標檢測中引入注意力機制理論上可以使模型聚焦于圖像中的關鍵信息,過濾無關信息,節省計算資源,同時提升模型對小目標的檢測效果。
注意力機制(Squeeze-and-Excitation,SE)[7]主要包括Squeeze 和Excitation 兩部分操作,注重特征圖中通道信息的重要性差異,使模型自適應地調整對各通道的注意力權重。
卷積注意力機制(Convolutional Block AttentionModule,CBAM)主要包括通道注意力(Channel Atten AttentionModule,CAM)和空間注意力(Spatial AttentionModule,SAM)兩個順序的子模塊,CBAM 在輸入特征圖的基礎上依次融合了沿通道和空間兩種維度上的注意力權重,并分別與輸入特征相乘得到新的特征,有利于提取特征圖上的重要信息。
坐標注意力機制(Coordinate Attention,CA)[8]主要包括坐標信息嵌入(Coordinate Information Embedding)和坐標注意力生成(Coordinate Attention Generation)兩部分操作,在避免龐大計算開銷的同時增大感受野。
基于規范化的注意力機制(Normalization-basedAttention Module,NAM)[6],利用權重的貢獻因子來改善注意力機制的性能。NAM使用批歸一化的比例因子來表示權重的重要性,可有效避免使用上述SE、CBAM 模塊中的全連接層和卷積層。具體來講,NAM采用CBAM的模塊集成,重新設計了通道和空間注意力子模塊,然后將NAM模塊嵌入每個網絡塊的末端[9]。
2.3 損失函數
目標檢測領域常用的目標框回歸損失函數有IoULoss(Intersection over Union,交并比)、GIoU Loss(GeneralizedIoU)、DIoU Loss(Distance IoU)、CIoU Loss(CompleteIoU)等,IoU 表示目標真實框與預測框的交集與兩者并集之比。IoU 的損失函數數學表達式如公式(2)所示。
3 基于YOLOv5 的鹿食植物細胞識別方法
本文將SE、CBAM、CA、NAM 這4 種注意力模塊分別引入圖3所示的CSP1-2和CSP1-3當中,并且比較其性能的提升程度,最終選擇CBAM模塊。并且在考慮預測框回歸的速度和精度綜合的情況下,該實驗在輸出層選擇用DIoU_Loss 作為邊界框回歸損失函數,加快邊界框回歸的速率以及提高定位精度,加快對弱小目標的檢測速率。
表1 中YOLOv5s 代表使用YOLOv5s 模型獲得的實驗數據,YOLOv5s_CBAM 代表本文提出的模型在實驗中獲得的實驗數據,根據數據不難看出,在草木、灌木、喬木、針葉四大類別中,本文提出的模型對比原始模型精確度與召回率均有提升,對于所有類別而言,本文提出的YOLOv5s_CBAM模型精確率提升了18.1%,召回率提升了11.1%,mAP@.5 提升了3.4%,mAP@.5:.95 提升了5.1%,YOLOv5s_CBAM 模型在各個性能評估指標的上升說明了在主干網絡之后CBAM注意力機制后,有效增強了特征信息。
4 結語
對鹿種群數量進行研究,有助于了解鹿的種群生態和生活史,也有利于動物的管理和保護。記錄瀕危物種在一段時間內覓食植物種類的變化,有助于保護區或管理人員對該物種的保護措施做出相應的調整。
本文首先建立了基本的鹿食植物葉片圖像特征庫與鹿食植物表皮碎片圖像特征庫。而后提出了一種鹿食植物識別方法,該方法結合鹿食植物細胞分類特征,針對鹿食植物細胞數據樣本少,類間差別小與目標尺寸小導致的檢測精度低、效果不佳等問題該方法在原有YOLOv5s 模型的基礎上,加入了注意力機制模塊與DIoU_Loss損失函數模塊,從而提高了模型的檢測效率。