欒興
摘要 人工智能在林業中的應用場景很多,如何精準測報是一大難題。通過建立病蟲基本信息庫、樹木基本信息庫、蟲害基本信息庫,再通過病蟲與樹木寄主的關系和蟲害特征進行層層篩選比對,以達到精準識別。
關鍵詞 人工智能;林業病蟲害;精準測報
中圖分類號:F307.2 文獻標識碼:B 文章編號:2095–3305(2021)03–0154–02
林業有害生物對患區當地及周邊地區林業生態造成的傷害往往是災難性的、不可逆的、永久性的,并且其危害也嚴重阻礙了林業生態健康、可持續發展。如何進行科學有效地防控,將林業有害生物災害控制在可控范圍內,不至于遏制或阻礙林業生態建設的進程,是當前林業有害生物防控工作亟需解決的重點和難點問題。
江蘇省林業有害生物2 003種,病害355種,蟲害1 467種,有害植物52種,其他類129種。其中,外來林業有害生物20種,國家公布的14種檢疫性林業有害生物,江蘇省就有2種在全省大面積發生,全國重點治理的六大林業有害生物,在江蘇省發生危害的有4種。當前,江蘇省監測預警、檢疫御災、災害應急難以滿足防控實際需要,林業有害生物聯防聯治、統一調度是防控工作的關鍵。隨著云計算、大數據、移動互聯網、物聯網等新技術的發展,將有助于林業有害生物防控的科學化管理[1]。構建自動化、智能化的林業有害生物管理平臺十分必要,而林業病蟲害精準測報是關鍵,因此,研究人工智能助力林業病蟲害精準測報對社會和經濟的發展有重要的現實意義。
1 圖像采集
害蟲識別首先要求獲取圖像,系統支持兩種圖像獲取方式:機器采集和人工獲取。
(1)機器采集:預置圖像采集點,按照林區的面積均勻分布圖像采集點,設置設備的焦距、采集時間、周期以及一周期內的快門響應次數,從而獲取圖片。隨后圖像將通過物聯網設備每隔一段時間(比如10 min)自動上傳至服務器,通過人工智能的算法識別出圖片內的昆蟲種類及數量,分析其中害蟲的數目變化,從而推斷出整個林區內大致的昆蟲分布情況以及蟲害情況[2]。當林區發生蟲害時,可以調取該區域機器采集的昆蟲數據,通過分析數量較多、占比較大的害蟲確定蟲害類型與發生原因,幫助操作人員更好地判斷蟲害發生的原因,若識別度不足可使用樹木識別輔助修正幫助判斷。采集識別流程見圖1。
(2)人工采集:操作人員在實地檢查時,可以通過便攜式圖像采集設備比如手機,拍攝昆蟲圖片,再通過手機或通訊網絡傳輸至服務器用以識別昆蟲種類。
2 圖像識別分析(核心算法)
獲取昆蟲圖像之后,使用人工智能的算法識別昆蟲。在圖像識別領域中,卷積神經網絡相較于其他模型有其獨特優勢,算法可以自行提取對象特征進行識別,從而使得圖像識別對于光線、強度等圖像質量要求并不需要太高。通過CNN發展而出的,如Faster R-CNN識別框架不僅能夠識別對象,而且可以劃定對象范圍,為計數功能提供方便。圖像識別算法主要包括以下3個步驟:
(1)圖像預處理:圖像處理技術,銳化去噪等;
(2)目標定位:定位圖片中所有昆蟲的bounding box,生成ROIs(Region of Interests);
(3)細粒度分類:構建并訓練深度學習分類模型,基于ROIs進行昆蟲識別。
其中,對于昆蟲識別,由于拍攝圖像時存在拍攝目標之間相互重疊的問題,使用Faster R-CNN進行目標識別時,對于目標定位始終存在一定的偏差。為了解決這一問題,可以使用Mask R-CNN進行目標識別。 Mask R-CNN是在Faster R-CNN的基礎上添加了一個預測分割mask的分支,將RoI Pooling層替換成了RoIAlign層,同時添加了并列的FCN層(mask層),因此可以有效彌補Faster R-CNN的不足。
構建好模型框架后,通過在大量標注數據上進行訓練,可以得到準確率較高的圖像識別模型。
3 樹木識別
操作人員通過使用便攜式圖像采集裝置拍攝樹木的樹葉以及樹木的整體照片,通過手機或通訊網絡上傳至服務器識別樹木的樹種,幫助操作員明確樹種,從而更加容易找出蟲害原因,并以此為依據修正識別結果,提高結果準確度。若識別度不足可使用蟲害識別輔助,修正幫助判斷。樹木識別算法與昆蟲識別算法相同。
4 蟲害識別
如果通過害蟲識別和樹木識別相結合,識別度仍然達不到設定的需求,需要通過蟲害識別進一步提高準確度。操作人員通過便攜式圖像獲取設備拍攝蟲害處照片,通過算法分析該蟲害產生的原因,結合害蟲識別結果與樹種識別結果推斷出結果。
蟲害識別算法與昆蟲識別算法相同。由于蟲害特征不存在非常明顯的關聯性,即同樣形態的蟲害可能是由不同昆蟲或不同原因引起的,僅僅識別蟲害圖片會存在多種可能的結果,因此,蟲害識別僅作為害蟲識別以及樹種識別的輔助修正識別,幫助提高害蟲測報的精確度,而難以單獨使用進行蟲害判斷。
5 推理流程
推理流程如圖2。
步驟一:首先取得并識別昆蟲圖片,獲得初步識別結論與識別度,若識別度小于90%,則進入步驟二。
步驟二:若圖片由操作人員拍攝,則繼續獲取樹木圖片,進入步驟三;否則交由專家人工判斷。
步驟三:獲取并識別樹種圖片,經由規則庫比對,該昆蟲是否習慣于生活在該種植物上,通過樹種識別度與規則庫匹配度加權修正昆蟲識別度,若識別度小于90%,進入步驟四。
步驟四:獲取并識別蟲害圖片,識別出可能產生該蟲害特征的害蟲種類、樹種種類,與步驟一、步驟三中的識別結果進行比對,修正識別度,若識別度小于90%,交由專家進行人工識別。
6 基礎庫建設
6.1 昆蟲庫
昆蟲庫主要包括:(1)昆蟲的基本信息:中文名、拉丁學名、別稱、界、門、亞門、綱、亞綱、目、亞目、科、屬、種、英文名、命名者及年代;(2)形態特征:成蟲、卵、幼蟲、蛹、鑒別特征;(3)棲地分布:生物學特性、原產地、中國分布現狀、引入擴散原因和危害;(4)寄生植物:寄主;(5)生長繁殖、擴展途徑、發生特點、昆蟲危害、相關法規、防治方法等相關信息。
其中,害蟲代碼采用中華人民共和國國家標準(GB/T 15775—2011)關于林業害蟲的林木資源分類與代碼的編碼規范。該規范選擇害蟲最穩定的本質屬性做為分類的基礎和依據,按照科-目-種3個層次分類將該標準的代碼分為3個層次,由七位數字構成。第一、二位代表害蟲分類中的“目”,第三、四位代表“科”,第五、六、七位代表“種”。
6.2 害蟲圖像庫
通過人工選取相應的害蟲圖像,每種昆蟲選取不同角度、不同背景、不同狀態的圖片,定位到具體的種,打上標簽并制作相應文件夾,同時也要選取同種昆蟲在不同生長時期的圖片并打上標簽。在算法訓練模型時,為防止過擬合現象,每張圖片需要進行旋轉、移動等操作,幫助提高識別準確率。
6.3 樹種庫
樹種庫主要由樹種信息表構成,信息表存儲了樹種的主要信息,包括種名、學名、科名屬名、生長類型、生態適應性、形態、形態圖像、物候、分布區域、病蟲害等信息。其中,樹種代碼依照樹木通用代碼。
6.4 樹種圖像庫
目前,網絡上開放的樹木數據庫包括PlantNet、Leafsnap以及Flavia,這些數據庫包含的數據主要是各樹種的樹葉信息,因此需要另外自行搭建包含各樹種整體圖片的圖像庫。可以將林區內的每種樹種拍攝不同角度的圖片,同時在不同季節、一天之內不同的時間、光線條件不同時拍攝,同時,加入樹葉與樹皮紋理的圖片以提高準確率。在算法訓練模型時為防止過擬合現象,每張圖片需要進行旋轉、移動等操作,幫助提高識別準確率。
6.5 蟲害庫
通過人工選取每種昆蟲造成不同蟲害的圖片,打上標簽并制作相應文件夾。
6.6 規則庫
對于森林中的常見多發病,森林病蟲害專家根據國內外資料和實踐觀察編寫了大量的病害檢索表。其中比較全面且權威的有周仲銘先生的《林木病理學》著作中的林木病害檢索表。
根據病害檢索表中的信息,構建病蟲害規則庫。記錄每種害蟲在不同時期對于不同的樹種造成的蟲害特征,不同昆蟲在不同時期寄生的樹種種類,將昆蟲庫、樹種庫與蟲害相互關聯。
參考文獻
[1] 李成贊.森林病蟲害診斷及害蟲預報專家系統的研建[D].北京:北京林業大學,2009.
[2] 姜紅花,張傳銀,張昭,等.基于Mask R-CNN的玉米田間雜草檢測方法[J].農業機械學報,2020(6):227-235,254.
責任編輯:黃艷飛