鄒金平 魏萱



















摘 要:雙孢蘑菇疣孢霉病導致菇農巨大的經濟損失,針對其早期癥狀不明顯且缺乏有效的病害診斷方法,將顯微高光譜成像技術應用于雙孢蘑菇疣孢霉病早期檢測研究。首先借助神經網絡強大的非線性學習能力,采用基于注意力機制和稀疏自編碼器重建網絡的BS-Net-FC算法對厚垣孢子顯微高光譜圖像波段選擇,并提出基于厚垣孢子目標形態特異性的MTCEM算法檢測厚垣孢子目標,結果顯示波段選擇算法保證波段子集的信息量同時有效降低了冗余波段,在波段數為17的波段子集上MTCEM算法AUC達到最佳為0.8785。本方法能夠有效減少數據冗余以及對厚垣孢子目標檢測效果良好,為雙孢蘑菇疣孢霉病早期檢測提供新思路和技術支持。
關鍵詞:高光譜;特征提取;孢子;檢測
中圖分類號:S 436.46 ??文獻標志碼:A ??文章編號:0253-2301(2022)02-0001-08
DOI: 10.13651/j.cnki.fjnykj.2022.02.001
Target Detection of the Mycogone Perniciosa of Agaricus Bisporus Based onthe Microscopic Hyperspectral Images
ZOU Jin-ping1, WEI Xuan1, 2*
(1. College of Mechanical and Electrical Engineering, Fujian Agriculture and Forestry University, Fuzhou, Fujian
350002, China; 2. College of Food Science, Fujian Agriculture and Forestry University, Fuzhou, Fujian 350002, China)
Abstract: The mycogone perniciosa of Agaricus bisporus caused huge economic losses to mushroom farmers. In view of the unobvious early symptoms and the lack of effective disease diagnosis methods, the microscopic hyperspectral imaging technology was applied to the early detection of the mycogone perniciosa of Agaricus bisporus. Firstly, the BS-Net-FC algorithm based on the attention mechanism and the sparse auto-encoder reconstruction network was used to select the band of microscopic hyperspectral image of chlamydospore by means of the strong nonlinear learning ability of neural network. The MTCEM algorithm based on the morphological specificity of chlamydospore targets was proposed to detect the chlamydospore targets. The results showed that the band selection algorithm ensured the information of the band subset and effectively reduced the redundant bands. The AUC of MTCEM algorithm reached the best value of 0.8785 on the band subset with 17 bands. This method could effectively reduce the data redundancy and had good detection effect on the chlamydospore targets, thus to provide new idea and technical support for the early detection of the mycogone perniciosa of Agaricus bisporus.
Key words: Hyperspectral; Feature extraction; Spores; Detection
福建省是食用菌類生產大省,其中以雙孢蘑菇Agaricus bisporus為代表,雙孢蘑菇富含高蛋白、高維生素和低脂肪以及它的生長周期短、繁殖快、市場需求量大等特點賦予其極高的經濟價值,但雙孢蘑菇疣孢霉病是雙孢蘑菇最為常見且最為普遍的病害之一,其致病菌為有害疣孢霉菌mycogone perniciosa,該病害傳染性強、破壞性大,通常對生產造成減產甚至絕收等惡劣影響。目前雙孢蘑菇栽培由于缺乏疣孢霉病早期檢測手段,通過人眼觀察法觀察雙孢蘑菇疣孢霉病害癥狀進行病害防治往往為時已晚,導致巨大的經濟損失;而依靠聚合酶鏈式反應(PCR)等生化試驗對病原體檢測,存在工作人員專業要求高,檢測費時費力等問題。因此,借助新型技術手段對雙孢蘑菇疣孢霉病早期檢測十分必要,實現在雙孢蘑菇栽培中罹患疣孢霉病早期監測,保障雙孢蘑菇生產。
高光譜成像技術作為一種新型檢測技術,具有高分辨率的圖像信息和豐富的光譜信息優勢,廣泛應用于農作物病害檢測領域。秦立峰等[1]采集黃瓜早期霜霉病高光譜圖像建立黃瓜霜霉病早期檢測模型,實現對染病1 d的測試集檢測識別率達到95.83%;陳子涵等[2]將高光譜成像技術應用于雙孢蘑菇疣孢霉病早期鑒別,采集染病雙孢蘑菇早期子實體樣本菌蓋高光譜圖像,基于極限學習機模型實現對測試集總體樣本鑒別準確度為91.32%;曹益飛等[3]針對白葉枯病菌的水稻葉片采集其光譜數據,提出光譜分形維數定量描述水稻葉片感染白葉枯病菌光譜指數實現對白葉枯病害的監測,其相關系數達到了0.984。高光譜圖像將傳統的空間維和光譜維信息融合為一體,高維光譜特征為高光譜圖像分類提供特異性表達,但維數過高會導致“維數詛咒”[4],導致信息冗余、波段相關性強和數據處理復雜性增加以及影響分類效果,因此對高光譜特征提取[5]、特征選擇[6]等數據降維手段必不可少。傳統高光譜波段選擇算法一般只考慮信息間的線性關系,基于深度學習的高光譜波段選擇算法能夠充分考慮光譜間非線性關系,通過端到端網絡的學習選擇大信息量且易于分類的波段。目前,注意力機制[7-8]是神經網絡中的研究熱點,廣泛應用于高光譜圖像波段選擇算法。Lorenzo等[9]構建了基于注意力機制卷積神經網絡(CNN)波段選擇算法,但提取到的波段子集的相關性很強,數據冗余較大;Cai等[10]引入通道注意力機制結合稀疏自編碼器網絡對原始數據稀疏重建,端到端訓練網絡有效地提取出信息量大且相關性低的波段子集;Roy等[11]結合光譜通道注意和位置通道注意機制挖掘波段之間的非線性關系,有效降低高光譜圖像冗余數據。因此基于注意力機制的波段選擇算法可以有效地對高光譜圖像降維。
高光譜圖像每個像素點都包含了幾十至上百個波段的光譜信息,不同的目標擁有不同的反射光譜,基于異物異譜對不同的像素點分類。高光譜目標檢測旨在檢測高光譜圖像中的小目標或者異常點,實際上是一種二元分類任務[12],核心是判斷一個像素點是目標光譜還是背景光譜。基于高光譜圖像的目標檢測算法也層出不窮,光譜匹配濾波[13](SMF)基于高斯分布假設;異常檢測算法是在沒有先驗光譜信息時借助數理統計模型去識別像素目標,具有代表性的Reed-Yu(RX)[14]是基于測試目標像素和背景像素之間的馬氏距離計算;正交子空間投影(OSP)[14]將樣本光譜向量與目標光譜向量均投影到正交子空間中做內積以達到最大化信噪比;約束能量最小化算法(CEM)[15]是在僅知道目標光譜信息的前提下設計一個FIR線性濾波算法向量,在先驗目標光譜約束下最小化總能量輸出,突出目標信息,抑制背景信息,被廣泛應用于遙感圖像目標檢測,具有穩定的檢測性能。由于厚垣孢子顯微高光譜圖像中充滿許多不確定的雜質,背景信息具有不確定性,只有孢子目標先驗信息,因此選用CEM作為目標檢測算法更適合本研究情況。
本研究根據雙孢蘑菇疣孢霉病通常是被污染的帶有病菌土壤中的厚垣孢子所侵染,并且在病害早期不表征出明顯的癥狀,依靠人眼觀察并不可靠,缺乏前瞻性、預防性,因此本研究基于疣孢霉菌土傳性特征,借助顯微高光譜成像系統獲取土壤中的有害疣孢霉菌厚垣孢子顯微高光譜圖像,采用基于注意力機制和稀疏自編碼器[16]重建網絡波段選擇算法數據降維,并提出MTCEM算法對顯微高光譜圖像中的厚垣孢子檢測,為實現雙孢蘑菇疣孢霉病早期檢測提供技術支持。
1 材料與方法
1.1 試驗材料
1.1.1 雙孢蘑菇培養 本研究在福建農林大學農業信息感知工程中心進行,雙孢蘑菇菌種編號為W192(福建省農業科學院食用菌研究所提供),采用袋栽方式培育雙孢蘑菇,置于22℃和90%濕度下的人工氣候培養箱避光培養。雙孢蘑菇培育周期共分為原基期、菇蕾期、小菇期和成熟期4個階段,在雙孢蘑菇菌絲爬出培養料表面,需要進行覆土并進入原基期生長狀態時,對土壤噴灑1×10^5個·mL-1的疣孢霉菌厚垣孢子溶液,模擬帶病菌土壤侵染雙孢蘑菇。
1.1.2 顯微高光譜圖像獲取 本研究采用由奧林巴斯BX53光學顯微鏡搭載四川雙利合譜GaiaField-Pro-V10E光譜成像儀構成的顯微高光譜成像系統獲取有害疣孢霉菌厚垣孢子顯微高光譜圖像(圖1)。在雙孢蘑菇生長原基期為期1周內采集帶病土壤1 g并加入5 mL的去離子水制成懸濁液,用吸管吸取懸濁液滴在載玻片放在顯微高光譜成像系統下獲取其孢子顯微高光譜圖像,光學顯微鏡物鏡放大倍數為×10,光譜成像儀圖像分辨率大小為890×960,光譜波長范圍在400~1046 nm,共計176個波段。
1.2 試驗方法
1.2.1 黑白校正 由于顯微高光譜成像系統受環境噪聲以及系統光源和光路中透鏡及傳感器性能的影響[17],顯微高光譜成像系統獲得的原始圖像數據不可避免帶有隨機噪聲和條帶噪聲等干擾,本研究中剔除異常波段并保留波段范圍在400~753.6 nm,共計100個波段,并且利用黑白校準算法對圖像進行去噪和輻射校正,提高圖像的成像質量。首先應采集光譜儀相機在聚氯乙烯白板及在黑暗環境下的光譜曲線用以校正顯微高光譜圖像數據,校正公式如(1)所示。
R=RS-DW-D(1)
公式中R為校正后的顯微高光譜圖像數據,RS為原始顯微高光譜圖像數據,W為白幀參考光譜數據,D為黑幀參考光譜數據。
1.2.2 波段選擇算法 高光譜圖像具有波段連續、數據量大等特點,高光譜圖像波段選擇算法能夠減少數據量和數據間的線性關系從而降低計算負擔,避免“維數詛咒”。本研究中厚垣孢子顯微高光譜圖像采用基于全連接網絡的波段選擇(Bandselection net based on Fully connected networks,BS-Net-FC)算法[10]選擇具有相關性低,信息量大的波段子集用于后續孢子目標檢測。BS-Net-FC算法包括基于波段注意力模塊(Band attention module,BAM)、波段加權模塊(Band re-weight module,BRM)和基于稀疏自編碼器重建網絡(autoencoder-basedreconstructionnetwork,AERecNet),網絡結構示意圖見圖2,網絡中不同隱藏層的輸入輸出尺寸見表1。模型是以單個像素點的光譜數據輸入,BAM是基于通道注意力機制學習不同光譜波段之間的權重關系,權重越高意味該波段具有更大的信息量;BRM是將原輸入光譜數據和BAM所對應的光譜通道權重相乘,完成各光譜通道加權;由于冗余特征可以通過其他有用特征的線性或非線性組合來表示,AERecNet是基于稀疏自編碼器網絡[16]將輸入特征壓縮到一個低維空間中,利用這些低維數據來表示原始特征,將對低維數據影響較小的特征識別為冗余,并通過稀疏正則化去除冗余特征。
假設高光譜圖像數據xR1×1×b輸入BAM得到波段權重向量ωR1×1×b,即
ω=fBAM(x,θb)(2)
其中θb代表BAM網絡中需要訓練的參數,為保證學習到的權重非負使用sigmoid函數作為輸出激活函數。在BRW中將波段權重ω與原輸入光譜數據相對應的通道相乘得到zR1×1×b,即
z=ω x(3)
最后利用AERecNet重建輸入光譜特征,將z作為網絡輸入,即
=fAERecNet(z,θc)(4)
其中θc是稀疏自編碼重建網絡中可訓練參數。在網絡訓練中采用均方誤差(Mean-Square Error,MSE)作為損失函數L,并對波段權重ω進行L1正則化約束。
L=12S∑Si=1‖xi-i‖22+λ∑Si=1‖ωi‖1(5)
S代表是訓練樣本數量,λ是正則化系數,用于最小化重構誤差和正則化項之間的值。
由于波段權重系數ω代表光譜波段信息量大小,對所有訓練樣本的ω求平均得到每個光譜波段平均權重值,然后選擇具有信息量大的波段子集,因此第j個波段的平均權重值為
j=1S∑Si=1ωij(6)
1.2.3 多目標CEM(Multiple-targetsCEM,MTICEM)算法 Multiple-Target CEMCEM廣泛應用于高光譜圖像目標檢測,但它對先驗目標信息十分敏感并且只能檢測一種目標信號而不能同時檢測多種目標,在現實應用中通常是針對多目標檢測任務且高光譜圖像中目標光譜信息容易被環境噪聲所干擾。本研究中根據厚垣孢子在形態上是分為兩個部分,提出一個具有強魯棒性且能同時檢測多種目標的多目標CEM(Multiple-targetsCEM,MTICEM)應用于顯微高光譜厚垣孢子目標檢測。
多目標CEM(Multiple-Target CEM,MTCEM)是設計一個有限脈沖響應濾波器(FIR)在滿足所有目標響應約束在特定值下最小化平均輸出能量,整個過程可以看作一個受等式約束的凸優化問題。在利用CEM對高光譜圖像目標檢測的過程中只需要知道先驗目標信息,設計一個濾波算子達到突出圖像的目標信息并抑制背景信息的目的。CEM算法是一種標準線性探測器,它的輸出可以表示為輸入光譜向量r與探測器ω系數內積,
y=ωTr=rTω(7)
假設高光譜圖像由矩陣S=[r1,r2…rN]表示,圖像中每個像元的光譜向量ri=[ri,1,ri,2…ri,L]T,其中i(1,N),L為波段數。當輸入為高光譜圖像矩陣S時,濾波器平均輸出能量E為
E=1N∑Ni=1y2i=1N∑Ni=1WTririTw=wT1N∑Ni=1ririTw=wTRW(8)
其中,R=1N∑Ni=1ririT是高光譜圖像矩陣S的自相關矩陣。所以,假設D=[d1,d2…dM]包含了M個先驗目標光譜信號在目標光譜信號,滿足約束條件(DTw=1)下最小化輸出能量E,其中1是長度為M且值全為1的列約束向量。因此,最優化問題可以描述為
minω{E}=minω{WTRW} s.t.DTW=1(9)
求得公式8線性約束最優解得權值向量W*
W*=R-1D(DTR-1D)-11(10)
濾波器輸出為
y*=W*Tr=DR-1rDTR-1D(11)
1.3 檢測方案設計
1.3.1 厚垣孢子顯微高光譜圖像分析 本研究中數據為厚垣孢子顯微高光譜透射圖像,經黑白校正和光譜異常剔除預處理,圖像像素灰度值分布在(0,1),圖像大小分辨率為890×960,波段范圍在400~753.6 nm,共計100個波段,圖像中只有害疣孢霉菌厚垣孢子一類目標和復雜的背景,孢子目標在圖像中占比很小。如圖2a所示為波長為624 nm的顯微高光譜圖像灰度圖,圖2b為厚垣孢子目標真值圖。
1.3.2 試驗平臺 試驗中軟件平臺均在win10系統下實現,編程語言采用python3.6以及神經網絡的搭建均采用pytorch深度學習框架完成,計算機配置為AMD Ryzen 5 1600 Six-Core Processor CPU,16G運行內存,NVIDIA GeForce GTX 1050顯卡。本研究使用BS-Net-FC對顯微高光譜圖像數據進行波段選擇,將圖像所有像素點的光譜數據輸入訓練,訓練網絡采用Adam優化器迭代損失函數,學習率設置為0.00002,正則化系數,對網絡訓練100次直至損失值收斂。
1.3.3 評價準則 為定量評價顯微高光譜圖像目標檢測算法性能,一般選用ROC(Receiver Operating Characteristic)曲線測試檢測結果,ROC能夠體現檢測器準確率Pd(Probability of detection)和虛警率Fa(False alarm rate)之間的關系,反映不同檢測算法對同一數據探測效果差異,在同等虛警率條件下能夠達到更高準確率,或者同等準確率條件下能夠獲得更低虛警率的檢測方算法探測效果更優,即ROC 曲線越位于左上方的探測器探測性能越優。為進一步分析檢測算法在厚垣孢子顯微高光譜圖像上的檢測性能,本研究采用AUC作為評價標準,即ROC曲線下的面積,AUC越趨近1表明檢測器檢測性能越好,反之越接近于0檢測性能越差。
2 結果與分析
2.1 波段選擇
為量化不同波段圖像之間的相關性,采用皮爾遜相關系數作為量化指標,圖3為顯微高光譜圖像各波段之間的自相關系數熱力圖,可以看出部分波段之間的相關性較大,因此需要使用波段選擇算法減少數據冗余和高共線性。
應用BS-Net-FC算法對顯微高光譜圖像波段選擇,圖4為網絡損失值收斂曲線圖,可見在第8個epoch下損失值就迅速下降到接近0,表明網絡具有高收斂性。 為可視化波段權重在訓練過程中的變化趨勢,將所有的權重值歸一化至(0,1)區間,繪制各波段權重隨訓練次數epoch的演變圖,如圖5所示。可以看出,波段權重變得更加稀疏,同時在信息量大且相關性低的波段越來越突出。根據BS-Net-FC算法波段選擇的結果,表是根據波段權重排序選擇的前15的波段子集。
為保證所選波段數據具有信息量大,對所選的波段子集的信息熵定量分析,單波段圖像的信息熵H可以代表圖像中信息量的大小,熵值越大則表明圖像所包含的細節越多,由下列公式計算,
H(Bi)=-∑y ?ψp(y)log[p(y)](12)
其中y代表的是第i個波段圖像Bi灰度直方圖的灰度值,p(y)是灰度值y的個數占所有像素點的比例。圖6顯示為不同波段圖像的信息熵大小,線上的點代表算法選出的前15個波段,由表2可知,分布比較均勻,較少連續相鄰波段,主要集中在熵值較大的范圍,表明所選波段子集相關性和數據冗余度低。
2.2 目標檢測
本研究數據集中的厚垣孢子顯微高光譜圖像共有890×960個像素點,根據厚垣孢子目標在形態上分為母孢和子孢2個部分,因此分別在這兩個不同部位取端元光譜數據(圖7)。基于BS-Net-FC算法選取的波段子集,應用MTCEM算法探測厚垣孢子目標,因為只有厚垣孢子一類目標,因此將MTCEM濾波器的兩個輸出求和運算及歸一化得到新的更具魯棒性的輸出分數,檢測結果見圖8。
為了驗證BS-Net-FC算法應用于CEM檢測上的效果,將AUC作為評價指標,如圖9a為AUC隨波段數的變化曲線,可以看出隨著波段數的增加,MTCEM和CEM檢測方法的AUC都呈現為先增大后減小的,且都在波段數為20左右AUC達到最大,表明BS-Net-FC算法極大地減少了冗余數據,降低計算開銷同時提升了CEM算法檢測性能。為查看MTCEM算法相較于CEM算法改進表現,基于選取的前15個波段將該算法與之前原有CEM算法進行對比測試,圖9b為MTCEM和CEM的ROC曲線,可以看出相比于原有的CEM算法,本研究提出的算法檢測性能更好,能夠更為有效地檢測出孢子目標。表3為MTCEM和CEM不同的檢測器AUC值最大值以及所需波段數,可以看出MTCEM在優選的波段數為17時的AUC最大等于0.8785,比CEM算法檢測性能更好,所需的波段數也越少。
3 結論與討論
本研究針對雙孢蘑菇疣孢霉病缺乏早期檢測手段,借助顯微高光譜成像技術應用于雙孢蘑菇疣孢霉病的早期檢測方法研究,提出結合BS-Net-FC波段選擇算法和MTCEM對厚垣孢子顯微高光譜圖像檢測厚垣孢子,在有效地檢測出孢子目標的同時減少了冗余波段圖像,為后續設備開發降低計算開銷,為雙孢蘑菇在疣孢霉病早期檢測提供新思路和技術支持。
參考文獻:
[1]秦立峰,張熹,張曉茜.基于高光譜病害特征提取的溫室黃瓜霜霉病早期檢測[J].農業機械學報,2020,51(11):212-220.
[2]陳子涵,廖小玲.雙孢蘑菇疣孢霉病早期高光譜圖像鑒別[J].福建農業科技,2021,52(4):16-22.
[3]曹益飛,袁培森,王浩云,等.基于光譜分形維數的水稻白葉枯病害監測指數研究[J].農業機械學報,2021,52(9):134-140.
[4]王盛銘,王濤.高光譜圖像目標檢測綜述[C]//2020年第三屆智慧教育與人工智能發展國際學術會議論文集(第二卷),2020.
[5]王立國,王麗鳳.結合高光譜像素級信息和CNN的玉米種子品種識別模型[J].遙感學報,2021,25(11):2234-2244.
[6]嚴陽,華文深,劉恂,等.基于高光譜基本準則的波段選擇方法[J].光學技術,2018,44(5):634.
[7]曾濤,薛峰,楊添.基于通道和空間雙重注意力的行人重識別[J].計算機工程,2022:DOI:10.19678/j.issn.1000-3428.0063136.
[8]FU J,LIU J,TIAN H,et al.Dual attention network for scene segmentation[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR),2019:DOI: 10.1109/CVPR.2019.00326.
[9]LORENZO P R,TULCZYJEW L,MARCINKIEWICZ M,et al.Hyperspectral band selection using attention-based convolutional neural networks[J].IEEE Access,2020,8:42384-42403.
[10]CAI Y, LIU X,CAI Z.BS-Nets:An end-to-end framework for band selection of hyperspectral image[J].IEEE Transactions on Geoscience and Remote Sensing,2019,58(3):1969-1984.
[11]ROY S K,DAS S,SONG T,et al.DARecNet-BS:Unsupervised dual-attention reconstruction network for hyperspectral band selection[J].IEEE Geoscience and Remote Sensing Letters,2020,99:1-5.
[12]王志威,譚琨,王雪,等.基于光譜空間重構的非監督最鄰近規則子空間的高光譜異常檢測[J].光子學報,2020,49(6):80-89.
[13]林娜,楊武年,劉漢湖.基于高光譜遙感的巖礦端元識別及信息提取研究[J].遙感信息,2011(5):114-117.
[14]劉軒,李向陽,何芳,等.基于空譜特征融合的高光譜RX異常檢測方法[J].系統仿真學報,2021,33(12):2891-2900.
[15]REN H,DU Q,CHANG C,et al.Comparison between constrained energy minimization based approaches for hyperspectral imagery[C]//IEEE Workshop on Advances in Techniques for Analysis of Remotely Sensed Data, 2004: DOI:10.1109/WARSD.2003.1295199.
[16]HAN K,WANG Y,ZHANG C,et al.AutoEncoder Inspired Unsupervised Feature Selection[C]//2018 IEEE International Conference on Acoustics,Speech and Signal Processing (ICASSP),2018:DOI: 10.1109/ICASSP.2018.8462261.
[17]劉洪英,李慶利,顧彬,等.新型分子高光譜成像系統性能分析及數據預處理[J].光譜學與光譜分析,2012,32(11):3161-3166.
(責任編輯:柯文輝)