廣東農(nóng)工商職業(yè)技術(shù)學(xué)院計算機(jī)學(xué)院 李冬睿 邱尚明 楊穎
甘蔗病害的識別與檢測是農(nóng)業(yè)領(lǐng)域的一個重要課題。然而,在實際應(yīng)用中,受限于光照環(huán)境的復(fù)雜性以及甘蔗病害樣本的不足,傳統(tǒng)的數(shù)據(jù)增強(qiáng)方法難以滿足實際需求。為了解決這一問題,提出一種基于改進(jìn)的生成對抗網(wǎng)絡(luò)(Improved GAN)的復(fù)雜光照環(huán)境下甘蔗病害樣本增強(qiáng)技術(shù)。該方法引入了自注意力機(jī)制和漸進(jìn)式生成對抗網(wǎng)絡(luò)(ProGAN),實現(xiàn)對甘蔗病害樣本的增強(qiáng)。實驗結(jié)果表明,與傳統(tǒng)的數(shù)據(jù)增強(qiáng)方法相比,提出的方法能夠有效提高甘蔗病害識別模型的泛化能力和準(zhǔn)確率。
甘蔗是全球重要的經(jīng)濟(jì)作物之一,其產(chǎn)量對于糖和生物能源等產(chǎn)業(yè)具有舉足輕重的地位。然而,甘蔗病害的發(fā)生給甘蔗產(chǎn)量帶來了嚴(yán)重影響。為了減輕甘蔗病害對農(nóng)業(yè)產(chǎn)量的影響,研究者們采用了計算機(jī)視覺和深度學(xué)習(xí)技術(shù),對甘蔗病害進(jìn)行識別和檢測。然而,由于光照環(huán)境的復(fù)雜性以及甘蔗病害樣本的不足,傳統(tǒng)的數(shù)據(jù)增強(qiáng)方法難以滿足實際需求。
為了解決上述問題,本文提出了一種基于改進(jìn)的生成對抗網(wǎng)絡(luò)的復(fù)雜光照環(huán)境下甘蔗病害樣本增強(qiáng)技術(shù)。首先,引入了自注意力機(jī)制[1],以捕捉圖像中的長距離依賴關(guān)系,提高生成器的生成能力;其次,采用漸進(jìn)式生成對抗網(wǎng)絡(luò)(ProGAN)[2]進(jìn)行訓(xùn)練,逐層增加生成器和判別器的分辨率,從而提高生成樣本的質(zhì)量。
基于圖像處理的方法主要通過對作物病害圖像進(jìn)行預(yù)處理,提取圖像特征,然后利用分類器進(jìn)行病害識別。例如,楊方[3]提出了一種基于顏色、紋理和形狀特征的梨樹葉部病害識別方法。然而,這類方法對光照變化敏感,容易受到光照條件影響。
基于特征提取的方法主要是利用機(jī)器學(xué)習(xí)算法進(jìn)行特征提取和分類。例如,孫瑜等人[4]使用支持向量機(jī)(SVM)對黃花菜葉部病害進(jìn)行識別。然而,這類方法需要手動設(shè)置特征,其特征提取過程復(fù)雜,且泛化能力有限。
基于深度學(xué)習(xí)的方法通過卷積神經(jīng)網(wǎng)絡(luò)(CNN)等模型直接學(xué)習(xí)圖像特征,具有更好的泛化能力。例如,朱帥[5]提出了一種基于深度殘差網(wǎng)絡(luò)的甘蔗病害識別方法。但深度學(xué)習(xí)方法需要大量樣本進(jìn)行訓(xùn)練,而實際應(yīng)用中,甘蔗病害樣本往往不足。
生成對抗網(wǎng)絡(luò)(GAN)[6]作為一種有效的樣本生成方法,在樣本增強(qiáng)領(lǐng)域取得了顯著成果。例如,于雪瑩等人[6]提出了一種基于生成對抗網(wǎng)絡(luò)和混合注意力機(jī)制殘差網(wǎng)絡(luò)的蘋果病害識別方法。然而,傳統(tǒng)的GAN 在訓(xùn)練過程中存在不穩(wěn)定性和生成樣本質(zhì)量不高的問題。
自注意力機(jī)制(Self-Attention)是一種用于計算輸入特征圖中不同空間位置之間依賴關(guān)系的方法。它通過計算不同位置之間的相似度,從而為每個位置分配一個權(quán)重,以將更多的注意力集中在重要的位置。這種方法可以幫助模型更好地捕捉圖像中的長距離依賴關(guān)系,提高生成器的生成能力。
在GAN 模型中,采用了多頭自注意力機(jī)制(Multi-Head Self-Attention),它將輸入特征圖劃分為多個頭,每個頭都計算自注意力權(quán)重,并將不同頭計算得到的結(jié)果拼接起來。具體來說,假設(shè)輸入特征圖為X,多頭自注意力機(jī)制的計算可以表示為如式(1)所示:
其中,headi表示第i個頭計算得到的注意力權(quán)重,h表示頭的數(shù)量,W0表示輸出變換矩陣,Concat表示拼接操作。每個頭的計算過程可以表示為如式(2)所示:
其中,WiQ、WiK和WiV分別表示第i個頭的查詢、鍵和值變換矩陣,Attention表示自注意力計算操作。
漸進(jìn)式生成對抗網(wǎng)絡(luò)(Progressive GAN,ProGAN)是一種逐層增加生成器和判別器分辨率的方法。在訓(xùn)練過程中,先從一個較低分辨率的生成器和判別器開始訓(xùn)練,然后逐步增加分辨率,直到達(dá)到最終的分辨率。這種方法可以幫助模型更好地學(xué)習(xí)圖像的細(xì)節(jié)和紋理信息,從而提高生成樣本的質(zhì)量。
我們采用了4 層漸進(jìn)式生成對抗網(wǎng)絡(luò),其中每層的分辨率依次為4×4、8×8、16×16 和32×32。在每一層中,生成器和判別器都包括一個卷積層和一個反卷積層。在訓(xùn)練過程中,我們采用了漸進(jìn)式訓(xùn)練的方法,先訓(xùn)練低分辨率的生成器和判別器,然后逐步增加分辨率,直到達(dá)到最終的分辨率。同時,我們還采用了超分辨技術(shù)(Super-Resolution,SR)來提高低分辨率圖像的質(zhì)量。
為了解決甘蔗病害樣本不足的問題,我們提出了一種基于改進(jìn)的GAN 的甘蔗病害樣本增強(qiáng)技術(shù),采用改進(jìn)的GAN 生成甘蔗病害圖像,以擴(kuò)大甘蔗病害數(shù)據(jù)集,提高甘蔗病害識別模型的泛化能力和準(zhǔn)確率。為了適應(yīng)復(fù)雜光照環(huán)境下的甘蔗病害樣本,引入了自注意力機(jī)制和ProGAN。
生成對抗網(wǎng)絡(luò)(GAN)由生成器G 和判別器D 兩部分組成。生成器G 的目的是將隨機(jī)噪聲向量轉(zhuǎn)換成逼真的圖像,而判別器D 的目的是區(qū)分真實圖像和生成圖像。生成器和判別器之間進(jìn)行博弈,以提高生成器生成的圖像質(zhì)量。為了提高生成器的生成能力,本文引入了自注意力機(jī)制,以捕捉圖像中的長距離依賴關(guān)系。自注意力機(jī)制的公式如式(3)所示:
其中,x為輸入特征矩陣,1W、2W、3W為可學(xué)習(xí)的權(quán)重矩陣,dk為注意力頭數(shù),y為輸出特征矩陣。自注意力機(jī)制可以捕捉圖像中的長距離依賴關(guān)系,從而提高生成器的生成能力。
本文還采用了漸進(jìn)式生成對抗網(wǎng)絡(luò)(ProGAN)進(jìn)行訓(xùn)練,逐層增加生成器和判別器的分辨率,從而提高生成樣本的質(zhì)量。ProGAN 將初始為低分辨率的圖像生成器逐漸擴(kuò)展到更高分辨率的圖像生成器。
ProGAN 的損失函數(shù)如式(4)所示:
其中,pdata和pz分別表示真實數(shù)據(jù)和噪聲分布。ProGAN 的損失函數(shù)中,生成器的目標(biāo)是最小化生成樣本與真實樣本的差距,即最大化D(G(z))的輸出。而判別器的目標(biāo)是最大化真實樣本的輸出D(Xr)和最小化生成樣本的輸出D(G(z))。
采用改進(jìn)的生成對抗網(wǎng)絡(luò)和漸進(jìn)式生成對抗網(wǎng)絡(luò)相結(jié)合和通過自注意力機(jī)制和逐層增加分辨率的方式,實現(xiàn)了對甘蔗病害樣本的增強(qiáng)。
使用的甘蔗病害數(shù)據(jù)集包括五類病害,分別是:鳳梨病、赤腐病、黑穗病、眼斑病和梢腐病。數(shù)據(jù)集中的甘蔗病害圖像采集于田間,光照環(huán)境復(fù)雜,包含不同程度的光照變化、陰影和反光等。每種病害有400 張圖像,共2000張圖像。本文將數(shù)據(jù)集按照6:2:2 的比例劃分為訓(xùn)練集、驗證集和測試集。訓(xùn)練集用于訓(xùn)練模型,驗證集用于調(diào)節(jié)超參數(shù)和選擇最優(yōu)模型,測試集用于評估模型的性能。
實驗使用的硬件環(huán)境為NVIDIA GeForce GTX 1080Ti GPU、 Intel(R) Core(TM) i7-8700K CPU @ 3.70GHz和DDR4-2933@64G,使用PyTorch 深度學(xué)習(xí)框架進(jìn)行實驗。
本文將提出的方法與三種傳統(tǒng)的數(shù)據(jù)增強(qiáng)方法進(jìn)行對比,包括隨機(jī)裁剪、隨機(jī)旋轉(zhuǎn)和隨機(jī)亮度調(diào)整。對于本文提出的方法,使用Adam 優(yōu)化器進(jìn)行訓(xùn)練,噪聲向量維度為512,每個Batch 包含64 個樣本,學(xué)習(xí)率設(shè)為0.0002,權(quán)重衰減系數(shù)為0.0001。訓(xùn)練過程中,每隔500 個Epoch,記錄一次生成樣本與真實樣本的差距,并保存生成器和判別器的參數(shù)。
將本文提出的方法與三種傳統(tǒng)的數(shù)據(jù)增強(qiáng)方法進(jìn)行了對比,包括隨機(jī)裁剪(RandomCrop)、隨機(jī)旋轉(zhuǎn)(Random Rotation)和隨機(jī)亮度調(diào)整(RandomBrightness)。如表1所示,本文提出的方法在測試集上取得了良好的表現(xiàn),準(zhǔn)確率達(dá)到了92.3%,相比于其他方法都有顯著的提升。

表1 不同數(shù)據(jù)增強(qiáng)方法下的模型準(zhǔn)確率比較Tab.1 Comparison of model accuracy under different data enhancement methods
同時,為了進(jìn)一步驗證本文提出的方法在復(fù)雜光照環(huán)境下的有效性,本文對比了不同光照條件下的模型性能。如表2 所示,本文提出的方法在不同光照條件下均表現(xiàn)出了顯著的優(yōu)勢,證明了本文提出的方法具有較強(qiáng)的適應(yīng)性和泛化能力。

表2 不同光照條件下的模型性能比較Tab.2 Comparison of model performance under different lighting conditions
此外,為了驗證本文提出的方法的可行性,本文還對比了不同噪聲維度下的模型性能。如表3 所示,本文提出的方法在不同噪聲維度下均表現(xiàn)出了較好的效果表現(xiàn),證明了本文提出的方法具有一定的穩(wěn)健性。
為了驗證本文提出的方法生成的樣本質(zhì)量,將生成樣本與原始樣本進(jìn)行了對比,顯示本文提出的方法生成的樣本與原始樣本在視覺上非常相似,具有很高的逼真度。同時,還使用FID 指標(biāo)對生成樣本的質(zhì)量進(jìn)行了評估。如表4 所示,本文提出的方法生成的樣本質(zhì)量比傳統(tǒng)GAN 方法更高,證明了本文提出的方法在生成樣本質(zhì)量上具有一定的優(yōu)勢。

表4 生成樣本質(zhì)量評估結(jié)果Tab.4 Generate sample quality evaluation results
為了探究自注意力機(jī)制和漸進(jìn)式生成對抗網(wǎng)絡(luò)對樣本增強(qiáng)效果的影響,對不使用自注意力機(jī)制和不使用漸進(jìn)式生成對抗網(wǎng)絡(luò)這兩種情況分別做準(zhǔn)確率測試實驗,如表5 所示,本文提出的方法在使用自注意力機(jī)制和漸進(jìn)式生成對抗網(wǎng)絡(luò)的情況下表現(xiàn)最好,證明了這兩種改進(jìn)方法對于甘蔗病害樣本增強(qiáng)的有效性。

表5 自注意力機(jī)制和漸進(jìn)式生成對抗網(wǎng)絡(luò)對樣本增強(qiáng)效果的影響Tab.5 The impact of self attention mechanism and progressive generative adversarial network on sample enhancement effect
本文提出了一種基于改進(jìn)的生成對抗網(wǎng)絡(luò)的復(fù)雜光照環(huán)境下甘蔗病害樣本增強(qiáng)技術(shù),該方法引入了自注意力機(jī)制和漸進(jìn)式生成對抗網(wǎng)絡(luò),并在保證生成樣本與原始樣本類別一致的同時,實現(xiàn)對甘蔗病害樣本的增強(qiáng)。通過對比實驗,驗證了該方法在復(fù)雜光照環(huán)境下甘蔗病害樣本增強(qiáng)的有效性和優(yōu)越性。實驗結(jié)果表明,本文提出的方法能夠有效提高甘蔗病害識別模型的泛化能力和準(zhǔn)確率。在未來的研究中,將會拓展該方法在其他作物病害識別領(lǐng)域的應(yīng)用,為農(nóng)業(yè)生產(chǎn)提供更加智能、高效的技術(shù)支持。
引用
[1] 岳煥景,廖磊,楊敬鈺.基于雙重自注意力機(jī)制的人臉圖像修復(fù)[J].湖南大學(xué)學(xué)報(自然科學(xué)版),2023,50(08):32-41.
[2] 王軍,劉小芳.基于注意力機(jī)制生成對抗網(wǎng)絡(luò)的遙感圖像增強(qiáng)算法[J].無線電工程,2023,53(6):1382-1389.
[3] 楊方.基于深度學(xué)習(xí)的梨樹葉部病害識別研究[D].晉中:山西農(nóng)業(yè)大學(xué),2020.
[4] 孫瑜,張永梅,武玉軍.基于粒子群算法和支持向量機(jī)的黃花菜葉部病害識別[J].中國農(nóng)學(xué)通報,2022,38(8):135-140.
[5] 朱帥.基于深度殘差網(wǎng)絡(luò)的番茄葉片病害識別研究[D].哈爾濱:東北林業(yè)大學(xué),2022.
[6] 于雪瑩,高繼勇,王首程,等.基于生成對抗網(wǎng)絡(luò)和混合注意力機(jī)制殘差網(wǎng)絡(luò)的蘋果病害識別[J].中國農(nóng)機(jī)化學(xué)報,2022,43(6):166-174.