






摘"要:為能夠更精確地量化病蟲害的發生程度和分布情況,以及綜合考慮多種影響因素,提出納入概率分布的多面域油菜種子病蟲害顯著性檢測方法。通過對油菜種子病蟲害圖像進行超像素分割,獲得超像素塊,以這些塊構建圖像連通圖,并結合初始圖像信息和先驗知識,計算出顯著圖中超像素的概率分布表示。利用KL散度,比較不同區域超像素的概率分布,提高顯著性檢測的精度,并采用超像素邊界連通性的量化指標,區分顯著圖區域與背景區域,獲得顯著圖,完成油菜種子病蟲害的檢測。結果表明,此方法檢測結果精確,顯著圖清晰,具有較高的實用性。
關鍵詞:概率分布;多面域;種子病蟲害;顯著性檢測;超像素分割;KL散度
中圖分類號:S565""文獻標識碼:A""文章編號:0488-5368(2025)03-0098-07
A Multifaceted Method for Detecting Significance of Rapeseed Seed Pests and Diseases Based on Probability Distribution
LI Fengqing, "SHAO Wentai, "LI Mingjun
(Institute of Agricultural Sciences, "Gannan Tibetan Autonomous Prefecture, Hezuo, Gansu, 747000, China)
Abstract:To accurately quantify the severity and distribution of pests and diseases in rapeseed seeds while considering multiple influencing factors, this study proposes a multifaceted significance detection method based on probability distribution. Superpixel segmentation was applied to images of infected rapeseed seeds to obtain superpixel blocks, which were "then used to construct an image connectivity graph. By integrating initial image information with prior knowledge, the probability distribution of superpixels in the saliency map was computed. KL divergence was employed to compare the probability distributions of superpixels across different regions, enhancing the accuracy of significance detection. A quantitative index of superpixel boundary connectivity was introduced to distinguish salient regions from the background, generating a refined saliency map for detecting pests and diseases in rapeseed seeds. Experimental results demonstrate that this method achieves high detection accuracy, produces clear saliency maps, and offers strong practical applicability.
Key words:Probability distribution; Multifaceted domain; Seed pests and diseases; Saliency detection; Superpixel segmentation; KL divergence
引言
通過全面、準確地掌握病蟲害的分布和嚴重程度,多面域油菜種子病蟲害顯著性檢測有助于及時發現病蟲害并采取有效措施,確保油菜的健康生長和產量穩定[1]。同時,它也為農民和農業管理部門提供科學的決策依據,有助于優化種植布局和資源配置,提高經濟效益和生態效益[2]。此外,這種檢測方法的運用還推動了農業生產的現代化和智能化,為農業的可持續發展注入了新的動力[3]。因此,多面域油菜種子病蟲害顯著性檢測在保障農業生產安全、促進農業可持續發展等方面具有重要意義。
對多面域油菜種子病蟲害顯著性檢測的方法有很多,比如Wu X等人提出的元學習在有限樣本條件下的植物病害檢測[4]。此方法利用大量相關任務學習積累的先驗知識,構建一個具備強大泛化能力的元模型。當面臨新的植物病害識別任務時,該模型僅需少量樣本即可迅速提取病害特征,并融合先驗知識,實現植物病害檢測。此方法中構建元模型需要大量的相關任務數據,且這些數據需要充分覆蓋各種植物病害情況,否則會導致模型泛化能力不足。由Ni J等人提出的基于優化卷積神經網絡的植物葉片病害檢測[5]。此方法先對番茄葉片病害圖像進行預處理,設計一個改進的卷積神經網絡模型,通過卷積層、池化層等結構提取葉片圖像中的病害特征。利用標注好的數據集對模型進行訓練,使其能夠準確識別不同種類的病害。利用訓練好的模型對新的葉片圖像進行病害檢測。該方法的卷積神經網絡訓練通常需要大量的計算資源和時間,特別是對大批量數據集以及繁雜網絡構架的處理時,對硬件要求較高,所以實現起來很困難。楊堃等人提出的采用視覺增強注意力機制的植物病蟲害檢測[6]。此方法通過圖像處理技術提取植物葉片的關鍵特征。利用注意力機制,模型能夠自動聚焦于與病蟲害相關的顯著區域,忽略無關背景。通過深度學習網絡對特征進行學習和分類,實現病蟲害的精準檢測。此方法由于視覺加強注意力模型具有強大的特征提取和學習能力,如果訓練數據中存在噪聲或異常值,模型會出現過擬合的訓練數據,使模型性能下降。由周維等人提出的基于優化的YOLOv4-GhostNet模型的水稻病蟲害檢測方法[7]。此方法以幻象模塊替代傳統卷積,優化主干特征提取網絡CSPDarkNet53,采用GhostNet模塊提取圖像特征;增強YOLOv4的PANet構架,以提升特征提取能力;并綜合遷移學習和訓練方法,實現對水稻病蟲害的檢測。但此方法對YOLOv4的PANet構架進行增強雖然提升了特征提取能力,但也增加模型的訓練難度和調參復雜性,所以結構不易操作。
本研究通過計算超像素的概率分布表示,量化不同區域的病蟲害特征,從而更準確地識別出病蟲害區域與正常區域的差異。概率分布的引入能夠綜合考慮多面域的信息,從而更全面地評估病蟲害的顯著性,提高檢測的準確性和穩定性。概率分布具有良好的可解釋性,能夠清晰地展示出不同區域的病蟲害程度。因此,本研究提出納入概率分布的多面域油菜種子病蟲害顯著性檢測方法。
1多面域油菜種子病蟲害顯著性檢測
1.1油菜種子病蟲害圖像超像素分割
超像素分割是對圖像進行的一種預處理,也就是把像素分割成超像素塊,其過程可把圖像中有用信息盡量多地留下[8]。依據圖論的超像素分割算法是將油菜種子病蟲害圖像A里的各個頂點ωi作為圖像內的各個像素點,bi是將頂點連起來的邊,邊的權重ωij是度量兩個相鄰像素間的相似度,由(1)式表達:
A=(W,B)(1)
其中ωi∈W,bi∈B。在圖像A內計算代價樹C的最小值的過程,即是超像素分割的過程,用(2)式表達:
|C|=min∑bi∈Cωbi(2)
其中C∈B。
依據聚類的超像素分割算法是在超像素分割前先設定油菜種子病蟲害圖像中像素聚類所需達到的擬合閾值[9],再直接采用油菜種子病蟲害圖像的初始像素進行聚類,直到滿足預先設定的擬合閾值,生成超
像素[10]。依據聚類的超像素分割算法的流程為:
(1)簇中心Oi=[xi1,xi2,…xin]+T初始化,各個像素qi的每個特征分量值用xi1,xi2,…xin表示。
(2)以某種鄰近方法,把簇中心Oi轉移至圖像內梯度最小的地方。
(3)對各個像素qi作標識label(i),并分配初始化成極大的距離值dist(i)。
(4)對各個簇中心Oi與全局的像素qi之間的距離進行運算,并修正label(i)和dist(i)值。
(5)對Oi與殘錯度REi進行重新運算。
(6)循環(5)步,直至殘余度REi迭代次數到達最高值或是比閾值小,完成聚類。
通過基于圖論方法以及聚類方法完成油菜種子病蟲害圖像超像素分割,得到超像素塊。
1.2構建連通圖
得到的油菜種子病蟲害圖像中的超像素塊用作連通圖的頂點,位于油菜種子病蟲害圖像邊界上的超像素塊的集合為D,用某種關聯關系把邊界上的超像素塊連接起來,形成一個閉環圖,也就是任意xi∈D
以及任意xj∈D,那么eij=1。相鄰的兩個超像素塊i和j有關聯關系,那么eij=1,若超像素塊P與超像素塊j相鄰,那么超像素塊P是超像素塊i的二近鄰,兩者也存在關聯關系,那么eip=1。對于超像素塊p,超像素塊g與之相鄰,運算P和g的距離,用式(3)表達:
s(xp,xg)=‖Xp-xg‖2(3)
對超像素塊P與超像素塊g兩者間距離和邊界超像素塊之間的關系進行判別,假如閾值αp大于s(xp,xg),那么超像素塊P與超像素塊g具有較大關聯度,將其填進關聯關系內,由(4)式表達:
αig=1,eip=epg=1 and "αp≥s(xp,xg)
0,else(4)
式中,閾值的運算式由(5)表達:
αp=α×average∑gs(xp,xg)(5)
如果超像素塊i和g之間有關聯關系,那么eig=1。接著尋找有關聯關系的超像素塊,直到全部超像素塊都找完。
依據上述過程可知,本研究構建的連通圖要符合(6)~(8)式的條件。條件1由(6)表達:
(xi,xj)|eij=1∪
(xi,xp)|eij=ejp)=1
xi,xj,xp∈X(6)
條件2由(7)表達:
(xi,xj)|eij=ejp=1,αp≥s(xp,xg)
xi,xj,xp,xg∈X(7)
條件3由(8)表達:
(xi,xj)|eij=1,xi,xj∈D(8)
式中,全部像素的特征分量集合用X描述。
由以上三個條件構建出油菜種子病蟲害連通圖R。
1.3多面域油菜種子病蟲害顯著圖的概率分布表示
在多面域油菜種子病蟲害顯著性檢測問題上,先運算出顯著圖中超像素概率分布表示,在運算形式上,都是極大后驗估計[11],用式(9)表達:
H=argmaxP(H|A)(9)
式中,油菜種子病蟲害顯著圖概率分布、油菜種子病蟲害初始圖像、初始圖像相應的油菜種子病蟲害顯著圖中超像素的概率分布表示分別用P(H|A)、A、H代表。依據初始圖像A和構建的相應連通圖R,得到顯著圖的概率分布,用(10)式表達:
P(H|R,A)=P(R|H)P(H|A)P(R|A)(10)
式中,油菜種子病蟲害顯著圖中超像素的概率分布表示關于連通圖的似然概率、顯著圖的概率分布表示關于初始圖的條件概率、連通圖關于初始圖的概率分別用P(R|H)、P(H|A)、P(R|A)代表。本研究把條件概率P(H|A)作為H的先驗分布。把已知的連通圖和初始圖定為常量。
由(2)式可知,在指定初始圖像構建相應連通圖的方法上,連通圖和先驗信息確定了顯著圖的概率分布表示。因為多面域油菜種子病蟲害是指在不同的生長環境、不同的品種、不同的生長階段等條件下,油菜種子病蟲害的分布和顯著性可能會有所不同[12],所以要針對多面域油菜種子病蟲害的顯著圖的概率問題。將選取的多面域條件設定成U={u1,u2,…un,相應的連通圖用{R1,R2,…,Rn}表示,則用(11)式描述多面域油菜種子病蟲害顯著性檢測問題:
H=argmaxP(H|R1,R2,…,Rn,A)(11)
把(11)式展開,獲得(12)式:
P(H|R1,R2,…,Rn,A)∝P(H|A)∏ni=1P(Ri|H)(12)
式中,油菜種子病蟲害連通圖關于顯著圖中超像素的概率分布表示的條件分布用P(Ri|H)表示,表達顯著圖中超像素的概率分布表示對連通圖的關聯幅度。
通過上述過程,將多面域油菜種子病蟲害顯著性檢測納入概率分布問題,得到多面域油菜種子病蟲害顯著圖中超像素概率分布表示。
1.4多面域油菜種子病蟲害的KL散度
使用KL散度來比較多面域油菜種子病蟲害圖像中超像素的概率分布,計算圖像中超像素概率分布之間的KL散度[13,14],獲得關于油菜種子病蟲害在多面域下的變化和顯著性信息,提高多面域油菜種子病蟲害顯著性檢測精度[15]。用(13)式表示KL散度形式:
MKL(P1‖P2)=∑x∈ΩP(x)logP1(x)P2(x)(13)
其中Ω,P1、P2、MKL(P1‖P2)分別代表圖像中超像素的概率空間、概率空間內的兩個超像素概率分布、分布P1關于分布P2的KL散度。分布P2關于分布P1的KL散度用MKL(P2‖P1)
代表。從式(13)看出MKL(P1‖P2)≠MKL(P2‖P1),也就是KL散度不是對稱的。在MKL(P1‖P2)中,油菜種子病蟲害圖像中超像素實際分布是P1,其相似分布是P2。MKL(P1‖P2)的值越小,說明實際分布和相似分布越相似,相反,則說明越不同。依據Jensen不等式,可得MKL(P1‖P2)≥0,只有P1=P2時,MKL(P1‖P2)=0。
1.5多面域油菜種子病蟲害顯著性檢測
本研究閉環操作油菜種子病蟲害連通圖,同時擴大鄰接,在閉環鄰接擴大的連通圖中運算,并設定油菜種子病蟲害顯著圖區域為目標區域,其它區域為背景區域。油菜種子病蟲害圖像中超像素v擴大的區域面積用(14)式表達:
S(V)=∑Ni=1exp-M2(v,v1)2×α2(v)(14)
式中M(v,vi)表示油菜種子病蟲害連通圖中最短的相異超像素路徑距離,采用離差標準化原理歸一化此最短路徑,此外M(v,v)=0。M(v,vi)的表達式為(15)式:
M(v,vi)=minv1=v,v2,Lt=vi∑t-1j=1MKL(vj,vj+1)(15)
其中,把每個超像素vi向v擴大區域面積的貢獻值控制在(0,1]中,則S(v)在S[1,N]中取值,N代表油菜種子病蟲害圖像中超像素數量。α(v)代表控制參數,用于每個超像素擴大區域面積的運算過程中,對不一樣的v,α(v)取值也不一樣。本研究對α(v)進行自適應處理,對于圖像中的每個超像素節點v,計算它與另外每個超像素節點之間的最短路徑。基于這些最短路徑值,確定預設閾值,使用此預設閾值二值分割全部最短路徑值,達到該預設閾值的1/3。
用(16)式運算油菜種子病蟲害連通圖邊界和超像素的距離L(v):
L(v)=S(v)×β(vi)(16)
式中,vi是邊界節點時,β函數取值1;vi是其它節點時,β函數取值0。
測量油菜種子病蟲害圖像中超像素v的邊界連通性的量化指標用(17)式表達:
Z(v)=L(v)S(v)(17)
依據得到的邊界連通性的量化指標,判斷油菜種子病蟲害顯著圖區域和背景區域,并運算每個超像素是潛在背景的概率值,用(18)式表達:
Pvi=1-expZ2(vi)2×α2Z(18)
式中αZ,取值3。超像素邊界連通性的量化指標Z(v)減小時,其為背景的潛在性概率值也隨之減小,向0趨近;相反,Z(v)減小時,潛在性概率值向0趨近。綜合PvI,加權油菜種子病蟲害顯著圖區域對比度,運算油菜種子病蟲害圖像中每個超像素的顯著值,用(19)式表達:
Y(v)=∑Ni=1MKL(v,vI)Psp(v,vi)Pvi(19)
其中Psp(v,vi)表達式為(20)式:
Psp(v,vi)=expM2sp(v,vi)2×α2sp(20)
式中Msp(v,vi)是執行歸一化后的兩個超像素空間歐式距離,αsp取值還是3。依據顯著值Y(v),把油菜種子病蟲害初始圖中的每個超像素區域加權,獲取顯著圖,用(21)表達:
YA=1-exp-Y2(v)2×α2t(t)(21)
式中αt(t)自適應取值,為預設閾值的1/3。綜上過程完成多面域油菜種子病蟲害顯著性檢測。
2結果分析
選取溫帶氣候油菜雜交種子數據集作為樣本來源。該數據集中包含五種不同品種、產地和生長環境的油菜種子圖像,共計500張圖像。圖像均使用Canon EOS R6相機在自然光條件下拍攝,拍攝距離約30 cm;每張圖像分辨率為5 184×3 456像素,確保種子細節清晰可見。每張圖像平均種子數量約10~20粒,部分圖像中存在輕微重疊,但大部分種子均為獨立或僅有輕微接觸,以保證分析的準確性。油菜種子樣本明細見表1。
以圖像中超像素邊界連通性的量化指標值為判斷標準,對圖像背景和顯著圖劃分,在所選的溫帶氣候油菜雜交種子數據集上進行驗證,圖1為邊界連通性量化指標在背景和顯著圖區域內的分布結果。
由圖1可知,油菜種子病蟲害圖像中背景和顯著圖的邊界連通性量化指標在2.5處相交。在這之后,顯著圖的分布概率逐漸趨于平穩,保持在0~0.01的范圍內;而背景的分布概率則從2.5開始迅速增長。因此,當量化指標選取為2.5時,能夠有效地將背景和顯著圖區分開來。綜合以上結果,可以得出結論:以油菜種子病蟲害圖像中超像素邊界連通性的量化指標值為判斷標準,能夠準確完成圖像背景和顯著圖的劃分。
選取1張油菜種子病蟲害圖像,驗證本研究方法對顯著性檢測的效果,并對比改進卷積神經網絡方法和視覺加強注意力模型方法,檢測結果如圖2(a)、(b)、(c)、(d)所示。
通過觀察圖2,可以明顯看出本研究方法在顯著性檢測方面的出色表現。該方法成功檢測出所有的油菜種子,無一遺漏,且檢測效果非常清晰,種子的輪廓得以完整呈現。相比之下,改進卷積神經網絡方法雖然清晰度很好,但部分種子未能被檢測出來,導致檢測結果不夠完整。而視覺加強注意力模型方法的檢測結果則不盡如人意,不僅檢測不完整,圖像邊緣部分也顯得較為模糊。綜合比較,本研究方法不僅檢測結果精確,無失誤,而且在清晰度方面也表現出色。
為了更科學地評估不同方法在油菜種子病蟲害檢測方面的性能,引入使用準確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1分數(F1-Score)和每秒幀率(FPS)作為評估指標。對比本研究方法、改進卷積神經網絡方法、視覺加強注意力模型方法進行病蟲害檢測,結果如表2所示。
分析表2中的數據,經過對三種不同方法在油菜種子病蟲害檢測任務中的性能評估,可以得到以下量化結果:本研究方法的平均準確率為99.04%,平均精確率為98.72%,平均召回率為99.14%,平均F1分數為98.93%,而改進卷積神經網絡方法和視覺加強注意力模型方法在這些指標上分別表現為98.28%和98.06%的準確率,92.92%和91.48%的精確率,92.98%和91.82%的召回率,以及92.95%和91.65%的F1分數。因此,本研究方法在油菜種子病蟲害檢測任務中表現出了顯著的優勢。在準確率上,本研究方法高出其他兩種方法近一個百分點,這表明本研究方法能夠更準確地識別出病蟲害種子。在精確率和召回率上,本研究方法同樣表現優異,分別高出其他兩種方法六個和七個多百分點,這進一步證明了本研究方法在識別病蟲害種子時的穩定性和可靠性。F1分數作為精確率和召回率的調和平均數,也體現了本研究方法的全面優勢。此外,雖然本研究方法在FPS上與其他兩種方法相近,但在保持高精度檢測的同時,仍然達到了較高的處理效率,這在實際應用中具有重要意義。綜上所述,本研究方法在油菜種子病蟲害檢測方面展現出了卓越的性能,為油菜種植業的病蟲害防控提供了有力的技術支持。
3結論
本研究創新性地納入了概率分布理論,對多面域油菜種子病蟲害顯著性進行檢測。通過構建油菜種子病蟲害連通圖,并計算出多面域病蟲害顯著圖的概率分布表示,得以對不同區域的病蟲害進行精細化分析。這種方法不僅突破了傳統檢測手段中數據單一、結果不穩定的局限,更能綜合考量多種影響因素,極大提高檢測結果的可靠性。此外,多面域的分析方式為人們提供更為全面、深入的病蟲害信息,為制定針對性的防治措施提供有力支持,展現出較高的檢測精度,可有效完成多面域油菜種子病蟲害顯著性檢測任務,對于保障油菜產業的健康發展具有重要意義,同時也為其他作物的病蟲害檢測提供有益的參考。
下一步的研究方向將聚焦于優化算法模型,提高檢測效率與準確性。同時,還將探索更多影響病蟲害發生的關鍵因素,并將其納入概率分布分析框架,以構建更完善的病蟲害預測體系。此外,期望將該方法推廣至其他作物病蟲害檢測中,為農業生產的健康與穩定貢獻更多力量。
參考文獻:
[1]"王圓圓,林建,王姍.基于YOLOv4-tiny模型的水稻早期病害識別方法[J].江蘇農業科學,2023,51(16):147-154.
[2]nbsp;吳葉蘭,管慧寧,廉小親,等.高光譜成像的多種類柑橘病蟲藥害葉片檢測方法研究[J].光譜學與光譜分析,2022,42(8):2 397-2 402.
[3]"張國忠,呂紫薇,劉浩蓬,等.基于改進DenseNet和遷移學習的荷葉病蟲害識別模型[J].農業工程學報,2023,39(8):188-196.
[4]"Wu X , Deng H , Wang Q ,et al.Meta-learning shows great potential in plant disease recognition under few available samples[J].The Plant Journal, 2023,114(4):767-782.
[5]"Ni J , Zhou Z , Zhao Y,et al.Tomato leaf disease recognition based on improved convolutional neural network with attention mechanism[J].Plant Pathology, 2023,72(7):1 335-1 344.
[6]"楊堃,范習健,薄維昊,等.基于視覺加強注意力模型的植物病蟲害檢測[J].南京林業大學學報(自然科學版),2023,47(3):11-18.
[7]"周維,牛永真,王亞煒,等.基于改進的YOLOv4-GhostNet水稻病蟲害識別方法[J].江蘇農業學報,2022,38(3):685-695.
[8]"楊穎,文小玲,章秀華.基于方向梯度直方圖和局部二值模式混合特征的水稻病蟲害識別方法研究[J].河南農業大學學報,2021,55(6):1 089-1 096.
[9]"閆云才,郝碩亨,高亞玲,等.基于空地多源信息的獼猴桃果園病蟲害檢測方法[J].農業機械學報,2023,54(S2):294-300.
[10]"李莉杰,王寶祥.基于漸進式分割的蔬菜病蟲害識別仿真研究[J].計算機仿真,2021,38(10):419-423.
[11]"袁非夢,耿化品,王思蕊,等.基于概率分布特征和代理模型的試驗數據擴充方法研究[J].機械強度,2023,45(4):871-878.
[12]"溫艷蘭,陳友鵬,王克強,等.基于機器視覺的病蟲害檢測綜述[J].中國糧油學報,2022,37(10):271-279.
[13]"楊晨,劉立波.圖文跨模態檢索的概率分布表示學習[J].計算機輔助設計與圖形學學報,2022,34(5):751-759.
[14]"趙宏偉,霍東升,王潔,等.基于顯著性檢測的害蟲圖像分類[J].吉林大學學報(工學版),2021,51(6):2 174-2 181.
[15]"翟繼友,周靜波,霍瑛.基于前景優化和概率估計的顯著性檢測[J].控制與決策,2021,36(4):917-924.