孟幼青,翁海勇,岑海燕,*,李紅葉,何 勇
(1.浙江省植物保護檢疫局,浙江 杭州 310020; 2.浙江大學 生物系統工程與食品科學學院,浙江 杭州 310058; 3.農業農村部光譜檢測重點實驗室,浙江 杭州310058; 4.浙江大學 農業與生物技術學院,浙江 杭州 310058)
柑橘黃龍病(citrus Huanglongbing)由一種限于韌皮部內寄生的候選韌皮部桿菌(Candidatusliberibacterspp.)引起[1],田間主要通過攜帶病菌的柑橘木虱(Asian citrus psyllid, ACP)取食進行傳播,具有極強的傳染性,目前無徹底根治的辦法[2-3]。當柑橘植株感染黃龍病時,首先會經歷一段時間的潛伏期,在這期間,病原菌在宿主內部增殖,并發展成為一個新傳染源。病原菌的侵染使柑橘葉片的韌皮部堵塞,新陳代謝紊亂,如淀粉的異常累積,最終造成宿主的生命力退化,呈現出果實著色不均勻,紅鼻子果及葉片斑駁黃化等癥狀[4-6]。目前,針對柑橘黃龍病的防控措施主要包括挖除病樹、消除傳染源和噴施農藥,減少木虱種群數量,阻斷病害的傳播擴散[7]。因此,及時診斷出染病植株并挖除,對于田間黃龍病疫情防控具有重要意義。
目前,對柑橘黃龍病的診斷方法主要通過經驗識別和聚合酶鏈式反應(polymerase chain reaction,PCR)[8-9]。基于經驗知識的診斷方法存在主觀性大、準確率低的問題;而采用PCR技術雖然能得到高的識別率,但存在操作步驟繁瑣、耗時費力的問題。因此,尋找一種簡便高效的柑橘黃龍病診斷方法迫在眉睫。近年來,光學技術在植物的生物脅迫和非生物脅迫檢測中表現出了極大的潛力[10-14]。翁海勇等[15]利用高光譜成像技術對柑橘潰瘍病進行診斷,并實現了判別模型在不同儀器之間的傳遞,得到了86.2%的識別正確率。Cen等[16]利用葉綠素熒光成像技術研究了柑橘黃龍病對宿主光合作用的影響,并用熒光參數來鑒別黃龍病,得到了97%的總體準確率,但是需要對柑橘葉片進行20 min暗適應,以便獲取準確的葉綠素熒光信號,導致其檢測效率不高。梅慧蘭等[17]采集了感染黃龍病柑橘葉片的可見-近紅外(370~1 000 nm)高光譜圖像,利用全波長光譜反射率建立了偏最小二乘判別分析(partial least square discriminant analysis,PLS-DA)模型,得到了96.4%的總體識別準確率,對無明顯癥狀樣本的識別準確率為94%。馬淏等[18]通過融合光譜和圖像特征,獲得了95.4%的平均識別正確率。劉燕德等[19]通過結合無信息變量消除法和連續投影法從256個高光譜變量中選擇了共線性最小的19個變量作為區分柑橘黃龍病的敏感波段,模型的識別率為100%。上述研究結果表明,基于高光譜成像技術對柑橘黃龍病的診斷可行性,識別效果大多針對顯癥的葉片,對潛伏期未顯癥的柑橘葉片的識別需要較多的光譜變量,并且普遍存在數據緯度較高的問題,不利于便攜式儀器的開發。由于處于潛伏期的染病植株充當著黃龍病傳染源的角色,因此,及時診斷出潛伏期的染病植株并挖除對果園黃龍病疫情的防控具有重要意義。
鑒于上述研究對處于潛伏期的柑橘黃龍病研究較少。因此,本文以感染黃龍病未顯癥和健康的柑橘葉片為研究對象,首先獲取兩者的近紅外高光譜圖像,并比較兩者的近紅外光譜差異;分析潛伏期的宿主在糖代謝水平上對黃龍病病原菌侵染的響應;最后篩選出最佳的敏感波段并構建柑橘黃龍病判別模型,為田間黃龍病的高效普查提供參考。
于2017年12月11日從浙江臨海上百巖村的柑橘果園中選擇經qPCR驗證的健康和染病未顯癥的溫州蜜柑樹各3棵,選擇每棵柑橘植株上東南西北4個方位的樹梢,從每個方位剪下5條枝條,枝條的切口處立即用濕潤的棉花包住,隨即將枝條裝進自封袋,并放入保鮮盒,防止樹梢水分的散失。在高光譜圖像采集之前,分別從每個枝條上取下2片葉子,本次試驗共收集240片(120片健康和120片感病未顯癥)作為研究對象。
為了獲取柑橘葉片的近紅外高光譜圖像,本次試驗所采用的實驗室高光譜成像系統主要包括分辨率為320×256 pixels的CCD相機(Xeva 992, Xenics Infrared Solutions, Leuven, Belgium)、波長范圍為874~1733 nm、分辨率為3.36 nm光譜儀(ImSpector N17E; Spectral Imaging Ltd., Oulu, Finland)、線光源(Fiber-Lite DC950, Dolan Jenner Industries Inc., Boxborough, MA)、電控移動平臺、暗箱和電腦。電控移動平臺移動速度為20 mm·s-1,工作距離為35 cm,曝光時間45 ms。高光譜圖像采集前,首先獲取暗電流和參考板的高光譜圖像數據,用于數據處理前對原始高光譜圖像的校正,校正公式為:
R=(Iraw-Idark)/(Iref-Idark)
(1)
式中:R為校正后的圖像;Iraw為原始圖像;Idark為暗電流圖像;Iref為參考板圖像。
為了確認所采集葉片的健康狀態,在獲取高光譜圖像之后進一步利用實時熒光定量PCR技術對葉片進行鑒定。分別從每棵健康樹的每個方位各取2片葉片,病樹的每個方位各取6片(共96片)用于病原菌濃度測量。利用植物DNA提取試劑盒(Simgen, Hangzhou, China)提取葉脈的DNA。根據文獻提供的探針和引物序列合成試驗所需的探針和引物(Tsingke, Hangzhou, China)[20]。反應體系為20 μL,其中包括10 μL SYBR Premix Ex Taqman Ⅱ, 0.4 μL ROX Reference Dye(TaKaRa Biotech. Co, Dalian, China),上下游引物(10 μmol·L-1)各0.5 μL,1 μL DNA模板(20 ng·μL-1)及7.6 μL ddH2O。在實時熒光定量核酸擴增檢測系統(7300, Applied Biosystems, Foster, USA)中擴增反應程序設置為初始1個周期的95 ℃,30 s;95 ℃,5 s 和60 ℃,31 s,40個循環。
為了探索潛伏期柑橘宿主在糖代謝水平上對病原菌的響應,本試驗分別測量了未顯癥和健康柑橘葉片的淀粉、蔗糖、葡萄糖及果糖的含量。從每棵樹的每個方位取4片葉片(共96片)用于碳水化合物測量。利用打孔器從葉片的四周取下4個面積為36.3 mm2的小圓盤葉片組織,其中2個圓盤用于淀粉測定,另外2個圓盤用于可溶性糖測定。測量淀粉時,將葉片圓盤置于2 mL離心管中并加入1 mL 95%乙醇,24 h后,舍去上清液,烘干,去除葉綠素對淀粉含量測定的影響。經研磨(160 s,60 Hz,2個周期)后,向離心管加入0.75 mL蒸餾水,沸水浴30 min。取200 μL的懸浮液(稀釋40倍)置于96孔板中,并加入15 μL 2%的碘液,待反應20 min后,測定595 nm的吸光度值(Epoch2, BioTek Instruments, Inc, Vermont, USA)。最后根據大米淀粉(S-7260, Sigma, St. Louis, MO, USA)制作的標準曲線計算出淀粉濃度。可溶性糖測量時研磨參數與淀粉測量一致,沸水浴后,再經10 000 r·min-1、1 min離心后,采用0.22 μm濾膜過濾上清液。取600 μL的稀釋液(稀釋40倍)用于蔗糖、葡萄糖和果糖測量,離子色譜儀(ICS3000, DIONEX, USA)的流動相為200 mmol·L-1NaOH,流速設為1.0 mL·min-1。最后根據蔗糖、葡萄糖和果糖標準品(Sinopharm Chemical Reagent Co., Ltd, Shanghai, China)制定的標準曲線計算出各自的濃度。
1.4.1 特征波段的選擇
將校正之后的近紅外高光譜圖像讀入計算機,把整個葉片視為感興趣區域(region of interest,ROI),求出每個葉片在874~1 733 nm的平均光譜反射率。盡管高光譜圖像能夠提供豐富的有關柑橘葉片光譜信息,但是存在一些多余的信息。為了剔除無貢獻和冗余變量并篩選出與柑橘黃龍病最具有相關性的光譜特征,本研究選用Random Frog算法計算各個波段被選中用于柑橘黃龍病識別的概率。該算法是一種新型的特征選擇算法,通過少量變量的建模,輸出每個變量被選中的概率,概率越高,表明該波段越能反映病原菌對葉片組織光學特性的影響[21]。運行過程主要包括以下3個步驟:1)初始化1個包含Q個變量的子集V0;2)在原始變量子集V0的基礎上,計算出1個包含Q*個變量的候選變量子集V*,接著選擇V*作為V1來代替原始的變量子集V0。迭代N次直到終止;3)輸出每個變量被選中的概率作為后續分析。
1.4.2 判別模型的建立
模型的性能直接影響著柑橘黃龍病的識別效果。本研究選擇Na?ve Bayes(NB)和linear discriminant analysis(LDA)兩種判別模型用于對柑橘黃龍病的識別,并比較兩者的識別效果。NB是一種基于概率統計知識進行分類的算法[22],假設每個特征之間相互獨立。主要思想是假設標簽為C的樣本X包含了n個特征,即X=(x1,x2,…,xn),根據貝葉斯理論,條件概率C為:
(2)
式中:p(C),據訓練模型算出的先驗概率;p(X|C)/p(X),測試過程中調整,使得p(X|C)近真實值。
LDA算法的思想則是將高維的樣本映射到一個低維空間,實現提取有用的分類信息并數據降維,同時保證映射到低維空間的樣本擁有最大的類間距離和最小的類內距離,具有最佳的可分離性[23]。在分類過程中,把染病和健康葉片的標簽分別設置成“1”和“2”,并采用Kennard-Stone(KS)算法將柑橘葉片按照2∶1的比例分成建模集和預測集[24]。
1.4.3 模型識別效果的評判標準及數據分析軟件
本研究采用單因素方差分析(one-way analysis of variance,ANOVA)來檢驗黃龍病病原菌是否對宿主糖代謝有顯著的影響。模型對柑橘黃龍病的識別效果通過混淆矩陣來計算總體準確率、漏檢率和誤判率,并作為評價標準。本次數據分析的軟件平臺為MATLAB R2014a(MathWorks, Inc., Natick, MA, USA)和IBM SPSS Statistics(Version 20.0, IBM Corporation, Armonk, New York, USA)。
柑橘從首次感染黃龍病到癥狀的顯現會經歷一段時間的潛伏期,在這期間,病原菌在宿主體內遷移、增殖,種群數量得以擴增,使其發展為新傳染源。因此,研究潛伏期柑橘葉片的糖代謝有助于了解潛伏期時植株對黃龍病的生理響應。圖1-A展示了本實驗采集的典型健康和潛伏期的柑橘葉片,但是無法根據肉眼進行區分,因此,有必要采用qPCR技術測量2類葉片和對照組(ddH2O)的循環閾值(cycle threshold, Ct),診斷所采集葉片的真實健康狀態。如圖1-B所示,對照組的Ct值為34.9±0.43,健康葉片的Ct值為34.0±0.23,兩者十分接近,可認為所采集的健康葉片均為陰性。與對照組和健康組相比,染病葉片的Ct值為19.2±2.71,顯著低于對照組,診斷為陽性。進一步分析圖1-B可知,qPCR技術能夠有效地診斷出柑橘黃龍病,因此可作為光學檢測方法的參考標準。

數據以平均值±標準差表示,健康、染病及對照組葉片數量分別為24、72和5。柱子上無相同小寫字母代表差異顯著(P<0.05)。Data were presented as mean± standard deviation for healthy (n=24) and asymptomatic HLB infected (n=72) leaves, as well as (n=5) for the control. Data on the bars marked without the same lowercase letter indicated significant differences at P<0.05.圖1 健康和未顯癥柑橘RGB照片和兩類樣本及對照組(蒸餾水)的Ct值Fig.1 RGB images of healthy and asymptomatic HLB infected leaves and their Ct values as well as control (ddH2O) measured by qPCR
分析潛伏期柑橘葉片的糖代謝變化,有助于了解宿主對病原菌的響應。圖2顯示了未顯癥和健康柑橘葉片的淀粉、蔗糖、葡萄糖及果糖的含量。如圖2-A所示,處于潛伏期染病的柑橘葉片淀粉含量為(128.5±53.9) μg·mm-2,是健康葉片[(35.9±10.6) μg·mm-2]的3.58倍,這說明淀粉相關代謝基因的表達在潛伏期時已經遭受影響。前人研究表明,感染黃龍病后,淀粉合成酶(如AGPase)的活性會被上調,而淀粉水解酶(如α-amylase)的活性會被下調[25-26],最終導致淀粉的異常累積。
蔗糖作為柑橘葉片葉綠體光合作用的主要產物,能通過韌皮部從源器官運輸至庫器官。如圖2-B所示,染病葉片[(8.22±1.80) μg·mm-2]的蔗糖含量是健康葉片[(3.81±0.86) μg·mm-2]的2.16倍,說明染病葉片蔗糖無法被有效地消耗和轉運,表明韌皮部功能在未顯癥時已經受損。進一步分析己糖(葡萄糖和果糖),染病葉片中的己糖含量同樣顯著高于健康葉片(圖2-C和2-D),分別是健康葉片的3.41和1.70倍,說明病原菌侵染會導致己糖無法被植物細胞充分利用,另一方面,逆轉錄酶的活性增加會促進蔗糖水解成己糖,加劇了己糖的累積[27]。總之,處于潛伏期染病未顯癥柑橘葉片中的淀粉、蔗糖、葡萄糖及果糖的異常累積,可間接作為柑橘感染黃龍病的一種標志。
圖2結果表明,處于潛伏期染病未顯癥柑橘葉片中的碳水化合物(淀粉、蔗糖、葡萄糖及果糖)已經出現異常累積,而近紅外區域的光譜特征能夠有效地反映出葉片內部的生化組分變化。分析圖3所示的健康和未顯癥柑橘葉片的平均光譜曲線可知,染病葉片的近紅外光譜反射率大于健康葉片,其中,在940~1380 nm兩者的反射率差異大于其他區域,這與葉片中水分子O—H鍵的彎曲振動及化學物質C—H鍵的2級和3級倍頻伸縮振動有關[28-29]。因此,可推測染病葉片的碳水化合物累積可能是導致這個波長范圍內的光譜特征變化的主要原因。病原菌侵染引發宿主葉片近紅外區域的光譜特征的變化,說明光學技術具有檢測柑橘黃龍病的潛力。
為了能在潛伏期有效地識別出染病的柑橘植株,并簡化數據緯度,優化判別模型,需要從原始的256個變量中篩選出最佳數量的敏感波段。圖4顯示了基于Random Frog算法計算的各個波段被選中用于柑橘黃龍病識別的概率。可以看出,選中概率較高的波段大部分集中在940~1 380 nm,這與圖3的分析結果一致。合適的特征波段數量有利于減少數據緯度和簡化模型,縮小后期硬件的開發成本,因此,需要根據最終模型識別效果來設定最佳選中概率的閾值,以便獲取最適合的輸入變量。初步選擇選中概率為前10的敏感波段(1 015、1 331、1 065、1 334、1 022、951、1 146、1 028、1 524、1 126 nm)作為后續分析。

數據以平均值±標準差表示,健康、染病葉片的數量均為48。柱子上無相同小寫字母代表差異顯著(P<0.05)。Data were presented as mean (n=48) ± standard deviation for each column. Data on the bars marked without the same lowercase letter indicated significant differences at P<0.05.圖2 健康和未顯癥柑橘葉片的淀粉、蔗糖、葡萄糖及果糖的含量Fig.2 Comparisons of carbohydrate metabolism (starch, glucose, fructose and sucrose) of healthy and asymptomatic HLB infected leaves

所示的曲線分別為健康和染病葉片的平均值(n=120)。Data were presented as mean (n=120) for each class.圖3 健康和未顯癥柑橘葉片的平均光譜曲線Fig.3 Mean spectra of healthy and HLB infected asymptomatic leaves
圖5展示了不同輸入變量下Na?ve Bayes(NB)和linear discriminant analysis(LDA)判別模型對柑橘黃龍病的識別效果。隨著輸入變量的增加,2個判別模型的識別準確率逐漸上升,說明敏感波段的數量對柑橘黃龍病的識別至關重要。當輸入變量數量≤5時,2個模型的識別效果相當。但是,當敏感波段數量增加至6個時,NB模型對潛伏期未顯癥柑橘黃龍病的總體識別準確率為97.5%,明顯優于LDA模型(92.5%)。隨著輸入變量的逐漸增加,NB模型的總體識別準確率保持平穩,說明增加的敏感波段與前6個敏感波段的相關性較高,并沒有增加對樣本的描述性信息。相比之下,LDA模型的識別效果在敏感波段數量為9時達到最優,為97.5%,LDA模型的輸入變量多于NB模型(6個)。

圖4 各個波段被選中用于柑橘黃龍病識別的概率Fig.4 Selection probability of each wavelength for citrus HLB disease detection in asymptomatic period

圖5 不同輸入變量下Na?ve Bayes和linear discriminant analysis判別模型預測的效果Fig.5 Prediction performance of Na?ve Bayes and linear discriminant analysis based on different number of selected wavelengths
僅根據總體識別準確率和輸入變量數量的多少評判NB和LDA模型的優劣勢還不夠,需要進一步分析2個判別模型對每一類樣本的識別效果。輸入變量數量為6(1 015、1 331、1 065、1 334、1 022、951 nm)時,NB模型可以正確識別所有染病葉片,模型的漏檢率為0,而2片健康柑橘葉片被誤判成染病葉片,NB模型的誤判率為4.1%。相比之下,輸入變量數量為9時(1 015、1 331、1 065、1 334、1 022、951、1 146、1 028、1 524 nm),雖然LDA能夠達到和NB判別模型相同的總體識別準確率,并且健康柑橘葉片能被100%正確識別,但是,有2片染病的葉片被漏檢成健康葉片,LDA模型的漏檢率為6.25%。通常情況下,判別模型擁有較低的漏檢率有助于提高對陽性樣本(染病葉片)的檢出率,這對于防控黃龍病在果園的擴散更具意義。鑒于NB判別模型所需更少的輸入變量和擁有更低漏檢率,其更適用于柑橘黃龍病的檢測。
由于柑橘黃龍病因具有極強的傳染力,因此及時發現并挖除病樹對果園病害的防治具有重要意義。本研究結果表明,黃龍病病原菌的侵染導致宿主在未顯癥時期就出現了糖代謝異常,表現為感病葉片的淀粉、蔗糖、葡萄糖及果糖的大量累積,進而引起葉片組織的光學特性發生變化,導致近紅外光譜的反射率大于健康葉片。利用Random Frog算法選擇的前6個敏感波段結合Na?ve Bayes(NB)判別模型能有效地實現對潛伏期柑橘黃龍病的檢測,模型的正確率為97.5%,對陽性樣本的漏檢率為0,說明應用近紅外高光譜技術能夠實現對未顯癥柑橘黃龍病的檢測。