楊增沖++劉桂禮++李響

摘要:使用傳統(tǒng)的聚合酶鏈反應(yīng)技術(shù)檢測(cè)番茄(Lycopersicon esculentum Mill.)植株是否有黃化曲葉病的抗病基因,進(jìn)而確定植株是否具有抗病性;采集鑒定后的植株葉片的近紅外漫反射光譜,采用多種方法對(duì)原始光譜進(jìn)行預(yù)處理,并將不同預(yù)處理后的數(shù)據(jù)以及原始光譜作為輸入,利用支持向量機(jī)建立抗病性的識(shí)別模型。采用標(biāo)準(zhǔn)正態(tài)變量變換和去趨勢(shì)算法預(yù)處理后所建立的模型對(duì)預(yù)測(cè)集的識(shí)別準(zhǔn)確率可以達(dá)到96.153 8%。表明通過(guò)近紅外光譜技術(shù)可以識(shí)別番茄植株對(duì)黃化曲葉病是否具有抗病性。
關(guān)鍵詞:番茄(Lycopersicon esculentum Mill.)黃化曲葉??;抗病性;近紅外光譜;光譜預(yù)處理;支持向量機(jī)
中圖分類(lèi)號(hào):S123;O657.33 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2017)05-0953-04
DOI:10.14088/j.cnki.issn0439-8114.2017.05.042
Study of Identifying Tomato Yellow Leaf Curl Disease Resistance Based on Near-infrared Spectroscopy Analysis Technique
YANG Zeng-chong,LIU Gui-li,LI Xiang
(School of Instrument Science and Opto Electronics Engineering,Beijing Information Science & Technology University,Beijing 100192,China)
Abstract: Gene of tomato(Lycopersicon esculentum Mill.) yellow leaf curl disease resistance has been detected by using polymerase chain reaction. This method is widely used to determine the disease resistance of tomato plants. The near-infrared diffuse reflectance spectroscopy of the identified samples was collected. Then the original data and the data preprocessed by different methods are used as the input of Support Vector Machine(SVM) to build the model to judge whether a tomato plant is resistant to the disease. Experimental results show that the model which used the correction method of Standard Normal Variate and Detrending had the best performance and the recognition accuracy of the test set can reach 96.153 8%. The result proves that it is feasible to identify the resistance of Tomato Yellow Leaf Curl Disease by Near Infrared Spectroscopy.
Key words: tomato (Lycopersicon esculentum Mill.) yellow leaf curl disease;resistance;NIR;spectral pretreatment;SVM
番茄(Lycopersicon esculentum Mill.)因其營(yíng)養(yǎng)豐富、高產(chǎn)等特點(diǎn)已經(jīng)成為中國(guó)乃至世界上的重要農(nóng)作物之一。番茄黃化曲葉病(TYLCD)會(huì)使番茄幼苗生長(zhǎng)緩慢甚至停滯,后期感染這種病也會(huì)影響果實(shí)的產(chǎn)量和品質(zhì),甚至造成絕收,已成為限制番茄生產(chǎn)的重要病害之一[1]。黃化曲葉病病毒(TYCLV)自然條件下通過(guò)煙粉虱傳播和擴(kuò)散,煙粉虱繁殖能力強(qiáng),寄主廣泛,易產(chǎn)生抗藥性,難以從寄主方面阻止病毒的傳播和擴(kuò)散。再加上TYCLD易爆發(fā)、擴(kuò)散迅速[2],選取具有抗病性的番茄植株進(jìn)行精細(xì)化的栽培能夠保障植株后期的發(fā)育成長(zhǎng),保證番茄的產(chǎn)量和經(jīng)濟(jì)收益。
國(guó)內(nèi)外已經(jīng)針對(duì)番茄黃化曲葉病抗病性的鑒定提出了多種方法,如嫁接接種鑒定、農(nóng)桿菌接種鑒定、基因槍轟擊法接種鑒定、煙粉虱浸染接種、田間自然接種等[3],但這些方法都相對(duì)費(fèi)時(shí)或者費(fèi)力,不能夠在大面積栽培前鑒定幼苗的抗病性。目前,廣泛采用的聚合酶鏈反應(yīng)技術(shù)(PCR)經(jīng)過(guò)對(duì)番茄DNA的提取、酶切、擴(kuò)增、電泳、凝膠等步驟,能夠標(biāo)記識(shí)別番茄抗TYCLV的抗病基因,完成對(duì)植株是否具有抗TYCLV特性的識(shí)別,可靠性強(qiáng)[4]。雖然該技術(shù)結(jié)果可靠,但其過(guò)程繁瑣,對(duì)操作者有較高的技術(shù)要求,所用部分試劑對(duì)人體有危害,仍然存在耗時(shí)、污染環(huán)境的缺陷。
近紅外光譜分析技術(shù)(NIR)能夠快速、無(wú)損、高效的對(duì)樣品進(jìn)行定量或定性地檢測(cè)識(shí)別,已經(jīng)被廣泛用于食品、農(nóng)業(yè)、醫(yī)學(xué)等眾多領(lǐng)域。在農(nóng)業(yè)上,利用NIR技術(shù)可以測(cè)定油菜種子的品質(zhì)[5],實(shí)現(xiàn)對(duì)番茄葉片灰霉病病害程度準(zhǔn)確、快速的檢測(cè)[6],識(shí)別番茄細(xì)菌性葉斑病的病害程度[7]。但在國(guó)內(nèi)應(yīng)用NIR識(shí)別番茄植株抗病性的研究鮮見(jiàn)報(bào)道。通過(guò)PCR技術(shù)檢測(cè)番茄黃化曲葉病的抗病基因,證明抗病基因存在的同時(shí),番茄抗病基因能夠在其光譜特征曲線(xiàn)上體現(xiàn)[8],通過(guò)光譜分析技術(shù)識(shí)別番茄光譜特征曲線(xiàn)上的差異,實(shí)現(xiàn)對(duì)番茄抗病性的識(shí)別。本研究以北京市農(nóng)林科學(xué)院蔬菜研究中心培育的番茄品種佳紅4號(hào)為對(duì)象,利用NIR技術(shù)對(duì)番茄黃化曲葉病抗病性進(jìn)行初步分類(lèi)研究,獲得了良好的分類(lèi)效果,為番茄選育提供一種新的有效檢測(cè)手段,進(jìn)而降低農(nóng)戶(hù)的種植風(fēng)險(xiǎn),保障其經(jīng)濟(jì)收益。
1 材料與方法
1.1 試驗(yàn)材料
采用荷蘭愛(ài)萬(wàn)提斯生產(chǎn)的近紅外光譜儀,型號(hào)為AvaSpec-NIR256-1.7。配套使用的光源為Avalight-HAL,波長(zhǎng)范圍360~2 500 nm。采用的光纖是標(biāo)準(zhǔn)型反射探頭FCR-71R400-2-ME,參考瓦為WS-2。所用番茄植株為北京市農(nóng)林科學(xué)院蔬菜研究中心培育的佳紅4號(hào)。
1.2 試驗(yàn)方法
1.2.1 光譜采集 植物的冠層葉片在很大程度上反映植株的健康程度,而抗病性檢測(cè)是分析番茄植株因基因差異所產(chǎn)生的最本質(zhì)的不同,無(wú)論冠層還是其他葉片,抗病與感病植株之間的差異都會(huì)存在。若只選取冠層葉片,很可能引入反映植株健康程度因子這一干擾,進(jìn)而影響抗病性識(shí)別模型的識(shí)別準(zhǔn)確度?;谶@種考慮,在實(shí)際采集番茄葉片的反射光譜時(shí),選取了番茄植株不同部位分別取樣。
在正式開(kāi)始采集番茄葉片光譜數(shù)據(jù)前,先對(duì)番茄植株進(jìn)行PCR檢測(cè),判斷植株有無(wú)抗性基因(Ty-1、Ty-3a),以此結(jié)果作為后期建模和預(yù)測(cè)時(shí)的分類(lèi)真值。每棵植株不同部位取2~3片葉,共采集了234個(gè)葉片樣本,其中具有抗性基因(抗?。┑臉颖?7個(gè),缺少抗性基因(感?。┑臉颖?37個(gè)。鑒于番茄葉片也可近似的看作粉狀材料,光譜采集采用漫反射測(cè)量法[9]。使用對(duì)應(yīng)的軟件在室溫下采集葉片光譜時(shí),積分時(shí)間設(shè)置為10 ms,平均掃描數(shù)設(shè)定為2(即所得光譜是2次掃描的平均值)。對(duì)已經(jīng)測(cè)得的光譜按2∶1劃分成訓(xùn)練集和預(yù)測(cè)集,其中訓(xùn)練集156個(gè)樣本(感病樣本92個(gè)、抗病樣本64個(gè)),預(yù)測(cè)集78個(gè)樣本(感病樣本45個(gè)、抗病樣本33個(gè))。
1.2.2 數(shù)據(jù)預(yù)處理及建模 由于是漫反射測(cè)量,為了消除葉片化學(xué)成分濃度和物理特性(固體顆粒大小、表面散射、厚度等)的影響,采用多元散射校正法(MSC)、標(biāo)準(zhǔn)正態(tài)變量變換法(SNV)以及標(biāo)準(zhǔn)正態(tài)變量變換和去趨勢(shì)算法(Detrending)相結(jié)合分別對(duì)原始光譜進(jìn)行預(yù)處理,原始光譜以及預(yù)處理后的光譜如圖1所示。利用支持向量機(jī)(SVM)模式識(shí)別與回歸的軟件包LIBSVM對(duì)訓(xùn)練集和預(yù)測(cè)集進(jìn)行建模和預(yù)測(cè)[10],選用徑向基函數(shù)K(xi,xj)=exp{-?酌||xi-xj||2}為內(nèi)核。SVM需要解決以下優(yōu)化問(wèn)題[11]:
■=■wTw+c■ξi
s.t.yi(wTxi+b)≥1-ξiξi≥0,i=1,…,n
其中,w為權(quán)向量,c為懲罰因子,ξ為松弛變量,xi為第i個(gè)番茄樣本的近紅外光譜數(shù)據(jù),yi∈{-1,1}為第i個(gè)番茄樣本的所屬類(lèi)別(感病樣本為“-1”,抗病樣本為“1”),b為分類(lèi)閾值。懲罰因子c起到對(duì)錯(cuò)分樣本懲罰程度控制的作用,實(shí)現(xiàn)在錯(cuò)分樣本的比例和算法復(fù)雜程度之間的“折衷”,核函數(shù)參數(shù) γ的改變實(shí)際上是隱含地改變映射函數(shù),從而改變樣本數(shù)據(jù)子空間分布的復(fù)雜程度[12]。
通過(guò)網(wǎng)格搜索法并結(jié)合交叉驗(yàn)證法選擇出最佳的懲罰參數(shù)c和參數(shù)γ,基本思想是將訓(xùn)練集作為原始數(shù)據(jù),利用K重交叉驗(yàn)證的方法得到分類(lèi)準(zhǔn)確率最高的那組c和γ作為最佳的參數(shù)。對(duì)于多組最佳參數(shù)的處理則是優(yōu)先選取首次搜索到的參數(shù)c最小的那組,以有效地防止過(guò)學(xué)習(xí)狀態(tài)的發(fā)生[13]。
2 結(jié)果與分析
將原始光譜以及不同預(yù)處理后的光譜作為輸入,依據(jù)網(wǎng)格搜索法,得到最優(yōu)的模型參數(shù)c、γ,并逐步減小搜索范圍,取得不同范圍下的最優(yōu)參數(shù),建立模型并對(duì)訓(xùn)練集和預(yù)測(cè)集進(jìn)行預(yù)測(cè),不同預(yù)處理后不同參數(shù)下,交叉驗(yàn)證后的平均分類(lèi)準(zhǔn)確率以及模型對(duì)訓(xùn)練集和預(yù)測(cè)集的預(yù)測(cè)結(jié)果如表1所示。由于SVM分類(lèi)器的支持向量的數(shù)目越小,分類(lèi)器的泛化能力就越強(qiáng)[14],最后選擇支持向量機(jī)分類(lèi)誤差較小且支持向量數(shù)目較少的SVM參數(shù)對(duì)應(yīng)的分類(lèi)模型為最優(yōu)模型[15]。
由表1可以看出,以原始光譜數(shù)據(jù)輸入建立的模型,支持向量數(shù)較大,預(yù)測(cè)準(zhǔn)確率較低,對(duì)番茄TYCLV的抗病性識(shí)別度不高。經(jīng)MSC處理后建立的模型,隨著懲罰因子c的增加,支持向量數(shù)隨之減少,預(yù)測(cè)的準(zhǔn)確度有小范圍的浮動(dòng),當(dāng)c=256時(shí),支持向量數(shù)最小,有出現(xiàn)過(guò)學(xué)習(xí)的趨勢(shì)。與MSC預(yù)處理后的模型相比,SNV預(yù)處理后建立的模型,懲罰因子c有所減小,預(yù)測(cè)準(zhǔn)確率有所提高。經(jīng)人為選取c=16、γ=2鄰近范圍的其他參數(shù)組合后確認(rèn),模型在c=16、γ=2預(yù)測(cè)準(zhǔn)確率最高。光譜經(jīng)過(guò)SNV & Detrending處理后,無(wú)論是交叉驗(yàn)證后的平均分類(lèi)準(zhǔn)確率、支持向量數(shù)還是對(duì)訓(xùn)練集和預(yù)測(cè)集的分類(lèi)準(zhǔn)確率,都要優(yōu)于前2種模型,模型的性能最好。所以對(duì)光譜的預(yù)處理方法,SNV & Detrending效果最好,以其預(yù)處理后的光譜輸入構(gòu)建的模型在c=84.448 5、γ=1時(shí),對(duì)樣本的分類(lèi)最為準(zhǔn)確,模型的泛化能力也最好。
3 小結(jié)與討論
研究以PCR檢測(cè)的TYCLV抗性結(jié)果為參考值,使用SNV與Detrending相結(jié)合的方法對(duì)光譜進(jìn)行預(yù)處理,建立的SVM模型對(duì)番茄抗病性的預(yù)測(cè)準(zhǔn)確率達(dá)到了96.153 8%,初步實(shí)現(xiàn)了利用近紅外光譜分析技術(shù)識(shí)別番茄植株對(duì)于黃化曲葉病是否具有抗病性。由于抗性基因的不同、番茄品種的差異,番茄植株對(duì)TYCLV的抗病性表現(xiàn)也不同。下一步繼續(xù)研究不同基因組合或不同品種下,利用NIR技術(shù)對(duì)TYCLV的抗病性識(shí)別效果。
參考文獻(xiàn):
[1] 葉青靜,楊?lèi)們€,王榮青,等.番茄抗黃化曲葉病育種研究進(jìn)展[J].中國(guó)農(nóng)業(yè)科學(xué),2009,42(4):1230-1242.
[2] 李小靖,葉志彪.我國(guó)番茄黃化曲葉病發(fā)生規(guī)律和研究進(jìn)展[J].長(zhǎng)江蔬菜,2010(2):1-5.
[3] 葉青靜,周?chē)?guó)治,王榮青,等.番茄黃化曲葉病毒病抗性鑒定技術(shù)研究[J].分子植物育種,2011,9(2):210-217.
[4] 魏光普,孫瑞芬,尚春明,等.番茄黃化曲葉病毒病抗病基因的PCR檢測(cè)[J].種子,2013,32(8):25-27,32.
[5] 朱文秀,趙繼獻(xiàn),張 品,等.近紅外光譜分析與化學(xué)方法檢測(cè)油菜種子品質(zhì)參數(shù)的比較[J].安徽農(nóng)學(xué)通報(bào)(上半月刊),2010, 16(17):182-183,185.
[6] 吳 迪,馮 雷,張傳清,等.基于可見(jiàn)/近紅外光譜技術(shù)的番茄葉片灰霉病檢測(cè)研究[J].光譜學(xué)與光譜分析,2007,27(11):2208-2211.
[7] JONES C D,JONES J B,LEE W S. Diagnosis of bacterial spot of tomato using spectral signatures[J].Computers and Electronics in Agriculture,2010,74(2):329-335.
[8] 劉興庫(kù),李兆華.多光譜診斷植物病害的初步研究[J].東北林業(yè)大學(xué)學(xué)報(bào),1993,21(2):106-110.
[9] 李民贊.光譜分析技術(shù)及其應(yīng)用[M].北京:科學(xué)出版社,2006.
[10] 張小超,吳靜珠,徐 云.近紅外光譜分析技術(shù)及其在現(xiàn)代農(nóng)業(yè)中的應(yīng)用[M].北京:電子工業(yè)出版社,2012.
[11] HSU C W,CHAN C C,LIN C J. A practical guide to support vector classification[EB/OL].https://www.csie.ntu.edu.tw/~cjlin/libsvm/,2010-04-15.
[12] 王 睿.關(guān)于支持向量機(jī)參數(shù)選擇方法分析[J].重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,24(2):36-38,42.
[13] 王小川,史 峰,郁 磊,等.MATLAB神經(jīng)網(wǎng)絡(luò)43個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2013.
[14] NELLO CRISTIANINI,JOHN SHAWE-TAYLOR,李國(guó)正,等.支持向量機(jī)導(dǎo)論[M].北京:電子工業(yè)出版社,2004.
[15] 康松林,周玖玖,李 瓊.入侵檢測(cè)中支持向量機(jī)參數(shù)選擇方法[J].中國(guó)科技論文,2012,7(10):762-765.