潘 同 吳偉鋒 侯浩楠 許亞男 涂柯玲 顧日良 王建華 孫 群
(中國農業大學 農學院/農業農村部農作物種子全程技術研究北京創新中心/ 北京市作物遺傳改良重點實驗室,北京 100193)
玉米是我國第一大作物,是重要的糧食、飼料和工業生產原料。玉米在我國農業發展中占有重要的地位,具有較強的耐旱性、耐寒性、耐貧瘠性以及極好的環境適應性,種子的出苗率是玉米產業發展的基礎,直接影響田間表現及最終產量。
ISTA(國際種子檢驗協會)將四唑染色法列為種子生活力檢測的標準方法,應用廣泛。其主要原理是通過氯化三苯基四氮唑(TTC)與活細胞的還原反應產生紅色的三苯基甲,指示種子是否有生活力。為了保證結果的準確性,在種子胚部染色程度和染色部位等方面的鑒別,對操作者的經驗具有較高要求。且人眼識別易受主觀影響,重復性不足。計算機圖像識別技術能夠模擬人的視覺功能,又具有信息自動提取、運算速度快和重復性好等特點,在種子活力檢測、種子識別、種子精選和質量檢測等種業領域的應用越來越廣泛。葉鳳林等提取黃芩種子的顏色和體積等物理指標并探究與種子活力之間的相關性,通過單指標篩選,識別準確率達78.5%。Tu等通過機器視覺技術提取單粒辣椒種子的形態和顏色指標,建模分析種子生活力,預測準確率最高達79.0%。Kurtulmu等利用顏色、形狀和紋理等信息建立ANN(人工神經網絡)模型,最終建立的辣椒種子生活力預測模型準確率達84.9%。趙新子等和章華仙利用計算機圖像分析系統分別對TTC染色后的玉米和水稻種子胚部進行圖像采集,以染色部分占胚部總面積超過2/3代表有生活力,將判定結果與標準發芽試驗及人工判斷結果進行分析,得到一系列回歸方程表明三者之間存在顯著的相關性,生活力判斷準確率可以達到93.7%,發芽率預測R
均達到0.9,但該方法需要人為設定顏色閾值從而確定染色面積。章華仙和董翠翠等探究過基于TTC染色玉米種子圖像處理獲得的染色面積比例與種子生活力的關系,但是種子染色胚部顏色指標與種子生活力的關系尚未見報道,因此,本研究以‘三北6號’玉米種子為材料,將TTC染色法與計算機圖像識別與處理技術結合,建立基于玉米染色胚部顏色特征的玉米種子生活力預測模型,旨在通過引入機器“視覺”技術,降低對操作人員經驗的依賴,從而提高種子生活力檢測結果的準確性和可重復性,以期為作物種子檢測的自動化和標準化提供參考。
玉米品種為‘三北6號’,收獲年份為2015年,產地為甘肅省張掖市,實驗室條件(25 ℃,RH 30%)下存放。驗證所用的6個不同品種的玉米種子,分別編號V、V、V、V、V、V,實驗室條件(25 ℃,RH 30%)下存放。
1
.2
.1
標準發芽試驗取‘三北6號’和驗證所用的6份玉米種子各300粒進行標準發芽試驗。發芽盒底部放置一塊薄海綿,并加入足量蒸餾水,以不超過海綿塊頂部為準,海綿塊上放置發芽紙,以確保不同發芽盒以及整個發芽期間水勢一致。置種,然后將發芽盒置于25 ℃ 發芽室中進行光照培養,發芽第7 d記錄發芽率。
1
.2
.2
TTC染色測定將種子放入裝有蒸餾水的錐形瓶中,在室溫下(25 ℃)浸泡24 h,使種子充分吸脹。隨機選取吸脹種子300粒,將玉米種子沿胚中線縱向切開,任取其中半粒。參照標準TTC染色的方法,將處理好的玉米種子置于0.1% TTC溶液中,在30 ℃、黑暗條件下染色2 h。染色結束后,將染色的玉米種子用蒸餾水沖洗3遍,以便后期觀察染色情況和進行圖像采集。
1
.2
.3
機器視覺及圖像分割TTC染色后的玉米種子切面朝下,置于Microtek MiCardWizard掃描儀(上海中晶科技有限公司)的玻璃板上,以600 dpi的分辨率對其進行掃描,得到TIF格式文件。將掃描得到的TTC染色后胚部圖像利用Image J(NIH)軟件處理,去除圖像背景,保留種子胚部,再使用種子表型自動化分析系統(PhenoSeed,中國農業大學種子科學與技術研究中心與南京智農云芯大數據科技有限公司共同研發),提取每一粒種子胚部的顏色特征。顏色特征包括R
(紅色值,Red)、G
(綠色值,Green)、B
(藍色值,Blue)、H
(色相,Hue)、S
(飽和度,Saturation)、V
(明度,Value)、L
(亮度,Luminosity)、a
(從紅色至綠色的范圍)、b
(從黃色至藍色的范圍)、Gray(灰度)及標準差(std),共20個指標。1
.2
.4
生活力鑒定邀請3名專業人員對玉米種子胚部的染色情況進行觀察鑒定。鑒定標準:胚芽或者切面的染色面積超過胚部面積2/3的,確定為有生活力的種子,反之染色面積少于胚部面積1/3的或者胚芽未染色的則為無生活力種子,見圖1。

圖1 通過染色程度鑒別不同活力的玉米種子Fig.1 Seed viability determination of maize seeds by staining degree
1
.2
.5
胚部染色面積及胚部總面積計算利用Image J軟件將掃描圖像轉為8-bit灰度圖像(圖2),調整背景和胚部的顏色對比度,用閾值算法將閾值調整為1~255,框選出胚部,然后測得胚部面積。同理,繼續將其閾值調整,框選出染色部分,測得其面積。染色比例為種子縱切面的胚部染色面積占胚部總面積的比例。
1
.2
.6
數據分析及建模利用WPS Office 2019和IBM SPSS Statistics 20等軟件進行方差分析、相關性分析及模型建立。獲取胚部染色圖片后,導入PhenoSeed軟件,提取出顏色特征指標,將這些指標分別作為多層感知器神經網絡(MLP)、支持向量機(SVM)、隨機森林(RF)的輸入,以有生活力(1)和無生活力(0)作為輸出結果,建立基于TTC染色的玉米種子生活力鑒定模型,見圖3。建模時,訓練集與檢驗集的比例均為3∶1。

圖2 Image J計算玉米種子胚部四唑染色面積Fig.2 Calculating tetrazole staining area of maize seed embryo by Image J

MLP,多層感知器;SVM,支持向量機;RF,隨機森林;x1~4,特征1~4; h1~5,隱藏單元1~5; O1,結果1。 MLP, multilayer perceptron neuralnetworks; SVM, support vector machine; RF, random forest; x1~4, feature 1~4; h1~5, hidden unit 1~5; O1, output 1.圖3 數據分析與建模Fig.3 Data analysis and modeling
1
.2
.7
生活力鑒定模型的驗證2018年從不同公司收集的6份不同品種的玉米種子,每份種子各取300粒,重復1.2.2和1.2.3的步驟。依次將提取出的各個品種的顏色指標代入1.2.6所建的種子生活力鑒定模型,獲得該品種生活力的預測結果,并與1.2.1中進行的標準發芽試驗獲得的該品種實際發芽率進行比對,從而驗證基于胚部TTC染色提取的顏色指標建立的生活力預測模型在實際玉米種子生活力檢測中應用的可能性。
R
、R-std、G
、G-std、B
、B-std、L
、L-std、b
、b-std、H
、S-std、V
、V-std、Gray、Gray-std與種子生活力呈極顯著負相關,其中B
相關系數最低,為-0.6左右。a
、b
、S
特征指標與生活力呈極顯著正相關,其中S
的相關系數最高,為0.6。因此,可以利用染色胚部顏色特征預測玉米種子生活力,實現基于TTC染色圖像的玉米種子生活力標準化測定。表1 PhenoSeed軟件提取種子染色胚部的顏色特征的相關性分析
Table 1 Correlation analysis of color features of dyed embryo extracted by Phenoseed software
顏色特征Color feature值Value相關系數Correlation coefficient變異系數/%Coefficient of variationR198.99±5.53-0.29**2.78R-std20.63±3.12-0.31**15.12G119.33±16.99-0.59**14.24G-std34.26±6.60-0.44**19.26B100.19±16.23-0.62**16.20B-std35.85±6.72-0.49**18.74L58.79±4.67-0.57**7.94L-std9.96±2.06-0.51**20.68a29.83±5.700.61**19.11a-std11.82±1.84-0.0815.57b25.02±3.450.57**13.79b-std8.64±1.10-0.18**12.73H10.03±2.84-0.33**28.32H-std22.02±8.03-0.0236.47S128.12±18.010.62**14.06S-std40.75±6.20-0.25**15.21V199.01±5.53-0.30**2.78V-std20.58±3.10-0.31**15.06Gray140.97±12.94-0.58**9.18Gray-std28.01±5.52-0.48**19.71
注:,紅色值;R-std,紅色值的標準差;,綠色值;G-std,綠色值的標準差;,藍色值;B-std,藍色值的標準差;,亮度;L-std,亮度的標準差;,紅色到綠色的范圍;a-std,紅色到綠色的范圍的標準差;,藍色到黃色的范圍;b-std,藍色到黃色的范圍的標準差;,色調;H-std,色調的標準差;,飽和度;S-std,飽和度的標準差;,明度;V-std,明度的標準差;Gray,灰度;Gray-std,灰度的標準差;**表示在0.01水平上差異極顯著。
Note: , red; R-std, standard deviation of red value; , green; G-std, standard deviation of green value; , blue; B-std, standard deviation of blue value; , luminosity; L-std, standard deviation of luminosity value;, red to green range; a-std, standard deviation of red to green range; , blue to yellow range; b-std, standard deviation of blue to yellow range; , hue; H-std, standard deviation of hue; , saturation; S-std, standard deviation of saturation; , value; V-std, standard deviation of value; Gray, gray; Gray-std, standard deviation of gray; ** indicates significance at <0.01.
基于Phenoseed軟件提取出來的單粒玉米種子TTC染色后胚部顏色特征數據,分別采用標準正態轉換(SNV)、多元散射校正(MSC)、一階導數(1-Der)、二階導數(2-Der)進行數據預處理,然后按照訓練集∶檢驗集=3∶1,分別建立MLP神經網絡(隱藏層數為2)、RF(n-estimators=500)和SVM(c=445.72,g=0.014,RBF核函數)3種模型,見圖4。基于胚部顏色特征的種子生活力檢測模型中MLP神經網絡模型優于SVM和RF模型,其中2-Der-MLP 神經網絡模型最好,其檢驗集的準確率為87.80%。故可以利用基于TTC染色切面胚部顏色指標的MLP神經網絡模型對種子生活力進行判斷。

RAW,原始數據;SNV,標準正態轉換;MSC,多元散射校正;1-Der,一階導數;2-Der,二階導數;數字表示模型準確率。 RAW, raw; SNV, standard normal variation; MSC, multiplicative scatter correction; 1-Der, 1-derivative; 2-Der, 2-derivative; Numbers denote the accuracy of digital representation model.圖4 基于不同預處理建立的單粒玉米 種子生活力模型準確率Fig.4 Accuracy of single maize seed viability model based on different pretreatment
在實際染色面積計算中,需要確定染色比例與顏色閾值,兩者設定不同閾值都會影響最終結果的準確率。根據專業判斷種子生活力的情況和胚部顏色閾值,確定判斷種子生活力的染色比例。由表2可知,對玉米種子TTC染色圖像進行顏色轉換和二值化處理,按照閾值150計算出胚部染色面積和胚部總面積,得到染色面積占胚部總面積的比例。結合傳統TTC法測定種子生活力的判斷依據,以胚部染色比例>2/3的種子為有生活力種子,胚部染色比例≤2/3的種子為無生活力種子,與人工鑒定結果對比,準確率可達85.4%。與2.2所建模型的準確率基本相同,但直接使用顏色特征建立模型可以省去閾值篩選的過程,數據處理和分析過程更為簡便易行。
表2 基于不同分類依據的玉米種子生活力預測準確率
Table 2 Accuracy of prediction for maize seed vitality based on different classification methods
活種子分類項目Classification project of live seeds顏色閾值Threshold valueof colour染色比例Stainingratio準確率/%Accuracy<140>0.5382.5<150>0.6685.4<160>0.7584.5<170>0.8385.4<180>0.9086.4
P
<0.05)。故使用基于MLP神經網絡和染色胚部獲得的顏色指標建立的生活力檢測模型或者基于胚部染色比例的單粒玉米種子生活力快速檢測方法均可對種子批的發芽率進行預測。但從操作的角度考慮,使用基于TTC染色后胚部顏色指標建立生活力檢測模型的方法更為簡單,因為無需選擇顏色閾值或計算染色比例。該方法更能滿足實際應用中對種子質量快速檢測的需求。
V1~6,樣品1~6。V1~6, sample 1~6.圖5 預測的發芽率與真實發芽率的關系Fig.5 The relationship between the germination rate predicted and the real germination percentage
R
、R-std、G
、G-std、B
、B-std、L
、L-std、b
、b-std、H
、S-std、V
、V-std、Gray
、Gray-std與種子生活力均呈極顯著負相關,其中B
與種子生活力相關系數最低,為-0.6左右。種子生活力與a
、b
、S
特征均呈極顯著正相關,其中與S
的相關系數最高,為0.6。R
與生活力負相關,相關系數僅為-0.29,這種平時根據紅色程度進行判定的結果不符,原因有待于進一步探究。基于TTC染色法的胚部切面顏色指標建立的MLP神經網絡模型,對玉米種子生活力的預測準確率可達85%以上。趙新子等提出采用圖像處理技術自動提取胚部染色比例的方法來進行生活力的判定,結合本研究選取的材料,調整閾值為150,生活力預測準確率達85.4%。基于染色胚部顏色指標建模和基于胚部染色比例2種方法均可以有效檢測種子生活力,減輕對操作人員經驗和主觀的依賴。但基于胚部染色比例的方法需要人為預先篩選判定和調整染色比例的閾值,不如直接使用顏色指標建立模型的方法簡便。
進一步利用6個不同品種的玉米種子對上述2種方法進行驗證。基于染色胚部的顏色指標建立的MLP神經網絡模型對6個玉米品種的發芽率進行預測,結果表明與實際發芽率無顯著差異,說明使用機器視覺技術獲取TTC染色后種子胚部的顏色指標結合MLP神經網絡模型對不同品種玉米種子的生活力預測是可行的。但在實際應用的過程中,模型的準確率有待進一步的提高,未來可結合不同TTC染液濃度、染色時間、反應溫度進行更為全面的探究,以期進一步提高生活力預測的準確率。因此,在實際生產上,將基于TTC染色后胚部顏色指標的玉米種子生活力檢測方法應用于種子生活力的檢測仍需更深入的優化。
R
、G
、B
、H
、S
、V
、L
、a
、b
、Gray及標準差),結合人工觀察鑒定,結果表明,基于‘三北6號’玉米種子TTC染色后胚部的顏色特征建立的MLP生活力檢測模型,準確率均達到85.0% 以上。該方法在簡便性方面具有很大優勢,同時可最大程度地避免人為鑒定的誤差。