彭彥昆 趙 芳 白 京 鄭曉春 王文秀 孫 群
(1.中國農業大學工學院, 北京 100083; 2.中國農業大學農學院, 北京 100094)
番茄種植的精準定量播種,對其種子的質量要求較高[1]。以往評價種子的指標主要有發芽率、凈度、純度與質量等。近年來,種子活力得到了農業生產工作者的重視,種子活力是種子發芽率、出苗率、幼苗生長的潛勢、植株抗逆能力和生產潛力的總和,是全面衡量種子質量狀況的一個指標[2]。目前檢測種子活力的方法主要有發芽試驗、生物化學法、組織化學法、軟X射線法以及熒光分析法[3]。很多研究表明[4-6],發芽指數和活力指數等幼苗生長指標比較可信,尤其是活力指數,能夠反映發芽速率、發芽總數、植物幼苗的生長勢,可以在多方面研究上應用。但這些方法所需測定時間較長,且都需要破壞種子結構品質,不能滿足農業生產對種子活力檢測快速、準確、無損的要求。
近年來,應用圖像處理技術對種子品質進行分級受到了很多研究者的關注,但主要集中在利用圖像中的物理特征值直接對種子外部品質進行評定分級[7-11]。陳兵旗等[8]利用稻種圖像的面積和寬長比作為特征參數,將等價矩形長、寬的最小差值作為標準,識別發霉和破損種子,正確率為76.8%~100%。彭江南等[9]利用圖像中棉籽的R(red)、G(green)、B(blue)、H(hue)、S(saturation)、B(brightness)和灰度以及物理指標對種子進行快速分選,棉籽發芽率可以由89%提高至95%。利用近紅外光譜技術對種子內部品質檢測的研究也逐漸增多[12-13]。耿立格等[13]采集不同年限的大豆種子的近紅外光譜信息,建立了其生活力的無損測定模型,校正集的判定系數為0.937,驗證集判定系數為0.902。光譜成像技術能同時獲取研究對象的空間信息和光譜信息,開始逐步應用于種子的品種分類及品質分析[14-15],許思等[15]利用高光譜圖像技術對不同老化程度的水稻種子進行判別分析,采用連續投影算法挑選的特征波長建立的定性分析模型,其預測集的判別正確率能達到98.75%。
上述研究為利用圖像處理技術和光譜檢測技術檢測種子質量提供了理論基礎和方法依據,但研究對象主要集中在大豆、水稻等大顆粒種子的活力研究上。目前對番茄種子活力檢測及分級的研究鮮有報道。本研究意在獲取番茄種子的圖像信息和光學信息,綜合分析番茄種子不同波長下的圖像,確定與種子活力相關的最佳波長并提取番茄種子圖像及其特征值,解析其特征值與種子活力的關系,求取與種子活力相關的種子圖像特征值的最佳閾值,進一步對種子進行分級驗證。
本試驗共隨機選用170粒番茄種子,每粒種子單獨為一份樣本,品種為“奇奇”櫻桃番茄,購自北京市博收種子有限公司。將樣本按照一定比例隨機劃分為校正集和驗證集,校正集為128粒樣本,驗證集為42粒樣本。所選種子粒型有扁橢圓形、圓形、橢圓形等。將樣品放置在(24±2)℃恒溫環境下,并保持環境濕度恒定,用于后續圖像采集以及種子活力的測定。
本研究使用實驗室自主研發的高光譜試驗系統[16]采集樣本的高光譜反射圖像。系統主要由高性能背照明CCD相機、行掃描光譜攝制儀、鹵鎢燈直流線光源(Oriel instruments)、圖像采集卡和控制計算機組成。相機分辨率為1 376像素×1 040像素,光譜儀的光譜范圍是400~1 100 nm。為排除外界光的干擾,試驗時將系統放置在體積為450 mm×600 mm×750 mm鋁合金支架組成的暗箱中。
將所有樣本標號并均勻平鋪在黑色背景板上,利用高光譜圖像采集系統獲取番茄種子的高光譜圖像,該圖像包含了種子表面的圖像信息和光譜反射信息[17]。由于不確定樣本種子的活力,故按照標準發芽試驗對采集過高光譜圖像之后的種子進行發芽試驗,測定種子活力。根據最終試驗觀察結果,將可以發芽的種子歸為合格種子,將不能發芽的種子歸為不合格種子。
本研究是基于圖像處理技術提取種子區域的大小、形狀、顏色特征值,與標準方法得到的樣本活力分級相結合,利用校正集尋求相關閾值,然后利用驗證集對該閾值進行校對判斷分級。具體試驗方法思路如圖1所示。

圖1 分級方法的建立過程Fig.1 Establishment process of classification method
1.3.1特征波長圖像選取
為了提取與種子活力相關的圖像信息,需在獲取的大量光譜信息中提取特征波長。光譜信息之間存在大量的冗余和共線性信息特征,對光譜有效信息的提取產生了較大的干擾,且大量光譜數據造成模型復雜、計算量大的問題[18]。連續投影算法(Successive projections algorithm, SPA)是一種特征變量前向選擇算法,在光譜特征波長中取得了廣泛的應用[19]。本文采用SPA提取特征波長,從光譜變量矩陣中找出冗余信息最少的變量,從而提取該特征波長下的圖像信息。
1.3.2圖像預處理及種子輪廓提取
利用ENVI軟件提取上述特征波長下的圖像信息圖。為了提取番茄種子的圖像特征值,本文首先對原始圖像進行雙邊濾波,二值化和形態學變換等預處理。雙邊濾波法作為一種非線性的濾波方式,可以達到保留邊緣信息去除噪聲的目的[20-21]。本文采用大津法對平滑后的圖像進行二值化處理。大津法能根據圖像灰度分布情況,自動計算出分割閾值,提高算法的適應性[22]。由于采集到的圖像中均有多個種子,且種子的灰度各不相同,故為保證每個種子圖像經過二值化處理后得到較為準確結果,采用掩膜方法,定位種子位置,并通過計算得到窗口大小后通過窗口移動的方式,單獨對種子進行大津法處理圖像。形態學變換通過對圖像進行腐蝕、膨脹處理,可以有效去除細小雜質輪廓,提取到種子圖像輪廓[23]。本文利用輪廓算法[24]對經過預處理后的圖像中每粒種子的大小、形狀特征值進行提取。
1.3.3特征參數計算
對采集到的圖像進行特征提取,主要提取種子的面積、圓形度、灰度,提取之前,需要對每幅圖像中每粒種子進行區域標記,將各個種子區分開來,從而提取各個連接成分的特征參數[25]。提取面積特征值時,統計標記輪廓內像素點的個數作為每粒種子面積特征值。番茄種子區域的圓形度刻畫的是其與圓形的偏離程度,通過面積和周長確定,其中種子周長為提取的種子輪廓長度。計算公式為
C=4πA/p2
(1)
式中C——種子圓形度
A——種子區域面積,像素
p——種子區域周長,像素
提取灰度平均值時,為去除邊緣灰度不準確的影響,選擇每粒種子特征區域為種子內部最大內切圓的區域,提取其灰度平均值。
1.3.4閾值的確定
以種子發芽試驗的活力分級結果為基礎,具體尋求閾值步驟如下:
(1)按照發芽試驗種子將合格種子與不合格種子各個特征值區分開,并分別求取平均值。
(2)單獨取閾值,對灰度來說,選取不合格種子灰度平均值為閾值,計算校正集判別正確率,依次提高或減小閾值,依據統計學規律,得到閾值在某一個值情況下,合格種子與不合格種子判別正確率均最高。面積閾值依此求取。
(3)番茄種子圓形度基本都接近于1,不合格種子與合格種子未有明顯特征,故選擇圓形度最小值作為閾值,以期去除其他雜質影響。
(4)將3個特征參數結合,驗證集中種子圓形度小于閾值的為不合格種子,其他2個特征值均需小于其閾值才被判斷為不合格種子。
綜合閾值分級算法如圖2所示。

圖2 綜合閾值分級算法Fig.2 Classification algorithm of integrated thresholds
根據種子本身發芽結果特性,得到樣本中有無活力種子的分布結果。其中校正集128粒種子中有97粒為有活力種子,所占比例為75.78%;而驗證集42粒種子中有31粒為有活力種子,所占比例為73.81%。由此得出兩類集合中不同級別的種子分布比較均勻。
圖3為番茄種子的反射光譜圖。由圖中光譜曲線可知,在采集光譜波段范圍內,種子的光譜曲線趨勢相同,但不同種子同一波長下反射強度不同,不能確定代表種子活力信息的波長,因此需要確定與種子活力相關的特征波長。

圖3 光譜反射強度曲線Fig.3 Reflectance intensity curves of spectra
本研究中將合格種子理化值賦值為2,不合格種子理化值賦值為1。由于波段較多,因此進行SPA計算時,以建模集樣本的光譜數據和類別賦值為輸入,將光譜數據分成幾個波段分別計算。變量數為運用SPA算法選擇的與預測結果相關性最大的特征波長選擇數量。圖4為其中某一個波段計算結果。圖4a為該波段下選擇的特征波長具體位置,即在該波段范圍內選擇的特征波長為4個,分別為577、595、654、684 nm。圖4b為變量個數與均方根誤差的關系,可以看到變量數在1~4范圍內,均方根誤差隨著變量數的增加其下降趨勢很大,表明種子反射光譜變量應該至少選擇4個以免產生過擬合問題;且第4個變量之后保持平緩,均方根誤差為0.164 1,故在這個波段選擇4個特征波長。SPA算法優先選擇了10個波長,分別為:535、577、595、654、684、713、744、768、809、840 nm。

圖4 555~700 nm下的波長選擇Fig.4 Wavelength selection under 555~700 nm
利用ENVI軟件提取特征波長下的圖像信息,如圖5所示為部分試驗種子分別在上述10個特征波長下的原始圖像。

圖5 各個特征波長下的原始圖像Fig.5 Original images under different characteristic wavelengths
由圖5可以看出不同特征波長下原始圖像并不相同,但不能確定最優波長下的圖像。采用1.3.2節所述的預處理方法對原始圖像進行去噪處理,其結果如圖6所示。圖6a為采集得到的712.58 nm特征波長下的60粒種子的原始圖像,為去除其中的噪聲,利用雙邊濾波法對圖像進行平滑預處理,其效果如圖6b所示。采用大津法對平滑后的圖像中的單粒種子進行二值化處理,其效果如圖6c所示。由圖6c可以看出,經過預處理后的圖像,可以較優質地保存圖像的邊緣信息,并且能夠去除其中一些噪聲,但是種子區域外一些其他雜質輪廓并未去除,種子區域內的孔洞也沒有填充。所以再采用形態學變換中的開運算對種子輪廓內部填充[26],去除孔洞,圖6d為形態學變換后種子區域提取效果圖。

圖6 圖像預處理結果Fig.6 Results of image processing
由提取輪廓圖像(圖6d)可以看出經過預處理后的圖像,若雜質面積像素數與種子面積像素數相近,則易被誤判做種子區域,造成種子輪廓提取不準確。且種子區域提取過程中若種子顏色過暗,面積過小,也會造成提取該種子輪廓不準確。在獲取的圖像中提取得到每個種子區域(圖6d)后,利用輪廓算法[24]準確、快速提取其輪廓線,如圖7所示。

圖7 種子區域輪廓圖像Fig.7 Contour plot of seed section
依據前面所述算法處理各個特征波長下圖像的過程中,各個圖像灰度不相同,運用大津法二值化處理圖像時,得到每粒種子的二值化圖像不盡相同。隨之進行的形態學變換處理不能彌補二值化圖像區別,故不同特征波長下圖像特征值提取也不相同。對校正集中128粒種子,按照標準發芽試驗得到的結果,對不同特征波長下的圖像,分別提取合格種子和不合格種子的各個特征值的平均值,其結果如表1所示。由表1可知,對各個波長下圖像提取種子特征值,2類種子的面積平均值和灰度平均值均有較大差別,在閾值分類時灰度平均值所占比例較大,而2類種子的圓形度平均值差別不大,故圓形度參數在閾值分類時所占比例較小。

表1 不同特征波長下的圖像特征值提取結果Tab.1 Results of image features extraction under different characteristic wavelengths
按照表1中2類種子的圖像特征值提取結果平均值,基于統計學規律,按照閾值尋求方法,遵循驗證集中2類種子判斷正確率最高的原則,分別確定各個特征值的閾值,其中圓形度閾值選擇時,因種子圓形度基本接近,故選擇樣本中種子圓形度最小值,以去除其他不規則雜質影響。以713 nm特征波長下選取最佳灰度閾值為例,其變化引起樣本校正集、驗證集識別正確率的規律如圖8所示,最終依據閾值選取方法選取的不同特征波長下各個特征值閾值結果如表2所示。

圖8 713 nm特征值下灰度的最佳閾值選擇Fig.8 Selection of accurate grey value thresholds in 713 nm wavelength

特征波長/nm面積閾值/像素圓形度閾值灰度閾值53544.500.9660.0057748.400.9661.0059546.500.9672.0065448.600.9687.0068449.600.9693.0071351.600.9692.0074453.600.9676.0076852.600.9672.0080951.500.9668.0084051.500.9667.00
利用本研究算法計算的3個特征值的閾值將種子進行綜合判別分類,分級完成后,不同活力種子的圖像主要區別為:合格種子圖像灰度平均值要高于不合格種子,亮度較高,且合格種子面積要大于不合格種子。將本研究算法計算的不同特征波長下圖像的分級結果與標準發芽試驗檢測番茄種子活力分級結果相比對,獲得檢測分級正確率如表3所示。其中,在特征波長713 nm下,校正集和驗證集檢測分級正確率綜合最高,分別為93.75%和90.48%。

表3 不同波長下閾值分級統計結果Tab.3 Classification results of threshold under different wavelengths
灰度是用黑色調表示顏色的濃烈程度,也可稱之為顏色的飽和度。種子中蛋白質、水分、酶等物質的含量與種子能否發芽具有較大關系,種子中該物質的含量影響特定波長下光的吸收,從而影響反射的灰度。采用高光譜技術檢測種子質量的研究中主要是利用了高光譜圖像中的光譜信息[14-15],而本研究主要利用了特征波長下圖像信息,確定各個特征波長下圖像特征值的閾值,在713 nm特征波長下,其分類正確率能夠達到90.48%,且有利于簡易、低成本的基于圖譜特征的種子活力分級設備的研發。本研究的對象為小顆粒的番茄種子,以上結果表明可以利用高光譜成像技術快速準確地鑒別番茄種子的活力,為小顆粒種子活力的無損快速識別提供一種方法。為了滿足實際生產需要,未來還需對在線狀態下的種子圖像的動態采集和活力判別進行分析研究與驗證。
利用高光譜技術對單粒番茄種子活力的檢測及分級進行了研究。采用SPA特征波長提取方法提取得到與種子活力相關的10個特征波長,并利用該波長下的圖像特征值對種子活力進行預判,有8個特征波長下判斷的正確率達到85%以上,表明用SPA的方法提取番茄種子活力特征波長是可行的。基于統計學選取特征波長圖像特征值的閾值,試驗結果表明,當713 nm特征波長下的圖像中番茄種子的面積平均值、圓形度平均值及灰度平均值的閾值分別選取為51.6像素、0.96和92時,活力分級結果最高,其校正集和驗證集的識別正確率分別為93.75%和90.48%,表明利用該波長下圖像的特征值可以有效地區分有活力種子與無活力種子。本研究結果為基于圖譜特征的番茄種子活力快速無損分級設備的開發奠定了理論基礎。
1 李會合.蔬菜品質的研究進展[J].北方園藝,2006(4):55-56.
LI Huihe. Research progress of tomato quality [J]. Northern Horticulture, 2006(4): 55-56. (in Chinese)
2 劉毓俠,王鐵固.種子活力研究進展[J].玉米科學,2012,20(4):90-94.
LIU Yuxia, WANG Tiegu. Research progress of seed vigor [J]. Journal of Maize Sciences, 2012, 20(4): 90-94. (in Chinese)
3 HAMPTON J G, TeKRONY D M. Handbook of vigour test methods[M]. Zurich. Switzerland:International Seed Testing Association, 1995: 70-80.
4 陳蕾太,孫愛清,楊敏,等.基于小麥種子發芽逆境抗逆指數的種子活力評價[J].應用生態學報,2016,27(9):2968-2974.
CHEN Leitai, SUN Aiqing, YANG Min, et al. Seed vigor evaluation based on adversity resistance index of wheat seed germination under stress conditions[J]. Chinese Journal of Applied Ecology, 2016, 27(9): 2968-2974. (in Chinese)
5 鄭文寅,姚大年,張文明.大豆種子活力評定指標的研究[J]. 種子,2007,26(12):70-73.
ZHENG Wenyin, YAO Danian, ZHANG Wenming. Study on seed vigor indexes of soybean [J]. Seed, 2007, 26(12): 70-73. (in Chinese)
6 智慧,陳洪斌,凌莉.加速老化法測定谷子種子活力的研究[J].中國農業科學,1999,32(3):68-73.
ZHI Hui, CHEN Hongbin, LING Li. Studies on accelerated aging seed vigor test for foxtail millet [J]. Scientia Agricultura Sinica, 1999,32(3): 68-73. (in Chinese)
7 ZHANG Wenchang, MEI Jiangping, DING Yabin. Design and development of a high speed sorting system based on machine vision guiding [J]. Physics Procedia, 2012, 335(3): 1955-1965.
8 陳兵旗,孫旭東,韓旭,等.基于機器視覺的水稻種子精選技術[J].農業機械學報,2010,41(7):168-173.
CHEN Bingqi, SUN Xudong, HAN Xu, et al. Rice seeds selection based on machine vision [J]. Transactions of the Chinese Society for Agricultural Machinery, 2010, 41(7): 168-173. (in Chinese)
9 彭江南,謝宗銘,楊麗明,等.基于Seed Identification軟件的棉籽機器視覺快速精選[J].農業工程學報,2013,29(23): 147-152.
PENG Jiangnan, XIE Zongming, YANG Liming, et al. Quickly selection for cotton seed based on Seed Identification software [J]. Transactions of the CSAE, 2013, 29(23): 147-152. (in Chinese)
10 DELL’ A A. Red-green-blue (RGB) color density as a non-destructive marker in sorting deteriorated lentil seeds [J]. Seed Science and Technology, 2006, 34(3): 609-619.
11 PEIRIS K H S, PUMOHREY M O, DONG Y H, et al. Near-infrared spectroscopic method for identification of fusarium head blight damage and prediction of deoxynivalenol in single wheat kernels [J]. Cereal Chemistry, 2010, 87(6): 511-517.
12 呂程序,姜訓鵬,張銀橋,等.基于變量選擇的小麥粗蛋白含量近紅外光譜檢測[J/OL].農業機械學報,2016,47(增刊):340-346. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=2016s052&journal_id=jcsam. DOI: 10.6041/j.issn.1000-1298.2016.S0.052.
Lü Chengxu, JIANG Xunpeng, ZHANG Yinqiao, et al. Variable selection based near infrared spectroscopic quantitative analysis on wheat crude protein content [J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(Supp.): 340-346. (in Chinese)
13 耿立格,宋春風,王麗娜,等.近紅外光譜無損測定大豆種子生活力方法研究[J].植物遺傳資源學報,2013,14(6):1208-1212.
GENG Lige, SONG Chunfeng, WANG Lina, et al. Non-destructive determination of soybean seed viability by near-Infrared spectroscopy [J]. Journal of Plant Genetic Resources, 2013, 14(6): 1208-1212. (in Chinese)
14 孫俊,路心資,張曉東,等.基于高光譜圖像的紅豆品種GA-PNN神經網絡鑒別[J/OL].農業機械學報,2016, 47(6):215-221.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20160628&flag=1.DOI:10.6041/j.issn.1000-1298.2016.06. 028.
SUN Jun, LU Xinzi, ZHANG Xiaodong, et al. Identification of red bean varity with prohahilistic GA-PNN based on hyperspectral imaging [J/OL].Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(6): 215-221. (in Chinese)
15 許思,趙光武,鄧飛,等.基于高光譜的水稻種子活力無損分級檢測[J].種子,2016,35(4):34-40.
XU Si, ZHAO Guangwu, DENG Fei, et al. Research on detection technology of rice seed vigour based on hyperspectral [J]. Seed, 2016, 35(4): 34-40. (in Chinese)
16 PENG Y K, WU J H. Hyperspectral scattering profiles for prediction of beef tenderness [C]. ASABE Annual International Meeting, 2008: 080004.
17 吳建虎,彭彥昆,高曉東,等.基于VIS/NIR高光譜散射特征預測牛肉的嫩度[J].食品安全質量檢測學報,2009, 1(1):20-26.
WU Jianhu, PENG Yankun, GAO Xiaodong, et al. Prediction of beef tenderness using VIS/NIR hyperspectral scattering characteristics [J]. Food Safety and Quality Detection Technology, 2009, 1(1): 20-26. (in Chinese)
18 劉天玲,蘇琪雅,孫群,等.基于NIR分析和模式識別技術的玉米種子識別系統[J].光譜學與光譜分析,2012, 32(6):33-36.
LIU Tianling, SU Qiya, SUN Qun, et al. Recognition of corn ceeds based on pattern recognition and near infrared spectroscopy technology [J]. Spectroscopy and Spectral Analysis, 2016, 32(6): 33-36. (in Chinese)
19 洪添勝,喬軍,趙祚喜, 等.基于高光譜圖像技術的雪花梨品質無損檢測[J].農業工程學報,2007,23(2):151-155.
HONG Tiansheng, QIAO Jun, ZHAO Zuoxi, et al. Non-destructive inspection of Chinese pear quality based on hyperspectral imaging technique [J]. Transactions of the CSAE, 2007, 23(2): 151-155. (in Chinese)
20 姜泳水,唐金輝,陳學佺.二值圖像中物體幾何主軸的提取方法[J].計算機工程,2005,31(18):56-58.
JIANG Yongshui, TANG Jinhui, CHEN Xuequan. Extracting method of geometrical principal axis for object from bi-tone image [J]. Computer Engineering, 2005, 31(18): 56-58. (in Chinese)
21 李俊峰.雙邊濾波算法的快速實現及其在圖像處理的應用[D].廣州:南方醫科大學,2013.
LI Junfeng. Fast implementation of bilateral filter with application in image processing [D]. Guangzhou: Southern Medical University, 2013. (in Chinese)
22 陳兵旗.機器視覺技術及應用實例詳解[M].北京: 化學工業出版社,2014:16-17.
23 王耀革,王玉海,朱長青,等.基于灰度形態學的高分辨率遙感影像預處理[J].測繪學院學報,2004, 21(2): 108-110.
WANG Yaoge, WANG Yuhai, ZHU Changqing, et al. The preprocessing of high-resolution remote sensing image on grey morphology [J]. Journal of Institute of Surveying and Mapping, 2004, 21(2): 108-110. (in Chinese)
24 BRADSKI G, KAEHLER A.學習OpenCV(中文版)[M]. 北京:清華大學出版社,2009:259-263.
25 陳兵旗,孫明.實用數字圖像處理與分析[M].北京:清華大學出版社,2008:197-198.
26 李青,彭彥昆.基于機器視覺的豬胴體背膘厚度在線檢測技術[J].農業工程學報,2015,31(18):256-261.
LI Qing, PENG Yankun. Pork backfat thickness on-line detection methods using machine vision [J]. Transactions of the CSAE, 2015, 31(18): 256-261. (in Chinese)