吳林峰 余懷鑫 祝志慧
(華中農業大學,湖北 武漢 430070)
雞蛋孵化過程大約需要21 d,對環境溫濕度條件要求較高,是個耗時、耗能的過程[1]。據統計[2],種蛋的成活率在85%~95%。目前市場上檢測種蛋最常見的方法主要是人工照蛋法,速度慢、效率低、準確性差,且受到工人主觀判斷的影響,并不能滿足當前自動化生產的需要。有許多學者利用機器視覺技術[3]、近紅外光譜[4]、高光譜圖像[5-6]實現了對雞種蛋內部特性的無損檢測,這些方法具有檢測速度快、精度高、所需時間短、勞動強度低等優點[7]。但光譜設備對于低成本的農業生產來說過于昂貴,對檢測環境也有較高的要求,限制了這些方法的推廣;機器視覺技術目前對種蛋孵化信息的無損檢測僅處于靜態單個蛋的模型檢測研究。
本試驗擬利用機器視覺技術,直接以工業蛋托為基礎,將整托蛋直接從孵化箱放進檢測裝置采集群體種蛋的圖像,從群蛋圖像中分割出單個蛋圖像,提取圖像信息,利用不同方法建立無損檢測模型,為高通量在線檢測提供有力的理論依據。
種蛋:京粉2號褐殼蛋,峪口禽業有限公司,共計164枚,其中受精蛋96枚,無精蛋68枚,孵化溫度37.8 ℃,濕度63.5%,翻蛋時間間隔2 h,每天對雞蛋進行稱重,從第3天開始采集整托種蛋圖像,蛋托為6枚×6枚規格,共計5托,第5托數量不足部分用其他托中的蛋補齊,防止漏光現象。
搭建如圖1所示機器視覺系統,由工業相機、鏡頭、光源、暗箱和計算機組成。相機選用DLC500型工業相機,鏡頭選用精工XW0612型,其焦距為6~12 mm,光圈為f1.6。光源選用35 W的鹵素燈置于種蛋下方,用橡膠環托住雞蛋減少漏光現象;暗箱用于隔絕環境光,減少外界干擾。工業相機通過USB接口與計算機連接,計算機保存圖像數據并進行處理。

1.光源 2.工業蛋托 3.種蛋 4.暗箱 5.攝像頭 6.USB線 7.計算機
圖1 圖像采集系統
Figure 1 Schematic diagram of image collection system
受精蛋和無精蛋的蛋重存在一定的差異,種蛋蛋重的大小對受精率和孵化率有顯著的影響[8]。使用XYSCALE的JAP型電子天平,精度為0.001 g,在每天固定時間測量蛋重信息,如圖2所示,在孵化0~8 d受精蛋與無精蛋的平均蛋重均緩慢下降,其中受精蛋共失重2.736 g,平均日失重率為0.55%;無精蛋共失重2.395 g,平均日失重率為0.53%。
將受精蛋和無精蛋每天的蛋重進行對照試驗T檢驗,所有P值<0.05,即證明在孵化0~8 d的受精蛋和無精蛋蛋重都符合正態分布,再進行獨立樣本T檢驗,所有P值<0.05,即認為2個總體之間的均值不相等,受精蛋平均蛋重大于無精蛋。雖然受精蛋與無精蛋的平均蛋重存在顯著差異,可以將蛋重用作特征參數,但是每個雞蛋的大小、蛋殼厚度都不一,無法單一用蛋重來區分受精和未受精的雞蛋,需加上其他的特征來區分。
1.4.1 群蛋圖像的分割 采集整托蛋的圖像上共有36枚雞蛋,首先需要對圖像進行分割。由于蛋殼厚度、孵化程度等因素,種蛋之間的亮度差異較大,局部閾值分割只能將少數亮度均勻的雞蛋分割出來。為了提高處理的速度和準確性,將所有種蛋看作圓形,通過建立坐標系確定每枚雞蛋中心的坐標,圖3(a)為第7天群蛋圖像,分別拾取左上、左下和右下3個雞蛋的中心,再通過蛋托的距離計算拿出每個雞蛋中心的坐標。雞蛋的半徑主要分布在區間[135,180]的像素長度上,為了防止拾取到非雞蛋像素,以125像素為半徑畫圓,如圖3(b)所示,保留圓形內部像素,再按照順序分割為單個種蛋圖像。
1.4.2 特征值提取 采集后的圖像包含一些干擾信息,運用平滑處理對圖像去噪[9],如圖4所示,通過平滑處理后直方圖的兩端更加突出,特征更加顯著。

圖2 孵化早期受精蛋與無精蛋蛋重變化Figure 2 The change of average weight in early days of hatching

圖3 分割得到的單個雞蛋圖像Figure 3 Single egg obtained by division
在此基礎上,再提取出圖像的RGB值,通過數學關系轉換為HIS值。分別挑選40個無精蛋和受精蛋統計各分量均值的散點圖,如圖5、6所示,第3天無精蛋與受精蛋的特征參數區分不明顯,到第7天多數無精蛋的G、B、I分量均值以及灰度均值都高于受精蛋,S分量均值低于受精蛋,無精蛋的R分量均值分布區間比受精蛋大。
種蛋數量按約為5∶3的比例分為訓練集和測試集,從164枚中隨機挑選104個作為訓練集,其中受精蛋61枚,無精蛋43枚,剩余的60個作為預測集,其中受精蛋35枚,無精蛋25枚,用Matlab對圖像中提取的R、G、B、H、S、I、灰度均值以及蛋重這8個特征參數分別建立多元線性回歸、SVM和BP神經網絡模型。

圖4 預處理對于圖像質量的影響Figure 4 Effects of image preprocessing

圖5 第3天蛋重特征參數Figure 5 Egg weight parameters on third day after hatching

圖6 第7天蛋重特征參數Figure 6 Egg weight parameters on seventh day after hatching
因變量y表示種蛋類別,設定受精蛋的y值為1,無精蛋為0,最后的擬合結果中將0.5及以上的值看做1,即受精蛋,小于0.5的值看做0,即無精蛋。RGB和HSI之間具有一定的數學關系,因此在建模前需去除其中的冗余信息。通過計算變量的方差膨脹因子(VIF)對變量的多重共線性進行檢測,當VIF<5時可以認為不存在共線性,當5≤VIF<10時認為存在中等程度的共線性;當VIF>10時,認為共線性嚴重。每次剔除一個最大VIF值的變量,直到所有剩余變量VIF值都<5,如表1所示。建立線性回歸模型,結果如表1、2所示,在孵化3~6 d時,蛋重是一個顯著性的影響因素,隨著孵化天數的增加,受精蛋圖像的顏色會逐漸變深,蛋重變量逐漸變得不顯著,故逐步判別時被剔除。從表2中可以看出,隨著孵化天數的延長,檢測精度逐漸提高。
SVM模型在高維數據、小樣本數據和非線性數據模式識別方面都有出色的表現[10],建立一個分類準確的支持向量機模型需要選擇合適的核函數[11]。常用核函數有線性核函數、多項式核函數、高斯徑向基核函數(RBF)和Sigmoid核函數,在其他參數相同的情況下進行比較,結果如表3所示,Sigmoid核函數的結果非常低,RBF核函數準確率略高,僅在第5天略低于Linear核函數建立的模型,且RBF核函數的收斂域相對較寬,不受訓練樣本數量的制約,因此選用RBF作為核函數。

表1 多元線性回歸模型Table 1 Model of linear regression

表2 多元線性回歸方程結果Table 2 Results of linear regression
運用SVM對種蛋進行分類,首先通過網格搜索尋找最優參數,結果如圖7所示,根據等高線圖和3D圖得出懲罰因子c和核參數g的值分別為0.25和0.062 5。
運用SVM模型對60個預測集進行分類,結果如表4所示,隨著孵化天數,準確率逐步提升,在5 d之后準確率達到了90%以上。
表3采用不同核函數時早期種蛋鑒別準確率的對比
Table 3 Results of egg identification in early hatching period with different kernel functions

核函數第3 d第4 d第5 d第6 d第7 d第8 dLinear80.080.093.391.796.796.7Polynomial80.081.791.793.396.796.7RBF81.783.391.795.096.796.7Sigmoid58.358.358.358.358.358.3

表4 SVM模型鑒別結果Table 4 Results of SVM model

綜上表2、4、5可知,對孵化3~8 d的褐殼種蛋運用多元線性回歸模型、SVM模型和BP神經網絡模型進行鑒別,種蛋鑒別的準確率隨著孵化時間的延長而逐漸升高,在第6天均能達到90%以上,都可以用來對群體褐殼種蛋的受精信息進行判別,其中SVM鑒別模型最穩定、準確率最高,在第3天和第7天的準確率分別達到81.7% 和96.7%。對比已有研究,利用機器視覺對整托白殼蛋的受精信息進行判別在第7天達到了97%[13],利用機器視覺對單枚褐殼蛋橫向放置采集圖像,在孵化第6天達到90%以上[14],目前,褐殼蛋受精信息的研究僅處于對單枚蛋,并無對整托褐殼蛋受精信息的研究,因此本研究提出的利用機器視覺技術和提取的特征參數來建模鑒別群體褐殼受精蛋和無精蛋是可行的,后續將進一步提高鑒別精度。

c=0.25,g=0.062 5,CVAccuracy=98.076 9%

表5 BP神經網絡鑒別結果Table 5 Results of BP neural network
本試驗對整托褐殼蛋受精信息進行檢測,通過對蛋重數據的分析表明了蛋重可以作為判別受精蛋和無精蛋的特征參數;利用機器視覺技術采集群體種蛋孵化信息,將群蛋圖像分割并從圖像中提取RGB值,用RGB、HIS、灰度均值和蛋重作為特征值建立了多元線性模型、SVM模型和BP神經網絡模型。對比了SVM3種核函數,其中RBF核函數的準確率較高。利用相同的測試集對3個模型進行驗證,綜合考慮,在檢測群體種蛋孵化情況時,SVM模型準確率較高,在第3天和第7天分別達到了81.7% 和96.7%,具有最好的穩定性和判別準確率,說明利用機器視覺技術對整托褐殼蛋進行孵化受精信息檢測是可行的。但在孵化前3 d檢測精度有待提高,可以嘗試尋找其他特征值和改進模型。