應(yīng)希源
(曲靖職業(yè)技術(shù)學院公共課教學部,云南 曲靖 655000)
砂糖橘是生活中常見的水果,果實大小及質(zhì)量是植物基因表達、生長狀況等屬性的表征,同時也是果實外在品質(zhì)的表現(xiàn)。植物的生長狀況及生長環(huán)境是影響植物果實發(fā)育、成長、成熟的重要因素,因此,通過圖像技術(shù)對砂糖橘體積及質(zhì)量進行預(yù)測,可以為植物生長狀況分析、栽培管理優(yōu)化等提供一定的參考,植物果實體積、質(zhì)量的快速測量對研究植物特性和優(yōu)質(zhì)豐產(chǎn)培育具有重要意義[1-6]。
機器視覺無損檢測分級是實現(xiàn)自動化分級的重要發(fā)展方向,而形狀和重量是劃分砂糖橘級別的重要指標,因此,對砂糖橘體積、質(zhì)量進行線性回歸分析,為自動化分級研究提供參考模型,具有一定的實際意義。
彭麗君[7]在球坐標的基礎(chǔ)上對植物果實砂糖橘三維點云開展研究,對果實進行長寬高、體積精細測量,與測量值比較的平均誤差分別為3 mm、2.3 mL。史燕山等[8]以蘋果的縱徑、橫徑、周長、縱徑橫徑乘積分別與果實體積和果實重量進行了線性回歸及一元非線性回歸分析。張青等[9]通過多元線性回歸分析建立了草莓重量分級模型,提出了一種基于機器視覺技術(shù)的草莓重量與形狀分級方法。本文在此基礎(chǔ)上,以市場上售賣的砂糖橘果實為材料,對縱徑、橫徑、周長、橫向投影面積分別與果實的體積和質(zhì)量進行一元、多元線性回歸分析,為植物生長狀況分析及果實自動分級提供參考。
采用圖像法獲取砂糖橘的縱徑、橫徑、周長、橫向投影面積數(shù)據(jù),采用量筒、機械天平分別測得砂糖橘的體積及質(zhì)量數(shù)據(jù),再分別進行一元、多元線性回歸分析。測量質(zhì)量的天平型號為HC-TP11-2,最大稱量200 g,分度值0.2 g。
圖像法獲取砂糖橘數(shù)據(jù)步驟如下:1)在A4白紙上打印一個2.0 cm×2.0 cm的正方形作為參照物,將砂糖橘編號后放置在A4紙上,再用手機在垂直上空居中位置拍照;2)打開PotoshopCS6軟件,插入步驟1)所得圖片,用“標尺”工具沿著正方形的水平位置畫一條線段,點擊“拉直圖層”將圖片調(diào)正;3)讀取圖像分辨率(本例為72像素/英寸),依次點擊“圖像”“分析”“設(shè)置測量比例”“自定”,像素長度設(shè)為“72”,邏輯長度設(shè)為“2.54”,邏輯單位設(shè)為“厘米”;4)調(diào)出“標尺工具”測量正方形的寬和高,再根據(jù)實際長度2.0 cm計算縮放比例后再調(diào)整圖像大小,再測量參照物正方形的寬高,直至標尺測量長度為2.0 cm;5)用“快速選擇”工具建立砂糖橘待測選區(qū),依次點擊“圖像”“分析”“記錄測量”便可得到縱徑、橫徑、周長、橫向投影面積數(shù)據(jù),測量結(jié)束后再批量導(dǎo)出數(shù)據(jù)。
運用上述方法對某一品種的砂糖橘測量了30組數(shù)據(jù)作為實驗樣本。分別繪制砂糖橘體積概率分布圖及砂糖橘質(zhì)量概率分布圖,從圖1、圖2可以看出砂糖橘體積、質(zhì)量概率分布接近正態(tài)分布。從獲取數(shù)據(jù)的散點圖可以初步得出體積及質(zhì)量與橫徑、縱徑、橫向投影面積呈線性關(guān)系?;貧w分析采用學生常用的辦公軟件:Microsoft Excel 2010,體積、質(zhì)量分別用V(單位:cm3)、m(單位:g)表示,縱徑(單位:cm)、橫徑(單位:cm)、周長(單位:cm)、橫向投影面積(單位:cm2)分別用x1、x2、x3、x4表示。

圖1 砂糖橘體積概率分布圖

圖2 砂糖橘質(zhì)量概率分布圖
分別對砂糖橘體積V與x1、V與x2、V與x3、V與x4進行一元線性回歸,置信度取95%,擬合結(jié)果如表1所示,從表1可以看出,砂糖橘體積與橫向投影面積x4的擬合效果最好,具有顯著的線性相關(guān)關(guān)系。根據(jù)參數(shù)F、Significanc F大小得出擬合模型通過F檢驗。擬合表達式V=-7.21+2.41x4為較優(yōu)的一元線性擬合模型,在所選的變量中,砂糖橘體積受橫向投影面積影響最大。

表1 砂糖橘體積一元線性擬合結(jié)果
砂糖橘質(zhì)量的一元線性回歸步驟與體積的一元線性回歸步驟一致,經(jīng)擬合檢驗后得到通過F檢驗的模型為m=-54.31+5.32x3,砂糖橘質(zhì)量受周長影響最大。
利用Microsoft Excel 2010的多元線性回歸工具,對砂糖橘體積與縱徑x1、橫徑x2、周長x3、橫向投影面積x4四個變量建立體積模型,置信度取95%,擬合結(jié)果如表2所示,由Significance F值<0.05可得模型通過F檢驗,但根據(jù)t檢驗的P-value值(簡稱“P值”)得出模型變量未通過t檢驗,因此將P值最大的變量x1刪除后再重復(fù)進行擬合、檢驗,經(jīng)4次擬合、檢驗后得到通過F檢驗及t檢驗的模型為V=-7.21+2.41x4。

表2 砂糖橘體積多元線性擬合結(jié)果
砂糖橘質(zhì)量的多元線性回歸步驟與體積的多元線性回歸步驟一致,經(jīng)四次擬合檢驗后得到通過F檢驗、t檢驗的模型為m=-54.31+5.32x3。
對砂糖橘體積、質(zhì)量進行多元線性回歸時,體積、質(zhì)量對全變量多元回歸得到的模型均通過F檢驗,說明回歸方程總體是線性相關(guān)的,但并不能說明回歸方程中所有自變量都對因變量有顯著影響[10],因此還要對回歸系數(shù)進行t檢驗。若自變量對應(yīng)的P值未大于0.05,則該自變量未通過t檢驗,此時采用后退法,將P值最大的變量刪除后再進行回歸檢驗,直至回歸模型同時通過F檢驗及t檢驗。在本例中,直至剩余自變量為1個時,回歸總體方程及系數(shù)才通過F檢驗及t檢驗,出現(xiàn)此種情況,主要因為剛開始選取的自變量中存在多重共線性。采用逐步刪除變量方法進行多元線性回歸后得到的較優(yōu)模型與一元線性回歸比較得到的較優(yōu)模型一致,較優(yōu)的體積模型為V=-7.21+2.41x4,較優(yōu)的質(zhì)量模型為m=-54.31+5.32x3,也即砂糖橘的體積與橫向投影面積顯著相關(guān),砂糖橘的質(zhì)量與投影面的周長顯著相關(guān)。
采用線性回歸分析得出的較優(yōu)體積、質(zhì)量模型對砂糖橘的體積及質(zhì)量進行預(yù)測。具體步驟為:1)選取該品種的10個砂糖橘,通過測量獲取體積、質(zhì)量、周長、橫向投影面積數(shù)據(jù);2)將砂糖橘的橫向投影面積代入體積模型、將周長代入質(zhì)量模型,計算出砂糖橘的體積及質(zhì)量;3)將計算值與測量值進行比較。模型預(yù)測結(jié)果如表3所示,線性回歸模型預(yù)測砂糖橘體積及質(zhì)量與測量值比較的平均相對誤差分別為4.94%、6.52%。

表3 較優(yōu)一元及多元線性回歸模型的預(yù)測結(jié)果
對某一品種砂糖橘的體積及質(zhì)量分別進行了一元及多元線性回歸,得出較優(yōu)體積模型為V=-7.21+2.41x4,較優(yōu)質(zhì)量模型為m=-54.31+5.32x3。并將模型計算值與測量值進行了比較,得出模型體積預(yù)測值、質(zhì)量預(yù)測值與測量值比較的平均相對誤差分別為4.94%、6.52%。對于其他品種砂糖橘的體積及質(zhì)量模型還需進一步驗證。