趙嘉瑋
(武警甘肅省總隊,甘肅 蘭州 730000)
我國是草莓生產和栽培面積最大的國家,針對草莓分類工作存在漏檢率高、精準度低和草莓品相、顏色、飽滿度容易忽略的問題,本研究在日本宮崎縣草莓上市標準的基礎上,結合草莓果實的周長、面積、形狀、顏色、成熟度特征,對草莓等級進行分類。
本研究對中國農業網草莓數據和實拍補充的500張草莓實體圖進行圖像預處理,并對預處理的圖像進行目標分割及特征提取,主要目的是提取形狀特征、顏色特征、成熟度特征。具體步驟分為3個部分。
首先,研究人員在Matlab中利用最小二乘法劃分目標區域,調用bwperim函數計算周長,利用像素點和計算有效面積,將圖像轉換為HSV坐標化圖像后,調用HSV模型對顏色成熟度和飽和度進行刻畫,利用傅里葉描繪子得到草莓形狀(飽滿度),對提取到的各特征進行加權,最終將草莓劃分為特等品、一等品、二等品、不合格4個等級。
其次,研究人員利用SVM算法對提取到的草莓特征值進行逐類目標特征訓練,對目標識別出的各類特征進行分類打分,經過加權算法最終劃分目標等級。
最后,研究人員對成果進行測試。研究人員采集新的草莓圖像,利用傳統的人工分類方式,對草莓進行分類,將采集圖像輸入程序與人工分類進行對比,驗證分類的準確性、魯棒性。
圖像預處理包括圖像二值化、圖像HSV坐標化圖像、圖像剪裁、目標分割與剪裁[1]。
研究人員在Matlab中調用rgb2hsv函數,將 RGB 的顏色轉換為HSV坐標,即RGB的值轉化為對應的明度、色調、飽和度坐標;利用mat2gray函數實現圖像歸一化,即所有在矩陣中的值為1或0;最后研究人員利用im2bw函數設置閾值(本研究閾值設置為0.6),將圖像轉變成二進制圖像。
本方法利用im2bw函數將圖像轉化為二進制圖像,通過imclose進行形態閉合,對相似像素點進行取舍,確定目標;然后利用imfill函數填充剛剛圈定的目標孔,使已確定像素目標中包含背景,呈多孔目標圖像,利用此函數對其進行填充,使其成為一個完整閉合的圖像;最后再次調用imcrop函數進行剪裁。
本方法獲取周長和面積的方式是在Matlab中,通過bwperim函數計算周長,通過像素點之和計算面積。圖像的預處理會使面積的計算更精確,尤其適用于不規則圖形面積的計算。
研究人員利用傅里葉描繪子對草莓形狀進行定義[2]。封閉的草莓輪廓Ω={(xi,yi),i=1,2,…,m}初始位置相同,研究人員可將其視為一個周期,利用傅里葉級數正弦波的形式展開研究。草莓輪廓Ω在復平面上的參數方程為:c(t)=x(t)+jy(t),t∈(0,2π]。曲線c(t)在(x,y)方向上的傅里葉:
(1)
曲線c(t)的傅里葉描述子為:
(2)
曲線受高頻噪聲影響,所以采用N個低頻橢圓傅里葉描述子描述草莓果形,即草莓形特征向量:FD=[FD1,FD2,…,FDN][3]。
HSV是一種直觀特性顏色模型,也叫六角椎體模型,是色調、飽和度、明度的綜合模型,用來反映所要表達事物的顏色、飽和度、成熟度的數據特征與特性[4]。
研究人員通過實驗,首先對涉及變量進行加權:將變量h劃分權重9,變量s劃分權重3,變量v劃分權重1;其次進行12級量化;最后將0~2級記作Ⅰ(不合格),3~5級記作Ⅱ(二等品類),6~8級記作Ⅲ(一等品類),9~11級記作Ⅳ(特等品類)。
SVM算法又被稱為支持向量機,是一種二分類的模型,修改后可用于多類別問題的研究與分類。該算法主要解決線性與非線性兩大類問題,為找到空間內能夠將所有分類劃分的超平面,使得所有本集合中的元素到這個超平面的距離最短,利用該算法對提取的特征值進行訓練,以達到對其他草莓進行分類的效果。SVM算法本質上是特征的訓練和分類,屬于機器學習。
研究人員將收集到的數據進行置亂,隨后設置訓練比,1.0為全訓,本文設置為0.8,數據集中共有500張照片,400張用來訓練,100張用來測試。
實驗運用SVM算法建立模型,首先確定核函數和懲罰參數,本文選用了網格搜索和交叉驗證的方法,用網格搜索確定待定參數(г,C)的組合;再對組合進行交叉驗證來再次確認[5];最后取交叉驗證正確率最高的參數作為模型參數訓練整個SVM算法。測試結果如圖1和表1所示。
圖1 測試結果
表1 測試過程
由表1可知,特等品、一等品、二等品、不合格這4種草莓分級正確率分別為90%,78.57%,92.72%和76.19%,綜合正確率為84.37%,表明使用SVM進行形狀分級是可行的。機器視覺和圖像處理運行時間為58 m,表明該篩選方法具備實時性。
本研究在SVM算法的基礎上,從周長、面積、形狀、顏色、成熟度5個方面分別對草莓進行相應的評級處理,根據加權比重,制定4個等級的草莓分級,利用邏輯運算關系串聯4個工作流程,建立一套草莓自動分級系統。該分級系統分級速度快(平均處理時間50 ms),參考因素全面,提高了人工分類的效率。利用該系統對100個草莓進行分級測試試驗,分級準確率達到84.37%(分類錯誤的草莓只出現在相鄰等級,沒有越級樣本),共耗時58 ms,可以滿足草莓實時分級的需要。