郭昊楠 趙 平*
(天津農學院,天津300800)
1.1 研究背景與現狀。在目前的技術發展中,國內外的人工智能以及自動識別技術已經發展的非常迅速,依賴于移動APP平臺所實現的識別程序也越來越多,圖像處理技術也越來越得到人們的重視,尤其是在農業領域,對于菌類的識別更是如此。因此,如同人臉識別技術的發展一樣,對于識別菌類來說,做到可以準確識別并區分不同菌類是目前為止具有挑戰性的實踐。
在對圖像識別上的研究中,中國農業大學于新文教授取得了較為顯著的進步,他主要采用了相似距離分類法以及二差分類法,再加上他所使用的判別模型分類法,他將這三類方法相結合,在對相關數字圖像的識別進行研究的同時,也對所識別的圖像有了非常高的精確度[1]。
1.2 研究過程。所謂圖像識別技術,就是以圖像本質為基礎,利用計算機對圖像進行處理分析和整合理解。首先對圖像進行預處理,利用不同的處理方法(灰度化處理以及平滑處理)處理菌類圖像;其次根據圖像的質量以及針對性的去噪,以達到對基于閾值的圖像分割的目的[1];最后利用分類和提取出圖像的重要特征,采用其圖像具有的代表性特征來識別它本身所具有的作為匹配的指標項,然后將各個指標值進行對比,通過Sift 算法進行特征匹配,確定指定范圍內的識別種類。
2.1 圖像的灰度化處理。對圖像的顏色進去處理后,圖像丟失顏色,保留下了其它方面信息的過程就是圖像灰度化處理。灰度化處理后的圖像中,去除了其本身所具有的一些顏色信息,因此便能減少在圖像處理過程中所包含的計算量,從而大大的提高圖像的處理效率。[2]
2.2 圖像的平滑處理。從信號處理的角度看圖像的平滑處理就是去除其中的高頻信息,保留低頻信息,它是一種能夠極大改善圖像質量的一種圖像預處理的方法,在圖像經過平滑處理后,其會增強本身圖像中的主要特征,進而最后減弱圖像噪聲和失真對圖像的影響,最終使圖像亮度平緩[3]。
2.3 基于閾值的圖像分割。將圖像劃分成特定的和獨特的各個區域,提取出識別系統所需要的目標和過程就是圖像分割,它是圖像分析中的關鍵步驟之一。對于菌類識別的圖像分割方法,選擇基于閾值分割圖像的方法更為合適,原因在于其更能處理較小的圖像,處理速度簡單快捷。
經過分割處理后的圖像,不僅能夠減少除本目標之外的圖像干擾,還突出了所抽取的特征目標區域,提高了識別系統對圖像的處理效率。圖像分割的地位不能忽視,它會直接作用在圖像的后續處理和分析識別上,所以圖像分割在圖像識別過程中起著至關重要的作用[3]。
基于閾值的圖像分割法最重要的一點是閾值的選擇,它需要根據具體問題來確定[2]。對于給定的圖像,可以通過分析直方圖的方法確定最佳的閾值,當直方圖明顯呈現雙峰情況時,可以選擇兩個峰值的中點作為最佳閾值。也可以把圖像分成n*n塊子圖,取每一塊子圖的灰度均值,即為均值閾值法,其中子圖越多分割效果越好,但效率可能會變慢[3]。
3.1 特征抽取與選擇。在進行菌類特征匹配之前,首先需要對不同菌類的各種特征項進行抽取篩選,選擇出便于后續匹配的特征,在模式識別過程中,特征抽取是圖像識別的重要步驟之一,從大量的菌類原始數據中找出最能代表其種類的少量特征,以便于進行分類和識別[4]。
降維是特征抽取的本質,同時還不能丟失模式的分類信息,在研究過程中采取了主成分分析(PCA)的方法,對菌類種類所具有的特征進行分組降維,選擇出符合代表性的特征,利用SPSS 工具分別對不同種類的菌類進行了主成分分析的步驟,最終抽取出每個菌類對應的其代表性特征,總括如下:菌類的形狀,菌類的大小,菌類的紋理等幾種主成分分析中輸出結果貢獻率高于90%的特征點組,因此在進行匹配特征時,就采用這幾種特征值來進行Sift 算法操作。
3.2 Sift 匹配算法。Sift 算法又稱尺度不變特征轉換,它是一種電腦視覺的算法,用來偵測與描述圖像中的局部性特征,并在空間尺度中尋找到對應的極值點,然后對其提取出位置、尺度、旋轉不變量等。選擇Sift 算法的原因在于:
該算法具有較好的穩定性和不變性,能在一定程度上不受視角變化、仿射變換以及圖像噪聲的干擾;區分性好,多量性,能產生大量特征向量;高速性,能夠對特征向量快速進行匹配;可擴展性,能夠聯合其它形式的特征向量[5]。
Sift 算法步驟分為:提取關鍵點、定位關鍵點、確定特征方向、通過各關鍵點的特征向量,進行兩兩比較找出相互匹配的若干對特征點,建立之間的對應關系[6]。算法實質如圖所示。
其中對特征點的檢測以及描述過程就是Sift 算法所計算的過程,在對菌類的特征組進行檢測之后,計算機中進行描述把其中的特征點集與數據庫中所存儲的原圖像中的特征點集進行對比匹配,在相應的關鍵點的對比下,分離出相像的特征點,由此得出對應的特征向量,最終在原圖像與目標圖像匹配的高度相似的特征點進行收集矯正,但是由于Sift 算法的速度較慢、數據復雜、耗時長,以及對邊緣光滑的目標無法準確提取特征點的弊端,導致最后只能初步實現對不同菌類的粗略識別[6]。

在以上的研究過程中,重點的研究了圖像預處理過程以及匹配特征兩大方面,采用了灰度化處理、平滑處理、閾值分割等比較常見而且實用的預處理方法,在對菌類識別的過程中不斷更新著這些預處理方法。
對匹配特征值Sift 算法進行深層次分析,利用Sift 算法的優勢對菌類目標圖像的特征點與原圖像的特征點進行比較,并通過不斷改進這種算法中的關鍵點對比來進行最終的菌類識別。
圖像處理是當今應用領域非常廣泛的一門技術,對圖像的各種處理及識別需要更多的知識與時間來研究學習,才能掌握基于圖像處理技術的菌類識別方法,在對識別過程中的圖像預處理、圖像分割、圖像增強、匹配特征,以及最后實現成功識別不同菌類的功能,仍然需要改進,將識別的過程以及結果更加準確化,才能更好的對所需要識別的圖像進行分析研究。