湯海林
摘要:圖像局部特征類型處理是對局部化特征信息的應用,通過采用分割圖像區域獲得關注圖像的局部區域特征,再利用特征描述方法描述圖像局部區域。該文分析了MSE和LMSE兩種測試圖像樣本分類算法,對算法的二分類模型及實現進行了詳細的闡述,并對兩種算法在指定AR數據集上的圖像進行分類精度測試,LMSE算法能夠通過減小噪聲對接收信號的干擾來降低因搜索噪聲點而產生的復雜度。通過實驗數據分析,基于LMSE算法在數據分類精度和處理效率上性能整體更優。
關鍵詞:LMSE;局部區域;算法;圖像特征
中圖分類號:TP 391.4 文獻標識碼:A 文章編號:1009-3044(2017)35-0211-02
Research on the Application of LMSE in Image Local Feature Extraction
TANG Hai-lin
(Faculty of Megadateand Computing,Guangdong Baiyun University, Guangzhou 510450, China)
Abstract: The processing of image local characteristic type is the application of local characteristic information. By using the segmentation image area, it can obtain the local area features of the image, then uses the feature description method to describe the local area of the image. This paper analyzes two kinds of image sample classification algorithm,the MSE and the LMSE. It describes the algorithm of binary classification model and implementation in detail, and uses this two algorithm to implement the classification accuracy test in the AR data set. The LMSE algorithm can reduce the complexity for the search point and noise by reducing noise which can interfere the received signal. Based on the analysis of experimental data, LMSE algorithm has better performance in data classification accuracy and processing efficiency.
Key words:Local Minimum Squared Error; Local Region; Algorithm;Image Feature
圖像匹配技術廣泛應用于計算機視覺領域中的立體視覺、目標識別和分類等方面[1]。在機器學習和圖像處理領域,對圖像處理的方法有全局學習算法和局部學習算法,全局學習算法利用全部訓練樣本建立學習模型,而局部學習算法[2]則是利用數據的局部結構來構造局部模型,再利用構造的模型對測試樣本進行分類。局部模型訓練的僅是與特殊的測試數據相關的訓練數據,并可獲得數據的局部結構。因此,局部學習算法一般優于全部訓練樣本來構造學習模型的全局算法,特別是對于不均勻分布的數據集來說,局部學習算法是一種很有效的學習方法。
1 最小均方誤差
最小均方誤差(Minimum Squared Error,MSE)是一種廣泛使用的以線性鑒別函數為基礎的分類方法。MSE是一種全局算法,它是在全部訓練集上構造的學習模型,面向分類的MSE的目的是找到唯一用于區分樣本的鑒別向量。當數據是均勻分布或線性可分時,MSE 算法的性能較好。
MSE模型設計基于二分類模型,通過設計兩個類別的訓練樣本,找到線性鑒別函數。具體設計如下:
給出n個訓練樣本: (1)
設計線性鑒別函數: (2)
具體設計過程:
(3)
其中是預先設定的每一類的號碼,即樣本的類標簽。利用公式(3)模型設計的最小均方誤差如下:
(4)
若屬于第一類時,則。若屬于第二類時,則。得到最小均方誤差式為:
(5)
其中:是奇異矩陣。
2 局部最小均方誤差
雖然MSE在數據是均勻分布或線性可分時具有較好的精度,但不能處理不均勻分布的數據集。而實際應用中的數據訓練樣本一般來自一個或多個數據分布,輸入空間中也很少有訓練樣本的數據服從均勻分布,訓練數據通常是線性不可分的,因此,對于MSE很難找到非線性的邊界[3]。
Matas首次提出最大穩定極值區域(MSERs)[4]局部不變特征提取算法,可以準確檢測各種不同形狀圖像區域并同時具有尺度、旋轉和仿射不變性的區域特征,但對于非線性數據信息處理效率不高。
局部最小均方誤差(local minimum squared error,LMSE)采用的是局部學習算法,它有效降低了利用全局學習模型的MSE的缺點,可正確分類預測樣本,且均方誤差更小。利用LMSE學習數據集的局部結構可獲得數據集內的非線性信息,適用于數據的不均勻分布,且在算法實現上優于基于線性鑒別分析LDA和保局部映射LPP等分類算法。endprint
面向分類的LMSE可逐一處理測試樣本,二元分類的LMSE設計模型如下:
對于測試樣本,有K個最近鄰,利用尋找核函數:
(6)
其中:
(7)
再將式(7)改寫成局部最小的均方誤差:
(8)
若屬于1類,則;若屬于2類,則;得到最小均方誤差為:
(9)
其中:是奇異矩陣。則有:
(10)
對于測試樣本,若,則類標簽為1,否則為-1。
3 LMSE的應用
利用AR數據集,通過LPP、MSE、LMSE對給定的圖像數據集進行預測樣本,分析各類算法對圖像數據集的分類精度。
給定較大數據量的人臉數據集AR,超過100人的4000幅人臉圖像,圖像是不同的面部表情、光照條件和遮擋條件下的下面人臉圖像。選擇數據集中120人,每人25張圖像,將所有圖像裁剪并調整成分辨率為20*25,再隨機將所有圖片分為訓練和測試兩級數據[5]。對于每個人的圖像數據選定5,6,7,8,9,組成5個訓練子集,每個子集的圖像數目為600,720,840,960,1080。利用LPP、MSE、LMSE三種算法對給定圖像數據集的精度計算,在LPP中確定局部參數來獲取樣本的最近鄰數目,參數為0.001*d,d是訓練集中任意兩個樣本間的平均距離。在每個數據集上,隨機運行各種算法10次,得到如表1所示5個訓練子集上的分類結果。
從表1中的各項數據可看出,對于同一數據集的數據,基于LMSE算法的各個訓練子集上的分類精度要優于LPP、MSE算法,可獲得更準確的圖像數據信息,且由于LMSE采用局部數據處理方式,在執行效率上整體性能更高。利用不同算法對同一訓練數據獲得的數據分類精度差異較大,但對于同一算法對所有訓練數據集上的分類精度變化呈平緩曲線變化,差異性較小,因此可根據實際應用需要,對LMSE算法應用中選擇符合數據樣本精度的變化值即可得到較準確的圖像數據分析結果。
4 結束語
基于局部學習算法,采用自適應迭代方法,通過設定迭代初值、參數和自適應學習,可生成LMSE算法,論文從理論分析和仿真實驗兩方面研究分析了最小均方誤差的表示及應用,從實驗數據結果得出,LMSE算法在局部圖像數據特征處理上具有較高的分類精度和較優運算性能。
參考文獻:
[1] 黃劍華. 視頻圖像文本信息提取關鍵技術的研究[D]. 哈爾濱:哈爾濱工業大學,2007.
[2] 馮嘉. SIFT 算法的研究和改進[D].吉林:吉林大學, 2010.
[3] 陳濤. 圖像仿射不變特征提取方法研究[D].長沙:國防科學技術大學,2006.
[4] MatasJ, ChumO, UrbanM, et al. RobustwideBaselineStereofromMaximallyStableExtremal Regions. Image and Vision Computing, 2004,22(10):761-767.
[5] 劉洋,薛向陽,路紅,等. 一種基于邊緣檢測和線條特征的視頻字符檢測算法[J].計算機學報,2005,28 (3).endprint