何苗,王保云,盛偉,孔艷
(云南師范大學信息學院,昆明 650500)
稀疏表示遙感圖像分類方法綜述
何苗,王保云,盛偉,孔艷
(云南師范大學信息學院,昆明650500)
信號的稀疏表示是目前計算機視覺領域中的研究熱點,在對稀疏表示遙感圖像分類方法進行綜述的基礎上,主要分析和總結稀疏表示中的稀疏系數求解方法、字典學習方法及分類方法方面的內容,并指出稀疏表示遙感圖像分類方法需要進一步研究的問題。
稀疏表示;遙感圖像分類;稀疏系數求解;字典學習
云南省教育廳科學研究基金(No.2014Y145)、云南省哲學社會科學規劃項目(No.QN2015067)、云師大博士啟動基金(No.01000205020503064)
隨著遙感技術的不斷發展,遙感圖像被廣泛地應用于多個領域,如民用、軍事等多個重要的領域。在航天技術和傳感器技術的迅猛發展的推動下,衛星遙感呈現出“三高”和“三多”的發展趨勢[1]。這一發展趨勢致使遙感圖像成為了名副其實的大數據。面對海量的數據,如何有效地、快速地對其進行處理成為當前計算機領域及遙感應用領域的研究熱點。遙感圖像的分類是遙感應用中較為關鍵的環節之一,尤其是軍事應用領域中對目標的檢測與識別,均需對目標圖像進行分類。遙感圖像相比一般的自然圖像較為復雜,不僅信息量大,而且空間結構復雜、數據維度較高,傳統的圖像處理及分類方法難以對其實現較好的分類效果,在一定程度上限制了遙感圖像的應用。
近年來,隨著壓縮感知理論的快速發展,信號的稀疏表示在其推動下得到了廣泛應用。稀疏表示具有避免“維數災難”、簡化復雜信號的處理、精確恢復信號及良好的抗噪能力的優勢,將其應用于遙感圖像的處理受到了眾多國內外學者的關注。在稀疏表示理論框架下,一個信號可以通過一個給定的過完備字典中盡可能少的原子線性組合表示。已有研究表明,稀疏表示模型與人類的視覺感知系統原理極其相似,因此,稀疏表示被廣范地應用到圖像處理的各個領域,如圖像去噪[2]、圖像恢復[3]、圖像理解[4]等計算機視覺領域。關于圖像分類的應用,2009年,John Wright等人[5]首次成功地將稀疏表示應用于人臉識別中,對受噪聲污染的數據取得了較好的分類識別效果。就遙感圖像處理而言,其應用主要集中在圖像去噪[6]、超分辨率遙感圖像重構[7]、多光譜遙感圖像分類[8]、SAR圖像目標識別[9]等方面。基于稀疏表示的遙感圖像分類方法的流程如圖1所示,研究主要集中在遙感圖像的特征提取、字典的構建與學習、稀疏系數的求解、分類判別準則四方面。

圖1 基于稀疏表示的遙感圖像分類方法流程
基于上述分析,本文主要對稀疏表示遙感圖像分類方法進行了分析和研究,并同時闡述常用的遙感圖像特征提取方法、稀疏表示中的稀疏系數求解方法和字典學習方法。
遙感圖像的特征提取主要集中在光譜特征提取和紋理特征提取兩方面。
1.1光譜特征提取方法
光譜特征是圖像中目標物的顏色及灰度或者波段間的亮度比等,它通過原始波段的點運算獲得。光譜特征的特點是,它對應于每個像素,但與像素的排列等空間結構無關[10]。光譜特征是一種地物區別于另一種地物的本質特征,是組成地物成分、結構等屬性的反映,正常情況下不同地物具有不同的光譜特征,在一些特殊情況下會出現“同物異譜、同譜異物”現象,因此根據地物光譜特征可以對遙感圖像進行特征提取[11]。光譜特征主要分為一階統計特征和二階統計特征。常用的光譜特征提取方法有主成分分析法(Principal Component Analysis,PCA)、核主成分分析法、櫻帽變換法、典型分析方法、基于遺傳算法的特征提取算法等。
1.2紋理特征提取方法
紋理是圖像的重要特征之一,它反映了圖像灰度的性質及其空間關系,是圖像中一個重要而又難以描述的特性[12]。遙感圖像具有較為豐富和復雜的紋理結構,在對圖像進行特征提取之前需要對其進行紋理分析,這是保證特征有效提取的關鍵。常用的紋理特征提取方法有灰度共生矩陣法(Gray Level Co-occurrence Matrix,GLCM)、Laws紋理能量法、空間自相關函數法、傅里葉變換法、Gabor濾波器方法、小波變換及小波包變換法等。
在遙感圖像的分類中,稀疏系數的求解是分類依據的關鍵所在。由于稀疏表示的求解中存在NP-Hard問題,國內外諸多學者已經對稀疏表示模型的求解算法作了大量深入的研究。就目前的研究現狀而言,稀疏系數求解算法大致可分為兩大類:貪婪算法和凸優化算法。
2.1貪婪算法
貪婪算法的主要思想是通過特定的度量準則從字典中逐一選擇最有用的原子來逼近原數據(信號)。常見的貪婪算法有:匹配追蹤算法(Matching Pursuit, MP)、正交匹配追蹤算法(Orthogonal Matching Pursuit, OMP)、正規化正交匹配追蹤算法(Regularized Orthogonal Matching Pursuit,ROMP)、多候選集OMP(Multicandidate OMP,MOMP)算法、梯度正交匹配追蹤算法(Stagewise Orthogonal Matching Pursuit,StOMP)、壓縮采樣匹配追蹤算法(Compressive Sampling Matching Pursuit,CoSaMP)等。
2.2凸優化算法
凸優化算法的主要思想是將非凸的范數松弛到上進行求解,然后用非線性規劃法來逼近原組合優化問題。常用的凸優化算法有:基追蹤算法(Basis Pursuit, BP)、梯度投影算法、L1_Magic算法、SL0算法、FOCUSS算法、LASSO算法等。
稀疏表示中字典的構造同樣是遙感圖像分類中的重要研究內容,字典的構建是圖像能否進行稀疏表示的前提條件,而如何有效的構建字典是提高分類精度的關鍵。一般而言,稀疏表示中要求字典具有過完備性,即字典中的原子個數要遠遠大于樣本的維度,這樣既能保證樣本維數不是很高又能實現字典中原子對信號的線性稀疏表示。對于字典的研究,過完備字典的構建大致可分為三類:直接用訓練樣本構建的字典、分析類字典和學習類字典。
直接用訓練樣本構建字典通常存在以下缺點:樣本不充足,不能構成過完備字典,導致分類精度不高;冗余的信息對原信號不能進行有效地表達從而導致分類精度的降低。鑒于此,字典的構造主要集中在分析類字典和學習類字典。
3.1分析類字典
分析類字典是基于解析式的字典構造方法,它是通過一定的數學函數對給定的信號進行建模,然后依據該模型設計相應的表示方法。常見的分析類字典主要有傅里葉變換字典、離散余弦變換字典(DCT字典)、小波變換字典等。該類字典的構建主要是通過將原信號轉換到頻率域上進行處理,其原理簡單,計算不復雜。但是對于較為復雜的遙感圖像,該類字典不能較好地適應信號的變換,原子的表示能力不是很強。
3.2學習類字典
學習類字典是基于機器學習的字典構造方法,它是通過對練樣本進行學習得到,能對各種特征的圖像進行有效的表示,具有良好的適應習性,同時,結構性較弱,但計算復雜度較高。學習類字典主要包括MOD算法、K-SVD算法、ODL算法等。學習類字典是稀疏表示字典設計中較為新的研究,它對信號稀疏表示模型求解算法的研究有著深遠的影響。相比之下,學習類字典比分析類字典更具有優越性,通過學習,可以在一些實際信號的處理應用中得到最優的結果。
在字典和稀疏系數求解完之后,最后的處理就是分類準則的設定,既分類器的設計。基于稀疏表示的遙感圖像分類中,在對訓練樣本提取特征向量,通過字典學習算法得到具有自適應能力的過完備字典之后,需對測試樣本進行同樣的特征向量處理,在過完備字典上進行稀疏系數的求解。求解完稀疏表示系數之后可根據一定的準則進行分類判斷,目前研究中較為常見的分類準則有:最小重構誤差分類判斷準則和最大分類系數判斷準則。稀疏表示的分類原理如圖2所示,根據系數表示分類的判別準則,設計稀疏表示的分類器,實現遙感圖像的分類。

圖2 稀疏表示分類原理
目前,稀疏表示理論已成為國內外的研究熱點,Dohono和Candes等人提出的壓縮感知理論推動了稀疏表示在各領域的應用。近年來,稀疏表示在遙感圖像處理中的應用引起了諸多學者的關注,尤其是在遙感圖像的分類和去噪等方面的研究已經取得了一定的進展。關于稀疏表示理論的研究,學者們主要集中在過完備字典的構建、字典學習算法、稀疏表示求解算法以及分類識別中分類準則的判定方面,已有的研究成果推動了稀疏表示在遙感圖像分類中的發展,但是遙感圖像與其它的自然圖像有所不同,還存在很多問題需要進行深入的研究。據此總結存在的問題并作展望:(1)遙感圖像具有較復雜的空間結構,其信息含量較豐富、數據維度較高、內部結構不平穩,這些數據的特性既能體現稀疏表示的優勢,也能加大稀疏表示的難度,因為稀疏表示可以較好的處理高維數據,避免“維數災難”,但數據量較大、結構較復雜會造成字典學習和稀疏系數求解的算法更加耗時耗能。如何針對遙感圖像進行算法的改進和優化,減少計算時間,提高算法效率是需要進一步研究的問題。(2)稀疏表示中要求字典具有過完備性,當選取的訓練樣本不充足時,會導致字典沒有完備性,從而影響分類效果。如何構建有效的過完備字典是稀疏表示用于分類需要深入研究的問題。針對這一問題,可以考慮借鑒壓縮感知理論中的低秩矩陣分解原理來構建字典。(3)遙感圖像分類中,提取有效的特征向量也是分類成功的關鍵,就目前的特征提取方法而言,空間特征與光譜信息的提取利用是相互獨立的,如何有效對其進行融合同樣需要深入研究。可通過提取不同的特征向量構建不同的特征字典,基于機器學習的方法融合特征,提高字典的表示能力。(4)“混合像元”、“同物異譜”、“異物同譜”等問題一直是遙感圖像處理中的難點,如何通過多源數據構建字典,對系數求解的結果進行數據融合也是需要深入研究的問題。
[1]李德仁.論21世紀遙感與GIS的發展[J].測繪與空間地理信息,2002,25(4):127-131.
[2]Rosten E,Porter R,Drummond T.Faster and Better:a Machine Learning Approach to Corner Detection[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,2010,32(1):105-19.
[3]張小洪,楊丹.使用梯度相關矩陣行列式的角點檢測算法[J].中國圖象圖形學報,2009,14(08):1601-1608.
[4]Mokhtarian F,Suomela R.Curvature Scale Space for Robust Image Corner Detection[C].Pattern Recognition,International Conference on.IEEE Computer Society,1998:1819-1819.
[5]Wright,J.,Yang,A.Y.,Ganesh,A.,etc.Robust Face Recognition via Sparse Representation[J].Ieee Transactions on Pattern Analysis and Machine Intelligence,Feb,2009,31(2):210-227.
[6]夏琴,邢帥,馬東洋,莫德林,李鵬程,葛忠孝.遙感衛星影像K-SVD稀疏表示去噪[J].遙感學報,2016,03:441-449.
[7]管超.基于稀疏表示理論的圖像超分辨率重構算法研究[D].上海交通大學,2012.
[8]宋相法,焦李成.基于稀疏表示及光譜信息的高光譜遙感圖像分類[J].電子與信息學報,2012,34(2):268-272.
[9]韓萍,王歡.結合KPCA和稀疏表示的SAR目標識別方法研究[J].信號處理,2013,29(12):1696-1701.
[10]杜培軍.遙感原理與應用[M].中國礦業大學出版社,2006.
[11]駱玉霞,陳煥偉.遙感圖像的特征提取與選擇研究[J].信息記錄材料,2002,3(2):22-26.
[12]張克軍.遙感圖像特征提取方法研究[D].西北工業大學,2007.
Sparse Representation;Remote Sensing Images Classification;Solution of Sparse Coefficient;Dictionary Learning
Survey on Remote Sensing Images Classification Based on Sparse Representation
HE Miao1,WANG Bao-yun2,SHENG Wei3,KONG Yan4
(School of Information Technology and Science,Yunnan Normal University,Yunnan,Kunming 650500)
Currently,sparse representation of the signal is a research focus in the computer vision.Summaries the sparse representation of remote sensing images classification methods,and mainly analyzes and reviews three aspects of content about solution of sparse coefficient,dictionary learning and classification.In addition,points out that sparse representation of remote sensing images classification is supposed to be study in the future.
1007-1423(2016)32-0067-04
10.3969/j.issn.1007-1423.2016.32.015
何苗(1990-),女,云南曲靖人,在讀研究生,碩士,研究方向為稀疏表示、圖像處理
王保云(1977-),男,云南玉溪人,博士,講師,研究方向為機器學習、圖像處理
2016-11-01
2016-11-05