作者簡介:劉怡?。?977-),男,江西贛州人,教授,博導,博士研究生,主要研究方向為類腦計算機、圖像處理、智能信息處理;龍錦濤(1998-),男,湖南長沙人,碩士研究生,主要研究方向為聚類算法;楊曉君(1983-),男(通信作者),安徽潁上人,副教授,碩導,博士研究生,主要研究方向為聚類算法、智能信息處理(yangxj18@gdut.edu.cn).
摘 要:針對傳統模糊聚類算法對初始聚類中心非常敏感以及對高光譜圖像處理效果不佳的問題,為減少聚類數據的復雜度、降低聚類過程的計算成本以提升聚類性能,提出了一種基于多層二部圖的高光譜模糊聚類算法。首先使用SuperPCA預處理方法對超像素分割得到的每個同質區域進行PCA來學習HSI數據不同區域的固有低維特征,從而獲得高光譜數據的低維表示;其次,構造一個多層二部圖矩陣來描述數據點和錨點之間的關系,降低了計算復雜度;最后,在模糊聚類中加入基于多層二部圖的非負正則項來約束模糊隸屬度矩陣的解空間。在Indian Pines和Pavia University數據集上進行的實驗表明,所提算法能提高聚類效果與性能。
關鍵詞:高光譜圖像;模糊聚類;多層圖;非負正則項
中圖分類號:TP751 文獻標志碼:A
文章編號:1001-3695(2023)04-046-1246-04
doi:10.19734/j.issn.1001-3695.2022.07.0407
Abstract:Traditional fuzzy clustering algorithm is very sensitive to the initial clustering center and has poor processing effect on hyperspectral image.To address this problem,this paper proposed a hyperspectral fuzzy clustering algorithm based on multilayer bipartite graph to reduce the complexity of clustering data and the computational cost of clustering process.Firstly,this paper used SuperPCA preprocessing method to perform PCA on each homogeneous region obtained by super pixel segmentation to learn the inherent low-dimensional characteristics of different regions of HSI data,so as to obtain the low-dimensional representation of hyperspectral data.Then,this paper constructed a hierarchical bipartite graph matrix to describe the relationship between data points and anchor points,which reduced the computational complexity.At last,this paper constrained the solution space of the fuzzy membership matrix by adding the nonnegative regularization term based on hierarchical bipartite graph to fuzzy clustering.Experiments on Indian Pines and Pavia University datasets show that the proposed algorithm can improve the clustering effect and performance.
Key words:hyperspectral image;fuzzy clustering;hierarchical graph;nonnegative regularization term
0 引言
高光譜圖像(HSI)是通過光譜成像技術獲取的,它包含了豐富的光譜和空間信息[1]。高光譜圖像廣泛應用于生物醫學、農業遙感、資源勘探等領域[2,3]。在這些應用中,HSI聚類得到了廣泛的關注。由于高光譜圖像的數據量龐大,空間結構復雜,HSI聚類算法的算法復雜度和聚類性能受到比較大的影響。因此,如何提高聚類精度一直是一個非常具有挑戰性的問題。在過去幾十年中提出了許多聚類算法,包括基于質心的聚類(如K均值算法(K-means)[4]、模糊C均值聚類(FCM)[5]、帶有空間約束的模糊聚類(FCM_S1[6]))和基于譜的聚類(如譜聚類(SC)[7])。
模糊聚類是HSI聚類中最基本的基于質心的聚類算法。模糊聚類根據對象本身的屬性來構造模糊矩陣,并在此基礎上根據一定的隸屬度來確定聚類關系[8]。然而,算法對初始聚類中心非常敏感,這可能導致聚類性能較差。此外,在應用于大規模聚類問題時,模糊聚類算法的實時性不是很好[9]。文獻[10]提出了基于二部圖的模糊嵌入聚類算法(FECBG),采用快速譜嵌入方法獲得HSI數據的低維表示,降低了計算復雜度。FECBG方法縮短了聚類時間,然而該方法的分類準確度不夠高。
目前,很多基于圖的算法通常構造基于錨圖的模型來降低計算復雜度,算法從原始數據中選擇錨點,然后計算數據點和錨點之間的二部圖[11]。為了提高傳統基于圖形的聚類算法的聚類性能,文獻[12]在構建大尺度圖時,有效地考慮了光譜特性,針對大型HSI提出了基于可伸縮圖的非負松弛聚類算法(SGCNR)。SGCNR有效利用了高光譜圖像的空間信息,然而,SGCNR的聚類結果并不穩定。
為了降低上述問題對聚類結果的影響,受多層二部圖[13]和模糊聚類[14]的啟發,本文提出了一種新的HSI算法,即基于多層二部圖的高光譜模糊聚類算法(FCHBG)。所提出的算法首先采用SuperPCA作為預處理方法,通過對超像素分割得到的每個同質區域進行PCA來學習HSI數據不同區域的固有低維特征。其次構造多層錨點圖,利用多層錨點圖與原始數據點構造成二部圖,降低了計算復雜度,減少實時聚類時間。最后,利用多層二部圖的非負正則化項約束模糊隸屬度矩陣的解空間,可以獲得每個HSI數據更好的隸屬度,從而減少初始聚類中心的影響,使得到的實驗結果更加穩定。
1 基本原理
1.1 SuperPCA預處理
本文使用SuperPCA預處理方法從原始HSI數據中獲取低維表示數據。SuperPCA算法包括以下兩個步驟:a)對初始HSI數據進行熵率超像素(ERS)分割;b)對較小的分量進行主成分分析,并重新排列得到的低維矩陣,以合成降維數據。
2 實驗結果與分析
2.1 高光譜數據集的介紹
本文所用高光譜數據集為Indian Pines和Pavia University,詳細信息如表1所示。Indian Pines數據集是AVIRIS設備于1992年在美國印第安納州西北部獲取,圖像成像大小為145×145,圖像中的地物共有16類,光譜帶數量為220個,去除掉一部分噪聲帶后,可用于圖像實驗的為21 025個圖像像素總數與200個光譜帶。 Pavia University數據集是在意大利北部帕維亞上空的一次飛行活動中由ROSIS傳感器獲取到的,圖像大小為610×340,圖像中的物體類別數為9個,光譜帶有115個。去除掉一部分噪聲帶后,可應用于圖像實驗的光譜帶為103個,樣本總數為207 400個。兩個數據集的真值圖分別如圖1(a)和(b)所示,每一類別的數量標注在括
2.2 實驗指標
本文實驗的對照方法包括K-means、模糊C均值聚類(fuzzy C-means clustering,FCM)、具有空間約束的模糊C均值聚類(fuzzy C-means clustering with spatial constraints,FCM_S1)三種聚類傳統算法以及基于二部圖的模糊嵌入聚類(fuzzy embedded clustering based on bipartite graph for large-scale hyperspectral image,FECBG)[10]、加入非負松弛項的改進譜聚類算法(scalable graph-based clustering with nonnegative relaxation,SGCNR)[12]兩個近3年相關領域的算法。本文實驗環境如表2所示。為了全面分析這些方法的性能,本文采用總準確度(overall accuracy,OA)、平均準確度(average accuracy,AA)、一致性系數Kappa和聚類結果圖作為實驗評估指標。實驗環境如表2所示。
2.3 評價實驗結果
本節給出了本文實驗的聚類性能和分析,設置參數λ1=0.1,λ2=0.1。另外,比較聚類方法的所有參數被調整為最優。為了不喪失一般性,本文在每個數據集上運行10次本文方法,并記錄平均結果。
2.3.1 Indian Pines數據集實驗結果分析
Indian Pines數據集的實驗結果如圖2和表3所示。FCHBG中使用的參數分別設置為m1=2 000、m2=200。每種聚類方法得到的定量評價如表3所示,對應于聚類結果的相應評價指標,最佳結果以粗體顯示,FCHBG各項實驗指標得到了大幅提升,AA為59.89%,比其他算法高18.58%~28.01%。對于OA和Kappa,FCHBG獲得的準確度分別為63.52%和59.35%,分別比其他方法高 24.69%~27.43%和27.91%~30.23%。與FECBG算法相比,FCHBG算法的AA提升了約20%,OA提升了約26%,Kappa系數提升了約29%;與基于圖的算法SGCNR相比,FCHBG算法的AA提升了18%,OA提升了約25%,Kappa系數提升了約28%,運行時間減少了0.3 s。表3中給出了各個方法的運行時間??梢钥闯?,FCHBG的運行時間僅次于K-means、FCM和FECBG。
圖2直觀地顯示了五種方法在Indian Pines數據集的聚類圖,其中FCHBG產生最佳結果,其類內區域平滑,而類間區域邊界清晰,視覺體驗更好。因此可以看出,在Indian Pines數據集聚類中,使用FCHBG是有益的。FCHBG算法充分利用高光譜圖像的空間信息進行了有效降維預處理,二部圖結構達到了二次去除冗余信息的效果,有效保存圖像的主要信息的同時提升了運行速度,同時利用多層二部圖的非負正則化項約束模糊隸屬度矩陣的解空間,可以獲得每個數據更好的隸屬度,從而大幅度提升了聚類精度。
2.3.2 Pavia University數據集實驗結果分析
Pavia University數據集的實驗結果如圖3和表4所示。FCHBG算法的參數分別設置為m1=800、m2=200。根據表4可知,本文方法在所有評估指標中的表現都明顯優于其他方法,實驗評估指標 AA、OA和Kappa系數分別為51.30%、52.56% 和48.69%。與SGCNR相比,平均準確度AA提升了1.2%;總準確度OA提升了2.6%;Kappa系數提升了6.46%。關注到表4中給出的每種聚類方法的運行時間,FCHBG的運行時間與其他對比方法處于相同的數量級,比SGCNR聚類時間提升了9.6 s。
從圖3中看到,K-means、FCM、FCM_S1、FECBG和SGCNR的聚類圖相對噪聲點較多,噪聲點聚類的視覺效果較差,但相比之下,FCHBG提高了聚類性能從而獲得了更平滑的聚類圖,這清楚地反映了合并空間信息的重要性。由于高光譜地物復雜且具有不同的數據結構,SPCA預處理有效地去除了冗余信息,二部圖結構可以更好地獲得數據間的鄰接關系,且多層圖的構造可以使得聚類精度得到進一步的提升。
2.4 實驗結論
綜上可以得出結論,本文提出的FCHBG算法可以在常規數量級的運行時間內有效提高聚類精度并得到更準確的聚類結果圖。
3 結束語
針對傳統聚類算法應用于高光譜圖像處理聚類精度低、分類圖不平滑等問題,提出了一種基于多層二部圖的模糊聚類算法,FCHBG創新性地將SuperPCA、多層圖結構與模糊聚類模型結合并應用于高光譜圖像處理中。首先,基于高光譜圖像多區域特征不同的特性,算法對數據進行SuperPCA預處理,獲得原始數據的低維表示。其次,通過添加基于多層二部圖的非負正則化項,有效地降低了模糊聚類對初始聚類中心的敏感性和計算復雜度,提高了聚類的穩定性。在兩個高光譜數據集上的實驗可以驗證FCHBG方法實現了更好的聚類性能和更準確的聚類圖。與本文列出的五種方法相比,FCHBG提高了算法的聚類指標AA、OA、Kappa,可以更好地應用于處理高光譜圖像。
參考文獻:
[1]楊紅艷,杜健民.高光譜遙感圖像波段選擇研究進展綜述[J].計算機工程與應用,2022,58(10):1-12.(Yang Hongyan,Du Jianmin.Research progress of band selection in hyperspectral images[J].Computer Engineering and Applications,2022,58(10):1-12.)
[2]張偉.高光譜技術在農業遙感中應用的研究進展[J].農業技術與裝備,2022(5):91-93.(Zhang Wei.Research progress on application of hyperspectral technology in agricultural remote sensing[J].Agricultural Technology and Equipment,2022(5):91-93.)
[3]王建宇,李春來.高光譜遙感成像技術的發展與展望[J].空間科學學報,2021,41(1):22-33.(Wang Jianyu,Li Chunlai.Development and prospect of hyperspectral remote sensing imaging technology[J].Chinese Journal of Space Science,2021,41(1):22-33.)
[4]Zhang En,Li Huimin,Huang Yuchen,et al.Practical multi-party private collaborative K-means clustering[J].Neurocomputing,2022,467(4):256-265.
[5]Jiang Zhaohui,Li Tingting,Min Wenfang,et al.Fuzzy C-means clustering based on weights and gene expression programming[J].Pattern Recognition Letters,2017,90:1-7.
[6]Qin Yuting,Zhang Yuyue,Zhao Qicheng,et al.Joint inversion of electromagnetic and acoustic data with spatial-constrained by FCM[C]//Proc of the 4th IEEE International Conference on Electronics Techno-logy.Piscataway,NJ:IEEE Press,2021:213-216.
[7]Chen Yongyong,Xiao Xiaolin,Hua Zhongyun,et al.Adaptive transition probability matrix learning for multiview spectral clustering[J].IEEE Trans on Neural Networks and Learning Systems,2022,33(9):4712-4726.
[8]Borlea I D,Precup R E,Borlea A B,et al.A unified form of fuzzy C-means and K-means algorithms and its partitional implementation[J].Knowledge-Based Systems,2021,214(2-3):106731.
[9]Zhao Xiaowei,Nie Feiping,Wang Rong,et al.Improving projected fuzzy K-means clustering via robust learning[J].Neurocomputing,2022,491(1):34-43.
[10]Yang Xiaojun,Xu Yuxiong,Li Siyuan,et al.Fuzzy embedded clustering based on bipartite graph for large-scale hyperspectral image[J].IEEE Geoscience and Remote Sensing Letters,2021,19:1-5.
[11]Shi Jiarong,Wang Zhiteng.A hybrid forecast model for household electric power by fusing landmark-based spectral clustering and deep learning[J].Sustainability,2022,14(15):9255.
[12]Wang Rong,Nie Feiping,Wang Zheng,et al.Scalable graph-based clustering with nonnegative relaxation for large hyperspectral image[J].IEEE Trans on Geoscience and Remote Sensing,2019,57(10):7352-7364.
[13]Yang Xiaojun,Yu Weizhong,Wang Rong,et al.Fast spectral clustering learning with hierarchical bipartite graph for large-scale data[J].Pattern Recognition Letters,2020,130:345-352.
[14]Zhou Jie,et al.Projected fuzzy C-means clustering with locality preservation[J].Pattern Recognition,2021,113(6):107748.
[15]Mu Caihong,Dong Zhidong,Liu Yi.A two-branch convolutional neural network based on multi-spectral entropy rate superpixel segmentation for hyperspectral image classification[J].Remote Sensing,2022,14(7):1569.
[16]Liu Zhicheng,Chang Hong,Du Donglei,et al.Improved algorithms for non-submodular function maximization problem[C]//Proc of International Conference on Algorithmic Applications in Management.Berlin:Springer,2022:190-199.
[17]Wang Meng,Fu Weijie,Hao Shijie,et al.Learning on big graph:label inference and regularization with anchor hierarchy[J].IEEE Trans on Knowledge and Data Engineering,2017,29(5):1101-1114.
[18]Shi Dan,Zhu Lei,Li Jingjing, et al.Flexible multiview spectral clustering with self-adaptation[J/OL].IEEE Trans on Cybernetics,2021.http://doi.org/10.1109/tcyb.2021.3131749.
[19]Wang Zhen,Zhang Long,Wang Rong,et al.Semi-supervised learning via bipartite graph construction with adaptive neighbors[J/OL].IEEE Trans on Knowledge and Data Engineering,2022.http://doi.org/10.1109/tkde.2022.3151315.
[20]Zhao Xiaowei,Nie Feiping,Wang Rong,et al.Improving projected fuzzy K-means clustering via robust learning[J].Neurocomputing,2022,491(11):34-43.