趙 峰
(泰州職業(yè)技術(shù)學院 機電技術(shù)學院,江蘇 泰州 225300)
隨著互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)的量級呈指數(shù)型函數(shù)飛快增長,大數(shù)據(jù)已經(jīng)滲透到各個領(lǐng)域。經(jīng)過半個世紀的探索和嘗試,遙感技術(shù)已經(jīng)在實用化的方向邁出了堅實的一步,數(shù)據(jù)獲取的渠道更加趨于多樣化,需要處理的遙感信息量也快速增加[1]。傳統(tǒng)的數(shù)據(jù)處理模式已經(jīng)無法適用于大數(shù)據(jù)的分析[2]。遙感場景識別是在計算機系統(tǒng)的支持下,通過對遙感場景中各類地物信息的空間特征和光譜特征進行綜合分析、提取,將特征空間劃分成互不重疊的子空間,然后將圖像中的各個像元劃分到各個子空間對應(yīng)的地物類別,極大地提高了從遙感場景中獲取信息的速度和遙感信息自身的客觀性[3]。基于大數(shù)據(jù)的遙感場景識別問題成為遙感信息處理面臨的一個難題。
MATLAB 具有方便的數(shù)據(jù)可視化功能,可以將向量和三維的可視化、圖像處理、動畫和表達式作圖[4-6]。Liblinear 是用于大型線性分類的庫,主要用于海量數(shù)據(jù)的分類,一般用于大規(guī)模的數(shù)據(jù)集,具有速度快,尤其是針對稀疏的特征的優(yōu)點,但缺點是內(nèi)存資源消耗高。
WHU-RS19是從谷歌衛(wèi)星影像上獲取的遙感場景。每幅遙感場景的像素均為600*600,它是由機場、海灘、橋、商業(yè)等19 種1005 幅場景組成的。AID(Aerial Image Dataset)航空圖像數(shù)據(jù)集來源于Google 地球圖像中采集的樣本圖像,由機場、荒地、棒球場等30種10000幅場景組成。
LBP(Local Binary Pattern),局部二值模式,是一種用來描述圖像局部特征的算子,優(yōu)點是具備灰度不變性和旋轉(zhuǎn)不變性。由于LBP 特征計算簡單、效果較好,因此LBP 特征在計算機視覺的諸多領(lǐng)域都得到了廣泛的應(yīng)用[7]。
SIFT(Scale Invariant Feature Transform),尺度不變特征變換,對旋轉(zhuǎn)、尺度縮放、亮度變化等特征均保持不變,是一種非常穩(wěn)定的局部特征。SITF 算法具有穩(wěn)定性、獨特性、多量性、可擴展性、高速性、實時性等特點。
CH(Color Histogram),顏色直方圖,是一種全局特征,對圖像本身的尺寸、方向、視角的依賴性較小,具有較高的魯棒性。CH算子特征提取優(yōu)點是旋轉(zhuǎn)不變性和平移不變性;不受數(shù)字圖像尺度變化的影響;其缺點是不能有效地表現(xiàn)出顏色的空間分布信息;實際應(yīng)用中受到天氣的影響較大,結(jié)果具有不穩(wěn)定性。
SVM(Support Vector Machine),支持向量機,是一種常見的判別方法。在機器學習領(lǐng)域,是一個有監(jiān)督的學習模型,通常用來進行模式識別、分類以及回歸問題的分析[8]。
SVM 支持向量機通過一個非線性映射p,把樣本空間映射到一個高維乃至無窮維的特征空間中(Hilbert空間),使得在原來的樣本空間中非線性可分的問題轉(zhuǎn)化為在特征空間中的線性可分的問題。
基于大數(shù)據(jù)的高分辨率遙感場景識別通常采用監(jiān)督法分類方法。本文研究的數(shù)據(jù)量較大,因此采用隨機函數(shù)來進行樣本的選取,依據(jù)訓練區(qū)的樣本選擇提取特征參數(shù),通過分類器進行分類[9]。第一步選取WHU-RS19 數(shù)據(jù)集和AID 航空數(shù)據(jù)集;第二步分別使用LBP 算子、SIFT 算法和CH算子進行特征提取;第三步使用SVM支持向量機進行分類。
(1)LBP算子特征提取。參數(shù)信息見表1。

表1 LBP算子特征提取參數(shù)
如果識別圖像大于600px則進行等比例縮放。
(2)SIFT算法特征提取。參數(shù)信息見表2。

表2 SIFT算法特征提取參數(shù)
將顏色場景轉(zhuǎn)化為灰度圖并轉(zhuǎn)化為矩陣,如果場景像素大于600,則進行等比例縮放。
(3)CH算子特征提取。參數(shù)信息見表3。

表3 CH算子特征提取參數(shù)
將顏色場景轉(zhuǎn)化為矩陣,如果場景像素大于600,則進行等比例縮放。
(4)特征信息綜合。參數(shù)信息見表4。

表4 綜合特征提取參數(shù)
通過循環(huán)對每類場景特征進行信息整合,文件名按照原文件名加參數(shù)的格式保存。如果文件夾中已有先前生成的文件則提示文件已存在,不再重新進行計算。
參數(shù)信息如表5 所示。通過循環(huán)對數(shù)據(jù)集進行樣本學習以及訓練[10]。

表5 SVM分類參數(shù)信息
本文通過每類場景的識別率來判斷算法的效果。
(1)WHU-RS19數(shù)據(jù)集實驗結(jié)果。

通過多次試驗,并進行結(jié)果分析,不同樣本比例的LBP算子、SIFT算法和CH算子特征提取識別率統(tǒng)計如表6所示,折線圖如圖1所示。

表6 不同樣本比例的LBP算子、SIFT算法和CH算子特征提取識別率統(tǒng)計(RS19數(shù)據(jù)集)

圖1 不同樣本比例的LBP算子、SIFT算法和CH算子特征提取識別率折線圖(RS19數(shù)據(jù)集)
根據(jù)表6 和圖1 可以得到:CH 算子的識別率明顯高于LBP 算子和SIFT 算法;隨著樣本比例的增大,CH算子、LBP算子和SIFT算法的識別率總體呈增長趨勢[11]。
混淆矩陣(Confusion Matrix)也稱誤差矩陣,可以很好地反映圖像分類的精度,適用于監(jiān)督學習。LBP算子在50%樣本比例中的混淆矩陣如圖2所示[12]。
根據(jù)LBP 算子在50%比例中得到的混淆矩陣中可以得出如下結(jié)論:橋、工業(yè)、公園場景識別效果較差。容易混淆的場景:農(nóng)田和停車場,草地和停車場,池塘和海灘。海灘、足球場、森林、草地、山、火車站和高架橋識別率較高。
通過三種不同的算法的比較,森林、山和火車站的識別率較高。橋的識別率較低。由于RS19數(shù)據(jù)集圖片數(shù)量相對較少,在實驗過程中采用的是隨機算法,導致出現(xiàn)個別實驗隨著樣本比例升高識別率下降的現(xiàn)象。但是總體上隨著樣本比例升高,場景的識別率越高。而且在低層次場景識別上,CH算子提取的特征比LBP算子和SIFT的效果好[13]。
(2)AID 數(shù)據(jù)集實驗結(jié)果。通過多次試驗,并進行結(jié)果分析,不同樣本比例的LBP 算子、SIFT算法和CH算子特征提取識別率統(tǒng)計如表7所示,折線圖如圖3所示。

圖2 樣本比例為50%的LBP算子混淆矩陣

圖3 不同樣本比例的LBP算子、SIFT算法和CH算子提取識別率折線圖(AID數(shù)據(jù)集)

表7 不同樣本比例的LBP算子、SIFT算法和CH算子特征提取識別率統(tǒng)計(AID數(shù)據(jù)集)
根據(jù)表7 和圖3 可以得到以下結(jié)論:(1)CH算子的識別率明顯高于LBP算子和SIFT算法;(2)隨著樣本比例的增大,CH算子、LBP算子和SIFT算法的識別率都呈增長趨勢[14]。
通過三種不同的算法的比較,密集的住宅和停車場的識別率較高。橋、中心、火車站、旅游勝地、學校和廣場的識別率較低[15]。總體上,不管是哪種算法,樣本比例越高,場景的識別率越高;在低層次場景識別上,CH算子提取的特征比LBP算子和SIFT的效果好。
本文在基于大數(shù)據(jù)的高分辨遙感圖像識別過程中,通過LBP 算子、SIFT 算法和CH 算子對RS19 數(shù)據(jù)集和AID 數(shù)據(jù)集進行遙感場景識別,通過其結(jié)果不難看出:CH算子的識別率最高,LBP算子的識別率其次,SIFT 算子的識別率最低;識別率隨著樣本比例的提高也逐漸提高。雖然低層特征所需的資源消耗少,但是其精度仍然是有限的(總體低于50%),后續(xù)將采用中層特征和高層特征來進行遙感場景的分類識別。