基于深度信念網(wǎng)絡(luò)的高光譜影像森林類(lèi)型識(shí)別①

2020-04-24 02:21:50羅仙仙許松芽肖美龍陳正超

計(jì)算機(jī)系統(tǒng)應(yīng)用 2020年4期

關(guān)鍵詞：分類(lèi)深度

羅仙仙,許松芽,肖美龍,嚴(yán) 洪,陳正超

1(泉州師范學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,泉州 362000)

2(福建省大數(shù)據(jù)管理新技術(shù)與知識(shí)工程重點(diǎn)實(shí)驗(yàn)室,泉州 362000)

3(泉州師范學(xué)院教育科學(xué)學(xué)院,泉州 362000)

4(泉州市林業(yè)局森林資源管理站,泉州 362000)

5(福建省林業(yè)調(diào)查規(guī)劃院,福州 350000)

6(中國(guó)科學(xué)院遙感與數(shù)字地球研究所,北京 100094)

森林類(lèi)型分類(lèi)或樹(shù)種識(shí)別是森林經(jīng)營(yíng)與管理的關(guān)鍵環(huán)節(jié),高光譜遙感技術(shù)用于森林類(lèi)型或樹(shù)種識(shí)別取得一系列的成果[1-3].近20年來(lái),以高光譜遙感圖像為數(shù)據(jù)源的森林類(lèi)型、樹(shù)種類(lèi)型的識(shí)別算法主要分為基于光譜特征[4]、基于光譜匹配[5]和基于統(tǒng)計(jì)分析方法[3,4].但由于高光譜圖像數(shù)據(jù)量大且存在較高的譜間相關(guān)性和空間相關(guān)性,導(dǎo)致Hughes 現(xiàn)象[6],通常采取特征選擇和特征提取兩種方式進(jìn)行降維處理.特征選擇的目的是選擇出對(duì)分類(lèi)最有用的參數(shù),壓抑或限制無(wú)用信息,使選擇后的特征參數(shù)盡可能大地反映類(lèi)別之間的差異,并且彼此之間的相關(guān)性盡可能弱.王玲段等運(yùn)用最佳指數(shù)法、波段指數(shù)法對(duì)HJ-1A 衛(wèi)星HIS 影像進(jìn)行波段選擇,篩選出3 種波段組合(28-40-77、28-54-75、20-40-58)集中在紅光和近紅外波段,對(duì)3 種經(jīng)濟(jì)林識(shí)別精度達(dá)到70%以上[7].李俊明等用光譜混合距離判斷出HJ-1A 影像中波長(zhǎng)508.42 nm、696.85 nm、885.18 nm 為區(qū)分闊葉林和混交林的最佳波段組合[8].Koedsin 等采取遺傳算法對(duì)EO-1Hyperion 高光譜數(shù)據(jù)進(jìn)行波段選取7 波段(549、712、732、1034、1235、2073、2083 nm)的“染色體”獲得最高樹(shù)種可分性[9].特征提取是建立在各光譜波段間的重組和優(yōu)化基礎(chǔ)上的運(yùn)算.通過(guò)數(shù)學(xué)變換的方式將原始數(shù)據(jù)矢量空間投影到維數(shù)低的新的空間中,從而實(shí)現(xiàn)降低空間維的目的,但改變了圖像的原有特性.高光譜特征提取和特征壓縮技術(shù)主要包括最小噪音分離變換、典范變量分析、獨(dú)立成分分析ICA 以及主成分分析PCA.Ballanti等人與Zhang 等人均采用最小噪音分離變換方法對(duì)高光譜數(shù)據(jù)進(jìn)行特征提取,并取得較好樹(shù)種識(shí)別精度[3,4].

深度學(xué)習(xí)是當(dāng)前機(jī)器學(xué)習(xí)與人工智能研究熱點(diǎn),是指超過(guò)三層的神經(jīng)網(wǎng)絡(luò)模型[10],模仿人類(lèi)大腦的層次結(jié)構(gòu),是一組嘗試通過(guò)使用體系結(jié)構(gòu)的多個(gè)非線(xiàn)性變換組成模型中數(shù)據(jù)的高級(jí)抽象機(jī)器學(xué)習(xí)算法.深度學(xué)習(xí)由加拿大多倫多大學(xué)Hinton 教授于2006年提出的一種有效的特征提取及分類(lèi)方法[11],被應(yīng)用到語(yǔ)音識(shí)別、圖像識(shí)別、計(jì)算機(jī)視覺(jué)等領(lǐng)域,并取得了良好的識(shí)別效果.深度學(xué)習(xí)典型方法包括限制玻爾茲曼機(jī)、深度信念網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)和自動(dòng)編碼器等[12].深度學(xué)習(xí)新方法包括遞歸神經(jīng)網(wǎng)絡(luò)及其變種模型長(zhǎng)短時(shí)記憶模型和生成對(duì)抗網(wǎng)絡(luò)等.深度學(xué)習(xí)方法用于遙感圖像處理取得快速發(fā)展[13-15],由于深度學(xué)習(xí)方法訓(xùn)練與測(cè)試需要大量樣本數(shù)據(jù),大多對(duì)現(xiàn)有標(biāo)準(zhǔn)數(shù)據(jù)集[16]進(jìn)行研究,實(shí)際應(yīng)用微乎其微[17,18],在林業(yè)遙感領(lǐng)域,只見(jiàn)李英杰等人利用線(xiàn)性稀疏自動(dòng)編碼器用于林業(yè)圖像分類(lèi)研究[19].目前,尚未見(jiàn)文獻(xiàn)報(bào)道深度學(xué)習(xí)方法在林業(yè)高光譜遙感分類(lèi)中應(yīng)用.因此,論文將研究深度信念網(wǎng)絡(luò)用于環(huán)境與災(zāi)害監(jiān)測(cè)預(yù)報(bào)小衛(wèi)星HJ-1A 高光譜影像森林類(lèi)型識(shí)別研究,通過(guò)深層的學(xué)習(xí),可以充分、自動(dòng)、高效利用高光譜的各個(gè)波段進(jìn)行特征提取,為高光譜林業(yè)遙感處理,乃至智慧林業(yè)等方向研究提供新的研究視角.

1 研究方法

1.1 受限玻爾茲曼機(jī)

1.1.1 受限玻爾茲曼機(jī)模型

一個(gè)受限制玻爾茲曼機(jī)有兩層,如圖1 所示,一層是輸入層v(或說(shuō)可見(jiàn)層),i 為任意一個(gè)節(jié)點(diǎn);另一層是輸出h(或隱藏層),j 是其中的一個(gè)節(jié)點(diǎn),可見(jiàn)層與隱藏層為全連接關(guān)系.同一層的單元之間沒(méi)有連接關(guān)系.RBM 是一個(gè)無(wú)向的生成能量模型,RBM 所具有能量如式(1)所示.

圖1 RBM 模型示意圖

同理,給定隱藏層節(jié)點(diǎn)的參數(shù)時(shí),可見(jiàn)層任一節(jié)點(diǎn)的激活概率為:

其中,σ (x)是由邏輯函數(shù)定義的S 型函數(shù),Sigmoid 函數(shù)為:

1.1.2 限玻爾茲曼機(jī)的訓(xùn)練

dk表示期輸出或目標(biāo)輸出,ok表示響應(yīng)于訓(xùn)練像素的實(shí)際輸出,總共為K 個(gè)輸出.為了最小化誤差E,可計(jì)算E 相對(duì)于網(wǎng)絡(luò)中每個(gè)權(quán)重和偏置值的偏導(dǎo)數(shù),通過(guò)對(duì)比散度算法(Contrastive Divergence,CD)可以快速進(jìn)行參數(shù)更新,更新規(guī)則為[20]:

式中,ε為學(xué)習(xí)率.〈 ·〉data是對(duì)數(shù)據(jù)分布的期望值,〈·〉recon是對(duì)模型分布的期望值.

1.2 深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)

一個(gè)深度信念網(wǎng)絡(luò)由多層RBM 構(gòu)成,如圖2 所示.DBN 有兩個(gè)關(guān)鍵的訓(xùn)練步驟:一個(gè)是預(yù)訓(xùn)練,另一個(gè)是微調(diào).

圖2 深度信念網(wǎng)絡(luò)的生成模型

1.2.1 預(yù)訓(xùn)練

預(yù)訓(xùn)練DBN 是無(wú)監(jiān)督的過(guò)程.采用對(duì)比散度算法,自底向上逐層訓(xùn)練RBM,直到最后的隱藏層為止,這樣使DBN 從原始的輸入數(shù)據(jù)中提取更多的深層特征.

1.2.2 使用反向傳播算法進(jìn)行微調(diào)

反向傳播算法最初是由Rumbelhart 提出的,是監(jiān)督分類(lèi)的過(guò)程.在預(yù)訓(xùn)練中,通過(guò)逐層訓(xùn)練,得到最終預(yù)測(cè)的分類(lèi)結(jié)果.然而,真實(shí)的結(jié)果與實(shí)際預(yù)測(cè)結(jié)果存在誤差,反向傳播算法根據(jù)此誤差向后微調(diào)DBN 的參數(shù),并通過(guò)靈敏度 δk修正網(wǎng)絡(luò)參數(shù),對(duì)于某一輸出層,若第k 個(gè)節(jié)點(diǎn)的實(shí)際預(yù)測(cè)為 ok,真實(shí)的結(jié)果為dk,其靈敏度定義為:

批處理的更新規(guī)則如下:

1.3 分類(lèi)精度指標(biāo)評(píng)價(jià)

1.3.1 總體精度

對(duì)分類(lèi)結(jié)果質(zhì)量的總體評(píng)價(jià)可以用總體精度來(lái)表示,總體精度等同于被正確分類(lèi)的像素總數(shù)除以總像素個(gè)數(shù)的總和.在混淆矩陣的對(duì)角線(xiàn)上,分布著被正確分類(lèi)的像素個(gè)數(shù),它能夠匹配正確分類(lèi)的像素?cái)?shù)與真實(shí)分類(lèi)的個(gè)數(shù).根據(jù)混淆矩陣計(jì)算總體精度的公式可以列出如下:

其中,C 表示分類(lèi)的總體個(gè)數(shù),mii表示混淆矩陣對(duì)角線(xiàn)上的元素,N 代表測(cè)試樣本的總數(shù).

1.3.2 Kappa 系數(shù)

Kappa 系數(shù)是采用多元離散分析技術(shù)來(lái)反映分類(lèi)結(jié)果與參考數(shù)據(jù)之間的一致性的指標(biāo).由于它將混淆矩陣中的全部因子都考慮在內(nèi),因此將其視為一個(gè)更為客觀(guān)的評(píng)價(jià)指標(biāo),其定義為:

其中,mi+,m+i分別代表混淆矩陣中第i 行與第i 列的總和,Kappa 系數(shù)與分類(lèi)精度密切相關(guān),呈正比關(guān)系.一般來(lái)說(shuō),Kappa 系數(shù)越高,分類(lèi)精度越高.

2 實(shí)驗(yàn)

2.1 實(shí)驗(yàn)區(qū)域與高光譜數(shù)據(jù)

研究選用HJ-1A 星HSI 數(shù)據(jù)2 級(jí)產(chǎn)品,成像時(shí)間為2011年8月24日,共115 個(gè)波段,空間分辨率為100 m.研究區(qū)為福建省泉州市德化縣西部8 個(gè)鄉(xiāng)鎮(zhèn),其行政區(qū)范圍及假彩色合成影像(第105、70、40 波段進(jìn)行假彩色合成)如圖3.該產(chǎn)品影像數(shù)據(jù)經(jīng)過(guò)系統(tǒng)幾何校正和輻射校正,校正誤差不小于一個(gè)像元,校正后影像統(tǒng)一到指定的地圖投影坐標(biāo)系下(西安1980 坐標(biāo)系).HSI 影像數(shù)據(jù)的部分波段存在明顯的條紋,主要包括第1-29 波段,嚴(yán)重影響圖像的質(zhì)量和應(yīng)用,因而本研究將前29 個(gè)波段剔除,剩余86 個(gè)波段,波長(zhǎng)區(qū)間范圍(529.6350-951.54 nm).

2.2 實(shí)驗(yàn)處理流程

實(shí)驗(yàn)總體處理流程如圖4 所示,先進(jìn)行數(shù)據(jù)準(zhǔn)備,然后搭建好tensorflow1.11.0 框架開(kāi)發(fā)環(huán)境,數(shù)據(jù)集轉(zhuǎn)換成Python 程序容易處理的csv 文件,進(jìn)行訓(xùn)練集與測(cè)試集劃分,再進(jìn)行實(shí)驗(yàn)對(duì)比.實(shí)驗(yàn)基于Windows 10 64 位操作系統(tǒng),處理器型號(hào)為Intel(R)Core(TM)i5-8250U CPU @1.60 GHz 1.80 GHz,實(shí)驗(yàn)在PyCharm 2018.3x64 編輯器中進(jìn)行編碼與參數(shù)調(diào)優(yōu),加載Python 擴(kuò)展庫(kù),包括深度學(xué)習(xí)TensorFlow、numpy、Pandas、Matplotlib 等[21].

圖3 研究區(qū)及假彩色合成影像

圖4 實(shí)驗(yàn)處理流程

實(shí)驗(yàn)中,依據(jù)二類(lèi)調(diào)查數(shù)據(jù),選取帶標(biāo)簽樣本,同時(shí)對(duì)86 個(gè)波段數(shù)據(jù)作為DBN 的輸入,并進(jìn)行歸一化處理,同時(shí)對(duì)標(biāo)簽進(jìn)行獨(dú)熱編碼(One-hot 編碼),再對(duì)數(shù)據(jù)集進(jìn)行隨機(jī)打亂,選取訓(xùn)練、測(cè)試兩部分?jǐn)?shù)據(jù).將訓(xùn)練好的參數(shù)保存在Tensorboar 中,對(duì)整體數(shù)據(jù)加載、混淆矩陣輸出,繪制圖像,并將結(jié)果與SVM 對(duì)比.

2.3 訓(xùn)練樣本與測(cè)試樣本分配

研究區(qū)域共97 258 個(gè)像素點(diǎn)被分類(lèi),為提高DBN 分類(lèi)效果,通過(guò)多次預(yù)實(shí)驗(yàn),選取28 000 個(gè)已知類(lèi)別的像素點(diǎn)作為訓(xùn)練樣本與測(cè)試樣本,其中51 989 個(gè)像素點(diǎn)是針葉林,6142 個(gè)像素點(diǎn)是闊葉林,16 283 個(gè)像素點(diǎn)是混交林,其余28 986 個(gè)像素點(diǎn)為非林地.在訓(xùn)練過(guò)程中,針葉林類(lèi)有10 000 個(gè)訓(xùn)練樣本,其他每個(gè)子類(lèi)有6000 個(gè)訓(xùn)練樣本.如表1.

表1 數(shù)據(jù)集標(biāo)簽分類(lèi)

3 結(jié)果與分析

3.1 隱藏層層數(shù)對(duì)分類(lèi)結(jié)果的影響

目前,由于對(duì)于DBN 結(jié)構(gòu)的選擇尚且沒(méi)有完善的理論基礎(chǔ),基本靠實(shí)驗(yàn)調(diào)參,給出最優(yōu)參數(shù).合適的網(wǎng)絡(luò)深度影響最終分類(lèi)結(jié)果與運(yùn)行時(shí)間.當(dāng)DBN 的層數(shù)過(guò)多,容易過(guò)擬合現(xiàn)象.反之,容易產(chǎn)生欠擬合現(xiàn)象.實(shí)驗(yàn)中,首先固定其它超參數(shù),如學(xué)習(xí)率為0.001,激活函數(shù)為Sigmoid,批處理量100,梯度下降方式采取rmsp,迭代次數(shù)1000,cd-k 為1.每個(gè)隱藏層節(jié)點(diǎn)數(shù)均采用256.對(duì)DBN 的層數(shù)是從{3,4,5,6,7}中選取,采用網(wǎng)絡(luò)搜索方式進(jìn)行參數(shù)調(diào)優(yōu),不同隱藏層層數(shù)對(duì)分類(lèi)結(jié)果影響見(jiàn)圖5.當(dāng)隱藏層層數(shù)為3 時(shí),總體精度與Kappa 系數(shù)最大.

圖5 不同隱藏層層數(shù)對(duì)分類(lèi)結(jié)果的影響

3.2 隱藏層節(jié)點(diǎn)數(shù)對(duì)分類(lèi)結(jié)果的影響

隱藏層節(jié)點(diǎn)數(shù)量選擇不當(dāng)常常造成訓(xùn)練出現(xiàn)“過(guò)擬合”現(xiàn)象.隱藏節(jié)點(diǎn)過(guò)少時(shí),網(wǎng)絡(luò)對(duì)數(shù)據(jù)的擬合性能很差,甚至無(wú)法有效的完成分類(lèi)任務(wù);過(guò)多時(shí),會(huì)造成訓(xùn)練時(shí)間增加,尋找最優(yōu)解過(guò)程中陷入局部最優(yōu)的機(jī)率提高.實(shí)驗(yàn)中,固定DBN 的層數(shù)為3,其它超參數(shù)也不變,隱藏層的節(jié)點(diǎn)數(shù)量依次從{16,32,64,128,256,512}中選取,實(shí)驗(yàn)結(jié)果如圖6 所示,當(dāng)隱藏層節(jié)點(diǎn)數(shù)為256 時(shí),總體精度和Kappa 系數(shù)最大.

圖6 隱藏層節(jié)點(diǎn)數(shù)對(duì)分類(lèi)結(jié)果的影響

3.3 與支持向量機(jī)分類(lèi)方法的比較

支持向量機(jī)方法采用的核函數(shù)為徑向基函數(shù)(RBF),懲罰因子C 的范圍在[1,0.1,0.001]上尋找,訓(xùn)練樣本與測(cè)試樣本與DBN 方式保持一致.采用5 折交叉驗(yàn)證與網(wǎng)絡(luò)搜索方法對(duì)SVM 進(jìn)行參數(shù)調(diào)優(yōu),當(dāng)C 值取1 時(shí)獲得最高總體精度,達(dá)到73%,Kappa 系數(shù)為0.6447.深度信念網(wǎng)絡(luò)與支持向量機(jī)分類(lèi)結(jié)果比較,見(jiàn)表2 與圖7.圖7 中,綠色為針葉林,闊葉林為黃色,粉紅色為混交林,藍(lán)色為非林地.

表2 不同方法分類(lèi)效果比較

圖7 不同方法分類(lèi)結(jié)果

從表2 可知,DBN 在各森林類(lèi)型的分類(lèi)精度以及總體精度、Kappa 系數(shù)都略高于SVM.究其原因,深度信念網(wǎng)絡(luò)方法將高光譜所有波段特征全部作為輸入,通過(guò)受限玻爾茲曼機(jī)的無(wú)監(jiān)督學(xué)習(xí),自底向上進(jìn)行預(yù)訓(xùn)練,獲取初始特征參數(shù),對(duì)各種森林類(lèi)型進(jìn)行深層特征提取;同時(shí),通過(guò)自頂向下的有監(jiān)督學(xué)習(xí)進(jìn)行參數(shù)調(diào)優(yōu),更有效挖掘出森林類(lèi)型地物特征,提高分類(lèi)效果.

當(dāng)隱藏層層數(shù)為3,隱藏層節(jié)點(diǎn)數(shù)為256 時(shí),是深度信念網(wǎng)絡(luò)的最優(yōu)參數(shù),此時(shí),DBN 分類(lèi)結(jié)果的混淆矩陣見(jiàn)表3.由表3 可知,闊葉林精度最低,僅為83.0%.混交林精度最高,達(dá)到95.4%.

表3 最優(yōu)參數(shù)的DBN 分類(lèi)方法混淆矩陣

4 結(jié)論與討論

4.1 結(jié)論

本文借助DBN 模型與HJ/1A 高光譜影像,通過(guò)無(wú)監(jiān)督的預(yù)訓(xùn)練和有監(jiān)督的微調(diào)對(duì)泉州市德化縣西部8 個(gè)鄉(xiāng)鎮(zhèn)進(jìn)行森林類(lèi)型識(shí)別研究,通過(guò)大量實(shí)驗(yàn)調(diào)參,層數(shù)為3,每層節(jié)點(diǎn)數(shù)為256 的網(wǎng)絡(luò)結(jié)構(gòu)對(duì)森林類(lèi)型識(shí)別效果最好,總體精度達(dá)85.8%,Kappa 系數(shù)為0.785,好于支持向量機(jī)的分類(lèi)結(jié)果,證明了深度信念網(wǎng)絡(luò)用于森林類(lèi)型分類(lèi)的優(yōu)越性.

4.2 討論

(1)本文利用深度信念網(wǎng)絡(luò)方法進(jìn)行森林類(lèi)型識(shí)別研究,具有研究方法創(chuàng)新,該方法分類(lèi)結(jié)果好于傳統(tǒng)決策向量機(jī),但該方法如何解決“同物異譜”和“同譜異物”的機(jī)理尚不明確.

(2)結(jié)合二類(lèi)調(diào)查數(shù)據(jù),選取近1/3 的樣本作為訓(xùn)練與測(cè)試樣本,才提高了分類(lèi)效果,但現(xiàn)實(shí)研究中,如果樣本量較少,或沒(méi)有樣本,如何利用對(duì)抗生成網(wǎng)絡(luò)進(jìn)行擴(kuò)展樣本將是下步研究重點(diǎn).

(3)本文僅從光譜特征出發(fā),沒(méi)有利用空間特征,以及光譜特征與空間特征(空譜聯(lián)合特征),而這些特征可以深層次的挖掘數(shù)據(jù)的內(nèi)部特征,是否可以提高分類(lèi)效果值得進(jìn)一步研究.

(4)最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)只是針對(duì)森林類(lèi)型識(shí)別而言,二級(jí)、三級(jí)地類(lèi)識(shí)別的最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)需要進(jìn)一步研究,同時(shí),迫切需要建立適用于林業(yè)遙感的深度學(xué)習(xí)分類(lèi)方法的標(biāo)準(zhǔn)與規(guī)范.