999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于未標簽信息主動學習算法的高光譜影像分類

2017-09-03 10:23:54羅祎敏馬洪超
計算機應用 2017年6期
關鍵詞:分類

張 良,羅祎敏,馬洪超,張 帆,胡 川

(1.湖北大學 資源環境學院,武漢 430062; 2.武漢大學 遙感信息工程學院,武漢 430079; 3.國網湖北省電力公司 檢修公司,武漢 430077)

基于未標簽信息主動學習算法的高光譜影像分類

張 良1*,羅祎敏2,馬洪超2,張 帆1,胡 川3

(1.湖北大學 資源環境學院,武漢 430062; 2.武漢大學 遙感信息工程學院,武漢 430079; 3.國網湖北省電力公司 檢修公司,武漢 430077)

(*通信作者電子郵箱zhangliang_hubeiU@hotmail.com)

針對高光譜遙感影像分類中,傳統的主動學習算法僅利用已標簽數據訓練樣本,大量未標簽數據被忽視的問題,提出一種結合未標簽信息的主動學習算法。首先,通過K近鄰一致性原則、前后預測一致性原則和主動學習算法信息量評估3重篩選得到預測標簽可信度高并具備一定信息量的未標簽樣本;然后,將其預測標簽當作真實標簽加入到標簽樣本集中; 最后,訓練得到更優質的分類模型。實驗結果表明,與被動學習算法和傳統的主動學習算法相比,所提算法能夠在同等標記的代價下獲得更高的分類精度,同時具有更好的參數敏感性。

高光譜遙感;主動學習;圖像分類;未標簽信息。

0 引言

高光譜遙感圖像分類是圖像處理技術中重要的一類技術,其標簽樣本的獲取十分困難,所以如何利用有限的訓練樣本獲得更優的分類模型是一個備受關注的問題[1]。近幾年,隨著機器學習的不斷發展,越來越多的機器學習算法,如深度學習[2]、遷移學習[3]、流行學習[4]和主動學習已經被應用于高光譜遙感圖像分類問題中[5]。其中主動學習算法通過篩選高質量的訓練樣本,從而在有限數量的訓練樣本幫助下獲得更優的分類模型[6],相比于被動學習的隨機選擇樣本進行標注,主動學習算法能通過優化選擇訓練樣本,使得訓練集合的構成更有目的性,避免了盲目標注的弊病,提高了分類精度,受到了學界的廣泛關注。然而,能夠成為訓練樣本的標簽數據畢竟是少數,在高光譜圖像數據中還有大量未標記信息沒有被利用。因此,如何利用未標記的數據來輔助標簽數據,并設計出高效的半監督的主動學習算法是一個重要方向[7]。實際上,部分未標注數據中可以被分類器預測正確,對于這種未標簽信息如果加入訓練樣本集,將其預測標簽當作真實標簽賦給它們,可能大大降低人工標記的成本[8]。

基于上述考慮,本文提出了一種結合未標簽信息的主動學習算法,通過可信度和信息量的雙重篩選,從未標簽數據中選出信息量大且預測標簽可信度高的未標簽數據,將其預測標簽當作真實標簽使用,并組建新的訓練樣本集,從而訓練得到更優質的分類模型。

1 主動學習算法

主動學習的目的就在于選擇出最具標注價值的樣本,獲得最優的訓練樣本集,從而達到優化分類模型的效果。這個概念最早由Angluin[9]在1988年提出,隨著對其研究的不斷深入,主動學習技術已被廣泛應用于各個領域。Tuia等[10-11]對多種經典的主動學習算法在高光譜遙感影像分類上的應用作了歸納,其中包括邊緣取樣主動學習算法、基于支持向量的邊緣取樣算法、熵值裝袋查詢算法和基于后驗概率取樣算法BT(Breaking Ties)。另外,Di 等[12-13]在2012年提出多視圖的主動學習算法,通過不同的波段子集組合投票表示樣本點的分歧度從而得到其標注價值。Crawford 等[14]對以上文獻中經典的多種主動學習算法進行了總結論述,并將它們作用于高光譜遙感影像數據進行實驗分析。實驗證明,主動學習算法的應用可以顯著地降低樣本標注成本。

就高光譜遙感圖像的分類問題而言,主動學習算法應用的基本流程如圖1所示,其中:C為一個或多個分類器;L為有標簽的訓練樣本集;Q為待標記樣本選擇策略,用于查找未標簽樣本中信息量大的能幫助提高分類精度的樣本;U為整個未標簽樣本集;S為標注專家,負責對Q中篩選出的候選樣本進行人工標記。由圖1可知,主動學習算法的核心是待標記樣本點的選擇策略。選擇策略的目的就是選出對分類器性能和分類效果提高有貢獻的信息量大的待標記樣本點。

圖1 主動學習流程

主動學習算法中,BT算法是建立后驗概率之上的算法,所以,所屬每類概率的獲得是算法實現的基礎。就每個樣本點xi屬于w類的概率p而言,對于支持向量機(Support Vector Machine, SVM)的決策函數輸出,可以使用sigmoid函數估計所得,如式(1)所示。

(1)

其中A和B都是估計值[14]。得到每個樣本點所屬每類的概率之后,根據BT算法的思想,首先通過訓練集構造SVM分類器,再按照式(1)得到將候選集C中每個樣本點屬于各個類別(分類器中N個分類類別)的概率,然后對樣本點最大概率和次大概率差值排序,最后根據式(2)選取部分差值最小的點作為待標記樣本點,標記后加入到訓練樣本集L中。

(2)

2 結合未標簽信息的主動學習算法

傳統的主動學習算法的每次迭代過程,都有大量不滿足選擇策略Q的未標簽樣本被重新放回至未標簽集U,并在下一次迭代中又重新參與計算,這樣大大增加了算法的時間復雜度和計算復雜度。另一方面,部分未標簽樣本同樣可以提供有效的信息,卻未能被有效利用。因此,本文提出結合未標簽信息的主動學習算法。在原主動學習算法流程之上,針對不滿足條件的未標簽樣本R,采用未標簽樣本選擇策略Q′進行未標簽樣本的篩選,將滿足條件的預測標簽作為真實標簽,使這些未標簽樣本成為標簽樣本,與人工標簽樣本一同加入訓練集L訓練,更新分類模型,算法流程如圖2所示。

由圖2可得,結合未標簽信息的主動學習算法的核心在于未標簽樣本選擇策略Q′。選出的未標簽樣本的預測標簽的可靠性會極大影響訓練樣本集的整體質量。另外,如果篩選出信息量小的未標簽樣本太多,也會削弱大信息量樣本的作用。更糟糕的是,那些信息量小的未標簽樣本一旦被預測錯誤,給分類器帶來嚴重錯誤的訓練信息。所以,為了優化分類器,被選出的未標簽樣本及賦予它的預測標簽必須同時具有可靠性和較高的信息量。而其中信息量由不確定度來判斷,不確定度越高的像素點被錯分的概率就越大,就代表其越難被判斷為具體哪一類別,其信息量也就越大。

圖2 結合未標簽信息的主動學習算法流程

針對上述問題,為了篩選出高質量的未標簽樣本,本文設計了如下未標簽信息的選擇策略Q′,這個策略包括三個重要的過程:K近鄰一致性判斷,前后預測一致性判斷和信息量判斷。具體流程如圖3所示,前兩個篩選步驟保證了所選樣本預測標簽的可靠性,最后一個篩選步驟保證了所選樣本的具備較高的信息量,優化分類模型。

圖3 未標簽樣本選擇流程

1)K近鄰一致性判斷策略:由K近鄰分類算法思想衍生而來[15],K近鄰分類算法是一種非常經典的分類算法,該算法認為,兩個光譜角距離較小的像素相似度較高,被歸于同一類別的可能性也較高。故在這里K近鄰的思想可以被用于保證未標簽樣本預測標簽的可靠性。其方法是將待標記樣本的預測標簽和其相似度最高的K個近鄰的預測或者真實標簽進行比對,如果全部一致,就說明該未標記樣本的預測標簽可信度高,其運算式可表示為式(3)。這里相似度的度量也是采取光譜角距離。對未標簽樣本u來說,不一致系數的計算如式(1),其中k為所選近鄰個數,fl(u)和fl(xi)為u和xi的預測或真實標簽。

(3)

2)前后預測一致性判斷策略:K近鄰一致性判斷是橫向比較,該一致性判斷是縱向比較,進一步確保未標簽樣本預測標簽的可靠性,通過比較未標簽樣本當前和上一次迭代過程中分類器對其標簽預測的結果進行判斷[8]。如果近鄰標簽和該未標簽樣本預測標簽全部表現一致,就說明這個未標簽樣本的預測標簽可靠。因為前后兩次所訓練出的分類器,對該點的類別判定一致,那么該點預測標簽的可靠性便可進一步得到保證。

3)信息量估計策略:雖然前兩步篩選所得的未標簽樣本的預測標簽正確性可以保證,但是這些點的信息量沒有被評估,如果其中信息量小的未標簽樣本太多,會削弱少數的信息量大的樣本的作用,而真正能為分類器的優化和分類精度的提高做貢獻的是那些信息量大的樣本。所以,需要利用主動學習算法的思想對那些預測標簽正確性有保障的未標簽樣本進行信息量的篩選。利用式(1)和(2)對第1)、2)步已經篩選出來未標簽樣本點進行信息量的評估和排序,取信息量較高的未標簽信息加入到訓練樣本集中。

3 實驗與結果分析

3.1 數據介紹

本文選用博茨瓦納數據(BOTswana,BOT)和美國波士頓數據(簡稱KSC)為實驗數據。BOT于2001年5月在OkavangoDelta、Botswana地區采集,該地區包括濕地和高地兩個生態系統,光譜范圍是 357~2 576nm,光譜分辨率為10nm,空間分辨率為 30m×30m,共 145 個波段。KSC于1996年3月美國肯尼迪航天中心由可見光紅外成像光譜儀拍攝,該地區同樣包括濕地和高地兩個生態系統,光譜范圍為400~2 500nm,光譜分辨率為10nm,空間分辨率為 18m×18m,共 176個波段。

兩組實驗研究區域高光譜影像的假彩色影像以及地面真實標記數據如圖4~5所示。

圖4 BOT數據

圖5 KSC數據

3.2 算法有效性分析

為了評價本文算法效果,分別對被動學習算法、主動學習算法和結合未標簽信息的主動學習算法對兩組高光譜影像數據的分類結果進行對比。每組實驗數據中的標簽數據依舊被分為三份:標簽樣本集、未標簽樣本集和測試樣本集。BOT、KSC實驗樣本數據分配如表1所示。

表1 實驗樣本數據分配

為驗證算法的有效性這里的總體分類精度為20次實驗結果的平均值,近鄰數K設置為7,取信息量較高的前50%,分類器選擇為支持向量機lib-SVM。對比結果如圖6所示。

圖6 不同數據分類精度實驗結果

從圖6中可以得到,結合未標簽信息的主動學習算法優于主動學習算法和被動學習算法。其中BOT數據在同樣達到效果最為明顯,僅迭代兩次就達到了飽和,分類精度最高高出主動學習算法5.146 4%。對于KSC數據效果在前5次迭代時非常明顯,分類精度最高可高出主動學習算法2.796 3%。由此可見,在同等迭代次數(標記樣本數)下,結合未標簽信息的主動學習算法能夠獲得更高的分類精度。

3.3 參數敏感性分析

結合未標簽信息的主動學習算法中有一個重要的參數K,K代表未標簽樣本選擇過程中近鄰一致性判斷的近鄰數。在不同K值下的對比結果如圖7所示。

圖7 不同數據參數敏感性分析結果

由圖7可知,不同K值下的分類精度曲線差異較小,幾條線基本可以重疊。說明本文算法穩定性較好,對參數K取值敏感性較小。

4 結語

本文提出的結合未標簽信息的主動學習算法,通過可信度和信息量的雙重篩選,從未標簽數據中選出信息量大且預測標簽可信度高的未標簽數據,將其預測標簽當作真實標簽使用,并組建新的訓練樣本集,從而訓練得到更優質的分類模型。實驗證明,與被動學習算法和傳統的主動學習算法相比,在同等標記代價下,結合未標簽信息的主動學習算法能夠獲得更高的分類精度。另一方面,未標簽樣本的選擇過程過于繁瑣,計算量過于龐大,有待繼續探索更高效的解決方案。

)

[1] 郝澤東,余淞淞,關佶紅.基于主動學習的高光譜圖像分類方法[J].計算機應用,2013,33(12):3441-3443,3448.(HAOZD,YUSS,GUANJH.Hyperspectralimageclassificationbasedonactivelearning[J].JournalofComputerApplications, 2013, 33(12): 3441-3443, 3448.)

[2]CHENYC,LINZH,ZHAOX,etal.Deeplearning-basedclassificationofhyperspectraldata[J].IEEEJournalofSelectedTopicsinAppliedEarthObservationsandRemoteSensing, 2014, 7(6): 2094-2107.

[3]RAJANS,GHOSHJ.Exploitingclasshierarchiesforknowledgetransferinhyperspectraldata[J].IEEETransactionsonGeoscienceandRemoteSensing, 2006, 44(11): 3408-3417.

[4]KIMW,CRAWFORDMM.Adaptiveclassificationforhyperspectralimagedatausingmanifoldregularizationkernelmachines[J].IEEETransactiononGeoscienceandRemoteSensing, 2012, 48(11): 4110-4121.

[5] 陳進.高光譜圖像分類方法研究[D].長沙:國防科學技術大學,2010:11-12.(CHENJ.Onclassificationmethodofhyperspectralimages[D].Changsha:NationalUniversityofDefenseTechnology, 2010: 11-12.)

[6]TUIAD,RATLEF,PACIFICIF,etal.Activelearningmethodsforremotesensingimageclassification[J].IEEETransactionsonGeoscienceandRemoteSensing, 2009, 47(7): 2218-2232.

[7] 劉康.基于主動學習的高光譜圖像分類技術研究[D].北京:中國礦業大學(北京),2014:12-13.(LIUK.Hyperspectralsensingimageclassificationtechnologybasedonactivelearning[D].Beijing:ChinaUniversityofMiningandTechnology(Beijing), 2014: 12-13.)

[8]WANLJ,TANGK,LIMZ,etal.Collaborativeactiveandsemisupervisedlearningforhyperspectralremotesensingimageclassification[J].IEEETransactionsonGeoscienceandRemoteSensing, 2015. 53(5): 2384-2396.

[9]ANGLUIND.Queriesandconceptlearning[J].MachineLearning, 1988, 2(4): 319-342.

[10]TUIAD,RATLEF,PACIFICIF,etal.Activelearningmethodsforremotesensingimageclassification[J].IEEETransactionsonGeoscienceandRemoteSensing, 2009, 47(7): 2218-2232.

[11]TUIAD,PASOLLIE,EMERYWJ.Usingactivelearningtoadaptremotesensingimageclassifiers[J].RemoteSensingofEnvironment, 2011, 115(9): 2232-2242.

[12]DIW,CRAWFORDMM.Viewgenerationformultiviewmaximumdisagreementbasedactivelearningforhyperspectralimageclassification[J].IEEETransactionsonGeoscienceandRemoteSensing, 2012, 50(5): 1942-1954.

[13]DIW,CRAWFORDMM.Multi-viewadaptivedisagreementbasedactivelearningforhyperspectralimageclassification[C]//Proceedingsofthe2010IEEEInternationalGeoscienceandRemoteSensingSymposium.Piscataway,NJ:IEEE, 2010: 1374-1377.

[14]CRAWFORDMM,TUIAD,YANGHL.Activelearning:anyvalueforclassificationofremotelysenseddata[J].ProceedingsoftheIEEE, 2013, 101(3): 593-608.

[15]LIJ,BIOUCAS-DIASJM,PLAZAA.Semi-supervisedhyperspectralimagesegmentationusingmultinomiallogisticregressionwithactivelearning[J].IEEETransactionsonGeoscienceandRemoteSensing, 2010, 48(11): 4085-4098

ThisworkispartiallysupportedbytheNationalNaturalScienceFoundationofChina(41601504).

ZHANG Liang, born in 1986, Ph. D., lecturer. His research interests include machine learning, intelligent classification of remote sensing image, three-dimensional point cloud data processing.

LUO Yimin, born in 1993, M. S. candidate. Her research interests include intelligent classification of remote sensing image.

MA Hongchao, born in 1968, Ph. D., professor. His research interests include machine learning, intelligent classification of remote sensing image, three-dimensional point cloud data processing.

ZHANG Fan, born in 1981, Ph. D., lecturer. His research interests include machine learning, signal processing.

HU Chuan, born in 1985, M. S. candidate. His research interests include machine learning, smart grid.

Hyperspectral remote sensing image classification based on active learning algorithm with unlabeled information

ZHANG Liang1*, LUO Yimin2, MA Hongchao2, ZHANG Fan1, HU Chuan3

(1.FacultyofResourcesandEnvironmentalScience,HubeiUniversity,WuhanHubei430062,China; 2.SchoolofRemoteSensingandInformationEngineering,WuhanUniversity,WuhanHubei430079,China; 3.MaintenanceCompany,StateGridHubeiElectricPowerCompany,WuhanHubei430077,China)

In hyperspectral remote sensing image classification, the traditional active learning algorithms only use labeled data for training sample, massive unlabeled data is ignored. In order to solve the problem, a new active learning algorithm combined with unlabeled information was proposed. Firstly, by realizing triple screening ofKneighbor consistency principle,predict consistency principle, and information evaluation of active learning, the unlabeled sample with a certain amount of information and highly reliable prediction label was obtained. Then, the prediction label was added to the label sample set as real label. Finally, an optimized classification model was produced by training the sample. The experimental results show that, compared with the passive learning algorithms and the traditional active learning algorithms, the proposed algorithm can obtain higher classification accuracy under the precondition of the same manual labeling cost and get better parameter sensitivity.

hyperspectral remote sensing; active learning; image classification; unlabeled information

2016- 10- 31;

2017- 01- 12。 基金項目:國家自然科學基金資助項目(41601504)。

張良(1986—),男,浙江紹興人,講師,博士,主要研究方向:機器學習、遙感影像智能分類、三維點云數據處理;羅祎敏(1993—),女,湖北武漢人,碩士研究生,主要研究方向:遙感影像智能分類; 馬洪超(1968—),男,浙江紹興人,教授,博士,主要研究方向:機器學習、遙感影像智能分類、三維點云數據處理; 張帆(1981—),男,湖北武漢人,講師,博士,主要研究方向:機器學習、信號處理;胡川(1985—),男,湖北黃石人,碩士研究生,主要研究方向:機器學習、智能電網。

1001- 9081(2017)06- 1768- 04

10.11772/j.issn.1001- 9081.2017.06.1768

P407.8

A

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數據分析中的分類討論
按需分類
教你一招:數的分類
主站蜘蛛池模板: 丁香五月亚洲综合在线| 9啪在线视频| 国产午夜福利亚洲第一| 亚洲国产精品人久久电影| 国产免费福利网站| 欧美在线观看不卡| 成人亚洲国产| 欧美日韩另类在线| 91视频日本| 亚洲视频在线观看免费视频| 国产成人高清亚洲一区久久| a亚洲视频| 色爽网免费视频| 51国产偷自视频区视频手机观看| 亚洲精品视频在线观看视频| 爱色欧美亚洲综合图区| 久久国产成人精品国产成人亚洲| 国产一区二区三区精品欧美日韩| 国产亚洲欧美在线中文bt天堂| 狠狠五月天中文字幕| 在线观看网站国产| 99在线视频精品| a级毛片视频免费观看| 波多野结衣第一页| www亚洲天堂| 亚洲婷婷六月| 亚洲中文字幕国产av| 久久精品人人做人人爽电影蜜月| 97se亚洲综合在线韩国专区福利| 日韩视频福利| 91在线无码精品秘九色APP| 久视频免费精品6| 成人小视频网| 亚洲系列中文字幕一区二区| 福利姬国产精品一区在线| 激情影院内射美女| 午夜福利视频一区| 国内a级毛片| 高清久久精品亚洲日韩Av| 日本在线视频免费| 国产在线观看人成激情视频| 色窝窝免费一区二区三区| 亚洲无码A视频在线| 人妻丰满熟妇αv无码| 亚洲无码日韩一区| 亚洲伦理一区二区| 国产人免费人成免费视频| 欧美色视频网站| 亚洲国产日韩欧美在线| 国产福利在线免费| 久久精品人人做人人爽97| 国产自在线播放| 久一在线视频| 91久久偷偷做嫩草影院精品| 亚洲国产欧美国产综合久久| 亚洲码在线中文在线观看| 久久中文字幕2021精品| 人人看人人鲁狠狠高清| 亚洲天堂网在线播放| 日本日韩欧美| 丝袜久久剧情精品国产| 东京热一区二区三区无码视频| 波多野结衣第一页| 国产欧美视频在线| 另类重口100页在线播放| 国产av一码二码三码无码| 大香伊人久久| 手机在线看片不卡中文字幕| 一本一本大道香蕉久在线播放| 一级看片免费视频| 国产成人AV男人的天堂| 91亚洲精选| 国产视频大全| 国外欧美一区另类中文字幕| 波多野结衣一区二区三视频| 中文字幕无码av专区久久| 亚洲丝袜第一页| 制服丝袜一区| 国产男人的天堂| 一级香蕉视频在线观看| 亚洲国产精品久久久久秋霞影院| 91精品国产91久久久久久三级|