999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

PCA降維和決策樹(shù)在多光譜圖像中的分類(lèi)研究

2017-05-19 12:52:00郝尚榮
計(jì)算機(jī)時(shí)代 2017年5期
關(guān)鍵詞:分類(lèi)

郝尚榮

摘 要: 采用PCA降維和決策樹(shù)兩方法對(duì)不同墨水筆跡的多光譜影像和不同對(duì)象的多光譜遙感影像分類(lèi)識(shí)別。實(shí)驗(yàn)表明,對(duì)于墨水筆跡可以分出較好效果而遙感影像效果較差,可能是受影像信噪比的影響;文章為不同墨水的分類(lèi)提供了解決方法。

關(guān)鍵詞: 決策樹(shù); 高光譜; PCA降維; 分類(lèi)

中圖分類(lèi)號(hào):TP751.1 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2017)05- 40-03

Application of PCA dimensionality reduction and decision tree

in hyperspectral image classification

Hao Shangrong

(Institute of Data and Knowledge Engineering, School of computer and information engineering,Henan University, Kaifeng, Henan 475004, China)

Abstract: PCA dimensionality reduction and decision tree methods are used to classify and recognize the hyperspectral images of handwriting with different inks and the hyperspectral remote sensing images with different objects. The experimental results show that the classification effect of handwriting image is better but the remote sensing image is poor, which may be caused by the signal to noise ratio of the image. This paper provides a solution for the classification of different ink.

Key words: decision tree; hyperspectral; PCA dimensionality reduction; classification

0 引言

研究了機(jī)器學(xué)習(xí)[1]中分類(lèi)算法之一的決策樹(shù)以及神經(jīng)網(wǎng)絡(luò)中PCA降維在高光譜圖像中的分類(lèi)應(yīng)用。分析了可能受信噪比低的原因,可以利用高光譜分類(lèi)的不同墨水;對(duì)于遙感信息由于衛(wèi)星拍攝時(shí)其信噪比較高的原因,具體表現(xiàn)為每一個(gè)光譜圖像產(chǎn)生的能量較小,而噪聲影響較大,這樣多光譜信息的有效信息太少而失去分類(lèi)的意義。

1 樣本的提取

由于不同的墨水在紙張上畫(huà)的筆跡產(chǎn)生不同的化學(xué)反應(yīng),進(jìn)而可以通過(guò)高光譜相機(jī)獲得含有不同高光譜信息筆跡的光譜圖。高光譜信息是指不同波段的圖像信息。本文的采樣過(guò)程如下。

對(duì)于筆跡,采用9只不同的筆,對(duì)于遙感影像,采用9類(lèi)對(duì)象,對(duì)應(yīng)101個(gè)波段的光譜信息進(jìn)行采樣。筆跡的采樣是對(duì)每一類(lèi)筆跡隨機(jī)采樣200個(gè)位置,獲得總的像素值為9*200*101維特征值。遙感影像采用boundingbox工具,對(duì)圖像中9類(lèi)對(duì)象200個(gè)相應(yīng)4*4區(qū)域,取像素值的均值,總的特征值緯度是9*200*101。

2 訓(xùn)練過(guò)程

PCA降維的思想是,在特征較多的情況下,通過(guò)減少對(duì)分類(lèi)產(chǎn)生很小影響特征數(shù)量的方式,達(dá)到簡(jiǎn)化計(jì)算效果的目的。決策樹(shù)是機(jī)器學(xué)習(xí)中十分強(qiáng)大的方法,其重要作用在于分類(lèi),其特點(diǎn)是每一次只針對(duì)一個(gè)最重要的特征進(jìn)行分類(lèi),形成一層的決策樹(shù)的時(shí)候拋棄該特征,多次循環(huán)通過(guò)相對(duì)次重要特征分類(lèi)的方式。采用機(jī)器學(xué)習(xí)的思想對(duì)這些信息進(jìn)行采樣、降維、采用決策樹(shù)的方法進(jìn)行訓(xùn)練,經(jīng)過(guò)擬合驗(yàn)證后,獲得一棵決策樹(shù)用在高光譜圖像的分類(lèi)工作中。

2.1 PCA降維

由于采樣后的樣本特征數(shù)太多,盡管采用了矩陣進(jìn)行數(shù)據(jù)運(yùn)算的技術(shù),但是由于特征數(shù)太多造成的緯度過(guò)大,對(duì)于矩陣的存儲(chǔ)、計(jì)算都會(huì)有很大的影響,而大部分的緯度并不對(duì)結(jié)果產(chǎn)生較大的影響。PCA降維[2-3]的思想就是對(duì)矩陣計(jì)算出協(xié)方差矩陣,進(jìn)而依據(jù)矩陣計(jì)算出每一列的特征向量、特征值。求出每一特征值與所有特征值之和的比例,對(duì)比例值由大到小排序,計(jì)算若干個(gè)最大值之和大于99%的特征向量對(duì)應(yīng)的特征作為有效特征。

2.2 決策樹(shù)的選取及訓(xùn)練

決策樹(shù)[4]按照不同的評(píng)判標(biāo)準(zhǔn)分為三種分別為:信息的增益、信息的增益比、基尼系數(shù)。但都是基于信息熵的思想。信息熵的計(jì)算公式為:

其中,P(ui)為類(lèi)別為i的樣本個(gè)數(shù)在總樣本中的概率,S為樣例個(gè)數(shù)。

本文采用的C4.5的決策樹(shù)[5]算法,其評(píng)判條件為信息的增益,具體含義:以某特征進(jìn)行分類(lèi)后的信息熵同分類(lèi)前的信息熵的差值。同時(shí),本文中對(duì)筆跡和遙感影像的分類(lèi)是9類(lèi)。所以,采用預(yù)剪枝的思想,限定了決策樹(shù)為九層。由于該分類(lèi)方法是二分類(lèi)的,所以就存在十個(gè)葉子節(jié)點(diǎn),分別對(duì)應(yīng)九類(lèi)結(jié)果和一類(lèi)的其他類(lèi)別。

接著,采用十折交叉驗(yàn)證的思想進(jìn)行過(guò)擬合驗(yàn)證。十折交叉驗(yàn)證是數(shù)據(jù)分為十份,一份為訓(xùn)練,九份為測(cè)試,循環(huán)十次觀測(cè)準(zhǔn)確率變化。過(guò)擬合是訓(xùn)練時(shí)準(zhǔn)確率高而測(cè)試的準(zhǔn)確率偏低的現(xiàn)象。通過(guò)多次調(diào)整訓(xùn)練集、測(cè)試集的樣本個(gè)數(shù)的比例,最終獲得平均準(zhǔn)確率為實(shí)驗(yàn)結(jié)果。

3 對(duì)比及結(jié)論

求準(zhǔn)確率和召回率時(shí),分別對(duì)筆跡和遙感影像分類(lèi)都要按照上述取樣的方式獲得101維的測(cè)試樣本,并進(jìn)行訓(xùn)練、測(cè)試,其對(duì)應(yīng)的準(zhǔn)確率為0.9504、0.671;對(duì)應(yīng)的召回率為0.796和0.971。結(jié)果表明本方法適合多光譜圖像不同墨水的分類(lèi);同時(shí)說(shuō)明多光譜的遙感影像可能受信噪比高低的影響,需要進(jìn)一步研究。

4 結(jié)束語(yǔ)

本文結(jié)合了PCA降維和決策樹(shù)方法解決了不同墨水筆跡分類(lèi)的問(wèn)題,表現(xiàn)出了較高的準(zhǔn)確率。討論了PCA降維和決策的優(yōu)點(diǎn),以及在高光譜圖像中分類(lèi)的應(yīng)用,可以在跡偽造檢測(cè)中,通過(guò)是否是相同的墨水進(jìn)行第一步區(qū)別操作,具有一定的使用價(jià)值。未來(lái)可以進(jìn)一步研究高光譜圖像分類(lèi)與信噪比的關(guān)系,以便于確定高光譜信息在分類(lèi)問(wèn)題中的應(yīng)用范圍。

參考文獻(xiàn)(References):

[1] 李銳,李鵬,曲亞?wèn)|(譯).機(jī)器學(xué)習(xí)實(shí)戰(zhàn)[M].人民郵電出版社,2013.

[2] 肖招娣.高維數(shù)據(jù)集上的降維算法及其應(yīng)用[D].華南理工大學(xué)碩士學(xué)位論文,2013.

[3] 張小勤.基于PCA與K-NN的故障檢測(cè)與診斷方法的研究[D].西南大學(xué)碩士學(xué)位論文,2016.

[4] 李海濤.基于Hadoop的決策樹(shù)算法改進(jìn)及林業(yè)數(shù)據(jù)分類(lèi)預(yù)測(cè)研究[D].東北林業(yè)大學(xué)碩士學(xué)位論文,2016.

[5] 黃秀霞.C4.5決策樹(shù)算法優(yōu)化及其應(yīng)用[D].江南大學(xué)碩士學(xué)位論文,2017.

猜你喜歡
分類(lèi)
2021年本刊分類(lèi)總目錄
分類(lèi)算一算
垃圾分類(lèi)的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類(lèi)
我給資源分分類(lèi)
垃圾分類(lèi),你準(zhǔn)備好了嗎
分類(lèi)討論求坐標(biāo)
數(shù)據(jù)分析中的分類(lèi)討論
按需分類(lèi)
教你一招:數(shù)的分類(lèi)
主站蜘蛛池模板: 亚洲精品中文字幕午夜| 国产在线98福利播放视频免费| 超级碰免费视频91| 九一九色国产| 欧美成人午夜在线全部免费| 婷婷综合缴情亚洲五月伊| 91精品国产一区| 激情国产精品一区| 无码精品国产VA在线观看DVD| 老色鬼欧美精品| 亚洲成年人网| 欧美日韩国产在线人成app| 一区二区三区高清视频国产女人| 中文字幕有乳无码| 精品视频福利| 制服无码网站| 欧美色99| 国产91无码福利在线| 精品免费在线视频| 欧美中文字幕在线播放| 国产欧美在线观看视频| 色老头综合网| 国产一二三区视频| 精品伊人久久久久7777人| 99久久国产综合精品2020| 色久综合在线| 国产在线观看91精品亚瑟| 91年精品国产福利线观看久久| 国产精品无码一区二区桃花视频| 另类重口100页在线播放| 中文字幕不卡免费高清视频| 视频一区视频二区日韩专区 | 国产在线视频二区| 久久久精品国产亚洲AV日韩| 欧美精品亚洲精品日韩专区va| 欧美国产日韩一区二区三区精品影视| 久久国产精品麻豆系列| 福利国产在线| 国产欧美日韩专区发布| 91在线精品麻豆欧美在线| 国产麻豆永久视频| 国产精品开放后亚洲| 欧美黄色网站在线看| 欧美日韩一区二区三| 麻豆国产精品一二三在线观看| 91国内视频在线观看| 精品人妻AV区| 国内毛片视频| 67194成是人免费无码| 99在线小视频| 伊人激情久久综合中文字幕| 国产欧美一区二区三区视频在线观看| 亚洲性视频网站| 性做久久久久久久免费看| 99这里只有精品免费视频| 国产区91| 亚洲国产天堂久久九九九| 九色综合伊人久久富二代| 国产永久免费视频m3u8| 久久毛片网| 久久精品视频亚洲| 国产精品永久在线| 日本高清在线看免费观看| jizz在线观看| 国产产在线精品亚洲aavv| 久久久成年黄色视频| 99精品国产自在现线观看| 欧美在线观看不卡| 色综合激情网| 国产网站免费观看| 最近最新中文字幕在线第一页| 一区二区影院| 欧美成人综合在线| 亚洲精品成人7777在线观看| 国产精品3p视频| 欧美精品啪啪| 国产精品19p| 丰满人妻久久中文字幕| 热这里只有精品国产热门精品| 午夜爽爽视频| 日韩美女福利视频| 啪啪永久免费av|