999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數(shù)據(jù)降維的機器學習分類應用問題探討

2018-09-18 09:56:56隋旻言李驍漢
數(shù)碼設計 2018年2期
關(guān)鍵詞:分類

隋旻言,李驍漢

(武漢理工大學自動化學院,湖北武漢,430070)

引言

數(shù)據(jù)降維是指將單幅圖像數(shù)據(jù)的高維化,使其轉(zhuǎn)化為高維空間中的數(shù)據(jù)集合,進行非線性降維,尋求高維數(shù)據(jù)結(jié)構(gòu)的一維表示向量,將其作為圖像數(shù)據(jù)的特征表達特定目標。數(shù)據(jù)降維可以應用于多個領(lǐng)域,尤其是大量數(shù)據(jù)的分析計算,包括機器學習相關(guān)工作。當前機器學習分類應用問題較為突出,很大程度上影響了具體工作的開展,分析基于數(shù)據(jù)降維的機器學習分類應用問題、探討解決對策有一定的現(xiàn)實意義。

1 當前機器學習分類應用問題

1.1 樣本歸類不清

樣本歸類問題,是機器學習分類應用最基礎的、最突出的問題,當前機器學習的基本方式是神經(jīng)訓練,該算法是對人體神經(jīng)系統(tǒng)進行模擬,通過廣泛收集非結(jié)構(gòu)化的海量數(shù)據(jù)進行學習,但在對樣本進行歸類時,由于海量數(shù)據(jù)中相近數(shù)據(jù)極多,很難實現(xiàn)精確的歸類,導致機器學習耗時長、效率低。

1.2 計算量較大

當前機器學習的一個核心弊端是較大的計算量,這也直接影響了分類應用工作。機器人出現(xiàn)之初,為求保證其能夠有效模仿人類的行為、實現(xiàn)“人工智能”,設計人員采用了神經(jīng)訓練法,這一算法的優(yōu)勢也是其弊端。具體來說,提升神經(jīng)訓練成果的主要方法是大量增加樣本數(shù)據(jù),樣本數(shù)據(jù)越多,計算結(jié)果越理想,機器人的模仿能力也越強。

1.3 精度問題

精度問題是當前機器學習分類應用的主要問題之一,對于精度標準,各國的看法并不一致,總體而言,機器學習依然遵循樣本數(shù)量越多、精度越高的基本規(guī)律[1]。

2 數(shù)據(jù)降維方式的選取

2.1 隨機森林法

隨機森林法是用隨機的方式建立一個擬森林狀的判斷系統(tǒng),在“判斷森林”(隨機森林)中,每一個進行判斷的程序都以一棵“決策樹”的形式存在,隨機森林的每一棵“決策樹”之間是沒有關(guān)聯(lián)的。隨機森林建成后,任意輸入樣本進入森林,森林中的“決策樹”都會分別進行一次判斷,分析該樣本應該屬于哪一類,被最多“決策樹”判定的類別,就是該樣本的類別[2]。

2.2 K近鄰算法

K近鄰算法是最典型的降維算法,該算法理論上十分成熟。K近鄰算法的核心思路是,建立若干標準點 K,各自代表一個分類類別,將樣本代入特征空間,如果樣本在特征空間中最鄰近某個K點,即表示該樣本屬于該類別。與隨機森林法不同,雖然K近鄰算法也強調(diào)相似判斷,但樣本并給完全遵循非線性規(guī)律,而是在不明確的線性標準下給予模糊分類,再進行精細化處理,而且K近鄰算法不遵循“決策樹”式的多數(shù)原則,只要某個樣本距離K點最近,就屬于該類別。

3 模擬實驗

3.1 觀察指標

實驗在虛擬環(huán)境下進行,通過參數(shù)帶入模擬實驗環(huán)境,應用神經(jīng)訓練法、隨機森林法、K近鄰算法對同一個機器人軟件進行訓練,觀察機器人的學習效率和精確性。

3.2 實驗過程與結(jié)果

所有實驗在人工干預下進行,應用100個、1000個、10000個樣本進行三輪實驗,同一輪實驗內(nèi)應用的樣本完全相同。通過對照,發(fā)現(xiàn)神經(jīng)訓練法、隨機森林法、K近鄰算法的學習效率和精確性存在差異。神經(jīng)訓練法、隨機森林法三組實驗所獲數(shù)據(jù)如表1所示。

表1 神經(jīng)訓練法和隨機森林法實驗數(shù)據(jù)

結(jié)果表明,隨機森林法下,機器學習的效率更高,精確性也更好,能夠較好的滿足分類應用要求。神經(jīng)訓練法、K近鄰算法三組實驗所獲數(shù)據(jù)如表1所示。

表2 神經(jīng)訓練法和K近鄰算法實驗數(shù)據(jù)

結(jié)果表明,K近鄰算法下,機器學習的效率更高,精確性也更好,能夠較好的滿足分類應用要求。

3.3 實驗結(jié)論

經(jīng)過實驗對比,在應用隨機森林法、K近鄰算法的情況下,可以實現(xiàn)數(shù)據(jù)降維,將多維度的數(shù)據(jù)以非線性條件進行分類,使所有數(shù)據(jù)能夠直接在特征空間內(nèi)與對應的分類類別實現(xiàn)匹配,免去線性約束條件下神經(jīng)訓練法復雜計算的麻煩,機器學習的效率高、分類應用的成果也更好。此外,應用隨機森林法進行數(shù)據(jù)降維,機器學習效率略低于K近鄰算法,但精度略高,這也體現(xiàn)了兩類算法各自的優(yōu)劣勢。

4 結(jié)束語

通過數(shù)據(jù)降維的方式可以加以應對,可行的計算方式包括隨機森林法、K近鄰算法等。模擬實驗表明,隨機森林法、K近鄰算法在機器學習中的效率更好,后續(xù)工作中,可作為機器學習的參考方式。

[1]楊磊, 唐曉燕.基于流形學習的高光譜圖像非線性降維算法[J].河南理工大學學報(自然科學版), 2016, 35(05): 660-665.

[2]李海亭, 肖建華, 李艷紅.機器學習在車載激光點云分類中的應用研究[J].華中師范大學學報(自然科學版), 2015, 49(03): 460-464.

[3]王懿.基于自然語言處理和機器學習的文本分類及其應用研究[J].《中國科學院研究生院(成都計算機應用研究所)》 , 2006.

[4]羅凱旋,鐘凡,趙亮,賀福初.評估幾種降維分類器應用于生物質(zhì)譜數(shù)據(jù)的性能 [J]《中國科學:生命科學》, 2010,40(6):544-550.

[5]楊秀鋒.基于機器學習的生物醫(yī)學數(shù)據(jù)處理方法研究[J].中國科學院大學,2014.

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數(shù)據(jù)分析中的分類討論
按需分類
教你一招:數(shù)的分類
主站蜘蛛池模板: 四虎永久免费地址| 国产亚洲成AⅤ人片在线观看| 自慰高潮喷白浆在线观看| 国产欧美日韩va另类在线播放| 亚洲一区二区在线无码| 国产欧美日韩91| 国产免费看久久久| 尤物亚洲最大AV无码网站| 成色7777精品在线| 国产在线精品人成导航| 啪啪永久免费av| 国产午夜福利在线小视频| 国产又大又粗又猛又爽的视频| 国产精品亚洲一区二区三区z | 亚洲中文字幕久久精品无码一区| 亚洲一区二区日韩欧美gif| 亚洲国产精品无码久久一线| 亚洲欧洲日韩综合色天使| 影音先锋丝袜制服| 久久国产乱子| 亚洲成A人V欧美综合| 色妞www精品视频一级下载| 亚洲熟女中文字幕男人总站| 亚洲成人播放| 欧美激情视频一区| 亚洲综合九九| 国产网站在线看| 日本三级精品| 国产熟睡乱子伦视频网站| 免费无码AV片在线观看国产| 99免费视频观看| 丁香综合在线| 亚洲免费毛片| 国产成人精品男人的天堂| 97超爽成人免费视频在线播放| AV在线天堂进入| 高清免费毛片| 国产女人综合久久精品视| 一区二区三区毛片无码| 久久夜色精品国产嚕嚕亚洲av| 亚洲一本大道在线| 国产一区成人| 欧美19综合中文字幕| 国模极品一区二区三区| 无码在线激情片| www.狠狠| 国产经典免费播放视频| 免费jjzz在在线播放国产| 免费人欧美成又黄又爽的视频| 欧美日韩激情在线| 天天摸夜夜操| 国产一区二区三区免费观看| 中文国产成人精品久久一| 久久中文电影| 成人综合在线观看| 欧美成人精品欧美一级乱黄| 国产国产人成免费视频77777| 日韩a级毛片| 欧美激情视频一区| 色窝窝免费一区二区三区| 91小视频版在线观看www| 亚洲综合精品第一页| 亚洲欧洲国产成人综合不卡| 伊人久久影视| 久久久国产精品无码专区| 午夜丁香婷婷| 国产无遮挡裸体免费视频| 国产精品30p| 成人国产精品一级毛片天堂| 日韩精品一区二区三区免费| 国产在线专区| 伊人国产无码高清视频| 色综合热无码热国产| 国产在线观看99| 这里只有精品在线| 亚洲综合色婷婷中文字幕| 国产成人免费手机在线观看视频 | 婷婷综合色| 国产裸舞福利在线视频合集| 国产成人区在线观看视频| 老司国产精品视频91| 国产极品美女在线播放|