999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機的實踐及應用

2021-01-06 08:47:15雷湘琦
家園·電力與科技 2021年9期
關鍵詞:分類

雷湘琦

摘要:本文使用的支持向量機以訓練誤差作為優化問題的約束條件,以置信范圍值最小化作為優化目標,即SVM是一種基于結構風險最小化準則的學習方法,其推廣能力優于其他的一些機器學習方法。現今運用的都是一些比較經典的算法,如傳統的決策樹算法等,同時這些算法也是學習數據挖掘算法的根基。文中主要列舉相關算法并應用相應的實例加以佐證,指出其中的不足和需要改進的地方。

關鍵詞:支持向量機;鳶尾花數據

引言

支持向量機(Support Vector Machine,SVM)SVM被提出于1964年,在二十世紀90年代后得到快速發展并衍生出一系列改進和擴展算法,在人像識別、文本分類等模式識別問題中有得到應用。它是一類按監督學習方式對數據進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面。SVM使用鉸鏈損失函數計算經驗風險并在求解系統中加入了正則化項以優化結構風險,是一個具有稀疏性和穩健性的分類器。SVM可以通過核方法進行非線性分類,是常見的核學習方法之一。

1 基本原理

標準SVM是基于二元分類問題設計的算法,無法直接處理多分類問題。利用標準SVM的計算流程有序地構建多個決策邊界以實現樣本的多分類,通常的實現為“一對多”和“一對一”。一對多SVM對m個分類建立m個決策邊界,每個決策邊界判定一個分類對其余所有分類的歸屬;一對一SVM是一種投票法,其計算流程是對m個分類中的任意2個建立決策邊界,樣本的類別按其對所有決策邊界的判別結果中得分最高的類別選取。一對多SVM通過對標準SVM的優化問題進行修改可以實現一次迭代計算所有決策邊界

傳統的統計模式識別方式只有在樣本趨向無窮大的時候,其性能才有理論的保證。統計學習理論研究有限樣本情況下的機器學習問題。SVM的理論基礎就是統計學習理論。

根據統計學習理論,學習機器的實際風險由經驗風險值和置信范圍值兩部分組成。而基于經驗風險最小化準則的學習方法只強調了訓練樣本的經驗風險最小誤差,沒有最小化置信范圍值,因此其推廣能力較差。

1.1 尋找最佳超平面

SVM的主要目標是找到最佳超平面,以便在不同類的數據點之間進行正確分類。超平面維度等于輸入特征的數量減去1(例如,當使用三個特征時,超平面將是二維平面)。

為了分離兩類數據點,可以選擇許多可能的超平面。我們的目標是找到一個具有最大邊距的平面,即兩個類的數據點之間的最大距離。最大化邊距的目的是最大概率的對未知的數據點進行正確分類。

1.2超平面和支持向量

超平面是決策邊界,有助于對數據點進行分類。落在超平面兩側的數據點可歸因于不同的類。此外,超平面的尺寸取決于特征的數量。如果輸入要素的數量是2,則超平面只是一條線。如果輸入要素的數量是3,則超平面變為二維平面。當特征數量超過3時,就超出我們的想象了。

最接近超平面的數據點稱為支持向量。支持向量確定超平面的方向和位置,以便最大化分類器邊界(以及分類分數)。SVM算法應該使用的支持向量的數量可以根據應用任意選擇。

1.3 SVM內核

如果我們使用的數據不是線性可分的(因此導致線性SVM分類結果不佳),則可以應用稱為Kernel Trick的技術。此方法能夠將非線性可分離數據映射到更高維空間,使我們的數據可線性分離。使用這個新的維度空間SVM可以很容易地實現。

SVM中有許多不同類型的內核可用于創建這種更高維度的空間,例如線性,多項式,Sigmoid和徑向基函數(RBF)。在Scikit-Learn中,可以通過添加內核參數來指定內核函數svm.SVC,也可以通過gamma參數來指定內核對模型的影響。如果特征數量大于數據集中的樣本數量,則建議使用線性內核(否則RBF可能是更好的選擇)。

1.4 特征選擇

減少機器學習中的功能數量起著非常重要的作用,尤其是在處理大型數據集時。實際上,這可以:加速訓練,避免過度擬合,并最終通過降低數據噪音來獲得更好的分類結果。例如下圖中顯示了在Pima Indians糖尿病數據庫中使用SVM識別的主要特征。在綠色中顯示對應于負系數的所有特征,而藍色顯示為正系數。

1.5 支持向量機的算法

比較經典的如1)Vapnik提出的Chunking方法;其出發點是刪除矩陣中對應Lagrange乘數為零的行和列將不會影響最終結果,然而,在訓練集的支持向量數很大的時候,Chunking算法仍然無法將矩陣放入內存中;2)Qsuna提出的Qsuna算法;該算法存在效率問題,因為在每一步中,進行一次QP問題的最優化只能使一個樣本符合Kuhn-Tucker條件;3)Plat提出的序貫最小優化方法(sequential minimal optimization,簡稱SMO);將一個大型的QP問題分解為一系列最小規模的QP子問題,即僅具有兩個Lagrange乘數的QP問題,從而使得原問題可以通過分析的方法加以解決,避免了在內循環中使用數值算法進行QP最優化。該算法在訓練線性SVM時,可以獲得非常好的性能。

2 數據選擇

Iris 鳶尾花數據集是一個經典數據集。數據集內包含 3 類共 150 條記錄,每類各 50 個數據,每條記錄都有 4 項特征:花萼長度、花萼寬度、花瓣長度、花瓣寬度,可以通過這4個特征預測鳶尾花卉屬于中的哪一品種。

3利用Support_Vector_Machines對Iris data進行分類

利用SVM對Iris data進行二分類后的到結果:

SVM是一種有堅實理論基礎的新穎的適用小樣本學習方法。它基本上不涉及概率測度及大數定律等,也簡化了通常的分類和回歸等問題。計算的復雜性取決于支持向量的數目,而不是樣本空間的維數,這在某種意義上避免了“維數災難”。因此可以利用已知的有效算法發現目標函數的全局最小值,有優秀的泛化能力。

參考文獻:

[1]程一芳.數據挖掘中的數據分類算法綜述[J].數字通信世界,2021(02):136-137+140.

[2]韓成成,增思濤,林強,曹永春,滿正行.基于決策樹的流數據分類算法綜述[J].西北民族大學學報(自然科學版),2020,41(02):20-30.

[3]李建新. 基于小波支持向量機的邊坡變形預測研究[D].江西理工大學,2020.

[4]姚奇峰,楊連賀.數據挖掘經典分類聚類算法的研究綜述[J].現代信息科技,2019,3(24):86-88.

[5]李璐. 基于機器學習的滑坡地質災害預報模型研究[D].西安工程大學,2019.

[6]郭天頌. 基于粒子群優化支持向量機的滑坡易發性評價與滑坡位移預測[D].長安大學,2019.

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數據分析中的分類討論
按需分類
教你一招:數的分類
主站蜘蛛池模板: 精品国产Av电影无码久久久| 午夜精品影院| 国产自无码视频在线观看| 三上悠亚在线精品二区| 色噜噜综合网| 亚洲AV无码一区二区三区牲色| 亚洲人成网18禁| 伊人久久婷婷五月综合97色| 国产成人久久综合一区| 国产综合在线观看视频| 国产麻豆精品在线观看| 欧美日韩中文字幕在线| 91久久偷偷做嫩草影院精品| 在线播放精品一区二区啪视频 | 亚洲精品动漫| 免费 国产 无码久久久| 国产99久久亚洲综合精品西瓜tv| 在线观看免费国产| 538精品在线观看| 久久免费成人| 国产屁屁影院| 久久久无码人妻精品无码| 中文字幕日韩久久综合影院| 国产精品免费电影| 国产精品无码久久久久AV| 超碰91免费人妻| 72种姿势欧美久久久大黄蕉| 奇米影视狠狠精品7777| 国产精品久线在线观看| 国产91小视频| 手机成人午夜在线视频| 在线观看国产一区二区三区99| 一级爆乳无码av| 国产成人91精品免费网址在线| 日韩第九页| 成人国产精品2021| 福利国产微拍广场一区视频在线| 亚洲成综合人影院在院播放| 国产97色在线| 国产在线自揄拍揄视频网站| 久久精品波多野结衣| 狠狠做深爱婷婷久久一区| 麻豆精品国产自产在线| 久久婷婷综合色一区二区| 国产欧美视频在线观看| 国产黄视频网站| 亚洲人精品亚洲人成在线| 欧洲熟妇精品视频| 成人免费午夜视频| 波多野结衣一区二区三区四区视频| 久久综合亚洲色一区二区三区| 免费一级毛片不卡在线播放| 777午夜精品电影免费看| 婷婷在线网站| 秋霞午夜国产精品成人片| 国产青青草视频| 色视频国产| 99视频在线免费观看| 毛片在线播放网址| 中文字幕日韩欧美| 天堂岛国av无码免费无禁网站| 91精品啪在线观看国产| 91福利免费视频| 国产日韩精品欧美一区灰| 丁香五月亚洲综合在线 | 国产高清在线丝袜精品一区 | 欧美色香蕉| 国产不卡在线看| 久久综合伊人77777| 国产色爱av资源综合区| 国产毛片基地| 狠狠躁天天躁夜夜躁婷婷| 亚洲第一在线播放| 日本爱爱精品一区二区| 欧美特黄一免在线观看| www.精品视频| 国产精品亚欧美一区二区| 天天综合网在线| 欧美精品在线免费| 全部无卡免费的毛片在线看| 国产在线观看99| 国产69囗曝护士吞精在线视频|