999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于特征選擇的SVM選擇性集成學習方法

2019-11-18 07:04:32扈曉君康寧
電子技術與軟件工程 2019年18期
關鍵詞:分類特征

文/扈曉君 康寧

1 引言

支持向量機(SVM)是一種基于統計學習方法中結構風險最小化以及VC維理論基礎上的機器學習方法[1]。SVM在解決過擬合和小樣本學習分類方面具有良好的性能,SVM的一個主要特點是它可以克服機器學習領域的維數災難問題。

在近些年來的機器學習領域中,集成學習也成為了研究熱點之一。基本原則是使用多個單獨的分類器通過投票的方式來綜合分析判斷。其中的基分類器類型又可以分為兩類:異質類型和同質類型。其中生成同質類型分類器的方法主要有:Bagging(bootstrap aggregating)算法[2]和Boosting算法[3]。Bagging是一種可以并行執行的方法,其產生的訓練子集通過有放回的數據抽樣產生,最后將由訓練數據產生的各個基分類器進行集成組合。而Boosting方法構成最終分類器的方式,則是給各個分類器賦予不同的權重來集合完成。

之前為了進一步提高SVM的泛化能力,部分研究已將集成學習技術集成到SVM中。然而由于集成學習是由多個基分類器進行合成,因而訓練速度相比單分類器要慢,而且其中包含的基分類器規模越大,其計算復雜度和運行需要的資源也就越多。本文通過從集成學習的輸入變量中提取特征子集來處理數據,獲得較大差異化的訓練子集,根據預測精度對所獲得的基分類器進行選擇組合。既可以讓訓練集和基分類器的差異增加,又可以讓基分類器數量在一定程度上減少。

2 基于特征選取的選擇性集成學習

一般的集成學習方法比較適合于不穩定的分類器,但SVM同其他分類器相比則屬于比較穩定的算法。為了產生不穩定的差異化結果,可以通過在輸入數據中構造特征子集的方式進行前期的數據處理,之后根據訓練精度,通過排序獲得部分選取的基分類器以形成最終的分類器集合。

2.1 SVM及選擇性集成

支持向量機(SVM)通過確定分類的最優決策邊界來使得類之間的間距最大化。SVM決策超平面可以表示為:

SVM的決策函數:

以下是引入核函數后SVM的超平面方程,以此解決非線性問題:

其中ai是為求得帶約束的最優化問題而得到的拉格朗日因子。在引入核函數后,SVM分類模型為:

集成學習一般是應用多個基分類器,對其結合加權或簡單投票的方式來分類。多項研究表明,集成學習框架同泛化能力不穩定的分類器進行結合會有比較好的作用。而對于選擇性集成來說,有訓練集T,驗證集V,分類器h,其基本工作原理有:首先,初始化分類器集合S為空集,定義最終得到的分類器數量n;其次,通過迭代計算在T上得到子集ST,并使用ST分別獲得hi,并將其放入S中;最后,在V上對S中的hi進行評估,按照一定的評估準則構成新的集合S*集成分類器。

2.2 特征以及數據集的選取

Bagging算法主要通過隨機有放回抽樣方法形成子數據集,然后生成差異化的子訓練集。然后將通過這些訓練子集獲得的子分類器組合成集成分類器集合。本文也主要采用了此種方式選取數據。

在本文中,使用Bagging中的bootstrap方法用于選擇訓練數據,以便生成的基分類器在泛化能力方面產生較大的差異。同時,在特征集規模為F的樣本數據集S中,隨機的選擇規模為f的子特征集,f

2.3 子分類器的選擇

算法需要通過一定的評估標準,從之前的基分類器集合C中獲得滿足條件的子分類器形成新的子分類器集合C*。本文將使用基分類器的預測精度作為度量和選取標準。其中主要的過程是從集合C中按照基分類器的泛化能力大小來選擇新的基分類器子集。

在分類器集合C中,通過驗證集V對q個分類器進行測試,|V|代表驗證集的樣本數量,分類器ht的錯誤率:

從得到的分類器中依據各個分類器錯誤率的大小選取符合要求的基分類器進行組合。部分研究表明,對于分類器數量的選取上,當集合C中的分類器較少[4]時,選取40%左右會比較理想,而當集合中分類器較多[5]時,選取15%~30%的成員較好。確定所選擇的規模大小之后,集合C*的成員由C中的分類器按精度排序并等間隔的選取構成,之后C*中的多個基分類器用簡單投票法對數據進行分類。在樣本集X中,h(x)i表示一組子分類器,kj表示第j類的標記。每類的得票數目如下:

該樣本的為得票最多的那一類:

在二分類問題中,可以設置基分類器的數目為奇數個,以避免出現投票數一樣多的問題。

2.4 執行步驟

有樣本數據集合S:{(x1,y1),…(xn,yn)},xi∈X,yi∈{+1,-1},i=1,2,3…n,S=R∪V,S劃分為訓練集R和驗證集V,h是子學習器,T為循環次數。R用于訓練最初的基分類器集合,V用于在初始集中選取符合要求的基分類器。

步驟1.初始基分類器集合E=?;

步驟2.迭代次數t=1…T,然后進行以下循環:

步驟2.1.為產生數據集Rt,在R上使用bootstrap算法進行抽樣選取;

步驟2.2.在Rt上得到規模為M的特征集合F,再隨機選取規模為m=|M/2|的特征集合f。Rt在f上投影得到子數據集Rt*;

步驟2.3.以Rt*作為訓練集獲得分類器ht,并放入集合E中;

步驟3.得到t個基分類器的集合E;

步驟4.通過V對E中的各個基分類器進行泛化評估,并對評估的分類器從大到小排序;

步驟5.將錯誤率大于0.5的基分類器去除,之后從E中剩余的分類器中選出一定的ht作為最終組合。

以上過程在2個方面得到了改善:首先,隨機選取基分類器后再次對數據樣本的特征集進行了隨機選取,以此加大樣本間的差異,進一步使得SVM的穩定性降低;其次,為了縮小基分類器最終的規模,在原集合中依據錯誤率再次對其中的基分類器進行了篩選。

3 實驗及分析

3.1 實驗數據

實驗數據選取了4組來自UCI的數據集,并隨機劃分出各自相應的訓練集、驗證集和測試集。SVM在遇到多分類問題時,可以使用一對一[6]或者一對多的方式將問題轉換為二分類問題。文中為便于處理非線性問題使用了高斯核函數,設置其參數σ為0.2,C為2。同時用一般的Bagging算法作為對比項,以往的驗證表明其抽取的樣本子集約包含63.2%的原數據。試驗中的循環次數T為1000,基分類器的規模均設為291。實驗所用數據的相關信息如表1所示。

3.2 實驗結果及分析

表1

表2

實驗所使用的是4個UCI數據集,實驗前已對其中的缺失數據和無效數據予以剔除,并使用一般的Bagging算法作為參照,對比后的準確率如表2所示。

實驗迭代次數均設為1000,本文算法與傳統的Bagging算法相比較在4個數據集的結果上均有所提升,獲得了相對于傳統的Bagging算法較好的泛化性能和效果。

4 結語

本文將SVM和集成學習框架進行結合,其中通過對訓練數據的子集和特征集進行選取使基分類器的泛化能力和結果產生較大的差異和不通,間接的將SVM分類器從穩定變為不穩定的狀態,以便于更加適合當前的集成學習理論。通過在數據集上比較,本SVM集成分類效果要好于傳統的Bagging集成算法。由于SVM可以通過調整不同的核參數來得到不同泛化能力的分類器,因而對于文中的算法還可以通過調參方式使得基分類器之間產生差異,這也是一個可以進一步研究和學習的方面。

猜你喜歡
分類特征
抓住特征巧觀察
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 国产人人射| 丝袜亚洲综合| 国产三级毛片| 欧美成人午夜在线全部免费| 亚洲Aⅴ无码专区在线观看q| 9丨情侣偷在线精品国产| 黄色污网站在线观看| 在线国产三级| 欧美成人a∨视频免费观看 | 天堂岛国av无码免费无禁网站 | 四虎影视永久在线精品| 成人综合在线观看| 亚洲精品福利视频| 精品国产中文一级毛片在线看| 99视频有精品视频免费观看| 久久99国产综合精品女同| 国产三区二区| 一级毛片在线直接观看| 91精品视频网站| 国产在线一区视频| 免费精品一区二区h| 无码国产伊人| 国产91麻豆免费观看| 99在线小视频| 日本色综合网| 狠狠色香婷婷久久亚洲精品| 91视频99| 中文字幕在线播放不卡| 国产欧美精品午夜在线播放| 国产亚洲一区二区三区在线| 伊人成人在线视频| 午夜不卡视频| a在线亚洲男人的天堂试看| 亚洲一级毛片免费观看| 国产黑人在线| 婷婷综合色| 亚洲五月激情网| 精品人妻无码中字系列| 91蝌蚪视频在线观看| 日韩视频免费| 国产亚洲欧美另类一区二区| 亚洲国产精品VA在线看黑人| 国产精品嫩草影院视频| 青青青视频91在线 | 东京热一区二区三区无码视频| 亚洲日本韩在线观看| 国产精品原创不卡在线| 91无码人妻精品一区| 国产美女人喷水在线观看| 国产精品久久久久久久久kt| 永久在线播放| 天天躁狠狠躁| 亚洲人成成无码网WWW| 美女毛片在线| 欧美成人aⅴ| 亚洲欧美精品在线| 91美女视频在线| 久久婷婷色综合老司机| 亚洲天堂在线免费| 中文字幕永久在线看| 欧美综合区自拍亚洲综合天堂| 亚洲精品你懂的| 色香蕉影院| 亚洲国产日韩在线成人蜜芽| 国产女人在线观看| 在线观看免费人成视频色快速| 久久婷婷五月综合色一区二区| 日韩第九页| 毛片久久网站小视频| 成人在线观看不卡| 免费看美女毛片| 亚洲人成网18禁| 98超碰在线观看| 久久精品国产精品青草app| 免费jizz在线播放| 欧美日韩动态图| 国产XXXX做受性欧美88| 91视频99| 婷婷99视频精品全部在线观看| 思思99热精品在线| 亚洲欧州色色免费AV| 久久精品91麻豆|