999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于逆冪核主成分的維度約減方法

2024-01-08 12:13:56張紅艷
現代計算機 2023年20期
關鍵詞:分類

張紅艷

(貴州民族大學數據科學與信息工程學院,貴陽 550025)

0 引言

隨著科技的進步和計算能力的提高,越來越多的數據呈現出高維特點,高維數據不僅包含大量的冗余信息,而且處理起來十分耗時。不斷增加的數據維度,更會導致所謂的“維數災難”(dimensionality curse)[1]問題。通過維度約減能有效減少數據特征的數量,提高計算效率。目前,維度約減被廣泛應用于機器學習[2]、數據分析、數據可視化、自然語言處理[3]和圖像處理[4]等領域。

維度約減可分為線性維度約減和非線性維度約減兩種方法。線性維度約減是指通過線性變換將高維數據映射到低維空間中,從而減少數據的維度,同時盡可能地保留原始數據的關鍵特征。它的典型代表為主成分分析法(principal component analysis,PCA)[5]。PCA 擅長處理線性可分的數據,當數據不可分,或存在缺失、異常等情況時,若仍采用線性維度約減,則數據將丟失原本的結構。因此,Sch?lkopf 等[6]提出基于核技巧的主成分分析法(kernel principal component analysis,KPCA)。與傳統(tǒng)PCA 不同,KPCA 可以通過非線性變換將數據映射到高維空間中,并在該空間中執(zhí)行PCA,以獲取更有效地捕獲數據特征的主成分。

KPCA 通過使用核函數計算原始數據點和高維空間中的映射點之間的相似度來獲得高維空間中的內積矩陣或距離矩陣,然后對矩陣進行分解以獲得主成分和其相關的投影系數。由于核函數的能力,它可以處理高維、非線性和具有任意核心密度的數據集。核主成分分析的核心之處在于核函數的選擇[7-8]。因此,構造了一個新的逆冪核函數,并用該核函數對高維數據進行維度約減。通過在四個高維數據集上的實驗分析,對比高斯徑向基核、多項式核、全變量情況,逆冪核函數的維度約減效果相對更優(yōu)。

1 核主成分分析

核主成分分析法是一種非線性的數據分析方法,其主要思想是:通過引入非線性變換Φ,將數據由輸入空間Rm映射到高維特征空間F,然后在特征空間F中利用PCA 方法進行數據分析和處理。

設樣本集X={χ1,χ2,χ3,…,χN}∈Rm通過非線性變換Φ 將樣本點χi映射在特征空間F中是Φ(χi),i= 1,2,…,N,將之中心化后,即轉換為

可得F空間中的協方差矩陣Σ為

根據

求Σ的特征值λ和特征向量ν。由式(2)知,計算Σ需知道Φ(χi)和Φ(χj),而Φ又是未知的。但所有的特征向量ν均可以表示為Φ(χ1),Φ(χ2),…,Φ(χN)的線性張成,即

因此,可得

將式(2)、(4)代入式(5),令

其中:K為N×N核矩陣,nλi是K的特征值,α=α1,α2,…,αN是對應的特征向量。按一定的標準取前m(m<N)個特征值和對應的標準化后特征向量α1,α2,…,αm。此時特征空間F中樣本點Φ(χi)在ν上的投影為

在進行維度約減時,怎么確定降維后應保留的屬性維度d,主要取決于數據集和核函數,不同的數據集和核函數分類預測精度不一樣。一般采用包裹式學習算法,即屬性維度d的取值與后續(xù)機器學習分類算法的表現性能聯系在一起,取得的屬性維度d應使后續(xù)分類算法的分類精度更優(yōu)[7]。

2 核函數

2.1 常見核函數

由低維空間向高維空間映射帶來的困難就是計算復雜度的增加,而核函數正好巧妙地解決了這個問題。這一過程是通過用核函數K(χi,χj)=<Φ(χi)Φ(χj)>代替Wolfe對偶問題中χi和χj的點積來實現的。常用的核函數如下:

(1)多項式核:

(2)高斯徑向基核:

其中,r,q,γ是核函數參數。r是平移參數,r≥0;q是多項式階數,常見取值范圍為(1,10);γ是一個超參數,控制數據點在高維空間中的分布情況,常見取值范圍為(10-3,103)。

2.2 逆冪核函數

核主成分分析法的關鍵是核函數的選擇是否恰當,不同的數據利用不同的核函數能有效提高維度約減效果,并能有效提高后續(xù)機器學習分類算法的預測性能,依據核函數的構造原理,本節(jié)構造新的核函數,稱其為逆冪核函數。

定義1[9]稱二元函數:X× Χ →R 是正定的,如果它是對稱的,即K(χ,χ')= K(χ,χ'),并且對任意m∈N(正整數集合),任意χ1,χ2,…,χm∈X,α1,α2,…,αm∈R,都有K(χi,χj) ≥0,即對任意訓練數據χ1,χ2,…,χm∈X,K=(κ(χi,χj) )是正定矩陣。

為了證明函數

是核函數,根據定義1,需證明對于任意的訓練樣本χ1,χ2,…,χm和任意的實數α1,α2,…,αm,都有

其中,K(χi,χj)表示χi和χj之間的核函數。

對于該函數,有以下推導

因此,對于任意的α1,α2,…,αm,有

然后,定義一個矩陣K,其中,第i行、第j列的元素為Kij= K(χi,χj)。因此,式(12)可以寫成

其中,a=[α1,α2,…,αm]T是一個m維向量。

因此,要證明該函數是核函數,只需要證明對于任意a,都有aTKa≥0。考慮到K是一個對稱矩陣,因此可以使用它對角化的特征值分解來證明。具體地,設K=UΛUT,其中U是一個正交矩陣,Λ是一個對角矩陣,其對角線上的元素λ1,λ2,…,λm表示K的特征值。由于K是半正定矩陣,因此,所有的特征值都非負。現在,將a表示為Ub的形式,其中,b=UTa。因此,有

由于所有的特征值都非負,上述式子的值都非負。因此,對于任意的訓練樣本χ1,χ2,…,χm和任意的實數α1,α2,…,αm,都有

2.3 核主成分分析維度約減算法

根據核主成分分析原理,其維度約減算法的基本步驟如下:

3 實驗結果與分析

實驗代碼使用R 語言(R-4.2.2)編碼實現。實驗環(huán)境為Windows10 64 bit操作系統(tǒng),8 GB內存,Intel(R)Core(TM)i5-8250U CPU@1.60GHz 1.80 GHz。數據集詳細描述見表1。使用分類精度作為評價不同數據集維度下的機器學習分類方法的分類性能。

表1 實驗數據集描述

3.1 實驗設計

為驗證逆冪核的分類性能,本文利用新的逆冪核和傳統(tǒng)的多項式核、高斯徑向基核及全變量對數據集進行維度約減,然后采用支持向量機主流機器學習分類方法對原始數據集及已降維的數據集進行分類預測。

3.2 對比實驗結果與分析

本文使用的幾種核函數均帶有參數,徑向高斯(radial basis function,RBF)核函數參數γ,其中δ2=50;多項式(polynomial function,POLYF)核函數參數r,q,其中r= 0;逆冪(inverse power function,IPF)核函數參數c,b。d表示屬性維度。由于核函數所包含的參數不多,對每個參數設置一定的范圍,然后采用簡單的網格搜索法,使得后續(xù)分類算法的精度達到最高。在降維后的數據集上進行支持向量機分類預測。同時不對數據進行處理,將全變量(full variable,FV)參與支持向量機(SVM)中,上述幾種方法可以記為AV+SVM、POLY+SVM、RBF+SVM、IPF+SVM。其五折交叉驗證精度見表2。

表2 不同核函數下SVM的五折交叉驗證精度對比

由表2可知,在沒有對數據進行維度約減的情況下,直接用SVM 進行分類,其分類精度都比較低,分別為52%、70.52%、19.33%和75.96%。這些情況都表明了支持向量機對高維數據集具有一定的敏感性。因此,需要對數據進行維度約減,可以看到,在用核主成分進行維度約減后,其分類精度較未進行維度約減前有了顯著提升。尤其對于數據特征較多的數據集(Multi-A),其分類精度較未進行維度約減前提升較大。但是,不同數據集的核表現性能有較大差異,對比高斯徑向基核、多項式核及全變量的情況,運用本文所提出的逆冪核主成分進行的維度約減,其分類精度相對較高,這表明核主成分的維度約減能有效提取原始數據的信息。

4 結語

對于高維數據集,為了提高后續(xù)機器學習算法的分類性能,證明了一種新的逆冪核主成分,并基于該逆冪核主成分的維度約減方法,對高維數據集進行維度約減。通過對四個高維數據集的對比實驗,得到與傳統(tǒng)的高斯徑向基核、多項式核及全變量情況的對比研究,結果表明提出的逆冪核主成分的維度約減更加有效地提高了機器學習方法的分類精度。

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數據分析中的分類討論
按需分類
教你一招:數的分類
主站蜘蛛池模板: 国产精品熟女亚洲AV麻豆| 国产正在播放| 久热中文字幕在线| 天天色天天综合| 亚洲精品无码在线播放网站| www.91中文字幕| 国内熟女少妇一线天| 女人18毛片水真多国产| 国产av色站网站| 国产精品白浆无码流出在线看| a毛片在线免费观看| 99视频在线免费观看| 亚洲天堂视频在线免费观看| 免费无码在线观看| 久久人妻xunleige无码| 美女高潮全身流白浆福利区| 欧美爱爱网| 99热最新在线| 久久semm亚洲国产| 午夜性爽视频男人的天堂| 中文字幕日韩视频欧美一区| 久久综合伊人77777| 女人18毛片一级毛片在线 | 国产伦精品一区二区三区视频优播| 国产三级毛片| 国产伦精品一区二区三区视频优播 | 亚洲天堂高清| 久久美女精品| 久久久久亚洲精品成人网| 亚洲精品视频网| 午夜不卡视频| 国产欧美日本在线观看| 91网址在线播放| 黑人巨大精品欧美一区二区区| 国内熟女少妇一线天| 国产区免费| 亚洲欧美自拍中文| 一本视频精品中文字幕| 午夜视频www| 色婷婷色丁香| 亚洲系列中文字幕一区二区| 国产凹凸视频在线观看| 成人一区专区在线观看| 亚洲一区免费看| 国产精品午夜电影| 欧美日韩成人| 激情综合五月网| 91福利片| 激情无码视频在线看| 亚洲中文久久精品无玛| 国产无遮挡猛进猛出免费软件| 999国内精品久久免费视频| 在线免费a视频| 日韩在线1| 一级毛片视频免费| 亚洲国产日韩欧美在线| 日韩色图在线观看| 最新日韩AV网址在线观看| 91色老久久精品偷偷蜜臀| 久久毛片基地| 欧洲免费精品视频在线| 99久久精彩视频| 在线看片免费人成视久网下载| 国产精品一线天| 久久综合AV免费观看| 亚洲精品综合一二三区在线| 5555国产在线观看| 亚洲青涩在线| 日本黄色不卡视频| 国产亚洲精品97AA片在线播放| 91外围女在线观看| 成年人久久黄色网站| 日韩免费成人| 亚洲日韩久久综合中文字幕| 欧美综合一区二区三区| 99re热精品视频国产免费| 中文天堂在线视频| 国产成人AV男人的天堂| 九色在线视频导航91| yy6080理论大片一级久久| 人妻出轨无码中文一区二区| 国内精品视频在线|