999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ELM-AE的遷移學習算法?

2018-05-29 03:10:54鄧萬宇屈玉濤
計算機與數(shù)字工程 2018年5期
關鍵詞:分類特征

鄧萬宇 屈玉濤 張 倩

(西安郵電大學計算機學院 西安 710061)

1 引言

互聯(lián)網(wǎng)和社交網(wǎng)絡的快速發(fā)展,帶來了數(shù)據(jù)(例如,Web數(shù)據(jù))的爆發(fā)式增長[11]。數(shù)據(jù)種類的增多導致實際應用中經常需要處理來自于不同領域的數(shù)據(jù)。由于數(shù)據(jù)特征之間的差異較大,導致很難訓練出一種公共分類器去分類不同類別的數(shù)據(jù),在這種情況下就需要使用遷移學習。遷移學習[15]的主要目的是訓練一種健壯的公共分類器,可以很好地對來自于不同領域的數(shù)據(jù)進行分類。遷移學習廣泛應用在自然語言處理[16~18],計算機視覺[18~20],統(tǒng)計和機器學習[18~20]中。傳統(tǒng)的遷移學習有很多都是基于主成分分析法(PCA)[6,9~10]來實現(xiàn)的。PCA[5,12]是在盡量不改變數(shù)據(jù)特征的情況下來降低數(shù)據(jù)的維度,它是考察多個變量間相關性的一種多元統(tǒng)計方法,研究如何通過少數(shù)幾個主成分來揭示多個變量間的內部結構,即從原始變量中導出少數(shù)幾個主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關。PCA所要做的就是設法將原來眾多具有一定相關性的變量,重新組合為一組新的相互無關的綜合變量來代替原變量。然而PCA具有它的局限性:1)它要求數(shù)據(jù)必須是線性的。2)它分解出的特征必須是正交的。這導致在實際應用中很多數(shù)據(jù)都無法應用PCA來進行處理。

本文使用一種新的特征提取方法,即極限學習機自編碼(ELM-AE)。基于ELM-AE來完成遷移學習,它可以解決PCA應用中的局限性,并在遷移學習上獲得更高的分類準確率。

遷移學習的最基本的實現(xiàn)方法是將原始數(shù)據(jù)映射到一個新的空間中,在這個空間中,源域和目標域的特征之間的差異被最小化。基于PCA的遷移學習算法已經被廣泛的研究[6,9~10],通過 PCA 可以找到一個公共的特征子空間。在文獻[8]中Blitzer等提出了一種方法,通過不同領域之間的特征關系去學習一個新的特征空間。在Chang[15]表示源域數(shù)據(jù)可以通過目標域數(shù)據(jù)線性變換而得到。在 Gong等[7]提出了一個 geodesic flow kernel(GFK),它主要統(tǒng)計源數(shù)據(jù)和目標數(shù)據(jù)在幾何和統(tǒng)計上特征的改變。Fernando等[3]提出了一種基于PCA的遷移學習算法,他們應用PCA分別得到源域數(shù)據(jù)和目標域數(shù)據(jù)的特征空間,然后將源域數(shù)據(jù)特征映射到目標域數(shù)據(jù)的特征空間中或者將目標域數(shù)據(jù)的特征映射到源域數(shù)據(jù)的特征空間中。

2 ELM-AE

極速學習機自編碼器(ELM-AE)是一種基于極速神經網(wǎng)絡(ELM)的自編碼器,具有ELM的計算速度快,效率高等優(yōu)點。和傳統(tǒng)的ELM[14]神經網(wǎng)絡類似,ELM-AE的網(wǎng)絡結構包含三層:輸入層,隱含層和輸出層。唯一不同之處在于ELM-AE的目標輸出和它的輸入是相等的,其網(wǎng)絡結構如圖1所示。

圖1 ELM-AE網(wǎng)絡結構

在圖1中,L代表的是隱含節(jié)點數(shù),d代表的是輸入層和輸出層的節(jié)點數(shù),也就是數(shù)據(jù)的維度,x代表的是ELM-AE的輸入和輸出。根據(jù)d和L之間的關系,ELM-AE可以被分為三種不同的類型。

壓縮型:代表數(shù)據(jù)從高維空間映射到低維空間中。

稀疏型:代表數(shù)據(jù)從低維空間映射到高維空間中。

等維型:代表數(shù)據(jù)映射前后的維度是相等的。

根據(jù)ELM的理論[4,14],隱含層的參數(shù)可以隨機地生成。通常可以選擇正交的隱含層參數(shù)來提高ELM-AE的泛化性能。隱含層的參數(shù)可以通過Johnson-Lindenstrauss lemma[13]來計算得到:

在式(1)中 a=是隨機正交的權重,b=[b1,…,bL]是隨機正交的偏差。對于壓縮型和稀疏型的ELM-AE,計算ELM-AE的輸出權值β可以通過式(2):

-1

其中,H=[h1,…,hN]是ELM-AE的隱含層輸出,C是ELM的輸入?yún)?shù),I是標準單位矩陣,X=[x1,…,xN]是ELM-AE的輸入和輸出。對于等維型ELM-AE,計算它的輸出權值 β可以通過式(3):

式(2)的奇異值分解(SVD)可以表示為

其中u是HHT的特征向量,d是H的奇異值,H是輸入X在隱含層空間上的映射,所以ELM-AE的輸出權值β通過奇異值可以對輸入數(shù)據(jù)進行特征表達,通過β可以將輸入數(shù)據(jù)映射到對應的特征子空間中。

3 基于ELM-AE的子空間對齊

在實際應用中,數(shù)據(jù)通常來源于不同領域,例如圖片和文本混合的數(shù)據(jù),如果使用圖片的數(shù)據(jù)來訓練一個分類器,并用它來分類文本的數(shù)據(jù),通常不會獲得好的分類效果。遷移學習可以很好地解決此類問題。

ELM-AE的輸出權β可以通過奇異值來對輸入數(shù)據(jù)進行特征表達,因此通過ELM-AE可以得到源域數(shù)據(jù)和目標域數(shù)據(jù)各自的特征子空間,分別記為WS和WT(WS,WT∈RD×L)。D表示的是數(shù)據(jù)的維度,L表示的是ELM-AE的隱含層節(jié)點數(shù)。由于源域數(shù)據(jù)和目標域數(shù)據(jù)分布不同,映射出的特征子空間也各不相同。通過子空間對齊將源域和目標域的特征子空間映射到一個公共的特征空間中,在該公共特征空間中,源域數(shù)據(jù)和目標域數(shù)據(jù)之間的特征差異被最小化。這樣通過公共特征子空間上的數(shù)據(jù)來訓練的分類器可以很好地分類來自不同域的數(shù)據(jù)。

假設源域數(shù)據(jù)為 xS,目標域數(shù)據(jù)為 xT,xS,xT∈R1×D,則源域和目標域的特征子空間 X?S和X?T可以被分別表示為 ySWS和 yTWT。為了將源域特征子空間 X?S和目標域特征子空間 X?T映射到一個公共特征子空間中,在此需要學習一個轉換矩陣M ,通過M 使WS和WT對齊。根據(jù)文獻[3],M可以通過最小化Bregman矩陣求解:

其中是Frobenius范數(shù)。由于Frobenius范數(shù)的正交不變性,式(5)可以寫成

由式(7)可以求得最優(yōu)的轉化矩陣M :

通過轉化矩陣M,可以得到子空間對齊后的新的映射空間:

W?a就是目標域特征子空間對齊源域特征子空間后的公共特征空間。

4 算法實現(xiàn)

基于ELM-AE的子空間對齊算法的實現(xiàn)主要分兩個環(huán)節(jié):子空間生成;子空間對齊。其主現(xiàn)現(xiàn)步驟為:首先初始化ELM-AE,計算輸入數(shù)據(jù)的輸出權值,生成對應的特征子空間。其次,利用生成的特征子空間求解出轉化矩陣M。最后利用轉化矩陣將各自的特征空間進行對齊。基于ELM-AE的子空間對齊算法流程見算法1。

算法1:基于ELM-AE的子空間對齊算法

輸入:源域數(shù)據(jù)XS,目標域數(shù)據(jù)XT,源域數(shù)據(jù)標簽TS,目標域數(shù)據(jù)標簽TT,隱含層節(jié)點數(shù) L,激活函數(shù) h(x)。

輸出:預測的目標域標簽 TT

5 實驗驗證

本次實驗選取 Office[1]和 Caltech256[2]數(shù)據(jù)集來進行算法的驗證。Office數(shù)據(jù)集上包含webcam圖片(W),DSLR圖片(D)和 Amazon圖片(A)。Caltech256中的圖片被標記為C。數(shù)據(jù)集共包含4個不同領域的數(shù)據(jù)。A,W,D和C可以組成12組遷移學習問題。遷移學習可以被標記為S→T,S代表源數(shù)據(jù)域,T代表目標數(shù)據(jù)域。

本實驗將基于ELM-AE的遷移學習算法與其他幾種常見的遷移學習算法進行了比較,每組遷移學習分別使用KNN和SVM作為最終分類器,實驗結果如表1所示。

表1 (Part I).KNN分類器的分類準確率(Office dataset+Caltech256)

表2 (Part I).SVM分類器的分類準確率(Office dataset+Caltech256)

6 實驗結果分析

在上述實驗結果中,表1和表2均被分為兩個部分。NA表示的是在該組遷移學習中不涉及特征映射。GFK[7]主要統(tǒng)計源數(shù)據(jù)和目標數(shù)據(jù)在幾何和統(tǒng)計上特征的改變。PCA[3]表示應用PCA分別得到源域數(shù)據(jù)和目標域數(shù)據(jù)的特征空間,然后將源域數(shù)據(jù)特征映射到目標域數(shù)據(jù)的特征空間中或者將目標域數(shù)據(jù)的特征映射到源域數(shù)據(jù)的特征空間中。DA-SA1[3]表示源數(shù)據(jù)通過PCA來求得源數(shù)據(jù)的目標子空間WS。DA-SA2[3]表示目標域數(shù)據(jù)利用PCA得到目標域子空間WT。表1使用KNN作為最終分類器,在表1的12組遷移學習中,有8組在準確率方面提升明顯。表2使用了SVM作為最終分類器,表2中的遷移學習中有11組遷移學習獲得了更高的分類準確率。實驗結果表明不論最終分類器是選擇KNN還是SVM,基于ELM-AE的遷移學習算法都可以獲得更高的分類準確率,這證明了基于ELM-AE的遷移學習算法擁有更好的應用性。

7 結語

基于ELM-AE的遷移學習算法相比傳統(tǒng)的遷移學習算法擁有著更好的效率。由于ELM-AE和ELM一樣在計算過程中不需要迭代,因此計算速度快。相比于PCA,ELM-AE可以很好地處理那些非線性的數(shù)據(jù)問題。隨著數(shù)據(jù)種類的增多,基于ELM-AE的遷移學習算法在未來會獲得更加廣泛的應用。

[1]Saenko K,Kulis B,F(xiàn)ritz M,et al.Adapting Visual Category Models to New Domains[J].ECCV,Heraklion,Greece,September 2010:213-226.

[2]Gopalan R,Ruonan L,Chellappa R.Domain adaptation for object recognition:An unsupervised approach[J].2011,24(4):999-1006.

[3]Fernando B,Habrard A,Sebban M,et al.Unsupervised Visual Domain Adaptation Using Subspace Alignment[C]//IEEE International Conference on Computer Vision.IEEE,2014:2960-2967.

[4]Kasun L L C,Zhou H,Huang G B,et al.Representational Learning with ELMs for Big Data[J].Intelligent Systems IEEE,2013,28(6):31-34.

[5]Jolliffe I T.Principal Component Analysis[J].Journal of Marketing Research,2002.

[6]Chen B,Lam W,Tsang I,et al.Extracting discriminative concepts for domain adaptation in text mining[C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,Paris,F(xiàn)rance,June 28-July.DBLP,2009:179-188.

[7]Gong B,Shi Y,Sha F,et al.Geodesic flow kernel for unsupervised domain adaptation[C]//IEEE Conference on Computer Vision and Pattern Recognition.IEEE Computer Society,2012:2066-2073.

[8]Blitzer J,Mcdonald R,Pereira F.Domain adaptation with structural correspondence learning[J].Emnlp,2006:120-128.

[9]Pan S J,Kwok J T,Yang Q.Transfer learning via dimensionality reduction[C]//AAAI Conference on Artificial Intelligence,AAAI 2008,Chicago,Illinois,Usa,July.DBLP,2008:677-682.

[10]Pan S J,Tsang I W,Kwok J T,et al.Domain adaptation via transfer component analysis[J].IEEE Transactions on Neural Networks,2011,22(2):199.

[11]Torralba A,Efros A A.Unbiased look at dataset bias[C]//Computer Vision and Pattern Recognition.IEEE,2011:1521-1528.

[12]Zwald L,Blanchard G.On the Convergence of Eigenspaces in Kernel Principal Component Analysis[C]//2005:1649-1656.

[13]Johnson W B,Lindenstrauss J.Extensions of Lipschitz maps into a Hilbert space[J].1984,26(189):189-206.

[14]Huang G B,Chen L,Siew C K.Universal approximation using incremental constructive feedforward networks with random hidden nodes[J].IEEE Trans Neural Netw,2006,17(4):879-892.

[15]Jhuo I H,Liu D,Lee D T,et al.Robust visual domain adaptation with low-rank reconstruction[C]//Computer Vision and Pattern Recognition.IEEE,2012:2168-2175.

[16]Iii H D.Frustratingly Easy Domain Adaptation[J].ACL,2009.

[17]Leggetter C J,Woodland P C.Maximum likelihood linear regression for speaker adaptation of continuous density hidden Markov models[J].Computer Speech&Language,1995,9(2):171-185.

[18]Huang J,Smola A J,Gretton A,et al.Correcting sample selection bias by unlabeled data[C]//International Conference on Neural Information Processing Systems.MIT Press,2006:601-608..

[19]Ben-David S,Blitzer J,Crammer K,et al.Analysis of representations for domain adaptation[C]//International Conference on Neural Information Processing Systems.MIT Press,2006:137-144.

[20]Pan S J,Yang Q.A Survey on Transfer Learning[J].IEEE Transactions on Knowledge&Data Engineering,2010,22(10):1345-1359.

猜你喜歡
分類特征
抓住特征巧觀察
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
抓住特征巧觀察
主站蜘蛛池模板: 91精品日韩人妻无码久久| 国产尤物在线播放| 亚洲成人www| 久精品色妇丰满人妻| 一级毛片免费的| 久久久91人妻无码精品蜜桃HD| 免费国产高清视频| 国产精品久久久久鬼色| 日韩在线第三页| 伊在人亞洲香蕉精品區| 高清视频一区| 欧美激情第一欧美在线| 一区二区三区在线不卡免费| 在线观看无码av免费不卡网站 | 精品久久久无码专区中文字幕| 中日韩一区二区三区中文免费视频| 国产91高清视频| 国产男女XX00免费观看| 熟妇丰满人妻| 毛片久久久| 国产男女免费视频| 亚洲国产天堂在线观看| 91视频精品| 亚洲精品国产首次亮相| 成年A级毛片| 草逼视频国产| 国产偷国产偷在线高清| 国产一级在线观看www色| 色网站在线免费观看| 欧美午夜网| 国产精品粉嫩| 久久精品国产精品青草app| 在线网站18禁| 国产手机在线小视频免费观看| 91久久精品国产| 国产裸舞福利在线视频合集| 五月婷婷导航| 91精品最新国内在线播放| 日韩毛片视频| 亚洲中文字幕久久精品无码一区| 久久精品嫩草研究院| 国产亚卅精品无码| 22sihu国产精品视频影视资讯| 一级看片免费视频| 亚洲视屏在线观看| 免费看av在线网站网址| 国产欧美成人不卡视频| 亚洲欧美自拍中文| 四虎成人在线视频| 鲁鲁鲁爽爽爽在线视频观看| 伊人大杳蕉中文无码| 精品欧美日韩国产日漫一区不卡| 全午夜免费一级毛片| 午夜日本永久乱码免费播放片| 有专无码视频| 国产成+人+综合+亚洲欧美| 2024av在线无码中文最新| 国产黑丝一区| 中国一级特黄大片在线观看| 国内毛片视频| 久久77777| 国产女人18水真多毛片18精品| 中文字幕在线一区二区在线| 青青青伊人色综合久久| 丰满的熟女一区二区三区l| 青青青伊人色综合久久| 欧美日韩国产在线观看一区二区三区| 亚洲欧洲日韩久久狠狠爱| 丰满人妻一区二区三区视频| 久久久四虎成人永久免费网站| 日本91在线| 国产午夜一级毛片| 亚洲天堂久久新| 麻豆精品在线| 亚洲第一黄色网址| 国产视频久久久久| 亚洲色图欧美在线| 国产亚洲视频在线观看| 亚洲va欧美ⅴa国产va影院| 91探花国产综合在线精品| 欧美成人免费一区在线播放| 在线观看无码av免费不卡网站|