999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于鄰域保持嵌入的時間序列聚類融合算法*

2015-10-21 00:15:42翁小清河北經貿大學信息技術學院河北石家莊050061
網絡安全與數據管理 2015年20期
關鍵詞:融合

劉 學,翁小清(河北經貿大學 信息技術學院,河北 石家莊 050061)

基于鄰域保持嵌入的時間序列聚類融合算法*

劉 學,翁小清
(河北經貿大學 信息技術學院,河北 石家莊 050061)

時間序列的維數比較大,直接對時間序列進行聚類性能不理想。如何提高時間序列的聚類性能,是主要研究點。首先使用鄰域保持嵌入對時間序列樣本維數約簡,然后對維數約簡后的數據進行聚類融合,最后將它的聚類性能與已有方法如主成分分析、分段聚合近似進行比較。實驗表明,所提出的算法更能提高聚類性能。

時間序列;聚類融合;維數約簡;鄰域保持嵌入

0 引言

時間序列是一種高維且隨著時間變化而變化的數據。時間序列聚類在風險管理、車輛檢測[1]、隧道通風控制、交通流等領域廣泛應用。

蘇木亞等人[2]提出了基于主成分分析(Principal Component Analysis,PCA)的時間序列聚類方法,但是PCA是線性方法,現實數據集往往具有非線性特征;李海林等人[3]先用分段聚合近似(Piecewise Aggregate Approximation,PAA)對時間序列降維,然后進行聚類,但是PAA沒有考慮樣本之間的內在關系。鄰域保持嵌入(Neighborhood Preserving Embedding,NPE)[4]是局部線性嵌入(Locally Linear Embedding,LLE)[5]的線性近似,它清晰地考慮了數據的流形結構,約簡后的數據可以最優地保持原數據集的局部鄰域信息,并考慮了樣本之間的內在關系。

針對單一聚類算法存在結果不穩定的問題,現在趨向于融合多個聚類的結果,即聚類融合。本文提出了一種基于NPE的時間序列聚類融合算法,實驗結果表明,本文提出的算法與已有方法相比,更能提高聚類性能。

1 背景

1.1 鄰域保持嵌入

(1)構造鄰域圖G。如果xj在xi的k近鄰中,就在兩個點之間放一條有向邊。

(2)計算加權矩陣W。通過解決最小化問題得到點xi到xj之間邊的權重Wij;如果xi與xj之間沒邊,則Wij=0。

(3)計算映射。通過解決一般特征值問題來獲得轉換向量a:其中,X=(x1,…,xn),M=(I-W)T(I-W),I=diag(1,…,1)。假設A=[a0,a1,…,ad-1],特征值排序后為0≤λ0≤…≤λd-1。得到y:yi=ATxi,其中yi是d維向量,A是l×d矩陣。

1.2 基于互信息的聚類成員的權值

每個聚類成員的平均互信息為:

2 時間序列聚類融合算法

算法包括三步:首先,使用NPE對數據集進行維數約簡;其次,對降維后的數據進行聚類,產生聚類成員;最后,使用加權投票法進行聚類融合。

聚類融合算法如下:

輸入:數據集Data,近鄰個數k,嵌入維數d,聚類個數M,聚類成員個數H

輸出:聚類結果

(1)使用PCA對數據集進行預處理;

(3)計算加權矩陣W;

(6)使用K均值聚類將Y聚成M個類,進行H次,得到H個聚類成員;

(7)計算每個聚類成員的權值;

(8)對聚類成員使用加權投票進行聚類融合。

3 實驗

3.1 數據集描述

表1列出了來自不同領域的10個時間序列數據集[7]的主要特征。

表1 數據集描述

3.2 評價準則

聚類性能用 micro-p[6]表示,如式(6)所示。設數據集分為 c類 {C1,C2,…,Cc},n為樣本個數,ah表示實驗正確分到Ch中的樣本個數,micro-p越大,聚類效果越好。

3.3 性能比較

每一種測試重復10次,記錄平均的micro-p,結果如表2所示。第2列是在原始數據上進行K均值聚類的micro-p,第3、4、5列分別是對PCA、PAA以及NPE降維后的數據進行K均值聚類時最高的micro-p以及相應嵌入空間的維數;第6列給出了對NPE降維后的數據進行聚類融合最高的micro-p以及相應聚類成員個數,用NPEC表示聚類融合算法。

表2 聚類結果比較

對表2中實驗結果進行配對樣本t檢驗,結果如表3所示。

表3 配對樣本t檢驗

從表2、表 3可以看到,NPEC的平均 micro-p為0.8,高于其他方法。另外,原始數據、PCA、PAA分別與NPEC配對樣本t檢驗的概率p值都小于0.05,說明NPEC的聚類性能顯著地好于這三種方法。

3.4 參數對算法性能的影響

圖1為在Coffee上,將k固定為10,micro-p隨d的變化情況。當d較小時,micro-p較低,聚類性能較差。產生這種情況,一種可能的解釋為數據集中不同的樣本經過NPE映射以后,在低維空間重疊在了一起。隨著d增加,micro-p快速上升,說明本文提出的算法并不需要很高的嵌入維數就可以獲得不錯的聚類效果。

圖1 在Coffee數據集上micro-p隨d的變化情況

圖2為在Synthetic Control上,將d固定為43,micro-p隨k的變化情況。隨著k的增加,micro-p在一定范圍內波動,說明k對聚類性能的影響較小。

圖2 在Synthetic Control數據集上micro-p隨k的變化情況

圖3給出在 Face Four上,micro-p隨H的變化情況。當H從5增長到100時,micro-p逐漸提高,當H繼續增大時,micro-p保持穩定并在一定范圍內波動。

4 結論

本文提出了一種基于NPE的時間序列聚類融合算法,與已有方法PCA、PAA相比,這種方法更能提高聚類性能。在算法中,如何選擇最優的嵌入維數以及共識函數的設計,值得今后進一步研究。

圖3 在Face Four數據集上micro-p隨H的變化情況

[1]陳龍威,孫旭飛.一種基于時間序列分層匹配的騎線車輛檢測方法[J].微型機與應用,2014,33(21):88-91.

[2]蘇木亞,郭崇慧.基于主成分分析的單變量時間序列聚類方法[J].運籌與管理,2011(6):66-72.

[3]李海林,郭崇慧,楊麗彬.基于分段聚合時間彎曲距離的時間序列挖掘[J].山東大學學報,2011,41(5):57-62.

[4]He Xiaofei,Cai Deng,Yan Shuicheng,et al.Neighborhood preserving embedding[C].IEEE International Conference on Computer Vision,2005:1208-1213.

[5]ROWEIS S T,SAUL L K.Nonlinear dimensionality reduction by locally linear embedding[J].Science,2000,290 (5500):2323-2326.

[6]唐偉,周志華.基于 Bagging的選擇性聚類集成[J].軟件學報,2005,16(4):496-502.

[7]Chen Yanping,KEOGH E,et al.The UCR Time Series Classification Archive.www.cs.ucr.edu/~eamonn/time_series_data/. 2015.

Time series clustering fusion algorithm based on neighborhood preserving embedding

Liu Xue,Weng Xiaoqing
(Information Technology College,Hebei University of Economics&Business,Shijiazhuang 050061,China)

The dimension of time series is relatively large,and the clustering performance which clusters directly to the time series data is not ideal.How to improve the clustering performance of time series is the main research point of this paper.Firstly,it uses neighborhood preserving embedding to time series sample for dimensionality reduction.Then clustering fusion of data after dimension reduction is carried out.Finally,the clustering performance is compared with the existing methods,such as principal component analysis and piecewise aggregate approximation.Experiment shows that the proposed algorithm can improve the clustering performance.

time series;clustering fusion;dimension reduction;neighborhood preserving embedding

TP311.13

A

1674-7720(2015)20-0048-03

劉學,翁小清.基于鄰域保持嵌入的時間序列聚類融合算法[J].微型機與應用,2015,34(20):48-50.

2015-07-29)

國家社會科學基金( 13BTJ007 )

猜你喜歡
融合
一次函數“四融合”
兩個壓縮體融合為一個壓縮體的充分必要條件
村企黨建聯建融合共贏
今日農業(2021年19期)2022-01-12 06:16:36
融合菜
寬窄融合便攜箱TPFS500
寬窄融合便攜箱IPFS500
從創新出發,與高考數列相遇、融合
寬窄融合便攜箱IPFS500
《融合》
現代出版(2020年3期)2020-06-20 07:10:34
“四心融合”架起頤養“幸福橋”
福利中國(2015年4期)2015-01-03 08:03:38
主站蜘蛛池模板: 一级看片免费视频| 999精品在线视频| 日韩免费视频播播| 精品1区2区3区| 国产成人精品2021欧美日韩| 毛片卡一卡二| 欧美国产菊爆免费观看 | 亚洲色图综合在线| 不卡午夜视频| 国产免费a级片| 亚洲欧美日本国产专区一区| 亚洲成网777777国产精品| 伊大人香蕉久久网欧美| 久久夜色撩人精品国产| 亚洲欧美另类色图| 无码专区在线观看| 一区二区午夜| 亚洲AⅤ无码日韩AV无码网站| 午夜人性色福利无码视频在线观看| yjizz国产在线视频网| 青草免费在线观看| 九色视频一区| 久久综合九九亚洲一区| 欧美在线精品怡红院| 欧美人人干| 免费中文字幕一级毛片| 欧美成人区| 国产无码性爱一区二区三区| 97免费在线观看视频| 国产亚洲欧美日韩在线观看一区二区| 国产精选小视频在线观看| 日韩高清一区 | 国产成人一区二区| 国产精品 欧美激情 在线播放| 日韩一区二区三免费高清| 久久久精品久久久久三级| 91系列在线观看| 中文字幕在线看视频一区二区三区| 青青草原国产免费av观看| 老司机午夜精品网站在线观看| 被公侵犯人妻少妇一区二区三区| 国产亚洲精品自在久久不卡 | 亚洲中文字幕23页在线| 亚洲日韩欧美在线观看| 激情影院内射美女| 找国产毛片看| 亚洲乱强伦| 欧美亚洲中文精品三区| 亚洲国产午夜精华无码福利| 亚洲一区二区无码视频| 精品三级在线| 九色免费视频| 成人一级免费视频| 亚洲午夜天堂| 97久久精品人人做人人爽| 在线亚洲精品福利网址导航| 亚洲乱码在线视频| 小13箩利洗澡无码视频免费网站| 亚洲bt欧美bt精品| 亚洲中文在线视频| 一区二区自拍| 亚洲无码四虎黄色网站| 又大又硬又爽免费视频| 欧美综合中文字幕久久| 欧美在线一二区| 国产经典免费播放视频| 亚洲天堂精品在线| 国产第一页亚洲| 亚洲色偷偷偷鲁综合| www.日韩三级| 国产成人精品高清在线| 日本午夜视频在线观看| 久久久久久久久久国产精品| 亚洲一级毛片在线播放| 欧美成人a∨视频免费观看 | www中文字幕在线观看| 91精品免费久久久| 亚洲日韩久久综合中文字幕| 91精品国产福利| 成人国产三级在线播放| 国产SUV精品一区二区6| 国产乱子伦无码精品小说|