999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于時間序列線性擬合方法的時間序列層次聚類

2014-12-07 11:01:03王赫楠燕燕王甜宇王和禹
中國科技縱橫 2014年3期
關鍵詞:關鍵點特征方法

王赫楠 燕燕 王甜宇 王和禹

(遼寧中醫藥大學信息工程學院,遼寧沈陽 110032)

基于時間序列線性擬合方法的時間序列層次聚類

王赫楠 燕燕 王甜宇 王和禹

(遼寧中醫藥大學信息工程學院,遼寧沈陽 110032)

本文利用一種有效的時間序列線性擬合方法。算法所選出的關鍵點是對時間序列的形態變化影響較大的點,將這些點依次連接實現時間序列的線性擬合。這種線性擬合算法在剔除了噪聲的同時,能更精確的定位時間序列中的關鍵點。實驗結果表明,該方法能更好的近似表示原時間序列。和已有的方法相比,該方法擬合后的時間序列和原時間序列之間的擬合誤差更小。并且在該方法的基礎上運用動態彎曲距離進行層次聚類得到了較好的結果。

時間序列 線性擬合 擬合誤差 關鍵點 動態彎曲距離

1 引言

時間序列數據挖掘是數據挖掘的一個重要分支,廣泛應用于醫學,金融,工業等眾多領域[1-2]。但由于時間序列有如下的特點,(1)時間序列的數據量巨大;(2)時間序列的噪聲干擾嚴重;(3)時間序列的短期波動頻繁。所以直接在原始時間序列上進行相似性查詢[3]、分類聚類[4]、模式挖掘等操作很難得到滿意的結果。因此許多研究者提出了時間序列的線性擬合表示方法,刻畫時間序列主要形態而忽略那些微小的細節,從而在保持序列的主要特征不變的情況下達到簡化計算量的目的。

本文詳細分析了如何抽取時間序列中的關鍵點,利用了一種有效的線性擬合方法FPSegmentation(Feature Piecewise Segmentation)。利用非單調序列中極值點保持時間段閾值來選取關鍵點,這種線性擬合方法相對于以往的方法不僅將壓縮率提升了,而且能更好的近似表示原時間序列,通過使用動態彎曲距離,對時間序列進行層次聚類得到了較好的結果。

2 基本概念

定義1:時間序列:時間序列是由記錄值和記錄時間組成的元素的有序集合,記為Q={q1=(p1,v1),q2=(p2,v2),…,qn=(pn,vn)},元素qi=(pi,vi)表示時間序列在vi時刻的 記錄值為pi。一般情況下,時間序列的采樣間隔 v=vi-vi-1相等,可以看做v1=0,v=1,此時間序列記為時Q={q1,q2,…qn}。qi表示時間序列Q的第i個元素。

定義2:時間序列分段線性表示的擬合誤差:時間序列Q={q1,q2,…qn},通過線性分段擬合后得到的時間序列L(Q)={L(qi1,qi2),L(qi3,qi4),…,L(qik-1,qik)},其中L表示連接兩點的直線段。將L(Q)通過線性差值之后得到的時間序列記為Q’={q1’,q2’…,qn’},那么該線性表示和原時間序列之間的擬合誤差定義為

Fig.1 the effect of Hierarchical clustering圖1 層次聚類的效果

3 特征點擬合法

特征點擬合法F P S e g m e n t a t i o n是對極值點擬合法IPSegmentation的改進。特征點擬合法所選出的關鍵點是對時間序列的形態變化影響較大的點,將這些點依次連接實現時間序列的線性擬合。具體實現原理如下所述:

FPSegmentation算法把時間按序列Q的起點和終點保留下來作為特征點,其它關鍵點需滿足以下兩點要求:①所選的特征值點必須是序列的極值點;②該極值點保持極值的時間段(即該點的前后極值點之間的時間段)與該序列長度的比值必須大于某個閾值M(參數M看作特征點的判斷影響因子,M的取值和領域知識、序列長度以及實際的關注點有關,一般在0.01-0.1之間)。

4 基于重要點的動態彎曲距離

動態時間彎曲距離在語音處理領域得到廣泛的研究,并且由Berndt和Clifford首次引入到數據挖掘領域。到現在,動態時間彎曲距離已經在醫療信號、生物學數據以及指紋識別等領域得到快速的發展。下面簡要介紹動態時間彎曲距離的基本定義和常用的計算方法.

定義1.時間序列x和y之間的動態時間彎曲距離定義為:

動態時間彎曲距離可以用動態規劃的方法計算,時間復雜度為O(|z|.|y|)。

我們在FPSegmentation的基礎上,運用動態彎曲距離,對于時間序列進行層此聚類,得到了較好的結果,如第五節中實驗所示。

5 實驗結果及分析

我們使用數據集system control chart。該數據集包括600個樣本,每個樣本60個點,共6類,每個類都是100個樣本。通過FPSegme ntation方法提取特征點,我們的聚類正確率可以達到70%以上。

圖中有三種樣本的時間序列分類明顯錯誤,其它的時間序列分類結果較好,分類的正確率能夠達到70%以上。

6 結語

特征點線性擬合法FPSegmentation能夠更好的擬合原時間序列,擬合后的時間序列和原時間序列相比,擬合誤差更小,壓縮率更大。我們在FPSegmentation的基礎上,利用動態彎曲距離,對擬合后的時間序列進行層次聚類得到了較好的結果。

[1]Park S,Kim S,Chu W. Segmentation-based approach for subsequence searchs in sequence databases[C]/.Proceedings of the 16th ACM Symposium on Applied Computing.New York: ACM Press,2001:248-252.

[2]肖輝,胡運發.基于分段時間彎曲距離的時間序列挖掘[J].計算機研究與發展.2005.42(1):72-78.

[3]Park K B,Fink E. Search for patterns in compressed time series[J]. International Journal of Image and Graphics,2002,2(1):89-106.

[4]D.J.Berndt,J.Clifford.Using dynamic time warping to find patterns in time series.Working Notes of the Knowledge Discovery in Databases Workshop,Seatle,WA,1994.

猜你喜歡
關鍵點特征方法
聚焦金屬關鍵點
肉兔育肥抓好七個關鍵點
今日農業(2021年8期)2021-11-28 05:07:50
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
醫聯體要把握三個關鍵點
中國衛生(2014年2期)2014-11-12 13:00:16
鎖定兩個關鍵點——我這樣教《送考》
語文知識(2014年7期)2014-02-28 22:00:26
主站蜘蛛池模板: 香蕉99国内自产自拍视频| 熟女成人国产精品视频| 国产在线精品99一区不卡| 性做久久久久久久免费看| 精品国产www| 国产精品成人一区二区| 久久a级片| 亚洲成人免费看| 亚洲视频四区| 欧美国产中文| 亚洲精品视频免费看| 熟妇丰满人妻av无码区| 一级毛片免费的| 超清无码一区二区三区| 亚洲视频欧美不卡| 五月激情婷婷综合| 蜜桃视频一区二区| AV天堂资源福利在线观看| 亚洲高清在线天堂精品| 伊人狠狠丁香婷婷综合色| 久久综合伊人77777| 女人18毛片一级毛片在线 | 久无码久无码av无码| 色综合中文字幕| 丁香六月综合网| 亚洲国产成人久久77| 国产欧美日韩资源在线观看| 少妇露出福利视频| 国产精品毛片一区| 永久在线播放| 日本一本正道综合久久dvd| 亚洲日本中文字幕乱码中文| 国产精品嫩草影院视频| 亚洲视频欧美不卡| 午夜视频www| 国产91精选在线观看| 麻豆a级片| 天天综合亚洲| 欧美综合区自拍亚洲综合天堂| 自拍亚洲欧美精品| 亚洲日韩每日更新| 亚洲免费毛片| 成年人国产网站| 国产精品开放后亚洲| 中国一级特黄视频| 国产激情无码一区二区免费| 国产精品19p| 国产精品内射视频| 69综合网| 伊人色在线视频| 激情爆乳一区二区| 久久精品波多野结衣| 欧美日韩久久综合| 欧美精品在线免费| 国产成人av一区二区三区| 五月婷婷中文字幕| 99在线视频精品| 波多野结衣一二三| 1769国产精品视频免费观看| 老汉色老汉首页a亚洲| 欧美成人在线免费| 亚洲精品色AV无码看| 欧美曰批视频免费播放免费| 久久精品只有这里有| 国产欧美综合在线观看第七页| 91在线无码精品秘九色APP| 亚洲人妖在线| 婷婷久久综合九色综合88| 久久婷婷六月| 久久免费视频播放| 国产h视频在线观看视频| 免费啪啪网址| 成人字幕网视频在线观看| 国产精品午夜电影| 亚洲美女高潮久久久久久久| 伊人91在线| 国产日韩丝袜一二三区| 91蜜芽尤物福利在线观看| 精品人妻AV区| 亚洲第一在线播放| 色综合久久无码网| 无码精油按摩潮喷在线播放|