杜瑩,李四虎,胡紹林,章樂,王飛
1. 63758部隊,廈門 361023 2.航天器在軌故障診斷與維修實驗室,西安 710043
?
遙測偽周期時間序列子序列異常檢測算法
杜瑩1,*,李四虎1,胡紹林2,章樂1,王飛1
1. 63758部隊,廈門 361023 2.航天器在軌故障診斷與維修實驗室,西安 710043
針對現有異常檢測算法用于偽周期時間序列異常序列檢測時易造成誤差累積,導致序列周期與特征值上顯著差異的不足,文章以衛星遙測偽周期時序數據為對象,綜合兩種常規分段方法的優勢,提出了最大周期窗寬內基于極值的模式子序列分段算法。在此基礎上,給出了一種基于均序列動態生成模型的子序列異常檢測方法(Anomaly Subsequence Detection method based on Optimized Sequence Model,ASD_OSM),并采用2次四分位距準則(Double Quantile ranges criterion,2Q準則)設置距離檢測門限閾值,將超出閾值的序列判定為異常序列。某航天器傳感器遙測子序列異常檢測試驗結果表明,提出的檢測方法能夠有效減少漏判,提高衛星遙測偽周期數據異常序列檢測的準確性。
異常檢測;衛星遙測;偽周期;時間序列;異常子序列;2次四分位距準則
受噪聲、干擾和復雜空間環境因素的影響,反映在軌衛星工作狀態的遙測數據多呈現一種帶時變的循環模式,其特征是數據序列既有重復趨勢,周期間隔又不完全相同,本文將具有該特征的遙測數據稱為遙測偽周期時序數據。遙測偽周期時序數據不同周期節拍下子序列的變化趨勢反映了衛星在軌運行的復雜動態,研究遙測偽周期時序數據的序列異常檢測算法,有助于及時發現遙測時序數據的異常子序列,提前預測衛星潛在故障和確定衛星故障模式,對維護在軌衛星的安全穩定運行有重要意義[1-2]。
異常序列檢測也稱為離群序列檢測,是近年來時序數據挖掘的熱點內容之一,其目標是在序列集中發現偏離大部分正常數據序列變化趨勢的子序列。目前,對于異常序列學術界并未給出一個統一的定義,借用D.M.Hawkins異常點的定義[3],可認為異常序列是在數據序列集中與眾不同的序列。現有研究主要集中在對序列中異常點的檢測,主要方法有基于統計、偏差、聚類、距離,以及密度等5大類方法[4-8]。對于時序數據異常子序列的檢測,文獻[9]最早提出將時序數據符號化并通過符號檢索的方法檢索出時序數據中差異最顯著子序列的方法,該方法簡單易行,但易喪失原始數據的數據特征;文獻[10]針對時間序列形態特征,提出一種基于趨勢對比的異常序列檢測算法,其利用冗余壓縮點算法較好地解決了因數據量帶來的計算復雜度問題;文獻[11]提出一種基于時間序列重要點的異常子序列檢測算法,基于重要度進行子序列劃分并通過K近鄰分類(K-Nearest Neighbor classification,KNN)算法進行子序列特征值聚類來檢測異常子序列;文獻[12]針對多變量時間序列,提出一種由粗到細的異常點二次探測方案,但該方案未考慮時間序列的偽周期性;文獻[13]針對偽周期時間序列,采用動態時間規整(Dynamic Time Warping,DTW)距離計算子序列間的相似性,通過建立子序列索引結構并進行聚類來檢測異常子序列,存在時間復雜度高,不適合實時處理的問題;文獻[14]提出一種基于局部線性映射(Local Linear Mapping,LLM)的異常子序列檢測算法,局限在于采用等間隔長度劃分子序列,不適用于偽周期時間序列的異常檢測問題;文獻[15]提出一種基于Hadoop的異常時間序列檢測算法,該算法采用MapReduce機制對海量時間序列進行并行化處理,同時引入基于顯著特征比對的局部約束方法,進一步降低了離群序列的時間復雜度。
綜合已有研究進展可以看出,現有異常序列檢測研究主要集中在特征提取、模型構建和子序列劃分,但未考慮序列的周期特性,用于偽周期時序數據的異常序列檢測時,易造成誤差上的累積,導致序列周期與特征值上的顯著差異。因此,本文面向遙測偽周期時序數據,建立一種基于均序列動態生成的異常序列檢測方法ASD_OSM。
定義1 偽周期序列:時序數據中的數據按照近似的時間間隔以相類似的特征重復出現,具有這種特點的數據序列稱為偽周期序列。
定義2 偽周期模式子序列:偽周期序列按其周期性數據特征(數據變化模式)重復出現,極值間隔可分為不同的模式子序列MSi(i=1,2,…),每一個模式子序列都是一個周期段,且包含以分斷間隔為時間窗口寬度的所有數據。
定義3 均序列:對正常模式下以極值點為初始點的N個偽周期模式子序列MSk,進行對應周期點的平均,得到的序列為均序列ASi(i=1,2,…)。
定義4 子序列殘差:偽周期子序列MSj與其對應均序列ASj的DTW距離差SRD(MSi,ASj)稱為子序列殘差。
定義5 偽周期序列的異常子序列:對于一個模式子序列WS,如果與所對應均序列產生的子序列殘差SRD大于門限閾值φ,即SRD>φ,則稱WS為異常子序列。
遙測偽周期時序數據具有以下特性:1)不固定的循環周期,具有偽周期性;2)無明顯不變的中心趨勢,具有非平穩性;3)每個周期段內抖動的特征值,具有特征抖動性[2-3]。例如,圖1所示某航天飛行器傳感器電流參數和太陽敏感器參數遙測偽周期時序數據。觀察圖1變化形態可知,這些數據都在循環某種相似模式,循環周期不完全相同,且該模式隨時間推移呈現一定的變化,使得每一次循環都不是準確重復,且同時每一次循環都存在抖動現象。


圖1 偽周期時序數據實例Fig.1 Examples of pseudo periodic time series data
針對遙測偽周期時間序列的偽周期性、非平穩性和特征抖動值,本節將構建一組基于均序列動態生成模型的子序列異常檢測方法。
2.1最大周期窗寬內基于極值的子序列分段算法
為了更好地進行異常檢測,需要按照某種標準將偽周期時序數據進行子序列分段。常規分段方法有基于固定窗口寬度的分段方法和趨勢轉折點的分段方法等。其中,基于固定窗口寬度的分段方法是通過尋找某一自然時間間隔為周期長度的周期特征,按照自然時間間隔對該數據進行模式子序列分段。圖2(a)是圖1(a)所示傳感器電流參數序列的固定窗口寬度模式子序列分段效果;圖2(b)是采用趨勢轉折點的模式子序列分段效果。從圖2可以看出,采用固定窗口寬度分段方法依據簡單固定的自然時間間隔進行分段,受偽周期數據特性影響,容易導致不合理的分段效果;采用趨勢轉折點分段方法,受周期段內特征極值和特征抖動影響,容易將局部特征極值點和抖動點作為趨勢轉折點進行分段。


圖2 模式子序列分段Fig.2 Sub-sequence block diagrams
由于上述兩種常規分段方法均不能較好地解決遙測偽周期時序數據的模式子序列分段問題,本文根據遙測數據特性,在吸收上述兩種分段方法優勢和克服各自缺點的基礎上,建立一組新的最大周期窗寬內基于極值的模式子序列分段方法。
具體地,考慮到遙測偽周期數據的最大周期呈現一種以軌道周期為基準的起伏狀態,簡記wi為時間窗寬、Torbit為軌道周期、Δt為固定時間間隔(工程取值通常小于1/4的軌道周期),本節在選擇時間窗寬時參考航天器軌道運行規律的影響,建立以軌道周期+時間間隔Δt為窗寬長度的方法:
(1)
最大周期窗寬內的基于極值的模式子序列分段算法,由7步構成,簡要描述如下:
1)輸入連續的遙測偽周期序列;
2)計算最大周期wi,設置時間初值t0、時間門限Δφ;
3)查找[t0,wi+t0]范圍內第一個極大(小)值時刻點ti;
4)查找[ti+wi-Δφ,ti+wi+Δφ]大周期范圍內極大(小)值ei的時刻點ti;
5)將ti、tj加入分段特征點集合,同時獲取ti、tj之間的序列,加入偽周期模式子序列集合;
6)令ti=tj;
7)如果序列未結束,則轉入第3步,否則跳出。
通過偽周期模式子序列的劃分算法,得到一系列的偽周期模式子序列分段特征點。圖1(a)所示傳感器電流參數序列基于本節分段算法的模式子序列分段效果如圖3所示。從圖3可以看出,分段特征點能夠有效匹配各模式子序列,分段效果較優。

圖3 最大周期窗寬內基于極值的子序列分段Fig.3 Sub-sequence segmentation diagram based on the extreme value of the wide range of maximum cycle window
2.2基于均序列動態生成的異常子序列檢測算法
遙測偽周期序列形態多樣、趨勢變化復雜。
均序列動態生成模型能夠較好地提取原訓練樣本數據的形態與趨勢,因此,本文采用基于均序列動態生成模型的異常子序列檢測算法,以有效進行偽周期子序列的異常檢測。
工程中通常需要先對遙測數據序列進行清洗和重采樣,然后根據第2.1節算法進行周期分段,獲取模式子序列及其分段特征點。然后,以訓練集正常樣本序列的平均序列作為檢測基準序列,基于模式子序列的分段特征點動態生成檢測序列,檢測序列與相應的模式子序列進行匹配,獲取待檢測序列與均序列的距離殘差,計算距離異常判定閾值,基于2Q準則判定遙測異常子序列,過程如圖4所示。
為實現上述的基于均序列動態生成的異常子序列檢測算法設計模型,通常需要完成如下6步:
1)獲取正常樣本序列集合,生成兩個周期的均序列。
2)然后獲取偽周期模式子序列的分段特征點集合。
3)將均序列以模式子序列的分段特征點為初始點,以模式子序列的長度Ln-1為序列長度,動態生成檢測序列。
4)計算待檢測序列與均序列的距離差,獲取殘差序列。
5)取ε=0.5,計算異常判定門限上限σ1=Q2+2×(Q2+Q3)+ε,門限下限σ2=Q2-2×(Q2-Q3)-ε。
6)基于2Q準則,將殘差在異常判定門限之外的序列判定為異常序列。

圖4 基于均序列動態生成的異常子序列檢測算法設計模型Fig.4 Algorithm design model for the detection of anomaly sub-sequences
為驗證本文提出的衛星遙測偽周期數據異常子序列檢測方法的有效性,本節選取某航天器的遙測傳感器參數序列為試驗對象,經數據整理、補點和潔化處理,消除間隔不等、局部重復和野值之后,在MatLab10.0環境下比較了本文ASD_OSM算法與兩種經典算法(基于固定窗口寬度分段特征點的異常子序列檢測和基于趨勢轉折分段特征點的異常子序列檢測)的實際效果。
3.1實測數據及其分段
航天器某運行時段473 s、566組傳感器電壓參數x1(t)和傳感器電流參數x2(t),變化曲線如圖5所示。由圖5可知,給定的遙測數據參數均為偽周期數據,數據曲線均存在異常子序列信息。

圖5 參與測試的遙測參數序列Fig.5 Telemetry parameters in the test
由于遙測數據呈現明顯的偽周期性,各子序列間無嚴格的時間分段點,且各子序列內部的可識別數據特征明顯,因此在該數據集測試過程中采用本文建立的最大周期窗寬內的基于極值的模式子序列分段方法,模式子序列分段的效果如圖6所示。

圖6 最大周期窗寬內基于極值的分段Fig.6 Segmental diagram based on the extreme valueof the maximum periodic window width
由圖6可以看出,基于數據特征的模式子序列分段方法可以有效劃分遙測偽周期數據序列的模式子序列。
3.23種算法的結果比較
以數據集中后31個序列為待測試序列,其余16個序列為正常樣本序列,采用ASD_OSM方法檢測異常子序列。
采用ASD_OSM算法,通過動態生成均序列,獲取均序列與測試序列的殘差,可以發現x1(t)的異常子序列是s23、x2(t)的異常子序列是s23、x3(t)的異常子序列是s22,如圖7所示。
采用基于固定窗口寬度分段特征點進行序列異常檢測,結果如圖8所示。由圖8可以看出,基于固定窗口寬度分段特征點進行序列異常檢測方法,由于偽周期的周期誤差累積性導致子序列殘差呈現上升趨勢,發現x1(t)的異常子序列是s14、x2(t)的異常子序列是s24、x3(t)的異常子序列是s22。

圖7 ASD_OSM算法的子序列異常檢測Fig.7 An abnormal sub-sequence detection based on ASD_OSM algorithm

圖8 固定窗寬分段特征點算法的異常子序列檢測Fig.8 An abnormal sub-sequence detection based on the algorithm of fixed windowwidth sub-feature points
采用基于趨勢轉折分段特征點序列異常檢測方法進行序列異常檢測,結果如圖9所示。由圖可知,基于趨勢轉折分段特征點序列異常檢測方法的子序列殘差呈現較大地動蕩性,發現x1(t)的異常子序列是s5、x2(t)的異常子序列是s2、x3(t)的異常子序列是s22。
對以上3種方法的異常子序列殘差檢測結果參數進行綜合比較,如表1所示。由表1可以看出,ASD_OSM方法的異常殘差檢測門限閾值最優,能夠有效減少漏判;檢測異常時刻點提前于實際報警時刻點,且與實際吻合。基于固定窗口寬度分段特征點的異常序列檢測方法,對兩類參數的檢測結果與實際基本吻合,一類與實際差距較大;基于趨勢轉折分段特征點序列異常方法,對一類參數的檢測結果與實際基本吻合,兩類與實際差距較大,檢測結果基本不符合檢測要求。試驗結果表明,在遙測偽周期時間序列的數據集上,與常規的兩種方法相比,本文提出的ASD_OSM方法能夠更有效地檢測出異常子序列,減少漏判。

圖9 基于趨勢轉折分段特征點的異常子序列檢測Fig.9 An abnormal sub-sequence detection based on the algorithm of trend turning point
本文在最大周期窗寬內基于極值進行模式子序列分段的基礎上,提出了一種基于均序列動態生成檢測序列的衛星遙測偽周期序列異常檢測方法,檢測結果比常規分段算法上的檢測效果好且漏判率低,并對檢測距離門限閾值難以確定的問題,采用2Q準則設置檢測門限閾值。針對某型號衛星遙測偽周期數據序列異常檢測的試驗結果很好地說明了算法的有效性。后續工作將在遙測異常子序列檢測算法的基礎上,深入遙測異常點的檢測研究。

表1 遙測數據集的異常子序列檢測結果參數
References)
[1]MONTGOMERY D C,JENNINGS C L,KULAHCI M. Introduction to time series analysis and forecasting[M].Montgomery:John Wiley & Sons,2015:79-82.
[2]洪申達,尹寧,邱鎮,等. SPG-Suite:面向偽周期時間序列的預測方法[J]. 計算機科學與探索,2014,8(10):1153-1161.
HONG S D,YIN N,QIU Z,et al. SPG-Suite:forecasting method towards pseudo periodic time series[J]. Journal of Frontiers of Computer Science and Technology,2014,8(10):1153-1161(in Chinese).
[3]HAWKINS D M. Identification of outliers[M]. London:Chapman and Hall,1980:135-138.
[4]TANG L A,CUI B,LI H,et al. Effective variation management for pseudo periodical stream[C]∥Proceedings of the ACM SIGMOD International Conference on Management of Data,Beijing,China,June 12-14,2007.
[5]CHEN X Y,CHEN Y L,HUANG S,et al. Detecting an abnormal subsequence in a data sequence:U.S.Patent Application 14/598,843[P]. 2015-1-16.
[6]陳運文,吳飛,吳廬山,等. 基于異常檢測的時間序列研究[J]. 計算機技術與發展 ISTIC,2015,25(4):166-170.
CHEN Y W,WU F,WU L S. Research on time series based on anomaly detection [J] Computer Technology and Development,ISTIC,2015 ,25(4):166-170(in Chinese).
[7]HE Z,XU X,DENG S. Discovering cluster-based local outliers[J]. Pattern Recognition Letters,2003,24(9):1641-1650.
[8]HORVATIC D,STANLEY H E,PODOBNIK B. Detrended cross-correlation analysis for non-stationary time series with periodic trends[J]. EPL(Europhysics Letters),2011,94(1):18007.
[9]KEOGH E,LIN J,FU A W,et al. Finding unusual medical time-series subsequences:algorithms and applications[J]. Information Technology in Biomedicine,IEEE Transactions on,2006,10(3):429-439.
[10]林果園,郭山清.基于動態行為和特征模式的異常檢測模型[J].計算機學報,2006,29(9):1553-1559.
LIN G Y,GUO S Q. An anomaly detection model based on dynamic behavior and character patterns[J] Chinese Journal of Computers,2006,29(9):1553-1559(in Chinese).
[11]李斌,劉瑞琴,劉學軍. 基于冗余點壓縮的趨勢異常序列檢測[J]. 傳感技術學報,2014,27(3):401-408.
LI B,LIU R Q,LIU X J. Abnormal series detection based on trend analysis with point compression[J].Chinese Journal of Sensors and Actuators,2014,27(3):401-408(in Chinese).
[12]張力生,楊美潔,雷大江. 時間序列重要點分割的異常子序列檢測[J]. 計算機科學,2012,39(5):183-186.
ZHANG L S,YANG M J,LEI D J. Outlier sub-sequences detection for importance points segmentation of time series[J].Computer Science, 2012,39(5):183-186(in Chinese).
[13]杜洪波,張穎. 基于 LLM 的時間序列異常子序列檢測算法[J]. 沈陽工業大學學報,2009,31(3):328-332.
DU H B,ZHANG Y. Outlier subsequence detection algorithm for time series based on LLM[J].Journal of Shenyang University of Technology,2009,31(3):328-332(in Chinese).
[14]譚琦,楊沛.基于變窗口神經網絡集成的時間序列預測[J]. 計算機工程,2009,35(1):176-177,182.
TAN Q,YANG P.Time series forecasting based on variable window neural networks ensemble[J].Computer Engineering,2009,35(1):176-177,182(in Chinese).
[15]張建平,李斌,劉學軍,等. 基于 Hadoop 的異常傳感數據時間序列檢測[J]. 傳感技術學報,2014,27(12):1659-1665.
ZHANG J P,LI B,LIU X J,et al. Abnormal time series detection in wireless sensor network based on Hadoop[J].Chinese Journal of Sensors and Actuators,2014,27(12):1659-1665(in Chinese).
(編輯:車曉玲)
Detection algorithm of abnormal sub-sequence in pseudo periodic time series of telemetry
DU Ying1,*,LI Sihu1,HU Shaolin2,ZHANG Le1,WANG Fei1
1.Satellite Telemetering Tracking and Command Station,Xia Men 361023,China 2.Key Laboratory of Spacecraft In-orbit Fault Diagnosis and Maintenance,Xi′an 710043,China
In order to detect the abnormal sub-sequence in the pseudo periodic time series of spacecraft telemetry,a sub-sequence segmentation algorithm on the wide range of maximum cycle window was proposed based on the two conventional segmentation methods. Then,an anomaly sub-sequence detection method based on an optimized sequence model was built by using the double quantile ranges criterion to set the threshold of the distance detection. The satellite experimental results show that the method can effectively detect the abnormal sub-sequence of satellite telemetry data.
anomaly detection;satellite telemetry;pseudo periodic;time series;abnormal sub-sequence;double quantile ranges criterion
10.16708/j.cnki.1000-758X.2016.0051
2015-12-01;
2016-03-28;錄用日期:2016-08-22;
時間:2016-09-2113:41:17
http:∥www.cnki.net/kcms/detail/11.1859.V.20160921.1341.002.html
國家自然科學基金(61473222)
杜瑩(1978—),女,碩士,工程師,ning7266@163.com,研究方向為航天測控、數據挖掘與故障診斷
TP707,V556.1
A
http:∥zgkj.cast.cn
引用格式:杜瑩,李四虎,胡紹林,等. 遙測偽周期時間序列子序列異常檢測算法[J].中國空間科學技術,2016,36(5):18-24.
DUY,LISH,HUSL,etal.Detectionalgorithmofabnormalsubsequenceinpseudoperiodictimeseriesoftelemetry[J].ChineseSpaceScienceandTechnology,2016,36(5):18-24(inChinese).