




摘要:時間序列分類算法廣泛應用于醫療診斷、金融預測等領域。然而,在解決時間序列分類問題時,深度學習模型通常面臨數據標注困難等挑戰。為了克服這些困難,本文提出了一種基于自監督學習的時間序列分類算法。該算法通過對時間序列片段進行數據增廣,并設計區分數據增廣形式的自監督輔助任務來挖掘時間序列的局部信息,以提高分類性能。實驗結果表明,該算法在五個基準時間序列數據集上展現出優異的分類性能,并超過了現有方法。
關鍵詞:時間序列分類;自監督學習;數據增廣;局部特征;遷移學習
中圖分類號:TP181 文獻標識碼:A
文章編號:1009-3044(2024)22-0004-03
開放科學(資源服務)標識碼(OSID)
0 引言
時間序列數據廣泛存在于現實世界,如交通分析、醫療診斷、金融預測和工業檢測等領域[1-3]。挖掘時間序列數據的信息有助于分析現實情況,進行科學決策。例如,研究人員通過分析心電圖、腦電圖等醫學數據來判斷病人的身體狀況,根據當前股票價格、匯率等金融數據預測股市未來發展趨勢等。因此,研究時間序列分類算法是具有現實意義的。
近年來,已有大量學者將深度學習模型應用于時間序列分類任務中[4-7]。XIAO等人[8]分別使用時間特征網絡提取數據局部特征和注意力網絡提取數據內在關系,然后結合兩種特征進行時間序列分類。DEMPSTER等人[9]提出一種利用隨機大小和權重的卷積核來提取時域信息的方法,該方法可以提取多種數據特征從而提高時間序列分類效果。自監督學習作為一種新的學習范式[10],其能夠利用輔助任務從大量無標簽數據中挖掘出有效的數據信息。SHI等人[11]設計了自動去噪和時間序列數據相似性判別的自監督任務,該方法提高時間序列分類效果。LIU等人[12]根據心電信號數據的實際特點在數據上面疊加任意頻率和幅度的正弦波以及疊加隨機噪聲進行數據增廣,從而提高分類效果。但是監督學習需要大量標簽數據進行訓練,而對數據標注則需要耗費大量的時間和人力成本。自監督學習可以緩解時間序列分類領域標記困難的問題。
目前,自監督學習在時間序列分類領域已經得到了大量的研究[13]。FAN等人[14]通過學習時間序列數據之間和內部的關系來學習未標記數據的潛在特征。該方法設置錨樣本和其他樣本進行組合,然后讓模型學習區分每種組合。YEHUDA等人[15]基于Koopman定理[16],通過自動編碼器學習時間序列數據的特征表示,在ECG等數據集上取得優異效果。ISMAIL-FAWAZ等人[17]將時間序列分成三段,利用自動編碼器進行特征表示,然后使用三重損失函數更新模型參數。然而,上述的自監督時間序列分類算法的輔助任務大多是簡單任務,缺乏對數據信息的深度挖掘,且沒有充分利用無標簽數據。
因此,本文提出一個基于自監督學習的多數據增廣時間序列分類算法,通過設置特定的多數據增廣分類任務來挖掘數據的局部特征,既緩解了數據標注的困難,又提高了下游時間序列分類效果。本文的主要貢獻包括:
1)本文提出了一種基于自監督的時間序列分類算法,通過設置區分數據增廣形式的分類輔助任務來挖掘時間序列數據的局部信息,從而提高分類性能。
2)在五個基準時間序列數據集上進行實驗驗證,結果表明該算法具有優異的分類性能。
1 基于自監督學習的時間序列分類算法
本文詳細介紹了基于自監督學習的時間序列分類算法的具體步驟。該算法主要分為兩個階段:自監督預訓練階段和監督微調階段。自監督預訓練階段如圖1所示,利用無標簽數據進行訓練。監督微調階段如圖2所示,利用有標簽數據對預訓練模型進行微調。算法的特征提取器部分使用一維ResNet網絡[18]。
令訓練集為[Dtrain=x1,y1,x2,y2,...,xN,yN],其中[xi=v1,v2,...,vd]表示長度為[d]的時間序列,子序列記為[xi,j],其中[yi∈1,2,...,C]是時間序列[xi]對應的標簽,[C]表示類標簽個數。令[??;θ]表示一維ResNet特征提取器,其中[θ]是網絡參數;[g?;?]表示全連接分類器,其中[?]是網絡參數;[h?;φ]表示帶一層CNN的全連接分類器,其中[φ]表示網絡參數。
1.1 自監督訓練
為了挖掘時間序列數據的局部特征,本文對時間子序列進行了數據增廣和混合增廣操作,并設置區分數據增廣形式的分類輔助任務。數據增廣方式包括隨機噪聲、數據抖動、上下采樣以及混合增廣(包含任意兩種基礎增廣方法)。
對給定時間序列數據[x=v1,v2,...,vd],進行數據增廣操作。
1) 隨機噪聲:隨機生成高斯分布噪聲[G=g1,g2,...,gd]對子序列[xi,j]添加噪聲,如公式(1)所示:
[vi=vi+gi] (1)
2) 數據抖動:隨機生成兩個參數[α],[β],其中[α>1],[β<1],對子序列[xi,j]進行抖動,如公式(2)所示:
[v=vi?αif i mod 2=0 vi?βotherwise] (2)
3) 上下采樣:令[k=i+j2],對子序列[xi,j]進行上下采樣,如公式(3)所示:
[v=-1if i <=k 1otherwise] (3)
對時間序列數據[x=v1,v2,...,vd]進行數據增廣操作后得到[x=v1,...,vi,...,vj,...,vd],并為增廣數據[x]添加相應的偽標簽[y],為了增加樣本數量和擴大特征提取范圍,隨機選擇兩個基礎增廣方法進行組合,形成新的增廣數據,最后得到新的自監督訓練集[Daug=x1,y1,x2,y2,...,xn,yn]。令時間序列數據經過特征提取器后得到高級特征[zi=?(xi,θ)],[zi]經過分類器后的類別概率為[pi=g(zi,?)]。損失函數使用交叉熵損失函數[Lcls],其中[Daug]表示[Daug]數據集的類別數,如公式(4)所示:
[Lcls=-1Daugi=1Daugyilogpi] (4)
最后,利用特征提取器提取高級特征[zi],并使用分類器[h?;φ]區分源數據經過了何種數據增廣,然后利用梯度下降算法更新特征提取器網絡參數,完成自監督預訓練。
1.2 監督訓練時間序列分類
在完成自監督預訓練后,將特征提取器參數遷移到真實標簽數據上進行微調。利用訓練集[Dtrain=x1,y1,x2,y2,...,xN,yN]進行微調,經過特征提取器得到[zi=?(xi,θ)],然后經過分類器[h?;φ]得到類別概率[pi=h(zi,φ)]。損失函數使用交叉熵損失函數,其中[Dtrain]表示[Dtrain]數據集的類別數,如公式(5)所示:
[LCE=-1Dtraini=1Dtrainyilogpi] (5)
2 實驗結果與分析
本節將介紹基于自監督學習的時間序列分類算法的實驗結果和分析,包括實驗數據集、評價指標、自監督驗證實驗、對比實驗、消融實驗等。
2.1 實驗設置以及評價指標
實驗在The UCR time series archive[19]的5個標準時間序列數據集上進行,其中數據集按照80%訓練集和20%測試集進行分配。具體數據集細節如表1所示。本文采用時間序列分類領域常用的準確率[accuracy]作為評價指標。
2.2 自監督驗證實驗
為了驗證自監督預訓練的有效性,本文設置了自監督驗證實驗。實驗分為三種類型:(1) 監督:直接使用初始化特征提取器參數進行有監督訓練;(2) 凍結:凍結預訓練后特征提取器參數,只訓練分類器;(3) 微調:加載預訓練后特征提取器參數進行微調訓練。實驗過程中發現,使用全連接分類器[g?;?]和帶一層CNN的全連接分類器[h?;φ]對實驗精度有不同的影響。實驗結果如表2所示。
實驗結果表明,模型經過自監督預訓練后再微調的準確率往往高于直接使用初始化參數進行訓練的準確率,這驗證了自監督預訓練的有效性。
實驗結果還表明,使用帶一層卷積的全連接分類器[h?;φ]比全連接分類器[g?;?]的效果好。這是因為分類器的一層卷積網絡可以對特征提取器得到的高級特征進行特征精煉操作,精煉后的特征更有利于全連接分類器分類。此外,模型增加一層卷積也提升了模型的泛化能力。
因此下文的對比實驗以及消融實驗均使用帶一層卷積的全連接分類器[h?;φ],并進行微調。
2.3 對比實驗
本節將本文提出的算法與現有的算法進行對比。 實驗分別采用20%、40%和100%的訓練集數據對模型進行微調,并比較算法的準確率。實驗結果如表 3 所示。
2.4 消融實驗
為了進一步驗證本文提出的算法的有效性,在數據集CricketX上進行了消融實驗。實驗分別為:1) 預訓練只進行經過3種基礎數據增廣的3分類任務,記為3-classification;2) 預訓練只進行經過3種基礎數據增廣兩兩混合的3分類任務,記為3-mix-classification;3) 預訓練經過基礎和混合數據增廣的6分類任務,記為self-supervised。實驗結果如表4所示。
實驗結果表明,自監督任務的復雜程度對模型性能有一定的影響。從上述實驗可以看出,復雜的自監督任務往往能取得更好的效果。預訓練階段的自監督任務有助于提升模型性能,相較于直接使用初始化參數訓練,更容易得到更好的效果。此外,模型適當挖掘數據自身局部信息有助于自監督預訓練。
3 結束語
針對時間序列數據標記困難的問題,本文提出了一種基于自監督學習的時間序列分類算法。該算法通過挖掘時間序列數據的局部特征進行自監督預訓練,在基準數據集上的實驗結果表明,所設計的自監督方案有助于提高模型性能。
參考文獻:
[1] HARUTYUNYAN H,KHACHATRIAN H,KALE D C,et al.Multitask learning and benchmarking with clinical time series data[J].Scientific Data,2019,6(1):96.
[2] REZAEI S,LIU X.Deep learning for encrypted traffic classification:an overview[J].IEEE Communications Magazine,2019,57(5):76-81.
[3] SEZER O B,GUDELEK M U,OZBAYOGLU A M.Financial time series forecasting with deep learning:a systematic literature review:2005–2019[J].Applied Soft Computing,2020,90:106181.
[4] ISMAIL FAWAZ H,FORESTIER G,WEBER J,et al.Deep learning for time series classification:a review[J].Data Mining and Knowledge Discovery,2019,33(4):917-963.
[5] LIM B,ZOHREN S.Time-series forecasting with deep learning:a survey[J].Philosophical Transactions Series A,Mathematical,Physical,and Engineering Sciences,2021,379(2194):20200209.
[6] BLáZQUEZ-GARCíA A,CONDE A,MORI U,et al.A review on outlier/anomaly detection in time series data[J].ACM Computing Surveys,2022,54(3):1-33.
[7] MOHAMMADI FOUMANI N,MILLER L,TAN C W,et al.Deep learning for time series classification and extrinsic regression:a current survey[J].ACM Computing Surveys,2024,56(9):1-45.
[8] XIAO Z W,XU X,XING H L,et al.RTFN:a robust temporal feature network for time series classification[EB/OL].2020:arXiv:2011.11829.http://arxiv.org/abs/2011.11829
[9] DEMPSTER A,PETITJEAN F,WEBB G I.ROCKET:exceptionally fast and accurate time series classification using random convolutional kernels[J].Data Mining and Knowledge Discovery,2020,34(5):1454-1495.
[10] JING L L,TIAN Y L.Self-supervised visual feature learning with deep neural networks:a survey[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2021,43(11):4037-4058.
[11] SHI P X,YE W W,QIN Z.Self-supervised pre-training for time series classification[C]//2021 International Joint Conference on Neural Networks (IJCNN).Shenzhen,China.IEEE,2021:1-8.
[12] LIU H,ZHAO Z B,SHE Q.Self-supervised ECG pre-training[J].Biomedical Signal Processing and Control,2021,70:103010.
[13] ZHANG K X,WEN Q S,ZHANG C L,et al.Self-supervised learning for time series analysis:taxonomy,progress,and prospects[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2024,PP:PP.
[14] FAN H Y,ZHANG F B,GAO Y.Self-supervised time series representation learning by inter-intra relational reasoning[EB/OL].2020:arXiv:2011.13548.http://arxiv.org/abs/2011.13548.
[15] YEHUDA Y,FREEDMAN D,RADINSKY K.Self-supervised classification of clinical multivariate time series using time series dynamics[C]//Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining.Long Beach CA USA.ACM,2023:5416-5427.
[16] MEZI? I.Spectral properties of dynamical systems,model reduction and decompositions[J].Nonlinear Dynamics,2005,41(1):309-325.
[17] ISMAIL-FAWAZ A,DEVANNE M,WEBER J,et al.Enhancing time series classification with self-supervised learning[C]//Proceedings of the 15th International Conference on Agents and Artificial Intelligence.February 22-24,2023.Lisbon,Portugal.SCITEPRESS-Science and Technology Publications,2023:40-47.
[18] HE K M,ZHANG X Y,REN S Q,et al.Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas,NV,USA.IEEE,2016:770-778.
[19] JAWED S,GRABOCKA J,SCHMIDT-THIEME L.Self-supervised learning for semi-supervised time series classification[M]//Advances in Knowledge Discovery and Data Mining.Cham:Springer International Publishing,2020:499-511.
[20] XI L,YUN Z C,LIU H,et al.Semi-supervised time series classification model with self-supervised learning[J].Engineering Applications of Artificial Intelligence,2022,116:105331.
【通聯編輯:唐一東】