摘要:
在時間序列相似性度量研究中,動態時間彎曲(dynamic time warping,DTW)是最為常用的算法之一,但其存在病態對齊問題且未考慮時間屬性影響。限制對齊路徑長度DTW(DTW under limited warping path length,LDTW)和時間加權DTW(time-weighed DTW,TDTW)分別嘗試解決上述兩個問題中的一個,但未能同時解決DTW兩方面的不足。為此提出一種綜合時間權重的LDTW(time-weighting LDTW,TLDTW)算法。首先通過測量兩個時間序列中時間點對的距離構建時間權值矩陣;然后在LDTW累計成本矩陣遞歸填充過程中融合對應的時間權值,以實現在考慮時間因素影響的同時保留有效抑制病態對齊特性?;赨CR數據集進行1-NN分類實驗,實驗結果顯示基于TLDTW相似度量的分類準確率優于其他對比算法,且進一步對比驗證了其可靠性。
關鍵詞:時間序列; 動態時間彎曲; 病態對齊; 時間加權; 相似度度量
中圖分類號:TP311文獻標志碼:A
文章編號:1001-3695(2022)04-006-0998-05
doi:10.19734/j.issn.1001-3695.2021.09.0401
Improved LDTW algorithm based on time-weighting
Zhu Zichun, Lyu Shengping, Liao Xinting, Jiang Cheng, Luo Yong
(College of Engineering, South China Agricultural University, Guangzhou 510642, China)
Abstract:DTW is one of the commonly used algorithms in time series similarity measurement. However, DTW has the shortcoming of pathological alignment and ignores the influence of time attribute. LDTW and TDTW have been proposed to handle two shortcomings of DTW separately, however they cannot be solved simultaneously by LDTW or TDTW independently. This paper proposed TLDTW algorithm. Firstly, it constructed time weight matrix by measuring the distance between points in two series. Secondly, it fused the corresponding time weights from time weight matrix into the recursive filling procedure for cumulative cost matrix of LDTW, thus it considered the time attribute and the problem of pathological alignment could still be suppressed. It conducted 1-NN classification experiment based on UCR dataset, and experimental results show that the classification accuracy based on TLDTW is better than other compared algorithms, and the reliability of TLDTW is verified by further comparison.
Key words:time series; dynamic time warping; pathological alignment; time-weight; similarity measurement
0引言
時間序列是一種常見且具有時間先后順序的數據,它具有時間屬性和其他變量屬性[1]。這類數據廣泛存在于各個領域,如醫療心電圖[2]、氣象溫度氣候變化[3]、客戶行為和訂單消費[4]、金融股票[5]等,時間序列數據的挖掘利用可以更好地把握研究對象的狀態、更精準地預測變化趨勢與規律,從而支持智能決策。近年來,相關學者對時間序列數據的挖掘利用進行了大量研究[6],具體主要集中于相似性度量、聚類、分類、預測等[7]。
相似性度量分析是時間序列聚類、分類等的基礎工作?;谀P偷南嗨菩远攘?、基于數據壓縮的相似性度量和基于形狀相似性度量等是其常用機制[8]。其中歐氏距離(Euclidean distance,ED)和動態時間彎曲算法(dynamic time warping,DTW)是基于形狀的時間序列相似性度量中的常見方法。ED相關算法對等長序列的度量效率高,但其一對一策略難以勝任非等長時間序列中縮放位移變化問題。DTW通過彎曲拉伸收縮調整時間軸來計算兩個序列的相似度,在應對時間序列相位偏移,振幅變化方面具有更強的魯棒性[9,10]。但DTW仍存在一些不足,如時間計算復雜度高[11]、序列匹配存在病態對齊[12]、忽視時間屬性影響(匹配時間點對時未考慮時間間隔遠近)[13]。隨著計算機計算性能的快速提升,DTW計算復雜度高的問題得到了一定的緩解。針對病態對齊問題,Jeong等人[14]在DTW中的距離矩陣中引入相位差,提出了權重動態彎曲算法(weighted DTW,WDTW),WDTW將相位差越高的元素賦予越高的懲罰權重,以避免時間序列過度彎曲和不合理匹配的問題。窗口限制法[10]限制了每一個時間點可以鏈接的數量,直接限制了病態對齊,但由于其剛性被過度修正,易導致正確鏈接被修改為錯誤鏈接。Zhang等人[15]利用時間序列之間的對齊長度限制策略在全局上限制了對齊的總長度,在此基礎上提出了LDTW,從而抑制病態對齊現象。在LDTW基礎上,夏寒松等人[16]將對齊路徑長度控制在某個區間改變為固定到某個具體值,并通過縮減DTW累計代價矩陣中元素的計算范圍,以降低時間復雜度和開銷。通常情況下,時間屬性對相似性度量存在較大影響,即最近時間點的重要性遠大于歷史時間點的重要性,但是上述方法未考慮該影響因素。針對該問題,Li[17]提出了一種基于時間加權的DTW算法,引入時間權重函數,給不同時間點賦予不同的權值,解決了時間點間隔遠近貢獻不同問題,提升了相似度度量的效果,但TDTW在病態對齊的問題上仍然存在不足。本文利用TDTW時間加權的思想,對LDTW進行改進,提出了時間加權改進的LDTW算法,TLDTW繼承LDTW算法對齊路徑長度控制策略,并對序列的各時間點賦予時間權值,以期同時解決病態對齊和時間屬性被忽略問題。
1基于DTW的LDTW算法
DTW最早由Berndt等人提出[10],其核心思想是通過遞歸方式在兩個序列之間找到一個最優的對齊方式,以實現最小的全局成本,即對齊路徑中每對點之間成本的總和最小。
設時間序列A={a1,a2,a3,…,aN}和B={b1,b2,b3,…,bM}的長度分別為N和M。定義時間點對之間的成本為
d(ai,bj)=|ai-bj|2(1)
兩個序列任意兩點之間的距離構成了N×M的累計成本矩陣RN×M,R(i,j)為矩陣第i行第j列對應單元的值,每個單元值所對應的是DTW中局部最優成本D(Ai,Bj),即R(i,j)=D(Ai,Bj),其中Ai、Bj分別表示A、B的子集(長度為i和j)。其求解全局最優成本通過式(2)遞歸填充累計成本矩陣實現。DTW的時間復雜度為O(NM)。
D(Ai,Bj)=d(ai,bj)+minD(Ai,Bj-1)
D(Ai-1,Bj-1)D(Ai-1,Bj)
(2)
DTW通過彎曲時間序列的時域對時間序列的數據點進行匹配,不僅能夠得到更好的形態度量效果,而且能夠度量兩條不等長的時間序列[18],但在DTW遞歸求局部最優解時易出現病態對齊現象,如圖1中圓圈標注部分,出現大量一對多對齊的病態點(常稱為奇點),從而使得兩個序列中不具有相似性的局部數據點進行匹配,使得度量距離值極小,從而影響DTW相似性度量效果。
DTW中子對齊路徑pk=R(i,j)的長度為l,l=|i-j|。當出現病態對齊現象時,序列間的鏈接總數會增加,所以對齊路徑的總路徑長度也會增加?;贒TW改進的LDTW的核心思想是通過限制兩個時間序列之間的鏈接總數上限(而非每個點所涉及的鏈接數)來緩解病理對齊。LDTW在DTW遞歸迭代過程中考慮其路徑長度,LD(Ai,Bj,l)表示LDTW的局部成本,相應遞歸填充過程如式(3)所示。
LD(Ai,Bj,l)=R(i,j,l)=d(ai,bj)+minD(Ai,Bj-1,l-1)
D(Ai-1,Bj,l-1)D(Ai-1,Bj-1,l-1)(3)
其中:l表示局部最優成本所允許對齊路徑的長度;LUB是對齊路徑的上限;序列A、B之間最長對齊路徑和最短對齊路徑分別為MaxL和MinL,MinL=max(N,M),MaxL=N+M-1。
圖2表示對齊路徑的最大和最小長度,LUB的范圍在最大和最小長度之間。圖中兩條線分別表示最短的路徑和其中一條最長路徑(即兩個序列長度之和減一)。最長路徑具有的特點為只向當前點的右邊或者上邊搜索。LDTW以第三維優先原則計算成本累計矩陣,并通過子序列間的對齊長度范圍減少遞歸搜索空間[15]。基于LUB范圍約束,LDTW搜尋符合約束的所有對齊路徑并計算其對應距離值,選出其最小值作為度量值,并保留該最小值相應對齊路徑。
圖3為兩條長度為5的時間序列構成的矩陣,每個單元格表示到達該點的路徑長度,DTW和LDTW選擇路徑示例如下所示:
DTW:R[4][5]=d(a4,b5)+min{R[3][4],R[4][4],R[3][5]}
LDTW:R[4][5][4]=d(a4,b5)+min{R[3][4][3],R[4][4][3]}
R[4][5][5]=d(a4,b5)+min{R[3][5][4],R[3][4][4],
R[4][4][4]}
R[4][5][6]=d(a4,b5)+min{R[3][5][5]·R[4][4][5]}
由此可見LDTW路徑選擇的長度限制,其到達點R(4,5)的可選路徑長度有三種(4,5,6),每一條路徑選擇都會有不同的對齊路徑與之對應。LDTW相似性度量過程如算法1所示,相應時間復雜度從O(NM)擴展到了三維O(NMLUB)。
算法1LDTW
說明:R(N,M,LUB)、L分別為成本矩陣和對齊路徑長度,R(i,j,l)=LD(Ai,Bj,l),局部最優解可用累計成本矩陣的單元值表示。
輸入:時間序列A、B;時間序列長度N=length(A),M=length(B);對齊路徑距離上限/最大/最小路徑長度LUB/MinL/MaxL。
輸出:兩序列累計距離總和LD(AN,BM,LUB),即R(N,M,LUB),LUB。
1)初始化
R(1,1,0)=D(a1,b1)
/*初始化填充第一行*/
for n=2 to N do
R(n,1,n-1)=R(n-1,1,n-2)+d(an,b1)
end for
/*初始化填充第一列*/
for m=2 to M do
R(1,m,m-1)=R(1,m-1,m-2)+d(a1,bm)
end for
2)遞歸填充累計成本矩陣
for n=2 to N do
for m=2 to M do
min_l=max(n,m)
max_l=(n,m,LUB,N,M)
for l=min_l to max_l do
R(i,j,l)=d(ai,bj)+minR(i,j-1,l-1)R(i-1,j-1,l-1)R(i-1,j,l-1)
end for
end for
end for
3)最佳路徑選擇
min_L=max(N,M)
max_L=(LUB-1)
LDTW=+∞,L=0
for l=min_L to max_L do
if R(N,M,l)lt;LDTW then
LDTW=R(N,M,l),L=l+1
end if
end for
圖4為通過LDTW優化后的對齊效果,與圖1不同之處在于圓圈標注部分的病態對齊得到了有效緩解,奇點大量減少。
2時間加權改進的LDTW
LDTW一定程度上解決了病態對齊問題,但仍忽略了時間屬性,未考慮遠近時間點時間權重不平衡現象,即在一般情況下,接近當前時間的時間點比遠距離時間點具有更強影響力,應被賦予更大的時間權值?;跈嘀氐腄TW(WDTW[18])和時間權重擴展的DTW算法(TWDTW[19])綜合考慮了時間權重影響,但其基于相位差設計的權重系數對應邏輯函數高度依賴于時間序列類型,較適合于相位差較大的序列,泛化性較差。Li提出的時間加權DTW(TDTW)更關注時間序列中不同時間點對序列相似度度量的影響,但又忽略了病態對齊問題。為此,本文融合限制對齊路徑總長度和時間加權機制以解決上述不足。時間加權的基本思想就是將越靠近當前時間點賦予更大的權重。設時間權重為W(i,j),并與成本矩陣中的每個單元R(i,j)一一對應。在此,W(i,j)定義為
W(i,j)=(i/N)2+(j/M)22(4)
其中:N、M分別表示序列A、B的長度。令i/N,j/M分別表示A、B兩個序列中第i個和第j個點所對應的權重。下面給出了長度均為10的A、B兩個序列時間權重矩陣:
可以看出隨著i、j值的增大,該時間點獲得的時間權重逐漸增大,可以保證越靠近近時間點獲得的權值就越大,即W(i,j)≥W(p,q),p≤i,q≤j。由于DTW算法的特性,遞歸填充過程是正向傳遞。由圖2可以看出,是由矩陣的左下角向右上角遞歸填充(最遠時間點向最近時間點遞歸填充),而最優路徑選擇則是反向從矩陣的右上角向左下角查找最小值(最近時間點向最遠時間點查找)。如果先對原始時間序列A={a1,a2,a3,…,an},B={b1,b2,b3,…,bm}進行反轉操縱得到反轉后時間序列={1,2,…,n}={an,an-1,…,a1}、={1,2,…,m}={bm,bm-1,…,b1},遞歸填充的過程便轉換為從最近時間點向最遠時間點填充(更加符合算法側重近時間點重要性的特性),且查找路徑是從時間序列的首向尾查找(遠時間點向近時間點查找),符合查找路徑的邏輯。此時的權重也要作出適當的修改,反轉序列之前A序列第i個點對應的是反轉之后第n-i+1個點,序列B同理,則時間權值的變化由i/N變化為(N-i+1)/N,即1-(i-1/N)。修正原有權重W(i,j)為
W(i,j)=(1-(i-1/n))2+(1-(j-1/m))22(5)
修正LDTW累計成本矩陣初始化和相應遞歸填充過程為
TLD(i,j,l)=R(i,j,l)=W(i,j)×d(i,j)+
minD(i,j-1,l-1)
D(i-1,j,l-1)D(i-1,j-1,l-1)(6)
其中:TLD(i,j,l)表示TLDTW中局部最優成本,它與矩陣的單元值一一對應,其他符號與式(3)相同。
TLDTW相似性度量過程如算法2所示。TLDTW計算了累計成本矩陣每一個單元對應時間點對的時間權值,在填充迭代過程中每一步均加入了時間權重系數,其時間復雜度亦為O(nmLUB)。
算法2TLDTW
說明:R(n,m,LUB)、L分別為成本矩陣和對齊路徑長度,R(i,j,l)=TLD(Ai,Bj,l),局部最優解可用累計成本矩陣的單元值表示。
輸入:時間序列A、B反轉后序列i、j,時間序列長度N=length(A); M=length(B),對齊路徑距離上限/最大/最小路徑長度LUB/MinL/MaxL。
輸出:兩個序列累計距離總和TLD(AN,BM,LUB),即R(N,M,LUB),LUB。
1)時間加權矩陣構建
for i=1 to N do
X(i)=1-i-1N
for j=1 to M do
Y(i)=1-j-1M
W(i,j)=(X(i))2+(Y(j))22
end for
end for
2)初始化
R(1,1,0)=d(a1,b1,0)×W(1,1)
/*初始化填充第一行*/
for n=2 to N do
R(n,1,n-1)=R(n-1,1,n-2)+d(an,b1)×W(n,1)
end for
/*初始化填充第一列*/
for m=2 to M do
R(1,m,m-1)=R(1,m-1,m-2)+d(a1,bm)×W(m,1)
end for
3)遞歸填充累計成本矩陣
for n=2 to N do
for m=2 to M do
min_l=max(n,m)
max_l=(n,m,LUB,N,M)
for l=min_l to max_l do
R(i,j,l)=d(ai,bj)×W(i,j)+minR(i,j-1,l-1)R(i-1,j-1,l-1)R(i-1,j,l-1)
end for
end for
end for
4)最佳路徑選擇
min_L=max(N,M)
max_L=(LUB-1)
TLDTW=+∞,L=0
for l=min_L to max_L do
if R(N,M,l)lt;TLDTW then
TLDTW=R(N,M,l),L=l+1
end if
end for
3實驗驗證
以UCR時間序列分類文檔為數據集[20],采用近鄰分類實驗方法進行實驗并開展對比分析。利用分類準確率(accuracy)和可靠性指標(通過準確率增益gain度量)進行評價,驗證所提出TLDTW的有效性與優越性。
3.1UCR數據集
UCR共包含128個時間序列數據集,每個數據集均帶有類標簽,并被劃分為訓練集和測試集。數據集中序列長度分布于[60,637],在此隨機選取25個數據集作為本實驗數據集,被選數據集序列長度分布于[96,637]。表1給出各數據集中的訓練集和測試集的大小、類別和時間序列長度等屬性。
3.21-NN分類驗證
1-NN分類先利用相似性度量算法計算各時間序列之間的距離值,然后選定一個時間序列,并優選與該確定序列距離最短的序列,將其歸為一類。未確定類別的時間序列采用上述相同操縱方式直到所有時間序列確定其所屬類別。1-NN不需要設置任何參數,精度完全取決于相似性距離度量的效果[21]。
用各數據集中的訓練集訓練TLDTW,并與ED、DTW、LDTW、TDTW四種算法進行對比。表2給出了在訓練集上分類準確率對比結果。其中LDTW和TLDTW需設置對齊路徑上限LUB參數值,該參數由留一驗證實驗(leave-one-out cross-validation,LOOCV)選?。ㄔ斠?.4節)??梢钥闯觯琓LDTW在選取的25個數據集上有20個取得最優效果(最高分類準確率),是所給出對比算法中準確率最高的。圖5給出了TLDTW和四種對比算法分類準確率的可視化結果。圖中的數據點表示一個數據集,橫軸表示對比算法所得準確率,縱軸表示TLDTW準確率。數據點落在斜線以上區域說明TLDTW的效果更好,落在斜線下面說明對比算法的效果更好,若落在斜線之上說明效果相當。由圖5(a)(b)可以看出,提出的TLDTW相對于ED和DTW具有明顯優勢,相對于ED和DTW分別在3和4個數據集上取得相同的效果,在22和20個數據集上TLDTW取得了更好的準確率;由圖5(c)(d)可以看出,TLDTW相對于TDTW和LDTW分別在17和14個數據集上取得更高的準確率,另外分別有7和6個數據集上準確率一樣。
3.3神槍手邏輯謬誤
為避免德州神槍手邏輯謬論,證明算法的可靠性,需進一步驗證算法在所取得準確率高的訓練集對應測試集上依舊能取得好的效果。引入增益混淆矩陣評估所提出算法的可靠性,先通過式(7)計算TLDTW準確率增益(gain),具體包括預期準確率增益(訓練集中取得的最好結果)和實際準確率增益(測試集中取得的結果):
gain=accuracyTLDTWaccuracycamparison(7)
其中:accuracyTLDTW表示TLDTW的準確率;accuracycamparison表示對比算法(ED、DTW、LDTW、TDTW)的準確率;gain大于1時表明TLDTW在給定數據集上優于對比算法,反之亦然。其中,TLDTW和LDTW的LUB最優值通過LOOCV確定。
圖6給出了TLDTW對比其他四種算法的預期準確率增益和實際準確率增益。圖中的每個點表示一個數據集(共25個),每個點落在圖中四個區域中的一個,這四個區域分別是:
a)TP(真陽性)區。預測TLDTW相對對比算法將提高分類準確率,實際結果與預測一致。落在該區域的點數越多,證明該方法可靠性越高。
b)TN(真陰性)區。正確預測出TLDTW相對對比算法會降低分類準確性,應避免在這類數據集上使用TLDTW。
c)FN(假陰性)區。預測TLDTW相對對比算法會降低準確率,但準確率實際上有所提高。
d)FP(假陽性)區。預測LDTW相對對比算法將提高準確率,但實際準確率降低了。這個區域的點越多說明該算法的可靠性越高。
從圖6中的四幅圖中可以看出,數據集對應點大部分落在TP區(最多22,最少17),說明所提出改進算法的分類正確率提高是可靠的。雖然落入TP區域的數據點有所減少,但減少的這些數據點并沒有落入其他區域,而是處于橫軸邊緣,這意味著在測試集上的分類準確率并沒有降低。
3.4LDTW和TLDTW LUB優化
LDTW和TLDTW有一個對齊路徑長度上界的參數LUB。在進行1-NN分類實驗時,需要確定LDTW和TLDTW對齊路徑長度上界參數LUB。找到最合適的LUB,LDTW和TLDTW才能更好地緩解病態對齊。根據LDTW定義規則,長度分別為N和M的兩條時間序列A、B,LUB應滿足max(N,M)+1lt;LUBlt;(N+M-2)。以第11個數據集gun_point為例,其長度為150,則LUB應在151~298。在此,開展LOOCV交叉驗證優化確定各數據集對應的LUB。對于數據集的序列長度變大,相應LUB的區間范圍也大(lightning-2取值在638~1 274),這時候LOOCV搜索步長也適當增大。LOOCV可以得到每一個候選LUB值對應的1-NN分類錯誤率。圖7給出了三個數據集在不同候選LUB 值對應分類的錯誤率。通過時間序列分類的錯誤率可計算在該LUB值之下的準確率,計算出隨著LUB的變化分類準確率的變化,從而找到最優解。當只有一個最優點時,直接選取該點對應的LUB長度(如圖7(a)所示);當出現多個最優解時,由LDTW和TLDTW算法的時間復雜度描述,LUB選取就需要考慮算法計算量的因素,LUB的值越小,算法的計算量越小,故一般取最小值作為LUB,如圖7(b)(c)所示。最終確定各數據集LDTW和TLDTW的LUB,如表3所示。
3.5算法時間復雜度與時間開銷
本文中,TLDTW算法的時間復雜度為O(n3),與LDTW算法的時間復雜度一致,由于時間加權的影響,可以進一步對比計算出TLDTW和LDTW算法的計算量。實驗結果參數相同的10個數據集,其中4個為表現性能持平,3個在改進算法表現更優秀,3個在LDTW算法上分類正確率更高。表4展示了兩種算法之間時間花費的差值。為了更加直觀地表現出對比算法的分類時間開銷,將采用條形圖對比,如圖8所示。在圖中看出,由于時間加權的加入,在提升分類準確率的同時,TLDTW算法時間開銷都大于LDTW算法。表現在數據集中,序列長度越短,則時間開銷增加幅度越小,序列越長,時間開銷增加幅度越大。
4結束語
本文在LDTW和TDTW的基礎上提出TLDTW算法,并開展了相應實驗驗證。TLDTW算法的特點及其效果主要體現在如下幾方面:
a)TLDTW利用LDTW限制對齊路徑長度思想和TDTW時間加權機制,協同解決了DTW病態對齊和未考慮時間屬性影響問題。
b)基于UCR數據集開展1-NN分類實驗,并與ED、DTW、TDTW、LDTW進行對比。結果顯示基于TLDTW相似度量的分類準確率相對于對比算法更高,在選取的25個數據集中,TLDTW分類準確率最高的數據集占19個,驗證了TLDTW的優越性;同時通過準確率增益量化分析了TLDTW的可靠性。
后續可從兩方面開展研究:a)降低LDTW算法開銷;b)嘗試非線性時間權值(TLDTW時間權值為基于時間序列長度的線性組合模型)以提高相似性度量效果。
參考文獻:
[1]Li Hailin. Multivariate time series clustering based on common principal component analysis[J].Neurocomputing,2019,349:239-247.
[2]Anguera A, Barreiro J M, Lara J A, et al. Applying data mining techniques to medical time series: an empirical case study in electroencephalography and stabilometry[J].Computational and Structural Biotechnology Journal,2016,14:185-199.
[3]Zhai Yuanzheng, Wang Jinsheng, Teng Yanguo, et al. Water demand forecasting of Beijing using the time series forecasting method[J].Journal of Geographical Sciences,2012,22(5):919-932.
[4]Ruan Guangchen, Hanson P C, Dugan H A, et al. Mining lake time series using symbolic representation[J].Ecological Informatics,2017,39(5):10-22.
[5]張喬夫,何文明.基于指數平滑和WKNN的金融時間序列相似性搜索[J].現代計算機,2019(29):21-25.(Zhang Qiaofu, He Wenming. Financial time series similarity search based on exponential smoothing and WKNN[J].Modern Computer,2019(29):21-25.)
[6]Fu T C. A review on time series data mining[J].Engineering Applications of Artificial Intelligence,2011,24(1):164-181.
[7]Chen Yewang, Hu Xiaoliang, Fan Wentao, et al. Fast density peak clustering for large scale data based on KNN[J].Knowledge-Based Systems,2020,187:104824.
[8]陳海燕,劉晨暉,孫博.時間序列數據挖掘的相似性度量綜述[J].控制與決策, 2017,32(1):1-11.(Chen Haiyan, Liu Chenhui, Sun Bo.Survey on similarity measurement of time series data mining[J].Control and Decision,2017,32(1):1-11.)
[9]李正欣,郭建勝,毛紅保,等.多元時間序列相似性度量方法[J].控制與決策, 2017,32(2):368-372.(Li Zhengxin, Guo Jiansheng, Mao Hongbao, et al. Similarity measure for multivariate time series[J].Control and Decision,2017,32(2):368-372.)
[10]Berndt D J, Clifford J. Using dynamic time warping to find patterns in time series[C]//Proc of the 12th International Workshop on Know-ledge Discovery in Databases.Palo Alto,CA:AAAI Press,1994:359-370.
[11]李海林,梁葉,王少春.時間序列數據挖掘中的動態時間彎曲研究綜述[J].控制與決策,2018,33(8):1345-1353.(Li Hailin, Liang Ye, Wang Shaochun. Review on dynamic time warping in time series data mining[J].Control and Decision,2018,33(8):1345-1353.)
[12]Keogh E J, Pazzani M J. Derivative dynamic time warping[C]//Proc of SIAM International Conference on Data Mining. 2001:1-11.
[13]Toshniwal D, Joshi R C. Similarity search in time series data using time weighted slopes[J].Informatica International Journal of Computing and Informatics,2005,29(1):79-88.
[14]Jeong Y S, Jeong M K, Omitaomu O A. Weighted dynamic time warping for time series classification[J].Pattern Recognition,2011,44(9):2231-2240.
[15]Zhang Zheng, Tavenard R, Bailly A, et al. Dynamic time warping under limited warping path length[J].Information Sciences,2017,393(7):91-107.
[16]夏寒松,張力生,桑春艷.基于LDTW的動態時間規整改進算法[J].計算機工程,2021,47(11):108-120.(Xia Hansong ,Zhang Lisheng,Sang Chunyan. Improved algorithm of dynamic time warping based on LDTW[J].Computer Engineering,2021,47(11):108-120.)
[17]Li Hailin.Time works well: dynamic time warping based on time weighting for time series data mining[J].Information Sciences,2021,547:592-608.
[18]Anantasech P, Ratanamahatana C A. Enhanced weighted dynamic time warping for time series classification[C]//Proc of the 3rd International Congress on Information and Communication Technology.Singapore:Springer,2019:655-664.
[19]Maus V, Camara G, Cartaxo R, et al. A time-weighted dynamic time warping method for land-use and land-cover mapping[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2016,9(8):3729-3739.
[20]Dau H A, Bagnall A, Kamgar K, et al.The UCR time series classification archive[J].IEEE/CAA Journal of Automatica Sinica,2019,6(6):1293-1305.
[21]Ding Hui, Trajcevski G, Scheuermann P, et al. Querying and mining of time series data: experimental comparison of representations and distance measures[J].Proceedings of the VLDB Endowment,2008,1(2):1542-1552.
收稿日期:2021-09-13;
修回日期:2021-11-06
基金項目:廣東省自然科學基金資助項目(2021A1515012395)
作者簡介:朱紫純(1995-),男,碩士研究生,主要研究方向為數據挖掘、數據分析;呂盛坪(1982-),男(通信作者),副教授,博士,主要研究方向為工業/農業數據挖掘、深度學習、圖神經網絡與知識圖譜、數字化制造與智能優化(lvshengping@scau.edu.cn);廖鑫婷(1997-),女,碩士,主要研究方向為深度學習、缺陷目標檢測;江城(1996-),男,碩士研究生,主要研究方向為云服務智能優化算法;羅勇(1995-),男,碩士,主要研究方向為深度學習、缺陷目標檢測.