999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

云環(huán)境下基于動(dòng)態(tài)滑動(dòng)窗口多通道Bi-LSTM的虛擬機(jī)故障預(yù)測模型

2023-01-01 00:00:00王開放姜瑛

摘 要:針對點(diǎn)值預(yù)測方法預(yù)測虛擬機(jī)故障,未充分利用虛擬機(jī)歷史周期特征和上下文信息、預(yù)測準(zhǔn)確率不高的問題,提出了一種動(dòng)態(tài)滑動(dòng)窗口多通道Bi-LSTM的虛擬機(jī)故障預(yù)測模型。該模型首先利用動(dòng)態(tài)滑動(dòng)窗口動(dòng)態(tài)捕獲虛擬機(jī)故障發(fā)生過程的上下文特征;然后構(gòu)建多通道機(jī)制的Bi-LSTM以同時(shí)學(xué)習(xí)不同指標(biāo)類之間的相關(guān)性特征,預(yù)測虛擬機(jī)下一周期的故障;最后根據(jù)OCSVM和區(qū)間偏移度方法對預(yù)測結(jié)果進(jìn)行判斷,得出具體的故障類型。實(shí)驗(yàn)表明,該模型在預(yù)測準(zhǔn)確率、召回率、F值三個(gè)指標(biāo)上均優(yōu)于基線模型,驗(yàn)證了模型對虛擬機(jī)故障預(yù)測的有效性。

關(guān)鍵詞:虛擬機(jī);故障預(yù)測;動(dòng)態(tài)滑動(dòng)窗口;多通道;Bi-LSTM

中圖分類號:TP393.04 文獻(xiàn)標(biāo)志碼:A

文章編號:1001-3695(2023)03-035-0855-08

doi:10.19734/j.issn.1001-3695.2022.07.0395

Virtual machine fault prediction model based on dynamic sliding window multi-channel Bi-LSTM in cloud environment

Wang Kaifang1,2,Jiang Ying1,2

(1.Computer Technology Application Key Laboratory of Yunnan Province,Kunming 650500,China;2.Faculty of Information Engineering amp; Automation,Kunming University of Science amp; Technology,Kunming 650500,China)

Abstract:To address the issue that the point-value prediction method does not make full use of the historical cycle features and contextual information of VM,and the prediction accuracy is not high,this paper proposed a dynamic sliding window multi-channel Bi-LSTM for VM fault prediction.The model firstly used dynamic sliding windows to dynamically capture the contextual features of the VM failure process,then it constructed a multi-channel Bi-LSTM to simultaneously learn the correlation features between different indicator classes,so as to predict the VM failure in the next cycle.Finally it judged the prediction results according to OCSVM and interval skewness methods to derive specific failure types.Experiments show that the model outperforms the baseline model in three metrics,namely prediction accuracy,recall and F-value,verifying the effectiveness of the model for VM fault prediction.

Key words:virtual machine;fault prediction;dynamic sliding window;multi-channel;Bi-LSTM

0 引言

虛擬機(jī)負(fù)責(zé)為用戶提供計(jì)算等相關(guān)資源,是云平臺服務(wù)運(yùn)行的主要承載者,保證虛擬機(jī)的正常運(yùn)行才能保證云平臺的服務(wù)質(zhì)量。但是各個(gè)虛擬機(jī)對平臺中硬件資源是共享的,這必將會(huì)引起資源競爭等問題,最終導(dǎo)致虛擬機(jī)在運(yùn)行過程中出現(xiàn)故障。虛擬機(jī)發(fā)生故障會(huì)導(dǎo)致其所承載的服務(wù)質(zhì)量難以保證,給用戶造成不可估量的損失,而且對整個(gè)云平臺的穩(wěn)定性和可靠性造成嚴(yán)重影響,不能更好地提供服務(wù)影響用戶體驗(yàn)。因此,為了減小故障發(fā)生而帶來的損失,提前對虛擬機(jī)的故障進(jìn)行預(yù)測是亟待解決的問題。針對云平臺中虛擬機(jī)故障預(yù)測問題,部分研究著手于對虛擬機(jī)故障的檢測,而沒有對故障預(yù)測進(jìn)行深入的研究。部分研究根據(jù)指標(biāo)值預(yù)測指標(biāo)值的點(diǎn)值預(yù)測方法,存在故障預(yù)測率不高提前預(yù)測時(shí)間相對較短等問題,不能為維護(hù)人員提供相對充足的時(shí)間。

Patel等人[1]提出了CNN-LSTM的預(yù)測模型預(yù)測虛擬機(jī)故障,該模型雖然能夠相對準(zhǔn)確地預(yù)測下一時(shí)刻CPU的負(fù)載狀況,但是其點(diǎn)值預(yù)測方法根據(jù)閾值進(jìn)行判斷會(huì)造成較高的誤警率。Sharma等人[2]提出了一種基于指數(shù)平滑的故障預(yù)測技術(shù),通過點(diǎn)值預(yù)測得到下一時(shí)刻的預(yù)測結(jié)果,實(shí)驗(yàn)結(jié)果表明該方法降低了虛擬機(jī)的故障發(fā)生率。韓守飛[3]采用機(jī)器學(xué)習(xí)的方法預(yù)測虛擬機(jī)下一時(shí)刻的性能數(shù)據(jù)如CPU使用率,然后對預(yù)測的性能數(shù)據(jù)進(jìn)行故障分類,實(shí)驗(yàn)表明預(yù)測周期為5 min時(shí)預(yù)測效果最好。Li等人[4]提出了一種AdaBoost和隱馬爾可夫模型的虛擬機(jī)故障預(yù)測算法,得到虛擬機(jī)未來時(shí)刻的故障狀態(tài),但該方法存在虛擬機(jī)觀測狀態(tài)與安全狀態(tài)之間關(guān)系的不確定性,這需要進(jìn)一步的探究。Dai等人[5]提出了Bi-LSTM預(yù)測模型預(yù)測云環(huán)境下各個(gè)虛擬機(jī)的資源使用情況,并根據(jù)閾值判斷虛擬機(jī)是否故障,實(shí)驗(yàn)證明該模型在預(yù)測CPU內(nèi)存過載故障方面表現(xiàn)出色,但其預(yù)測性能隨著時(shí)間的推移而降低。張爭萬等人[6]設(shè)計(jì)了一個(gè)基于多通道稀疏LSTM的蜂窩流量預(yù)測模型,利用多通道捕獲多源網(wǎng)絡(luò)流量信息提高了預(yù)測準(zhǔn)確性,但該模型單步預(yù)測的準(zhǔn)確性高于多步預(yù)測的準(zhǔn)確性,存在提前預(yù)測時(shí)間較短的問題。Nam等人[7]提出了CNN模型根據(jù)虛擬機(jī)的日志預(yù)測虛擬機(jī)下一時(shí)刻的故障,實(shí)驗(yàn)表明該模型可以提前5 min預(yù)測故障,但該模型的F值為0.67,說明該模型的預(yù)測準(zhǔn)確性不是很高。丁三軍等人[8]提出了基于模糊數(shù)據(jù)挖掘的虛擬機(jī)故障預(yù)測方法,利用日志數(shù)據(jù)獲得故障預(yù)測的關(guān)聯(lián)規(guī)則,利用規(guī)則得出故障預(yù)測結(jié)果。Saxena等人[9]通過開發(fā)和使用集成資源預(yù)測器來主動(dòng)預(yù)測由于資源不足導(dǎo)致的虛擬機(jī)故障,將容易發(fā)生故障的虛擬機(jī)分配到容錯(cuò)單元已處理此故障,從而為基于資源競爭的云服務(wù)故障提供全面的解決方案。

本文研究與已有研究具有明顯的不同,本文不再僅僅根據(jù)虛擬機(jī)的指標(biāo)數(shù)據(jù)去預(yù)測下一時(shí)刻的指標(biāo)數(shù)據(jù)再加以判斷,而是根據(jù)虛擬機(jī)運(yùn)行的歷史周期特征預(yù)測下一周期特征并加以判斷其故障類型。

1 基于動(dòng)態(tài)滑動(dòng)窗口Bi-LSTM的虛擬機(jī)故障預(yù)測模型

本文提出的預(yù)測模型首先利用K-means算法將虛擬機(jī)關(guān)鍵度量指標(biāo)依據(jù)指標(biāo)相關(guān)性進(jìn)行聚類劃分k個(gè)不同的指標(biāo)類,然后為Bi-LSTM設(shè)置動(dòng)態(tài)滑動(dòng)窗口,接著利用動(dòng)態(tài)滑動(dòng)窗口多通道Bi-LSTM(dynamic sliding window multi-channel bi-LSTM,DSWMCBi-LSTM)預(yù)測模型依據(jù)不同指標(biāo)類的周期特征預(yù)測下一周期的故障特征,最后根據(jù)歷史周期特征訓(xùn)練建立的OCSVM和區(qū)間偏移度故障判別方法對預(yù)測結(jié)果進(jìn)行判定,得出具體的故障類型。具體的預(yù)測流程如圖1所示。

在本文中將虛擬機(jī)的故障界限為性能故障,即虛擬機(jī)在任務(wù)計(jì)算的過程中由于過度地占用資源而未及時(shí)地釋放導(dǎo)致虛擬機(jī)的相關(guān)指標(biāo)發(fā)生異常、計(jì)算處理速度變慢、虛擬機(jī)的運(yùn)行效率下降、出現(xiàn)云服務(wù)響應(yīng)時(shí)間變長等情況。這雖然不會(huì)導(dǎo)致虛擬機(jī)馬上崩潰,但卻嚴(yán)重影響云平臺的服務(wù)質(zhì)量。也由此可以看出虛擬機(jī)出現(xiàn)性能故障是一個(gè)緩發(fā)的過程,虛擬機(jī)相關(guān)的性能指標(biāo)數(shù)據(jù)將逐漸地從正常變?yōu)楫惓?。所以在對虛擬機(jī)故障進(jìn)行預(yù)測時(shí),需要從虛擬機(jī)的歷史狀態(tài)來預(yù)測未來狀態(tài)是否將發(fā)生故障,是一種基于時(shí)間序列的動(dòng)態(tài)預(yù)測過程[10]。而Bi-LSTM通過前后兩個(gè)傳播網(wǎng)絡(luò)不僅能夠?qū)W習(xí)時(shí)間序列前向數(shù)據(jù)的規(guī)律而且能夠?qū)W習(xí)后向數(shù)據(jù)的規(guī)律,即能夠?qū)W習(xí)時(shí)序數(shù)據(jù)的上下文信息,在處理具有時(shí)序特征的虛擬機(jī)故障問題上具有較大的優(yōu)勢。因此提出了基于動(dòng)態(tài)滑動(dòng)窗口多通道Bi-LSTM的虛擬機(jī)故障預(yù)測模型。為了有效捕捉故障發(fā)生過程中的特征變化,設(shè)置動(dòng)態(tài)滑動(dòng)窗口來改進(jìn)Bi-LSTM以固定歷史窗口進(jìn)行預(yù)測的不足。為了充分利用不同指標(biāo)類之間的相互依賴,設(shè)置了多通道的Bi-LSTM神經(jīng)網(wǎng)絡(luò),即通過聯(lián)合學(xué)習(xí)融合不同類指標(biāo)之間的相互依賴。

1.1 基于虛擬機(jī)指標(biāo)相關(guān)性的特征聚類

在對虛擬機(jī)采集的眾多指標(biāo)中,存在一些噪聲指標(biāo)和與判斷虛擬機(jī)狀態(tài)無關(guān)的指標(biāo)。因此,在滿足故障預(yù)測模型準(zhǔn)確性的同時(shí),需要從采集到的虛擬機(jī)原始度量指標(biāo)中選擇出關(guān)鍵度量指標(biāo),以減少故障預(yù)測模型的開銷。而特征選擇方法是在準(zhǔn)確表征虛擬機(jī)性能的前提下,從原始特征集中選出對表征虛擬機(jī)性能影響比較高的特征子集來代替原始特征,從而達(dá)到降低特征維度的目的[11]。因此本文采用文獻(xiàn)[12]中的Relief算法對采集到的虛擬機(jī)原始度量指標(biāo)進(jìn)行降維,剔除和虛擬機(jī)故障無關(guān)和關(guān)聯(lián)性不強(qiáng)的度量指標(biāo)。具體過程為:首先隨機(jī)地從虛擬機(jī)總訓(xùn)練樣本中選取一個(gè)樣本R;然后找出其最近鄰樣本H,接著從訓(xùn)練集剩下的樣本中找出和R不是同類的最近鄰樣本M;再接著更新每個(gè)特征的權(quán)重,即如果R和H的某個(gè)指標(biāo)距離小于P和M的某個(gè)特征距離,則說明該指標(biāo)能夠?qū)︻悇e的區(qū)分產(chǎn)生益處,則增加該指標(biāo)的權(quán)重,否則減小該指標(biāo)的權(quán)重。通過重復(fù)n次以上過程,得到和指標(biāo)相對應(yīng)的權(quán)重,依據(jù)權(quán)重大小對指標(biāo)進(jìn)行排序,并設(shè)定權(quán)重閾值將權(quán)重大于設(shè)定閾值的指標(biāo)作為關(guān)鍵度量指標(biāo)。

通過特征選擇方法得到了和虛擬機(jī)的故障預(yù)測具有相關(guān)性的關(guān)鍵度量指標(biāo)集,而不同的關(guān)鍵度量指標(biāo)很可能描述虛擬機(jī)相同的系統(tǒng)問題。為了能夠預(yù)測出虛擬機(jī)下一周期具體的故障類型,本文根據(jù)指標(biāo)之間的相關(guān)性對關(guān)鍵度量指標(biāo)進(jìn)行聚類,并最終將指標(biāo)特征劃分成k類,每類描述相同的問題,同樣每類異常也代表一種故障類型,這樣在對虛擬機(jī)進(jìn)行故障預(yù)測時(shí)可以更加準(zhǔn)確地預(yù)測到具體的故障類型,從而方便運(yùn)維人員根據(jù)預(yù)測結(jié)果,采取針對性的措施避免故障的發(fā)生。

K-means聚類方法基于對樣本與簇中心的距離將樣本劃分到不同的簇中,并以迭代實(shí)現(xiàn)樣本與其所屬簇類中心的距離為最小目標(biāo)。該聚類方法和本文中按照指標(biāo)之間不同的相關(guān)性對指標(biāo)進(jìn)行分類的思想吻合,因此本文采用K-means的聚類方法將虛擬機(jī)的關(guān)鍵度量指標(biāo)按照其相關(guān)系數(shù)進(jìn)行聚類,將相關(guān)性相近的指標(biāo)聚為一類,并最終將所有的指標(biāo)劃分到k個(gè)類中。具體的過程為:首先初始化虛擬機(jī)關(guān)鍵度量指標(biāo)的聚類中心,即從n個(gè)數(shù)據(jù)樣本集中隨機(jī)地選擇k個(gè)對象作為初始的聚類中心;然后通過循環(huán)的迭代更新將聚類中心移動(dòng)到所包含成員的平均位置;最后對其內(nèi)部的對象成員重新劃分,直到所有類中的成員對象到類中心的距離最近為止[13]。最終將總體樣本集X=(x1,x2,x3,…,xn)通過K-means聚類方法劃分成k個(gè)樣本集合S=(s1,s2,s3,…,sk),使得類內(nèi)的平方和最小。

在對指標(biāo)相關(guān)性進(jìn)行計(jì)算時(shí),考慮描述相同虛擬機(jī)系統(tǒng)問題的指標(biāo)之間相關(guān)性較強(qiáng),而描述不同問題的指標(biāo)間的相關(guān)性較弱的特點(diǎn),采用皮爾森相關(guān)系數(shù)來描述各個(gè)指標(biāo)之間的相關(guān)關(guān)系,然后利用K-means聚類方法根據(jù)相關(guān)關(guān)系進(jìn)行聚類,將指標(biāo)劃分到k個(gè)類中。根據(jù)指標(biāo)相關(guān)性進(jìn)行特征聚類的算法如算法1所示。

算法1 根據(jù)指標(biāo)相關(guān)性進(jìn)行特征聚類算法

輸入:虛擬機(jī)關(guān)鍵度量樣本集keyresult。

輸出:虛擬指標(biāo)聚類結(jié)果result。

a)Correla=corr(keyresult) /計(jì)算虛擬機(jī)關(guān)鍵度量指標(biāo)之間的相關(guān)矩陣/

b)初始化聚類數(shù)k

c)kresult=K-means(Correla,k) /根據(jù)相關(guān)矩陣和聚類數(shù)k對指標(biāo)進(jìn)行聚類/

d)Correla[lable]=kresult.labels //獲取關(guān)鍵指標(biāo)的聚類結(jié)果

e)coordic=dict(Correla[lable]) //將指標(biāo)聚類結(jié)果轉(zhuǎn)為字典類型

f)定義字典result存放指標(biāo)聚類結(jié)果

g)for key,value in coordic.items() /將相同類型的指標(biāo)名放入到對應(yīng)的鍵值列表中/

h) if not value

i) continue

j) if value not in result.keys()

k) result[value]=[]

l) result[value].append(key)

m) end for

n) return result

根據(jù)指標(biāo)相關(guān)性和聚類算法將虛擬機(jī)關(guān)鍵度量指標(biāo)劃分成了k類,每類描述一種虛擬機(jī)系統(tǒng)問題,同樣也是一種故障類型,并通過接下來的虛擬機(jī)故障預(yù)測模型學(xué)習(xí)各種故障類型的發(fā)生特征,預(yù)測下一周期虛擬機(jī)的故障。

1.2 設(shè)置Bi-LSTM虛擬機(jī)故障預(yù)測模型的動(dòng)態(tài)滑動(dòng)窗口

Bi-LSTM是在LSTM的基礎(chǔ)上進(jìn)行改進(jìn)的雙向長短期記憶網(wǎng)絡(luò)。LSTM的神經(jīng)單元中包含三種不同的門結(jié)構(gòu)來達(dá)到對信息的控制作用,分別是遺忘門、輸入門和輸出門[14]。這些門的作用是學(xué)習(xí)時(shí)間序列數(shù)據(jù)中的一些有用的長期信息,放棄一些無用的信息。LSTM的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,其中:xt表示輸入序列,即用于虛擬機(jī)故障預(yù)測的周期特征數(shù)據(jù);ht是隱藏層輸出,即每個(gè)LSTM單元的學(xué)習(xí)結(jié)果;ft、it、ot分別為遺忘門、輸入門、輸出門。

使用動(dòng)態(tài)滑動(dòng)窗口可以將虛擬機(jī)的時(shí)間序列信息擴(kuò)展到較高的維度空間,從而挖掘其隱含信息,尤其是動(dòng)態(tài)地學(xué)習(xí)其局部變化的信息特征,為故障預(yù)測提供更可靠的信息依據(jù)。動(dòng)態(tài)滑動(dòng)窗口的更新依據(jù)是根據(jù)歷史序列周期特征的差異性來動(dòng)態(tài)地調(diào)整歷史序列周期窗口大小,從而使得每次訓(xùn)練的序列長度發(fā)生變化。動(dòng)態(tài)滑動(dòng)窗口的更新算法如算法2所示。

算法2 動(dòng)態(tài)滑動(dòng)窗口的更新算法

輸入:虛擬機(jī)歷史周期特征數(shù)據(jù)perifeat。

輸出:動(dòng)態(tài)滑動(dòng)窗口中的樣本數(shù)據(jù)window。

a)定義窗口window,最大長度maxw,最小長度minw,差異度閾值q

b)for i=0 to perifeaf.lenth do

c) initial=perifeaf[i:maxw]

d) len=initial.lenth//窗口樣本數(shù)據(jù)的長度

e) k=1

f) for j=minw to len do

g) initial1=initial[minw:len]

h) initial2=initial[minw-k:len-k]

i) k+=1

j) covar1=cov(initial1) //計(jì)算初始窗口中特征的協(xié)方差矩陣

k) eigen1=linalge(covarl) //計(jì)算初始窗口中特征的特征值

l) featvec1=linalgig(covar1) /計(jì)算初始窗口中特征的特征向量/

m) covar2=cov(initial2) /計(jì)算滑動(dòng)一個(gè)步長窗口中特征的協(xié)方差矩陣/

n) eigen2=linalge(covar1) /計(jì)算滑動(dòng)一個(gè)步長窗口中特征的特征值/

o) featvec2=linalgig(covar2) /計(jì)算滑動(dòng)一個(gè)步長窗口中特征的特征向量/

p) cos=differ(featvec1,featvec2) /計(jì)算初始窗口和更新窗口之后的特征差異度/

q) if cosgt;q

r) window=initial[minw-k:len-k] /根據(jù)差異度獲得最終窗口數(shù)據(jù)的大小/

s) break

t) end for

u) end for

v) return window

動(dòng)態(tài)滑動(dòng)窗口更新的具體過程為:首先初始化滑動(dòng)窗口的長度,設(shè)定最小滑動(dòng)窗口和最大滑動(dòng)窗口的大小,并設(shè)置動(dòng)態(tài)滑動(dòng)窗口的滑動(dòng)步長,然后選取距離當(dāng)前時(shí)刻最近的最小滑動(dòng)窗口的歷史周期特征,計(jì)算該窗口中周期特征的協(xié)方差矩陣,并根據(jù)特征矩陣計(jì)算其特征值和特征向量,隨后滑動(dòng)窗口將緊鄰初始滑動(dòng)窗口中的周期特征加入作為新窗口中的數(shù)據(jù),計(jì)算該窗口數(shù)據(jù)的協(xié)方差矩陣、特征值和特征向量,接著根據(jù)兩個(gè)特征向量的余弦相似度計(jì)算其特征差異性,根據(jù)設(shè)定的差異度閾值,動(dòng)態(tài)地更新滑動(dòng)窗口大小,如果差異性較小說明特征變化平緩,則將該新的周期特征數(shù)據(jù)加入到動(dòng)態(tài)窗口中,擴(kuò)大窗口長度,直到特征差異度超過設(shè)定的閾值或者窗口大小超過最大值,如果特征差異性較大則說明特征變化劇烈,則不將該周期特征樣本加入到動(dòng)態(tài)窗口中,停止此次動(dòng)態(tài)窗口的更新。通過對歷史周期特征的差異度計(jì)算,動(dòng)態(tài)更新滑動(dòng)窗口的長度對Bi-LSTM模型進(jìn)行改進(jìn),從而使得每次對Bi-LSTM預(yù)測模型進(jìn)行訓(xùn)練的序列長度發(fā)生變化,動(dòng)態(tài)捕獲虛擬機(jī)故障發(fā)生的特點(diǎn)。

1.3 基于DSWMCBi-LSTM的虛擬機(jī)故障預(yù)測

現(xiàn)有研究中一般采用虛擬機(jī)歷史的指標(biāo)數(shù)據(jù),來預(yù)測下一時(shí)刻指標(biāo)數(shù)據(jù)的點(diǎn)值預(yù)測的方法來對虛擬機(jī)的故障進(jìn)行預(yù)測。這在云平臺這樣高度分布式的系統(tǒng)中,不僅預(yù)測準(zhǔn)確性不高,而且預(yù)測一個(gè)點(diǎn)的值無法為系統(tǒng)維護(hù)管理人員提供足夠的處理時(shí)間。因此本文基于以上原因?qū)μ摂M機(jī)的歷史運(yùn)行數(shù)據(jù)進(jìn)行周期劃分,對各個(gè)周期的關(guān)鍵指標(biāo)數(shù)據(jù)進(jìn)行特征的抽取,然后利用歷史序列的周期特征預(yù)測下一周期的特征,并進(jìn)行故障狀態(tài)的判斷。這不僅能夠提高云環(huán)境下虛擬機(jī)故障預(yù)測的準(zhǔn)確率,而且也能夠給系統(tǒng)維護(hù)人員提供相對充足的預(yù)處理時(shí)間。

根據(jù)1.1節(jié)中的聚類方法將虛擬機(jī)性能關(guān)鍵度量指標(biāo)進(jìn)行分類之后,將虛擬機(jī)歷史數(shù)據(jù)按相同的周期對各個(gè)類中的指標(biāo)數(shù)據(jù)進(jìn)行劃分,然后對各個(gè)周期的性能指標(biāo)數(shù)據(jù)進(jìn)行特征的抽取,抽取的特征除了指標(biāo)之間的相關(guān)性特征之外,還包括周期內(nèi)數(shù)據(jù)的均值、方差、標(biāo)準(zhǔn)差、偏度和峰度。抽取虛擬機(jī)歷史周期特征如算法3所示。

算法3 抽取虛擬機(jī)歷史周期特征算法

輸入:虛擬機(jī)性能指標(biāo)歷史數(shù)據(jù)performdata。

輸出:歷史周期特征矩陣featmatrix。

a)newperdata=slide_window(performdata) /將歷史數(shù)據(jù)按周期進(jìn)行劃分/

b)featmatrix=[] //定義特征矩陣

c)for i=0 to newperdata.lenth do

d) cormatrix=pearson(newperdata[i]) /計(jì)算第i個(gè)周期指標(biāo)的相關(guān)矩陣/

e) iuindex=triu_indices(cormatrix)//獲取上三角矩陣的索引值

f) eig=cormatrix[iuindex] //根據(jù)索引值獲取相關(guān)矩陣的上三角元素/

g) mathfe=[] //定義特征向量

h) mea=mean(newperdata[i]) //計(jì)算第i個(gè)周期數(shù)據(jù)的均值

i) var=var(newperdata[i]) //計(jì)算第i個(gè)周期數(shù)據(jù)的方差

j) std=mean(newperdata[i]) //計(jì)算第i個(gè)周期數(shù)據(jù)的標(biāo)準(zhǔn)差

k)skew=skew(newperdata[i]) //計(jì)算第i個(gè)周期數(shù)據(jù)的偏度

l) kur=kurtosis(newperdata[i]) //計(jì)算第i個(gè)周期數(shù)據(jù)的峰度

m)mathfe=mathfe.add(eig,mea,var,std,ske,kur) /將第i個(gè)周期的每個(gè)特征存入特征向量中/

n) featmatrix=featmatrix.add(mathfe) /將第i個(gè)周期的特征向量存入特征矩陣中/

o) end for

p) return featmatrix

在抽取的周期特征中方差代表周期內(nèi)的樣本數(shù)據(jù)對本周期內(nèi)樣本均值的偏差,偏度是衡量對均值的偏離程度,峰度是衡量極端值的情況。通過抽取這些特征來綜合表征虛擬機(jī)的運(yùn)行狀態(tài),將這些特征作為故障預(yù)測的歷史特征依據(jù)來對下一周期的虛擬機(jī)特征進(jìn)行預(yù)測并加以分析判斷其故障類型。

本文1.1節(jié)中根據(jù)虛擬機(jī)關(guān)鍵度量指標(biāo)的相關(guān)性特點(diǎn),將關(guān)鍵度量指標(biāo)劃分成了k類,每個(gè)類描述不同的問題即不同的故障類型。通過相關(guān)性分析發(fā)現(xiàn),不僅相同指標(biāo)類內(nèi)的周期特征具有一定的相關(guān)性,而且不同指標(biāo)類之間的周期特征也具有一定的相關(guān)性。在對虛擬機(jī)進(jìn)行故障預(yù)測時(shí),不僅要考慮類內(nèi)特征的相關(guān)性而且要考慮各類之間的相關(guān)性,通過學(xué)習(xí)各個(gè)類之間的依賴關(guān)系來更加合理準(zhǔn)確地預(yù)測出具體的故障。而單通道Bi-LSTM網(wǎng)絡(luò)只能處理單個(gè)類內(nèi)特征的信息,無法有效處理多個(gè)類之間的相關(guān)依賴關(guān)系,如果使用不同的Bi-LSTM對各個(gè)類的虛擬機(jī)關(guān)鍵度量分別建立時(shí)間序列模型,則無法有效地捕獲類之間的相關(guān)性。如果使用一個(gè)Bi-LSTM處理所有類的時(shí)間序列,則在同一時(shí)刻將所有指標(biāo)類的周期特征值作為Bi-LSTM的第一層輸入,之后該輸入被映射成為一定維度的特征,即所有類的序列信息被融合成一個(gè)相同的特征表達(dá),這種特征的表達(dá)方式明顯會(huì)丟失很多重要信息,無法有效地挖掘不同關(guān)鍵度量類之間的相互影響[16]。

通過分析單通道Bi-LSTM模型在虛擬機(jī)故障預(yù)測方面處理不同關(guān)鍵度量類之間存在的不足,以及虛擬機(jī)故障的發(fā)生特點(diǎn)。本文在動(dòng)態(tài)滑動(dòng)窗口Bi-LSTM的基礎(chǔ)上融合了多通道機(jī)制構(gòu)建DSWMCBi-LSTM的虛擬機(jī)故障預(yù)測模型,并將虛擬機(jī)歷史特征數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),來訓(xùn)練該模型以預(yù)測虛擬機(jī)下一周期的周期特征。該模型不僅能夠更好地捕獲虛擬機(jī)故障發(fā)生過程中局部特征的變化特性,而且能夠有效地提取不同關(guān)鍵度量類之間的相關(guān)依賴性,即在虛擬機(jī)故障預(yù)測模型的訓(xùn)練過程中,通過聯(lián)合學(xué)習(xí)融合了不同關(guān)鍵度量類之間的相關(guān)特征,以此達(dá)到更高的預(yù)測準(zhǔn)確性。DSWMCBi-LSTM故障預(yù)測模型的結(jié)構(gòu)如圖5所示。

DSWMCBi-LSTM預(yù)測模型的建立過程為:首先通過動(dòng)態(tài)滑動(dòng)窗口動(dòng)態(tài)獲取各個(gè)類內(nèi)指標(biāo)周期特征的歷史序列長度,即使用多少歷史周期特征預(yù)測下一個(gè)周期特征。然后將各個(gè)類對應(yīng)的歷史序列的數(shù)據(jù)輸入到各個(gè)單通道的Bi-LSTM中,每個(gè)單通道的Bi-LSTM均使用兩個(gè)Bi-LSTM網(wǎng)絡(luò)層,第一層的神經(jīng)維度設(shè)置為128,第二層的神經(jīng)維度設(shè)置為64,通過兩層Bi-LSTM網(wǎng)絡(luò)將各個(gè)類的周期特征映射到更高的維度進(jìn)行學(xué)習(xí)。接著將所有單通道的Bi-LSTM的輸出作為merge層的輸入,將各個(gè)單通道的學(xué)習(xí)結(jié)果進(jìn)行融合來聯(lián)合學(xué)習(xí)各個(gè)類之間周期特征的依賴性,并通過反向傳播進(jìn)行參數(shù)的更新,然后將merge層的輸出作為dense層的輸入,dense層將聯(lián)合學(xué)習(xí)的預(yù)測結(jié)果進(jìn)行轉(zhuǎn)換輸出期望的預(yù)測結(jié)果。在模型訓(xùn)練的過程中,將mse作為損失函數(shù),將adam作為模型的優(yōu)化器,batch_size設(shè)置為64,即每經(jīng)過一個(gè)batch對網(wǎng)絡(luò)中的參數(shù)進(jìn)行一次梯度下降,epoch設(shè)置為200即擬合網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)輪數(shù)。

基于DSWMCBi-LSTM的虛擬機(jī)故障預(yù)測過程具體為:首先是利用歷史周期的特征數(shù)據(jù)訓(xùn)練預(yù)測模型,將虛擬機(jī)各個(gè)關(guān)鍵度量類內(nèi)的周期特征作為訓(xùn)練數(shù)據(jù)利用動(dòng)態(tài)滑動(dòng)窗口進(jìn)行劃分,以一個(gè)窗口中的歷史序列特征作為訓(xùn)練數(shù)據(jù),下一個(gè)周期的特征作為學(xué)習(xí)目標(biāo)進(jìn)行模型的訓(xùn)練;然后在預(yù)測階段同樣根據(jù)動(dòng)態(tài)窗口將數(shù)據(jù)進(jìn)行劃分,以動(dòng)態(tài)窗口中的歷史序列特征為依據(jù),預(yù)測下一個(gè)周期的特征。

1.4 基于OCSVM和區(qū)間偏移度的故障判別方法

基于DSWMCBi-LSTM對虛擬機(jī)故障進(jìn)行預(yù)測,預(yù)測得到虛擬機(jī)下一周期的特征數(shù)據(jù)之后,還需要對特征數(shù)據(jù)加以分析,判斷其具體的故障類型。而云環(huán)境下的虛擬機(jī)正常的性能數(shù)據(jù)比較容易獲取,在故障發(fā)生率不高的云平臺中虛擬機(jī)的故障數(shù)據(jù)相對偏少,獲取較多的故障數(shù)據(jù)有一定的難度?;诖丝紤]利用云平臺中虛擬機(jī)的正常數(shù)據(jù)建立故障判別方法,對預(yù)測到的虛擬機(jī)特征進(jìn)行判斷其故障類型。在傳統(tǒng)SVM基礎(chǔ)上進(jìn)行擴(kuò)展的一類支持向量機(jī)(one classs support vector machine,OCSVM)算法,是一種只需要通過虛擬機(jī)的正常數(shù)據(jù)就能夠建立虛擬機(jī)故障判別方法的無監(jiān)督學(xué)習(xí)算法。所以O(shè)CSVM十分適用于云環(huán)境下虛擬機(jī)正常性能數(shù)據(jù)和故障數(shù)據(jù)的不平衡的故障判別。但是由于OCSVM只能對一類樣本數(shù)據(jù)進(jìn)行故障識別,而本文在對虛擬機(jī)進(jìn)行故障預(yù)測時(shí)將虛擬機(jī)性能的關(guān)鍵度量指標(biāo)劃分成了k類,當(dāng)多個(gè)類別同時(shí)被OCSVM識別出故障時(shí),OCSVM算法無法對其進(jìn)一步分析判斷虛擬機(jī)最終是發(fā)生了哪一種故障。所以,本節(jié)提出了基于OCSVM和區(qū)間偏移度的故障判別方法,對預(yù)測模型預(yù)測到的下一周期的特征結(jié)果進(jìn)行判斷,得出其具體的故障類型。OCSVM在對樣本數(shù)據(jù)進(jìn)行分類時(shí),把坐標(biāo)原點(diǎn)當(dāng)作異常數(shù)據(jù)進(jìn)行處理,通過將輸入的樣本數(shù)據(jù)映射到高維空間中訓(xùn)練得到一個(gè)由支持向量表示的超平面[17]。該超平面能夠?qū)⒄颖九c原點(diǎn)盡可能分開,在保證盡量多地正確區(qū)分目標(biāo)樣本的情況下,最大化原點(diǎn)到超平面的距離,以此將對樣本數(shù)據(jù)的單分類問題轉(zhuǎn)換為二分類問題,從而實(shí)現(xiàn)對正常樣本和異常樣本的分類[18]。將虛擬機(jī)的周期特征樣本組成訓(xùn)練數(shù)據(jù){x1,x2,…,xi,…,xN},其中xi為n維特征向量,定義高維空間的超平面函數(shù)為式(9)所示。

則上述分類過程轉(zhuǎn)換為求解下列優(yōu)化問題:

其中:N是訓(xùn)練樣本的個(gè)數(shù);v∈(0,1]是一個(gè)權(quán)衡參數(shù);vn類似于SVM中的懲罰系數(shù)C;ζi是松弛變量,其作用是提高分類方法對異常數(shù)據(jù)的識別能力[19]。在核函數(shù)選擇方面,在對比分析高斯核函數(shù)以及徑向基核函數(shù)的優(yōu)缺點(diǎn)之后,選擇使用徑向基和函數(shù)作為分類方法的核函數(shù)。本文根據(jù)1.1節(jié)中將虛擬機(jī)性能關(guān)鍵度量指標(biāo)劃分為k類的結(jié)果,針對每一類度量指標(biāo)分別建立OCSVM故障判別模型,將各個(gè)類內(nèi)的正常樣本數(shù)據(jù)的周期特征作為訓(xùn)練數(shù)據(jù),訓(xùn)練OCSVM虛擬機(jī)故障判別模型。然后將各個(gè)訓(xùn)練好的故障判別模型對利用DSWMCBi-LSTM進(jìn)行故障預(yù)測的結(jié)果進(jìn)行判別,判斷各個(gè)關(guān)鍵度量指標(biāo)類的周期特征所描述的系統(tǒng)問題是否出現(xiàn)故障,得到具體的預(yù)測結(jié)果。因?yàn)殛P(guān)鍵度量指標(biāo)的類型有k類,利用各個(gè)類所訓(xùn)練出來的OCSVM故障判別方法只能識別該類型的故障,若對預(yù)測到的虛擬機(jī)下一周期的特征進(jìn)行故障判斷時(shí),判斷出多個(gè)類均出現(xiàn)了異常,即判斷出多個(gè)故障類型,由于各個(gè)類之間具有一定的相關(guān)性,那么究竟是由哪一類故障導(dǎo)致或引起的其他故障OCSVM是無法進(jìn)行判斷的[20]?;诖?,本文在OCSVM故障判別的基礎(chǔ)上增設(shè)了區(qū)間偏移度的故障判別方法,來針對OCSVM同時(shí)判別出多個(gè)故障類型時(shí),再利用區(qū)間偏移度來綜合性地進(jìn)行分析,具體是哪一種故障最終導(dǎo)致的。

由于本文劃分的k個(gè)虛擬機(jī)性能關(guān)鍵度量指標(biāo)之間具有一定的相關(guān)性,所以在其中一個(gè)類型指標(biāo)發(fā)生異?;蛘叱霈F(xiàn)故障時(shí),與之具有相關(guān)關(guān)系的指標(biāo)類也有可能出現(xiàn)不同程度的異常,但其主要原因是前者類型的故障所導(dǎo)致的。針對這種現(xiàn)象本文將認(rèn)為虛擬機(jī)的故障類型是前者而不是后者,其表現(xiàn)在周期特征的差異為:前者故障狀態(tài)下的特征和正常狀態(tài)下的特征差異偏離置信區(qū)間的偏移程度,將大于后者故障狀態(tài)下的特征和正常狀態(tài)下的特征差異偏移度。

由于云平臺系統(tǒng)的復(fù)雜性,其正常狀態(tài)下不同周期的特征也會(huì)存在一些差異,例如當(dāng)云平臺中新出現(xiàn)大批的任務(wù)需要處理時(shí),負(fù)責(zé)計(jì)算任務(wù)的虛擬機(jī)性能指標(biāo)將會(huì)出現(xiàn)一定的波動(dòng),其周期特征也會(huì)產(chǎn)生一些變化,而此時(shí)虛擬機(jī)依然是正常的,這種情況和虛擬機(jī)計(jì)算量小的情況下的特征將會(huì)出現(xiàn)差異。所以為了有效地識別具體的故障類型,計(jì)算各個(gè)指標(biāo)類建立正常狀態(tài)下不同歷史周期的特征差異度,根據(jù)各個(gè)歷史周期特征之間的差異度建立差異度的置信區(qū)間。計(jì)算根據(jù)預(yù)測結(jié)果為故障的周期特征和正常狀態(tài)下的特征差異度,并按照式(11)計(jì)算該差異度偏離正常狀態(tài)下特征差異置信區(qū)間的偏移程度[21]。

其中:costrue表示預(yù)測為故障虛擬機(jī)的周期特征和正常狀態(tài)下的特征差異度,cosmid表示正常狀態(tài)下特征差異度置信區(qū)間的中值,cosu 表示正常狀態(tài)下特征差異度置信區(qū)間的上限,cosl表示正常狀態(tài)下特征差異度置信區(qū)間的下限?;贠CSVM和區(qū)間偏移度的故障判別算法如算法4所示。

算法4 基于OCSVM和區(qū)間偏移度的故障判別算法

輸入:虛擬機(jī)正常狀態(tài)歷史周期特征數(shù)據(jù)perifeat,周期特征預(yù)測結(jié)果predicr,訓(xùn)練好的各類OCSVM。

輸出:最終的故障類型flable。

a)將預(yù)測結(jié)果predicr按照索引將特征劃分為k類,對應(yīng)k類關(guān)鍵度量指標(biāo)的特征

b)利用各類OCSVM對各類特征進(jìn)行判斷并將結(jié)果存入midresult列表中

c)aindex=[j for j,x in enumerate(midresult) if x是故障] /記錄各個(gè)故障所對應(yīng)的下標(biāo)/

d)根據(jù)perifeat計(jì)算各類特征差異度的置信區(qū)間并存入字典confinter中

e)if aindex.lenthgt;1

f) eig=cormatrix[iuindex] /根據(jù)索引值獲取相關(guān)矩陣的上三角元素/

g) for k in aindex do

h) 計(jì)算各個(gè)故障類特征與相對應(yīng)的正常特征的差異度

i) 計(jì)算各個(gè)特征差異度偏離對應(yīng)特征差異度置信區(qū)間confinter[k]的偏移度

j) 比較偏移度的大小

k) 將偏移度最大的判定為最終的故障類型flable

l) end for

m)else

n) for x=0 to midresult.lenth do

o) if midresult[x] 是故障

p) flable=midresult[x]

q) end for

r)return flable

當(dāng)利用OCSVM判別出多種故障類型時(shí),分別計(jì)算預(yù)測的周期特征和各自正常狀態(tài)下周期特征的差異度,得到差異度之后計(jì)算和正常差異度置信區(qū)間的偏移程度,將偏移程度最大的判定為最終的故障類型。

2 實(shí)驗(yàn)

為了驗(yàn)證本文虛擬機(jī)故障預(yù)測模型的預(yù)測效果,利用9臺Opzoon機(jī)架式服務(wù)器,服務(wù)器搭載了英特爾至強(qiáng)CPU(E5-2620v3)頻率為2.4 GHz,搭建了真實(shí)的OpenStack云平臺環(huán)境進(jìn)行相關(guān)的實(shí)驗(yàn)。搭建的云平臺一共有9個(gè)節(jié)點(diǎn),其中包含1個(gè)控制節(jié)點(diǎn)、1個(gè)存儲節(jié)點(diǎn)、1個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)、1個(gè)管理節(jié)點(diǎn)和5個(gè)計(jì)算節(jié)點(diǎn),并在該云平臺上創(chuàng)建9個(gè)虛擬機(jī)實(shí)例使其位于不同的計(jì)算節(jié)點(diǎn)上。5個(gè)計(jì)算節(jié)點(diǎn)的配置信息如表1所示。

9個(gè)虛擬機(jī)按照規(guī)格劃分為三種類型,每種類型3個(gè)虛擬機(jī),各種類型的配置信息如表2所示。

本次實(shí)驗(yàn)利用采集到的各個(gè)虛擬機(jī)運(yùn)行數(shù)據(jù)有495 000條,其中正常數(shù)據(jù)為400 404條,占整體數(shù)據(jù)的72%,故障數(shù)據(jù)140 532條,占整體數(shù)據(jù)的28%。在對預(yù)測模型進(jìn)行構(gòu)建時(shí),將55%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),將45%的數(shù)據(jù)作為測試數(shù)據(jù),具體為270 000條訓(xùn)練數(shù)據(jù)和225 000條測試數(shù)據(jù)。根據(jù)虛擬機(jī)運(yùn)行數(shù)據(jù)利用構(gòu)建的DSWMCBi-LSTM虛擬機(jī)故障預(yù)測模型,預(yù)測虛擬機(jī)下一周期的故障。在實(shí)驗(yàn)之前首先是從采集到的26個(gè)原始數(shù)據(jù)指標(biāo)中選擇和虛擬機(jī)故障預(yù)測相關(guān)的關(guān)鍵度量指標(biāo),通過特征選擇的方法得到16個(gè)與虛擬機(jī)故障相關(guān)的關(guān)鍵度量指標(biāo),關(guān)鍵度量指標(biāo)信息如表3所示。

然后根據(jù)關(guān)鍵度量指標(biāo)的歷史數(shù)據(jù)計(jì)算指標(biāo)之間的相關(guān)性,利用K-means聚類算法根據(jù)計(jì)算得到的指標(biāo)相關(guān)性,對關(guān)鍵度量指標(biāo)進(jìn)行聚類,并通過多次實(shí)驗(yàn)將關(guān)鍵度量指標(biāo)聚為四類,能夠符合每個(gè)類型中的指標(biāo)描述相同的系統(tǒng)問題。

為了驗(yàn)證本文虛擬機(jī)故障預(yù)測模型的預(yù)測效果,在相同的數(shù)據(jù)集下將本文的故障預(yù)測模型與其他四種故障預(yù)測方法文獻(xiàn)[4~6]和馬爾可夫鏈故障預(yù)測方法進(jìn)行對比。

本文的實(shí)驗(yàn)采用故障預(yù)測的準(zhǔn)確率(accuracy)、召回率(recall)、F值(F-measure)和預(yù)測耗時(shí)作為評價(jià)預(yù)測方法的評估指標(biāo),其計(jì)算方式如式(12)~(14)所示。

在本次實(shí)驗(yàn)中,使用相同的訓(xùn)練數(shù)據(jù)集用以訓(xùn)練DSWMCBi-LSTM虛擬機(jī)故障預(yù)測模型和四個(gè)基線模型,對9臺虛擬進(jìn)行故障預(yù)測。本文方法所使用的訓(xùn)練集和四個(gè)基線對比方法所使用的訓(xùn)練集均為同一批數(shù)據(jù),即52%的訓(xùn)練集即270 000條訓(xùn)練數(shù)據(jù),訓(xùn)練數(shù)據(jù)中有故障數(shù)據(jù)68 522條,將每個(gè)虛擬機(jī)所發(fā)送的25 000條測試數(shù)據(jù)共225 000條數(shù)據(jù)作為測試集,分別對以上的預(yù)測方法進(jìn)行驗(yàn)證。四種方法的故障預(yù)測準(zhǔn)確率、召回率、F值結(jié)果對比如圖6~8所示。

從圖6可以看出,本文的DSWMCBi-LSTM方法在預(yù)測準(zhǔn)確率方面相比于其他四個(gè)對比基線方法,即文獻(xiàn)[4~6]和馬爾可夫鏈方法,分別提升了14%、8%、13%和6%,其根本原因在于DSWMCBi-LSTM方法能夠動(dòng)態(tài)捕獲周期特征的變化過程,同時(shí)學(xué)習(xí)各類周期特征的上下文時(shí)序特征和相關(guān)特征,從而提升了預(yù)測的準(zhǔn)確性。

從圖7可以看出,相比于其他四個(gè)基線方法,本文虛擬機(jī)故障預(yù)測方法的預(yù)測召回率也同樣均有較為明顯的提升。但同樣可以看出各個(gè)預(yù)測方法的召回率相比準(zhǔn)確率有所下降,說明預(yù)測方法故障判別方面仍有一定的不足,導(dǎo)致了誤判。

從圖8中可以看出,相比于其他四個(gè)對比基線方法,本文虛擬機(jī)故障預(yù)測模型的F值也均有較為明顯的提升。F值總和考慮了準(zhǔn)確率和召回率兩個(gè)評價(jià)指標(biāo),是該兩個(gè)評價(jià)指標(biāo)的加權(quán)調(diào)和平均,更能反映出預(yù)測方法的有效性。綜合來看本文預(yù)測模型的F值在90%左右,相對于其他四個(gè)基線對比模型分別提升了17%、15%、16%和7%,該結(jié)果更加綜合性地說明了本文DSWMCBi-LSTM故障預(yù)測方法的準(zhǔn)確性和魯棒性。

綜合本文的故障預(yù)測方法和其他四個(gè)基線方法對9臺虛擬機(jī)的預(yù)測效果,計(jì)算每個(gè)方法平均的預(yù)測準(zhǔn)確率、召回率和F值,具體結(jié)果如表4所示。

從表4可以看出,本文預(yù)測方法在平均預(yù)測準(zhǔn)確率方面相對于其他四個(gè)對比基線方法,分別提高了13.96%、9.69%、14.22%和6.79%,在平均預(yù)測召回率方面分別提高了17.71%、16.69%、16.66%和9.01%,在平均預(yù)測F值方面分別提高了15.92%、13.44%、15.48%、7.94%。因此,該實(shí)驗(yàn)結(jié)果說明了本文方法相比對比方法在預(yù)測性能上均有一定的提高。

本文方法和對比方法在實(shí)驗(yàn)的過程中均記錄了預(yù)測過程所耗費(fèi)的時(shí)間,并將預(yù)測耗時(shí)同樣作為預(yù)測方法的評價(jià)指標(biāo)。各個(gè)方法在預(yù)測過程中的預(yù)測耗時(shí)如圖9所示。

從圖9中可以看出,本文方法的預(yù)測耗時(shí)并不是明顯小于四個(gè)基線方法的預(yù)測耗時(shí),本文方法的預(yù)測耗時(shí)在2.5 s左右,馬爾可夫鏈的預(yù)測耗時(shí)在2.4 s左右,文獻(xiàn)[4]預(yù)測耗時(shí)在7.5 s左右、文獻(xiàn)[5]預(yù)測耗時(shí)在3.7 s左右、文獻(xiàn)[6]預(yù)測耗時(shí)在4.7 s左右。綜合來看本文的預(yù)測方法雖然在預(yù)測耗時(shí)上和馬爾可夫鏈方法相近,但在預(yù)測性能上卻明顯優(yōu)于馬爾可夫鏈方法,所以綜合分析本文方法在虛擬機(jī)故障預(yù)測方面具有一定的優(yōu)勢。

3 結(jié)束語

本文根據(jù)虛擬機(jī)性能關(guān)鍵度量的周期特征,提出了基于動(dòng)態(tài)滑動(dòng)窗口多通道Bi-LSTM的故障預(yù)測模型,模型設(shè)置動(dòng)態(tài)滑動(dòng)窗口對Bi-LSTM進(jìn)行改進(jìn),以動(dòng)態(tài)捕獲虛擬機(jī)故障發(fā)生的特征變化,并利用多通道機(jī)制同時(shí)學(xué)習(xí)不同類特征之間的依賴性,來提高預(yù)測效率。通過具體的實(shí)驗(yàn)表明本文方法比文獻(xiàn)[4~6]以及馬爾可夫鏈等基線方法的預(yù)測效果更好,預(yù)測耗時(shí)也更小。雖然本文的虛擬機(jī)故障預(yù)測方法能夠根據(jù)故障發(fā)生前的周期特征預(yù)測下一周期的故障,但是對于突發(fā)的異常點(diǎn)故障則預(yù)測效果欠佳,因此后期需要進(jìn)一步提高對虛擬機(jī)突發(fā)故障進(jìn)行預(yù)測的魯棒性。

參考文獻(xiàn):

[1]Patel E,Kushwaha D S.A hybrid CNN-LSTM model for predicting server load in cloud computing[J].The Journal of Supercompu-ting,2022,78(8):1-30.

[2]Sharma Y,Si Weisheng,Sun D,et al.Failure-aware energy-efficient VM consolidation in cloud computing systems[J].Future Generation Computer Systems,2019,94(6):620-633.

[3]韓守飛.云計(jì)算環(huán)境下的虛擬機(jī)故障預(yù)警研究[D].沈陽:沈陽航空航天大學(xué),2018.(Han Shoufei.Research on virtual machine fault early warning in cloud computing environment[D].Shenyang:Shen-yang University of Aeronautics and Astronautics,2018.)

[4]Li Zhixin,Liu Lei,Kong Degang.Virtual machine failure prediction method based on AdaBoost-Hidden Markov model[C]//Proc of International Conference on Intelligent Transportation,Big Data amp; Smart City.Piscataway,NJ:IEEE Press,2019:700-703.

[5]Dai V D,Vu X T,Kim Y.Deep Learning-based fault prediction in cloud system[C]//Proc of International Conference on Information and Communication Technology Convergence.Piscataway,NJ:IEEE Press,2021:1826-1829.

[6]張爭萬,吳迪,張春炯.基于多通道稀疏LSTM的蜂窩流量預(yù)測研究[J].計(jì)算機(jī)科學(xué),2021,48(6):296-300.(Zhang Zhengwan,Wu Di,Zhang Chunjiong.Research on cellular traffic prediction based on multi-channel sparse LSTM[J].Computer Science,2021,48(6):296-300.)

[7]Nam S,Hong J,Yoo J H,et al.Virtual machine failure prediction using log analysis[C]//Proc of the 22nd Asia-Pacific Network Ope-rations and Management Symposium.Piscataway,NJ:IEEE Press,2021:279-284.

[8]丁三軍,薛宇,王朝霞,等.基于模糊數(shù)據(jù)挖掘的虛擬環(huán)境主機(jī)故障預(yù)測[J].計(jì)算機(jī)工程,2015,41(11):202-206.(Ding Sanjun,Xue Yu,Wang Chaoxia,et al.Fault prediction of virtual environment hosts based on fuzzy data mining[J].Computer Engineering,2015,41(11):202-206.)

[9]Saxena D,Singh A K.OFP-TM:an online VM failure prediction and tolerance model towards high availability of cloud computing environments[J].The Journal of Supercomputing,2022,78(6):8003-8024.

[10]Gao Jiechao,Wang Haoyu,Shen Haiying.Task failure prediction in cloud data centers using deep learning[J].IEEE Trans on Services Computing,2020,15(3):1411-1422.

[11]孫勤.基于在線機(jī)器學(xué)習(xí)的高性能計(jì)算機(jī)故障預(yù)測技術(shù)研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2017.(Sun Qin.Research on high-performance computer fault prediction technology based on online machine learning[D].Changsha:National University of Defense Technology,2017.)

[12]丁思凡,王鋒,魏巍.一種基于標(biāo)簽相關(guān)度的Relief特征選擇算法[J].計(jì)算機(jī)科學(xué),2021,48(4):91-96.(Ding Sifan,Wang Feng,Wei Wei.A relief feature selection algorithm based on label relevance[J].Computer Science,2021,48(4):91-96.)

[13]王瑩,項(xiàng)雯,張群,等.泛在電力物聯(lián)網(wǎng)下基于DPSO-Kmeans的客戶用電行為分析[J].哈爾濱理工大學(xué)學(xué)報(bào),2022,27(2):106-113.(Wang Ying,Xiang Wen,Zhang Qun,et al.Analysis of custo-mer electricity consumption behavior based on DPSO-Kmeans under the ubiquitous power Internet of Things[J].Journal of Harbin University of Science and Technology,2022,27(2):106-113.)

[14]王鑫,吳際,劉超,等.基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的故障時(shí)間序列預(yù)測[J].北京航空航天大學(xué)學(xué)報(bào),2018,44(4):772-784.(Wang Xin,Wu Ji,Liu Chao,et al. Fault time series prediction based on LSTM recurrent neural network[J].Journal of Beijing University of Aeronautics and Astronautics,2018,44(4):772-784.)

[15]倪祥龍,石長安,麻曰亮,等.基于Bi-LSTM的電子裝備故障預(yù)測方法研究[J/OL].航空兵器.(2022-04-14)[2022-09-25].http://kns.cnki.net/kcms/detail/41.1228.TJ.20220412.1158.003.html.(Ni Xianglong,Shi Chang’an,Ma Yueliang,et al. Research on the failure prediction method of electronic equipment based on Bi-LSTM[J/OL].Aviation Weapons.(2022-04-14)[2022-09-25].http://kns.cnki.net/kcms/detail/41.1228.TJ.20220412.1158.003.html.)

[16]林友芳,尹康,黨毅,等.基于時(shí)空LSTM的OD客運(yùn)需求預(yù)測[J].北京交通大學(xué)學(xué)報(bào),2019,43(1):114-121.(Lin Youfang,Yin Kang,Dang Yi,et al.OD passenger demand forecasting based on spatiotemporal LSTM[J].Journal of Beijing Jiaotong University,2019,43(1):114-121.)

[17]Xie Xijiong,Sun Shiliang.Multi-view support vector machines with the consensus and complementarity information[J].IEEE Trans on Knowledge and Data Engineering,2019,32(12):2401-2413.

[18]武玉坤,李偉,倪敏雅,等.單類支持向量機(jī)融合深度自編碼器的異常檢測模型[J].計(jì)算機(jī)科學(xué),2022,49(3):144-151.(Wu Yukun,Li Wei,Ni Minya,et al.Anomaly detection model of single-class support vector machine fused with deep autoencoder[J].Computer Science,2022,49(3):144-151.)

[19]張慶朔,何強(qiáng),張長倫,等.模糊多核一類支持向量機(jī)[J].北京建筑大學(xué)學(xué)報(bào),2020,36(1):82-90.(Zhang Qingshuo,He Qiang,Zhang Changlun,et al.Fuzzy multi-kernel first-class support vector machine[J].Journal of Beijing University of Architecture,2020,36(1):82-90.)

[20]潘思辰.基于單類支持向量機(jī)的ICS入侵檢測方法研究[D].哈爾濱:哈爾濱工程大學(xué),2021.(Pan Sichen.Research on ICS intrusion detection method based on single-class support vector machine[D].Harbin:Harbin Engineering University,2021.)

[21]李柯辛.基于LSTM的云平臺故障預(yù)測方法研究[D].哈爾濱:哈爾濱工程大學(xué),2020.(Li Kexin.Research on fault prediction me-thod of cloud platform based on LSTM[D].Harbin:Harbin Enginee-ring University,2020.)

收稿日期:2022-07-29;修回日期:2022-09-27 基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(62162038,61462049,61063006,60703116);國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2018YFB1003904);云南省應(yīng)用基礎(chǔ)研究計(jì)劃重點(diǎn)項(xiàng)目(2017FA033);云南省計(jì)算機(jī)技術(shù)應(yīng)用重點(diǎn)實(shí)驗(yàn)室開放基金資助項(xiàng)目(2020101)

作者簡介:王開放(1995-),男,河南商丘人,碩士,主要研究方向?yàn)樵朴?jì)算、大數(shù)據(jù)分析、軟件質(zhì)量保證與測試;姜瑛(1974-),女(通信作者),浙江余姚人,教授,博士,主要研究方向?yàn)檐浖|(zhì)量保證與測試、云計(jì)算、大數(shù)據(jù)分析、智能軟件工程(jy_910@163.com).

主站蜘蛛池模板: 国产精品冒白浆免费视频| 无码中文AⅤ在线观看| 麻豆国产在线观看一区二区| 国产成人免费观看在线视频| 亚洲天堂高清| 国产无码高清视频不卡| 欧美一级特黄aaaaaa在线看片| 国产成人高清精品免费软件| 九九热这里只有国产精品| 国产亚洲精品自在久久不卡| 国内自拍久第一页| 久久久精品国产SM调教网站| 小说区 亚洲 自拍 另类| 91精品情国产情侣高潮对白蜜| 亚洲天堂久久久| 国产91高清视频| 91精品国产情侣高潮露脸| 92午夜福利影院一区二区三区| 国产一二三区在线| 中文字幕日韩丝袜一区| 亚洲综合狠狠| 在线视频97| 精品日韩亚洲欧美高清a| 一级爱做片免费观看久久| 欧洲极品无码一区二区三区| 啪啪永久免费av| 色首页AV在线| 精品国产免费观看一区| 欧美翘臀一区二区三区| 美女无遮挡拍拍拍免费视频| 精久久久久无码区中文字幕| 久草青青在线视频| 国产爽歪歪免费视频在线观看 | 亚洲国产日韩一区| 激情国产精品一区| 色天天综合| 刘亦菲一区二区在线观看| 久久国产精品无码hdav| 亚洲国产系列| 国产精品福利在线观看无码卡| 毛片久久久| 亚洲毛片在线看| 最新日韩AV网址在线观看| 六月婷婷激情综合| 欧美日韩综合网| 欧美性爱精品一区二区三区| av尤物免费在线观看| 国产乱子伦手机在线| 这里只有精品在线| 色天天综合久久久久综合片| 亚洲性视频网站| 老司机精品99在线播放| 无码专区国产精品第一页| a级毛片在线免费观看| 69国产精品视频免费| 国产又粗又猛又爽视频| 狼友视频一区二区三区| 凹凸精品免费精品视频| A级全黄试看30分钟小视频| 97国产精品视频自在拍| 国产一区二区精品福利| 亚洲中文无码h在线观看| 一本大道香蕉中文日本不卡高清二区| 亚洲欧美人成电影在线观看| 欧美日韩福利| 亚洲欧美另类久久久精品播放的| 中文字幕无码电影| 国产丝袜丝视频在线观看| 伦精品一区二区三区视频| 亚洲a级在线观看| 天天做天天爱夜夜爽毛片毛片| 香蕉久人久人青草青草| 国产三级成人| 国产高清在线观看91精品| 国产91麻豆视频| 亚洲V日韩V无码一区二区| 福利片91| 成人久久18免费网站| 精品国产99久久| 99色亚洲国产精品11p| 亚洲天堂免费在线视频| 又黄又爽视频好爽视频|