999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TCBN組合模型的硬盤健康度預(yù)測

2022-10-01 02:41:42何辰煜
計算機工程與設(shè)計 2022年9期
關(guān)鍵詞:故障模型

李 國,何辰煜,李 靜

(中國民航大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,天津 300300)

0 引 言

海量數(shù)據(jù)的時代已經(jīng)到來,現(xiàn)今數(shù)據(jù)存儲的方式已經(jīng)從本地轉(zhuǎn)移到了云端。數(shù)據(jù)安全被認為是影響云計算系統(tǒng)可靠性的重要因素,大規(guī)模數(shù)據(jù)存儲中心的可靠性研究不容忽視。研究[1-3]表明,在大型數(shù)據(jù)中心的硬件故障報告中,硬盤故障的比例最高。硬盤故障將導(dǎo)致數(shù)據(jù)丟失,影響客戶端的經(jīng)濟效益,如果沒有相對應(yīng)的故障處理機制,造成的損失將是無法想象的。如果能夠提前預(yù)測硬盤的健康狀態(tài)[4,5],并且可以通過預(yù)警遷移機制及時進行備份和遷移,則可以大幅度減少硬盤故障所帶來的損失。

許多學(xué)者研究了硬盤故障預(yù)測問題,但是先前的一些研究僅僅預(yù)測硬盤在將來是否會發(fā)生故障,而沒有提供更多可參考的指標,并且在可解釋性方面表現(xiàn)不佳。統(tǒng)計分析[2]發(fā)現(xiàn),運維人員在收到磁盤故障的FOTs(故障操作通知單)后,不會立即采取相應(yīng)的措施,因此直接預(yù)測硬盤的剩余使用壽命失去了實際意義。運維人員真正想知道的是硬盤故障發(fā)生的緊迫性即硬盤故障的健康程度。如果預(yù)測模型能向運維人員提供有關(guān)硬盤故障緊急程度的信息,運維人員則可以根據(jù)硬盤的健康程度對故障操作通知單進行排序,從而及時處理來降低故障風(fēng)險。本文提出一種能反饋的硬盤健康狀況的基于TCBN的硬盤健康度預(yù)測模型,以提高預(yù)測性能及應(yīng)用價值。

1 相關(guān)工作

大多數(shù)硬盤制造商使用自我監(jiān)視,分析和報告技術(shù)(SMART),但是該項技術(shù)采用的閾值算法進行故障檢測率約為3%至10%,無法滿足預(yù)期的要求。Hughes等統(tǒng)計發(fā)現(xiàn)SMART屬性是非參數(shù)分布的,因此研究建議使用Wilcoxon秩和檢驗方法進行建模。在基于3744個磁盤數(shù)據(jù)集上的實驗結(jié)果表明,當誤報率(false alarm rate,F(xiàn)AR)為0.5%時,模型的故障檢出率(failure detection rate,F(xiàn)DR)達到60%。

李靜等[6]提出了一種基于分類和回歸樹的硬盤故障預(yù)測模型。在具有25 792個硬盤的數(shù)據(jù)集上,F(xiàn)DR達到95%,F(xiàn)AR低于0.1%。此外,還提出了一種基于回歸樹的健康度模型。該模型可以評估硬盤的健康狀況,將健康樣本的值設(shè)置為1,并使用基于個性化惡化窗口的函數(shù)來表示故障的樣本。也就是說,硬盤的健康狀態(tài)通過特定的概率值來表示,這樣的表達不是精確和直觀的。Basak等[7]使用LSTM建立了硬盤剩余壽命的在線預(yù)測模型。經(jīng)過訓(xùn)練的模型可以預(yù)測大約10天的故障,精度約為0.8。盡管在研究中給出了硬盤剩余使用壽命的預(yù)測,但剩余使用壽命以天為單位。如果運維人員獲得了此類數(shù)據(jù),則認為只要在預(yù)計的日期內(nèi)處理故障,數(shù)據(jù)就不會丟失。實際上,這樣會導(dǎo)致錯過進行故障排除的最佳時間。Xu等[8]認為硬盤故障預(yù)測的研究屬于長期依賴性的問題,因此作者提出了一種基于遞歸神經(jīng)網(wǎng)絡(luò)的硬盤健康評估模型,該模型在健康評估方面具有更好的表現(xiàn)。但是,該模型忽略了健康度劃分會影響模型在實際工作中的性能。

Wang等[9]提出了AIOPs解決方案,用于解決硬盤故障數(shù)據(jù)不平衡的問題。該解決方案集成了XGBoost分類,LSTM和XGBoost回歸的3種算法模型。實驗結(jié)果表明,該集成算法的預(yù)測效果更加準確、穩(wěn)定。Pang等[10]設(shè)計了CBN硬盤健康度預(yù)測模型,其預(yù)測故障時間為實際故障時間的70%或更早。但是作者忽略了模型的老化以及基于不同結(jié)構(gòu)的模型之間的相互影響。同時,該研究也沒有給出具體的硬盤健康度劃分模型。

鑒于上述的研究中產(chǎn)生的不足,本文做出了如下改進:

(1)為提高模型的實際應(yīng)用價值,本文調(diào)研了大數(shù)據(jù)中心的故障調(diào)查報告[2],通過數(shù)據(jù)中心運維人員的工作日志,了解到運維人員更需要的是指示硬盤健康狀況的輸出結(jié)果。于是,采用貝葉斯網(wǎng)絡(luò)將4個在硬盤故障預(yù)測方面表現(xiàn)較好的單個分類器組合起來,組合成TCBN硬盤健康度預(yù)測模型。

(2)基于大型數(shù)據(jù)中心提供的真實數(shù)據(jù)設(shè)計實驗,驗證TCBN組合模型的硬盤故障預(yù)測性能,并與其它單個分類器進行比較。此外,為避免不同硬盤型號差異的影響,提取了特定型號的硬盤來驗證TCBN模型在預(yù)測硬盤剩余壽命方面的表現(xiàn)。本文中使用的數(shù)據(jù)集來自大型云存儲供應(yīng)商公司Backblaze。

(3)考慮到硬盤健康度劃分對硬盤健康度預(yù)測模型應(yīng)用的影響,因此本文提出了“SMART-Degree”硬盤健康度劃分,并設(shè)計了相關(guān)對比實驗來驗證采用該健康度劃分的健康度預(yù)測模型的性能。

2 TCBN硬盤健康度預(yù)測模型

2.1 “SMART-Degree”健康度劃分的構(gòu)建

在先前研究[2]中發(fā)現(xiàn),關(guān)于硬盤健康狀況的信息對數(shù)據(jù)中心運維人員處理故障時更為重要,通過硬盤健康度信息可以動態(tài)調(diào)度運維人員處理故障預(yù)警信息,一方面節(jié)省人力成本,并降低數(shù)據(jù)中心發(fā)生硬盤故障的風(fēng)險。硬盤的健康程度能更好地表達硬盤是否能正常運行,這是硬盤故障預(yù)測模型中不能忽略的關(guān)鍵參考因素。另外在先前研究中[8,10],研究人員對硬盤健康程度進行均等劃分或隨機劃分,并沒有給出健康度劃分的具體定義,從而忽略了健康度劃分對預(yù)測模型的影響。以往研究[6]指出硬盤的惡化不是突然的,而是逐漸發(fā)生的,并利用基于個性化惡化窗口函數(shù)來預(yù)測硬盤健康狀況。統(tǒng)計報告[2]指出硬盤的故障率隨著時間的推移是呈現(xiàn)逐步上升的趨勢,可見硬盤的壽命與自然生物的壽命相似,存在一個逐漸退化的過程,而基于Fibonacci推導(dǎo)的數(shù)學(xué)模型在壽命研究領(lǐng)域應(yīng)用廣泛。于是本文基于Fibonacci函數(shù)結(jié)合硬盤健康度時間間隔提出了“SMART-Degree”硬盤健康度劃分。統(tǒng)計報告同時也指出實際數(shù)據(jù)中心運維人員在接收到故障預(yù)警信息時,在30天內(nèi)處理故障的可能性僅為0.65左右。即該硬盤健康度劃分一方面能反饋硬盤壽命的退化過程便于模型進行預(yù)測,另一方面更貼合實際運維人員的反應(yīng)時間便于及時進行數(shù)據(jù)遷移等操作。

本文將硬盤的實際剩余工作時間作為硬盤健康度的來源,硬盤的實際剩余工作時間可以真正反映硬盤的健康狀況。以20天或480小時為限來表示硬盤的健康程度,預(yù)測結(jié)果超過20天或480小時的硬盤被認定為是相對安全的,本文將這些硬盤歸類為健康硬盤。反之,預(yù)測結(jié)果是少于20天或480小時的硬盤,將被認為是一個有問題的故障硬盤,需要對該硬盤的健康狀況進行評估。考慮到數(shù)據(jù)集以及數(shù)據(jù)中心運維人員的工作習(xí)慣,故不能隨意劃分硬盤的健康度等級。如果硬盤健康度劃分的時間間隔太小,或者大部分集中在只有夜間值班人員的情況下,所提出的模型不能提供貼合實際應(yīng)用場景的預(yù)測結(jié)果。所以該模型以天為基本單位,即24小時或24小時的倍數(shù)作為最小的健康度劃分單元。“SMART-Degree”硬盤健康度的劃分區(qū)間表示為interval(i), 具體公式如下:

當i=1時

interval(1)=1*24h

(1)

當i=2時

interval(2)=1*24h

(2)

當i≥3時

(3)

圖1展示了具體的“SMART-Degree”健康度劃分,根據(jù)上面定義的時間間隔公式劃分480 h,制定了7個硬盤健康度等級。健康度等級越低,硬盤發(fā)生故障的緊急程度就越高;健康度等級越高,硬盤的故障發(fā)生時間越遲緩,相對應(yīng)的緊急程度就越低。

圖1 SMART-Degree硬盤健康度劃分

2.2 TCBN組合模型的具體構(gòu)建

組合模型往往比單個分類器具有更高的預(yù)測準確性,一般分類器通常進行二分類,而本文需要的是關(guān)于硬盤健康度的多分類結(jié)果,貝葉斯網(wǎng)絡(luò)為本研究提供了可能性。在先前研究中,基于樹的模型在硬盤故障預(yù)測方面取得了較好的效果。因此本文選擇了XGBoost、Adaboost、CT以及GBDT作為基分類器并通過貝葉斯網(wǎng)絡(luò)組合在一起。在該組合模型中基分類器之間是等權(quán)重的,但是各個分類器之間的相互影響是一個不容忽視的問題。不同模型之間相互影響著最終的預(yù)測結(jié)果。硬盤健康度的預(yù)測研究也是如此,每個基分類器的預(yù)測結(jié)果對最終預(yù)測出的硬盤健康度有著不同的貢獻,于是本研究采用了全連接的方式組合貝葉斯網(wǎng)絡(luò)。

圖2展示了TCBN模型的具體結(jié)構(gòu)以及整個模型的訓(xùn)練過程。首先通過硬盤數(shù)據(jù)集訓(xùn)練4個分類器,然后結(jié)合經(jīng)過“SMART-Degree”健康度劃分處理后的硬盤健康度等級,以形成一個新的訓(xùn)練集來訓(xùn)練TCBN模型。

圖2 TCBN硬盤健康度預(yù)測模型的具體構(gòu)建

如圖2所示采用X,A,C,G的4個節(jié)點代表XGBoost、Adaboost、CT和GBDT這4個單一分類器,并作為貝葉斯網(wǎng)絡(luò)中的特征節(jié)點。節(jié)點D代表硬盤健康度等級,作為貝葉斯網(wǎng)絡(luò)中的分類節(jié)點。例如,Adaboost的預(yù)測結(jié)果影響XGBoost的預(yù)測,而CT的預(yù)測結(jié)果影響GBDT的結(jié)果,彼此相互影響。如圖2所示,任意兩個節(jié)點之間都有一條邊,故它們的聯(lián)合分布P(D,X,A,C,G)為

P(D,X,A,C,G)=P(G|D,X,A,C)*P(A|D,C,G)*
P(C|D,X)*P(X|D)*P(D)

(4)

其中先驗概率P(D) 是通過訓(xùn)練集中的統(tǒng)計數(shù)據(jù)獲得的。

TCBN硬盤健康度預(yù)測模型的性能離不開4個單一分類器的共同作用。單一分類器的內(nèi)容如下所示:

(1)XGBoost模型使用了“梯度增強”的思想,該思想可以連續(xù)分割特征并擬合最后預(yù)測的殘差。在硬盤故障預(yù)測上,如果沒有處理XGBoost模型的預(yù)測結(jié)果,則默認輸出結(jié)果是概率值。此時需要給出一個閾值,當它低于給定的閾值時,就將其判斷為有故障的硬盤。XGBoost使用Gain增益函數(shù)找到最佳分割節(jié)點,首先計算分割節(jié)點左右子樹的得分總和,在減去分割之前的總得分,計算信息增益,然后選擇最大信息增益的特征。其增益函數(shù)如下

(5)

上面Gain增益函數(shù)中,H代表葉子節(jié)點包含樣本的二階偏導(dǎo)數(shù)累加之和,G表示葉子節(jié)點包含樣本的一階偏導(dǎo)數(shù)之和。L和R則分別代表左右子樹的節(jié)點,γ代表加入新葉子節(jié)點引入的復(fù)雜度代價。首先計算左右子樹分數(shù)和減去未分割前的得分,遍歷后取增益得分最大的作為新的分割節(jié)點。

由于本文所用的硬盤數(shù)據(jù)包含122 507個硬盤的數(shù)據(jù),直接使用精確查找算法會降低計算速度,所以采用近似算法。根據(jù)硬盤SMART特征的分布,確定n個分割點Sn={S1,S2…Sn-1,Sn}, 然后將相應(yīng)的樣本放入相應(yīng)的分割桶中,并對分割點集進行精確的貪婪搜索。圖3展示了XGBoost硬盤故障預(yù)測模型中的簡化樹模型。

圖3 XGBoost硬盤故障預(yù)測模型簡化實例

圖3可以看到第一個分割節(jié)點是SER(seek error rate),旁邊標注的是SMART屬性序列號。當SER<80時,使用Gain函數(shù)來計算出當前的最大增益節(jié)點作為下一個分割點,即POH(power-on hours),然后計算葉節(jié)點的得分。XGBoost模型的最終預(yù)測值是所有葉子節(jié)點得分的總和。葉子節(jié)點得分的公式如下所示

(6)

在XGBoost執(zhí)行一次迭代后,它將葉節(jié)點上的權(quán)重乘以學(xué)習(xí)率。學(xué)習(xí)率主要弱化每棵樹的影響,使后續(xù)學(xué)習(xí)有更多的學(xué)習(xí)空間,降低過擬合的風(fēng)險。

(2)CT模型不像上述提到的“boosting”思想,而是學(xué)習(xí)了一套分類規(guī)則以形成一棵樹。與以前的研究[6]不同,本文采用信息增益率作為分割函數(shù),因為一些SMART特征的取值比較多,將某個SMART特征的信息增益一直保持最大的狀態(tài),很容易導(dǎo)致過擬合。整個分割過程是通過計算信息增益率最高的特征作為下一個分割節(jié)點。首先,將D其定義為決策樹的父節(jié)點,Di代表其子節(jié)點,s代表D節(jié)點的選定的特征屬性。則增益函數(shù)的公式如下所示

Gain(D,s)=Ex(D)-Ex(D|s)

(7)

信息增益Gain(D,s) 是經(jīng)驗熵Ex(D) 減去經(jīng)驗條件熵Ex(D|s)。 如前面所述,如果某一個SMART特征的取數(shù)量太多,那么經(jīng)驗條件熵Ex(D|s) 的值就會趨近于0,最終導(dǎo)致信息增益的結(jié)果最大,導(dǎo)致過擬合。本文所采用的信息增益率Gratio(D,s) 的公式如下所示

(8)

H(s)代表s特征的熵,其表達式為

(9)

如果硬盤的某一個SMART特征屬性的取值較多,則H(s) 的值將增大,同時Gain(D,s) 的值也將增大。采用信息增益率Gratio(D,s) 將可以消除這部分影響。使用信息增益率Gratio(D,s) 來選擇硬盤的SMART特征會更準確,但是不能忽略其可能會受到某個取值較少的SMART特征屬性的影響。于是在選擇分割點之前,首先要找出信息增益高于平均的SMART特征,然后再選擇其中信息增益率最高的SMART特征。

(3)Adaboost首先初始化硬盤樣本的權(quán)重,使用SMART特征構(gòu)建決策樹,對數(shù)據(jù)進行分類,評估結(jié)果,然后計算該樹在最終分類中的重要性,并更新硬盤樣本的權(quán)重,繼續(xù)迭代。最后通過硬盤數(shù)據(jù)集訓(xùn)練的多個基學(xué)習(xí)器進行賦權(quán)結(jié)合得到最終的強學(xué)習(xí)器。其中權(quán)重更新公式如下所示

(10)

式中:xi表示第i個訓(xùn)練樣本,yi表示第i個訓(xùn)練樣本的類別標簽。

(4)GBDT算法與XGBoost不同,利用損失函數(shù)的負梯度擬合基學(xué)習(xí)器。首先通過硬盤數(shù)據(jù)訓(xùn)練一個弱學(xué)習(xí)器,計算損失函數(shù)并求導(dǎo)獲取梯度,然后計算出權(quán)重,一直迭代,最后每個弱學(xué)習(xí)器與權(quán)重結(jié)合得到最后的結(jié)果。計算負梯度的公式如下所示

(11)

以上4個單一分類器都是樹型結(jié)構(gòu),具有良好的可解釋性,模型之間的平衡性很好,所以能有效提升本文組合模型的預(yù)測性能。

3 實驗結(jié)果及分析

3.1 數(shù)據(jù)預(yù)處理

本文采用的數(shù)據(jù)集來自大型云存儲公司Backblaze。自2013年以來,Backblaze公司每季度會對數(shù)據(jù)中心的硬盤進行統(tǒng)計分析。本文抓取的數(shù)據(jù)集包含2019年4個季度總共122 507個硬盤,每條記錄包含硬盤型號、制造商、容量等信息。

硬盤SMART特征包含255個屬性,但是其中僅有少部分屬性對硬盤健康狀況有影響。為了提高模型的可移植性,本文篩選出3個具有代表性的特征選擇方案,通過簡單的投票機制,篩選出適合的SMART特征屬性。

第一個方案來自Backblaze公司,該公司通過統(tǒng)計分析挑選出5個SMART屬性,這些屬性預(yù)示了硬盤在將來是否發(fā)生故障。第二個方案來自于同樣涉及云存儲業(yè)務(wù)的國內(nèi)大型互聯(lián)網(wǎng)公司騰訊。在先前的研究發(fā)現(xiàn)SMART特征屬性是非參數(shù)分布的,于是先前工作[6]使用3種非參數(shù)統(tǒng)計方法(秩和檢驗、Z-score和倒序排列測試)選取特征。所以,將常用的統(tǒng)計學(xué)方法作為本文的第三個方案。

圖4展示了3個具體SMART特征提取方案的熱力圖,表1展示了本研究最終選取的SMART特征屬性。

圖4 3種SMART特征提取方案

表1 最終選取的硬盤SMART屬性

3.2 TCBN模型在故障預(yù)測方面的表現(xiàn)

為驗證組合模型的效果,本文在包含122 507個硬盤的數(shù)據(jù)集上設(shè)計了多個硬盤故障預(yù)測模型的對比實驗。TCBN硬盤健康度預(yù)測模型是一個多分類的輸出,所以,本文將預(yù)測結(jié)果高的硬盤健康等級定義為運行狀況良好的硬盤。反之,預(yù)測結(jié)果顯示較低等級的硬盤健康度則被認為是故障硬盤。本文采用真陽率(TPR)和假陽率(FPR)作為評估指標。真陽率和假陽率是評估硬盤故障預(yù)測模型的常用評估指標。其公式如下所示

(12)

(13)

圖5和表2展示了各種硬盤故障預(yù)測模型的真陽率和假陽率。如圖5可以看到,TCBN模型的真陽率達到0.857,假陽率僅達到0.031。組合模型的故障預(yù)測性能已經(jīng)超過了其余的單個分類器,其中Adaboost模型的假陽率最高,為0.092。在真陽率方面,GBDT模型的性能相對較差,僅達到0.793。CT硬盤故障預(yù)測模型的效果與先前研究人員提到的CBN模型相近。

圖5 TCBN模型在故障預(yù)測方面與其它模型的比較

表2 各模型真陽率與假陽率數(shù)據(jù)

圖5可以觀察到TCBN模型的性能也超出了先前研究[10]中提出的CBN模型的性能,這驗證了組合模型應(yīng)考慮模型之間的平衡性及模型老化的問題。以前的CBN模型包括一些較老化的模型,例如SVM,并且這些模型在當時所采用的硬盤數(shù)據(jù)集規(guī)模明顯不足。此外,該模型包含了樹型結(jié)構(gòu)和網(wǎng)絡(luò)等結(jié)構(gòu),導(dǎo)致各個模型之間的差異增大,影響了整體模型的最終的性能。

3.3 TCBN模型在擬合剩余壽命方面的表現(xiàn)

上一個實驗驗證了TCBN模型比其它單個分類器具有更好的故障預(yù)測性能。但是,僅通過實驗來驗證TCBN模型在真陽率和假陽率方面的性能還不夠全面,因此本文又設(shè)計了實驗來驗證TCBN模型在硬盤的剩余使用壽命方面的表現(xiàn)。首先,篩選合適的數(shù)據(jù)集,當不同型號的硬盤發(fā)生故障時,與硬盤故障相關(guān)的SMART特征值也會有所不同,從而影響硬盤的正常運行。

為了消除這部分的影響,本文首先分析了Backblaze提供的數(shù)據(jù),并抓取了Seagate公司的型號為ST12000 NM0007硬盤,選取該型號硬盤的原因如下:

(1)該型號硬盤的故障數(shù)量最大為1156個,年故障率為3.32%。

(2)ST12000NM0007型號的硬盤總數(shù)占2019年硬盤總數(shù)的55.90%。

為了驗證TCBN的性能預(yù)測特定型號硬盤上的剩余使用壽命,本文更改了先前定義的SMART-Degree健康度劃分,將其劃分間隔改成24 h即一天,并取消了480 h的總時間限制,以便利用TCBN硬盤健康度預(yù)測模型進行硬盤剩余使用壽命的預(yù)測。圖6展示了更改后的24 h等分硬盤健康度劃分。

圖6 24 h等分硬盤健康度劃分

圖7展示了2019年度的硬盤統(tǒng)計信息。圖8顯示了TCBN模型在預(yù)測硬盤剩余使用壽命方面的性能。圖中的正方形圖案代表硬盤的真實剩余使用壽命,圓形圖案代表TCBN模型預(yù)測的硬盤剩余使用壽命。本文使用了20多個測試用例,可以看到預(yù)測的硬盤剩余使用壽命與真實剩余使用壽命在整體上相當吻合。

圖7 2019年度硬盤統(tǒng)計信息餅狀圖

圖8中觀察到TCBN模型預(yù)測的剩余使用壽命在宏觀水平上非常符合真實的剩余使用壽命,但是可以觀察到硬盤的預(yù)測的剩余使用壽命在微觀水平上與真實值之間存在波動。盡管波動很小,但模型的預(yù)測最小單元是一天。該模型預(yù)測的結(jié)果可能會導(dǎo)致數(shù)據(jù)中心運營人員無法提前處理預(yù)警的故障信息,從而導(dǎo)致數(shù)據(jù)中心發(fā)生故障,例如數(shù)據(jù)中心的海量數(shù)據(jù)丟失。

圖8 TCBN模型在預(yù)測硬盤剩余使用壽命方面的擬合情況

關(guān)于硬盤剩余壽命預(yù)測的研究[1,7,11,12],相對于傳統(tǒng)的硬盤故障二分類研究能夠直觀給出故障硬盤的實際剩余使用壽命,運維人員可以根據(jù)硬盤的壽命指標進行故障預(yù)警遷移工作,從而達到維護數(shù)據(jù)中心用戶數(shù)據(jù)安全以及減少故障帶來的損失的目的。但是預(yù)測出的剩余使用壽命僅能較好擬合實際的剩余使用壽命,還存在一定的波動,運維人員需要增加信息處理以及排序等步驟。因此,關(guān)于硬盤健康度的預(yù)測顯得尤為重要。本文提供的硬盤健康度預(yù)測模型為運維人員提供了的有關(guān)硬盤健康狀況等級信息,以便運維人員在某個時間范圍內(nèi)提前進行故障盤的維修和數(shù)據(jù)遷移操作,也驗證了硬盤健康度預(yù)測模型的實際應(yīng)用價值。

3.4 采用不同劃分的TCBN模型對比實驗

為了驗證本文提出的SMART-Degree硬盤健康度劃分的性能,本文設(shè)計了與上述24 h等分硬盤度劃分的對比實驗。圖9和圖10分別顯示了在采用不同劃分的TCBN模型在每個硬盤健康度劃分間隔的預(yù)測準確性。

圖9 采用SMART-Degree劃分的TCBN模型的準確率

圖10 采用24 h劃分的TCBN模型的準確率

圖10中可以觀察到采用24 h劃分的TCBN健康度預(yù)測模型在大多數(shù)時間間隔內(nèi)的準確率約為30%。這種效果顯然是不夠的。過于密集的劃分間隔實際上會降低模型在預(yù)測硬盤健康度方面的準確率。另一方面,圖9中采用SMART-Degree硬盤健康度劃分的TCBN模型準確率是呈現(xiàn)逐漸上升的趨勢。隨著劃分間隔的擴大,預(yù)測模型的準確率也逐漸提高,其中在288 h~480 h區(qū)間的準確率達到了75%。從整體上看,本文提出的“SMART-Degree”硬盤健康度劃分取得了良好的性能。

樣本數(shù)量可能會對準確性產(chǎn)生一定的影響,但是本文的樣本是來自實際數(shù)據(jù)中心的硬盤數(shù)據(jù)集。該因素正驗證了數(shù)據(jù)中心硬盤故障的實際發(fā)生狀況。如果盲目地擴大硬盤健康度劃分的最小單元,擴大到極端情況下,它就演變成為二分類問題。盡管準確率將大大提高,但這種研究與傳統(tǒng)的故障二分類問題一樣,在實際應(yīng)用中不具備更高的實際應(yīng)用價值。

4 結(jié)束語

本文建立了一種基于TCBN組合模型的硬盤健康度預(yù)測模型,依據(jù)真實數(shù)據(jù)中心運維人員故障處理機制,提出了“SMART-Degree”硬盤健康度劃分。實驗結(jié)果表明,TCBN模型在TPR和FPR指標方面超過以往研究提出的單個模型;模型預(yù)測的剩余使用壽命與真實值具有較好的吻合度;此外,對比采用提出的“SMART-Degree”與常見等分的硬盤健康度劃分,TCBN硬盤健康度預(yù)測模型準確率顯著提升。

與以往研究相比,本文設(shè)計的TCBN組合模型解決了單一模型預(yù)測效果差及預(yù)測結(jié)果單一的問題,同時提出的“SMART-Degree”健康度劃分,為數(shù)據(jù)中心可靠性研究提供了新思路。未來的研究將繼續(xù)嘗試其它算法,提高組合模型的性能;同時探索其它因素對硬盤預(yù)測模型的影響,讓其更貼合實際應(yīng)用場景,從而提高研究的應(yīng)用價值。

猜你喜歡
故障模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
故障一點通
3D打印中的模型分割與打包
奔馳R320車ABS、ESP故障燈異常點亮
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
故障一點通
故障一點通
故障一點通
主站蜘蛛池模板: 国产精品蜜臀| 亚洲成网777777国产精品| 国产成人夜色91| 国产噜噜噜| 国产一级二级在线观看| 日本高清免费一本在线观看| 日本精品视频一区二区| 婷婷丁香色| 亚洲成a人片7777| 99九九成人免费视频精品| 免费jjzz在在线播放国产| 欧美在线国产| 亚洲欧州色色免费AV| 国产在线无码一区二区三区| 国产欧美亚洲精品第3页在线| 亚洲欧美在线看片AI| 成年免费在线观看| 久久国产乱子| 无码区日韩专区免费系列| 国产真实乱人视频| 免费亚洲成人| 亚洲国产成人在线| 亚洲国产成人精品一二区| 国产成人毛片| 国产主播喷水| 久久久波多野结衣av一区二区| 欧美成人午夜视频| 亚洲91精品视频| 国产激情在线视频| 高清不卡毛片| 成人午夜视频网站| 久久天天躁夜夜躁狠狠| 国产在线精彩视频论坛| 午夜国产精品视频黄| 亚洲视频一区| 欧美一级大片在线观看| 国产亚洲精久久久久久久91| 国产本道久久一区二区三区| 看你懂的巨臀中文字幕一区二区 | 欧美不卡在线视频| 一级看片免费视频| 亚洲欧美一区二区三区麻豆| 2022精品国偷自产免费观看| 日韩中文精品亚洲第三区| 欧美国产综合色视频| 亚洲国产天堂久久综合| 国产成人精品18| 欧美日韩在线观看一区二区三区| 2021国产精品自产拍在线观看| 天天视频在线91频| 久久永久视频| 9966国产精品视频| 欧美国产精品拍自| 日韩激情成人| 久久综合九九亚洲一区| 欧美精品影院| 伊人91在线| 欧美精品影院| 久久久噜噜噜久久中文字幕色伊伊| 久久毛片基地| 亚洲精品久综合蜜| 91在线免费公开视频| 国产无码性爱一区二区三区| 自拍偷拍一区| 精品国产一二三区| 日韩高清一区 | 久久www视频| 九九线精品视频在线观看| 久久久久久久久18禁秘 | 91高清在线视频| 美女高潮全身流白浆福利区| 亚洲综合中文字幕国产精品欧美| 精品少妇人妻无码久久| 亚洲国产成人超福利久久精品| 国产成人精品第一区二区| 国产一区二区三区在线观看免费| 都市激情亚洲综合久久| 国产aaaaa一级毛片| www.99在线观看| 亚洲午夜片| 亚洲综合狠狠| 国产91视频观看|