四川中電啟明星信息技術有限公司 余 癡 李 立 王海慶 胡 波
大數據分析、云存儲技術的迅速發展為電力系統智能化發展提供了堅實的數據支持,這些數據對維護系統正常運行具有重要的參考和指導意義,維護數據信息的安全至關重要。數據信息存儲在網絡運設備中,存儲設備數量較為龐大,監視存儲設備的運行狀態,預測存儲系統的存儲故障顯得只管重要。本文對存儲設備故障的神經網絡預測方法進行了論述,具有一定的參考意義。
隨著大數據技術、物聯網技術以及網絡云技術等網絡信息技術的快速發展,人們對大規模存儲系統的發展要求也越來越高。互聯網系統的數據存儲系統變得越來越龐大。大量的重要信息存儲在數據中心,這些數據的安全性是人們關注的一個關鍵問題。硬盤是最常用的數據存儲設備,一旦硬盤出現問題,則很容易導致數據的損壞和丟失,從而造成難以估量的損失。并且隨著有用數據數量的迅速膨脹,所需的存儲系統規模的不斷增大,建立一個高安全性的存儲系統成為一個亟需解決的問題。最為常見的方式就是針對硬盤的一些運行參數制定相應的健康標準,一旦硬盤運行過程中超出健康范圍,系統則發出報警信息并采取相應的應對措施如數據遷移或者數據備份。
如今,副本機制是大型數據存儲中心最常見的提高存儲設備可靠性的方式。通常可以將需要存儲的數據保存數個副本,通過多個備份的手段來提高數據的安全性,一旦數據丟失或損壞可以很快的從副本重新提取數據,這種方式的數據安全性和重塑性好,但是需要的存儲空間大,成本投入較高。同時,由于副本機制無需加密解碼,且網絡資源占用小,具有較強的數據重構性。
此外,糾刪碼也是常用的數據存儲安全技術。糾刪碼的方式利用一定的計算模型根據數據內容計算出數據校驗碼,當數據損壞或丟失后,系統可以根據計算模型反向推導出原始數據的內容。糾刪碼所需的存儲空間較小,但在數據恢復過程中的計算量較大,其可靠性也低于副本機制。
另外,磁盤的扇區和塊出現故障或者損壞的情況也經常出現,因此,系統應定期對磁盤扇區進行檢測,從而及時發現扇區故障,并采取備份等措施保護扇區數據。這一技術被成為扇區清洗。
提高存儲系統的可靠性,其關鍵在于及時發現存儲故障。SMART技術是常用的存儲故障檢測技術,它通過故障檢測和報警處理的方式,對存儲器的故障進行主動檢測處理。從而在故障發生以前,提前發出故障報警,并對危險數據進行備份,提高了數據的安全性,避免了數據丟失的危險。采用SMART法根據硬盤運行參數對硬盤健康程度進行簡單的預測分析已經取得了一定的成果,為提高預測的準確性,我們需要建立更加科學完善的數學模型。
神經網絡是常用的計算模型,其利用計算機模擬人類的認知過程,通過模型的建立,對研究對象影響因素進行特征值分析提取,并對特征值進行計算分析,最終得到最優解。反向傳播算法是神經網絡模型的常用算法,這種計算模型通過對系統誤差的反向推算,不斷減小系統誤差。本文采用了輸入層、隱含層以及輸出層三層結構組成的神經網絡模型對存儲設備的故障進行預測。其結構如下圖1所示。

圖1 存儲設備故障檢測的神經網絡模型
神經網絡的隱含層可能存在多個,上圖中的圓圈表示一個神經元節點,神經元節點是數據處理的基本單元,每個層次都包含若干神經元節點,臨近層次的神經元節點通過某種權重關系而相互關聯,不同層次之間的連線代表這種權重關系。權重關系在模型計算之前,通過一定算法賦值,通常,權重的數值大小表示了神經元節點之間的作用強度,通常權重的數值越大代表神經元節點間的作用關系越強。如上圖所示,神經元節點的信息往往只沿著一個方向傳播,不會往復循環。輸入層包含了研究對象的樣本特征,輸出層的計算結果則用來判斷硬盤故障是否將要發生。
在分析過程中,我們首先將一個研究樣本輸入模型的輸入層,將關系硬盤健康狀況的屬性根據一定的算法得出權重和特征值,然后將這些屬性綜合加權,并建立函數關系,函數的輸出就是模型的輸出信號。在分析過程中,我們利用誤差的反向傳播,通過比較目標值和輸出值之間的偏差,對神經元節點之間的權重關系進行調整,從而盡可能減小誤差。通過不斷的往復計算,對神經網絡模型的權值不斷的進行調整,最終使得神經網絡模型計算結果的誤差達到允許范圍內,求得最優解,通常達到一定的迭代次數即可達到預期效果。在實際運算過程中,迭代的次數越多,往往誤差值越小,但迭代次數過多,會導致運算負擔過重。因此,迭代計算的次數往往通過人為設定,使得最終誤差在允許范圍內即可。
隨著技術的不斷革新,存儲設備的故障預測分析技術在不斷的發展和完善,存儲設備的故障檢測工作還有很多工作需要進一步完善。神經網絡算法作為存儲設備故障點預測模型,還需在實際的云存儲系統中,通過不斷的實踐驗證,發現問題并不斷的改進。