楊仙瑜 李章華 曹澤

摘要: 隨著數字經濟下大數據、云平臺、互聯網、區塊鏈技術的不斷完善和發展[1],傳統的數據恢復技術已經無法有效地處理海量數據集合中發生的數據災難。本文探索以人工智能數據技術應用于數據恢復領域,提升傳統數據恢復算法的計算能力,對海量數據進行實時、高效、準確地處理,實現數據準確、高效的重構和恢復。
關鍵詞:人工智能; 數據恢復; 海量數據; 重構;
0 引言
大數據時代的到來,標志著數據將成為人類發展的關鍵。隨著大數據、5G技術、互聯網技術、人工智能技術、區塊鏈技術的不斷完善和發展,對傳統的數據恢復技術帶來了變革和挑戰,傳統的數據恢復技術已經無法有效地處理海量數據集合中發生的數據災難[2]。因此,開發一款集互聯網技術、大數據技術的人工智能數據恢復軟件成為解決這一問題的關鍵,人工智能數據恢復軟件將人工智能和傳統的數據恢復技術相結合,提升傳統數據恢復算法的計算能力,對海量數據進行實時、高效、準確地處理,實現數據準確、高效的重構和恢復。
通過人工智能數據恢復軟件的研發,可對海量數據進行實時、高效、準確地處理和恢復,滿足大數據時代與日劇增的數據恢復需求,通過機器學習,預測分析數據丟失的因素,通過不斷地模擬學習,不斷調整算法以從各種不同的場景中實現數據的恢復。
1 人工智能數據恢復介紹
數據恢復技術是指通過各種技術手段對丟失和遭到破壞的數據進行恢復和重建,是一種跨硬件平臺、軟件系統,包容了操作系統、文件格式、數據庫結構、數據存儲原理、存儲硬件設計等多種要素的綜合技術數據恢復。傳統的數據恢復技術即通過恢復軟件、恢復設備對存儲介質的數據進行恢復的過程,傳統數據恢復軟件由于受存儲介質的制約,數據恢復針對性強,擴展性差,沒有形成規模化的恢復。
人工智能數據恢復技術即將大數據、互聯網技術、人工智能等技術和傳統的數據恢復技術相結合,對傳統數據恢復技術進行變革,提升傳統數據恢復算法的計算能力,對海量數據進行實時、高效、準確地處理,實現數據準確、高效的重構和恢復的技術,人工智能數據恢復軟件擴展性強,通過預測分析模型,更好地將不同的代碼串在一起,以確保它被正確地重構,實現對各種不同的場景中數據的恢復。人工智能數據恢復軟件集成多款數據恢復功能,通過預測分析,加入了智能分析的因素,使得系統可以不依靠固定介質,具有系統推廣性強、適應范圍更廣、數據恢復準確率更高以及恢復效率快等特點。
2人工智能數據恢復原理及技術路線
人工智能數據恢復的原理即對丟失和遭到破壞的數據進行重構的過程。存儲介質數據丟失后,數據內部結構被打亂成亂碼,需要通過算法進行重組和拼合,系統結合大數據獲取海量數據恢復案例,通過機器學習對算法進行清洗和提取,對具體的數據恢復案例進行智能分析,根據分析結果選擇最佳的算法。同時通過深度學習不斷調整算法,對預測分析模型進行訓練,將代碼進行重構,從而實現數據恢復。
綜上,人工智能數據恢復路線如下圖:
3 人工智能數據恢復關鍵技術
人工智能數據恢復系統采用的技術有數據備份技術、碎片重組技術、數據重構技術、數據遷移技術、互聯網技術、機器學習技術和深度學習技術等。
數據備份技術:即以只讀的方式對故障系統做完整鏡像的技術,主要采用逐檔及鏡像兩種手段。
碎片重組技術:即基于信息熵特征提取算法,結合支持向量機作為分類器來分類文件碎片,并使用基于磁盤簇邏輯順序的重組算法對文件碎片進行重組的技術;
數據重構技術:指根據損壞的NTFS文件系統殘留信息對文件進行初揀的技術;
數據遷移技術:對歷史數據進行清洗、轉換,并轉載到新系統的過程;
互聯網技術:指互聯網的技術、平臺、商業模式和應用與移動通信技術結合并實踐的技術,用戶使用手機、平板電腦等移動終端,通過移動網絡獲取互聯網服務。
機器學習技術:機器學習是人工智能(Artificial Intelligence, AI)的核心,是使計算機具有智能的根本途徑,它主要使用歸納、綜合而不是演繹。機器學習就是探究和開發一系列算法來如何使計算機不需要通過外部明顯的指示,而可以自己通過數據來學習建模,并且利用建好的模型和新的輸入來進行預測的學科;
深度學習技術:深度學習是基于機器學習延伸出來的一個新的領域,由以人大腦結構為啟發的神經網絡算法為起源加之模型結構深度的增加發展,并伴隨大數據和計算 能力的提高而產生的一系列新的算法。
4人工智能數據恢復應用研究
將人工智能技術應用于數據恢復領域,需要解決的問題包括:
1)基于信息熵特征提取算法,結合支持向量機作為分類器來分類文件碎片,使用重組算法對文件碎片進行重組;
2)通過機器學習對算法進行清洗和提取,對具體的數據恢復案例進行智能分析,根據不同的場景選擇不同的算法;
3)結合人工智能和數據共享模式,建立云南省數據恢復共享服務平臺。
4 結語
目前,我國信息化建設高歌猛進,人工智能與數據恢復技術的結合是時代發展的需求[3],如何處理海量數據,如何保障數據安全已成為數據恢復領域研究的熱點,本文從人工智能數據恢復原理、涉及關鍵技術以及應用需要解決的問題進行探討,為人工智能數據恢復軟件的開發提供支撐,為進一步提供數據安全性提供前期研究。
參考文獻
崔校郡.新時期大數據分析與應用關鍵技術研究[J].信息技術與信息化,2020:204-206.
田兵,嚴文濤,李明,殷齊林,郭爽爽.海量結構化數據實時恢復技術研究[J].自動化與儀器儀表,2019:133-135+139.
董磊,崔永波.新時期數據恢復技術應用與研究[J].電子世界,2019:132-132.
作者簡介:
楊仙瑜(1990-),女,云南,工程師,2014年畢業于云南大學,主要從事軟件系統研發相關的工作。