楊曉東
(內蒙古自治區大數據中心 內蒙古自治區呼和浩特市 010020)
數據安全不僅關系個人因素,同時還會影響國家的政治、經濟、國防等重要領域。對于一些重要的政府部門、國防部門而言,數據具有極高的保密要求。所以,計算機上的機密數據和文件在銷毀擦除時,必須能夠完全銷毀,不能存在一點恢復的可能,數據銷毀技術也就因此而誕生。在當前信息技術發達的當下,數據存儲系統已經成為了數據記錄必不可少的基本設備,數據存儲設備記錄了大量的重要數據和敏感信息,所以在進行存儲設備數據信息刪除時,如果沒有高端的數據清除和銷毀技術,在特定的條件下或者技術應用下,這些數據就可能被恢復。所以,為了保障計算機數據安全,需要使計算機在特定情況下,具備數據銷毀能力,能夠自動清除數據存儲記錄設備中的數據,并且清除的數據不可恢復,達到保密和安全的目的。
在研究計算機數據自毀擦除技術時,需要了解計算機數據刪除技術的原理和特點。在數據安全系統中所說的數據自毀擦除技術指的是磁盤擦除技術(即:DataWipingorDataErasing),這種技術是利用軟件或者硬件技術手段,將存儲設備(U 盤、硬盤)中的數據刪除,并且不可恢復。目前人們認知中的計算數據刪除其實是在誤導用戶,人們常規使用的回收站和文件徹底刪除并不能使數據信息被永久刪除,利用一些數據恢復技術能夠重新恢復這些數據。所以,在探究數據安全系統中數據自毀技術之前,需要針對以下幾個誤區進行解釋。其一,常用的Delete刪除數據,并不能完全擦除磁盤信息。在使用這一功能時,只是在文件系統中刪除了目錄區的文件名與數據區存儲數據之間的鏈接,在鏈接刪除后,只存在單鏈接的FAT 和NTFS 文件系統就會顯示存儲區清空的狀態,但是數據依然保存在存儲區,并沒有實現“重寫”[1]。除此之外,我們通常認為的存儲設備格式化和重新分區操作,都不能徹底刪除數據。
在處于銷毀和擦除技術中,物理銷毀是數據銷毀效果最好最安全方式。物理銷毀通常包括磁盤消磁、化學腐蝕、粉碎、燒毀等手段。這些方式能夠通過對存儲設備的破壞,實現對數據不可恢復的消除。消磁技術似乎利用專業的消磁設備是磁盤表面的磁介質磁化。在磁化磁場的影響下,磁盤的磁介質被破壞,存儲的數據也就徹底銷毀了。化學腐蝕是利用化學消極將磁盤中的磁性介質腐蝕,使其發生破壞,達到銷毀的目的。物理破壞則是利用外力將磁盤粉碎,或者通過火燒等方式進行處理。由于磁盤最小存儲單位為512 字節,所以當磁盤碎片小于這個存儲量時,數據就完全不可讀取[2]。但是物理銷毀成本較高,磁盤通常不可重復利用,而且損壞的存儲設備還會造成環境污染,所以這種銷毀技術應用價值不高。
密碼技術的出現是保護計算機數據最有價值的技術。但是密碼技術并不能阻止刪除數據的恢復。EFS 可以利用單密匙加密計算機的文件、目錄,但是如果密碼被破解,那么刪除后的數據依然會被恢復。所以加密技術通常不會作為擦除數據的方法,尤其是隨著計算技術的進步,密碼破解速度的加快和難度的降低,導致銷毀的數據恢復并非不可能[3]。利用加密技術來進行數據銷毀需要使用加密工具,利用加密工具對文件、目錄或者文件系統進行加密,那么沒有密匙文件數據就不能被訪問,當密匙被銷毀后,擦除的數據也就無法被恢復,這種銷毀方式甚至不需要覆寫,或者只需要很好的覆寫次數。這種數據銷毀方式缺點在于密匙管理難度大,被加密的文件在磁盤中仍然可見、而且加密技術的水平也會影響數據銷毀效果。
利用文件系統進行數據的銷毀,技術難度較高。在Ext2、Ext3、Reiserfs 系統中,支持利用特定屬性來標識需要銷毀的文件以及目錄。但是這種特殊標識屬性會隨著操作系統的升級變得困難。不同的文件系統采用的數據銷毀方式不同,Bauer 就是通過識別被標識的文件,然后利用Ext2 修改功能函數,使其將被標識的文件數據和文件元擦除。這種數據擦除的方式需要更改和增加文件系統的源代碼,導致技術要求較高,能夠使用的人較少,而且數據擦除并不完整。
安全數據擦除技術是隨著計算機市場發展出現的新的數據銷毀技術。由于市場和用戶的需求,加利福尼亞大學研究出了一種安全數據擦除技術,這種技術采用CMRR 協議將數據銷毀擦除的程序命令安裝到磁盤的內部。所以,磁盤的數據擦除可以脫離操作系統運行,當受到病毒和惡意軟件的攻擊時就會執行數據銷毀命令,實現數據的不可恢復性擦除。
覆寫是計算機數據銷毀擦除中常用的技術手段。利用預算定義的格式,使用無意義、無規律的信息來覆蓋磁盤中原本存儲的數據,使數據擦除后被覆寫數據替代,實現不會恢復。這是由于磁盤數據是以二進制形式進行保存的,當數據覆寫完成后,那么原本的數據保存是“0”還是“1”都無法被確定。雖然一次覆寫成功就會導致磁盤中所存儲的數據無法被計算機技術所恢復,但是利用“磁盤放大鏡”可以通過物理方法將磁盤中被覆寫的數據恢復,所以為了保障數據銷毀的可靠性,通常需要多次覆寫,覆寫的次數越多,數據銷毀的效果也就越好。
利用軟件進行數據銷毀通常是基于覆寫算法進行的。其中偽隨機算法是較為經典的算法之一,還有DoD5220.22-M 算法,Gutmann 算法等。這種算法手寫需要找到需要被銷毀的文件,然后在文件的起始位置,用預先設定的代碼來重寫整個文件,最后將文件關閉。利用軟件進行數據銷毀需要保障其銷毀的可靠性,也就是安全等級,其衡量標準包括軟件不可恢復性、硬件難恢復性和硬件極難恢復性。這種覆寫數據銷毀由于需要對銷毀的數據進行多次的股改,所以消耗的時間非常大,為了確保數據銷毀的安全性,需要進行多次覆寫,也就代表著每一次覆寫都會增加同等的時間。因此,這一數據銷毀技術需要將提升銷毀速度作為關鍵,以節約數據擦除的時間。
利用軟件進行數據擦除由于覆寫的原因,需要占用大量的時間,所以為了提高數據銷毀擦除的速度,提出了異步IO 等待的多線程擦除技術。這種技術與普通的多線程技術區別在于,普通多線程不能對清楚的文件起到作用,普通磁盤一個盤片只有一個磁頭,在啟動多個清除任務是,只能是磁頭的效率變低。異步多線程則是在CPU 計算能力的基礎上,對緩存和磁盤讀寫進行綜合調度。在進行數據擦除任務時,需要重復進行磁盤的寫入,儲蓄指令只能按照順序,在數據寫入完成后再繼續執行下一個命令。異步IO 則會在處理應用程序是將控制返回給應用程序,無需等待操作結束。
磁盤是數據存儲的主要設備,隨著技術的發展,為了更好的管理磁盤存儲的數據,文件系統得到了進一步發展。例如,基于Windows 系統的FAT32、NTFS 等系統。雖然操作系統不同,但是磁盤的文件系統結構是相似的,區別在于不同文件系統中,文件分配表區存在差異。Windows 系統采用了訪問安全保護機制,在操作系統下不能直接訪問物理內存,但是并非不能對硬件設備進行訪問,利用文件磁盤操作的API 可以對文件及磁盤進行數據存取的訪問。因此,在利用軟件進行磁盤數據的銷毀時,需要考慮到磁盤與文件系統的工作原理。
在計算機數據銷毀和擦除技術發展的過程中,與之相對應的數據恢復技術也在不斷的進步,尤其是在計算機取證方面,這一技術發揮著非常重要的作用。所以,在衡量數據銷毀效果時,可以利用數據恢復技術對其銷毀的數據進行恢復,從而做出判定。數據銷毀效果主要以數據殘留量作為衡量的標準,數據殘留包括元數據殘留和文件數據的內容殘留。由于數據銷毀和擦除都會進行覆寫,通過不同的覆寫次數來提高數據銷毀的安全級別,數據恢復技術則是利用數據覆寫的模式進行反數據擦除,進行數據恢復。在判定數據銷毀效果時,可以利用軟件對經過擦除的存儲設備進行殘留物的檢測,檢測內容包括文件名、文件時間戳和文件內容。
數據恢復技術的原理是通過元數據提供的信息恢復存儲的數據。包括磁盤分區后的數據、被格式化的數據、誤刪除數據等。但是如果數據被覆寫之后,數據恢復工具就無法實現數據的恢復了。因此,在磁盤數據被誤刪除和格式化之后,都不能有任何磁盤寫入數據的操作,必須立刻送到專業的數據恢復公司進行恢復,當前應用較為廣泛的數據恢復工具包括:Data Recovery、Final Data 等。當我們將文件刪除到回收站并且清空回收,然后格式化磁盤,對磁盤進行重新分區就會發現,這些操作知識修改了文件的元數據,而文件的數據區內容并沒有發生變化,這就是利用數據恢復技術進行擦除數據恢復的原理,這也說明常規刪除操作不能徹底完成數據的銷毀。
除了利用軟件完成計算機擦除數據的恢復之外,計算機取證技術和硬盤檢測技術也能夠恢復數據,并且效果更好。計算機取證技術通過收集和分析數據殘留的信息獲取證據,軟件可以從目錄文件中找到被刪除的內容,恢復曾經存在的文件名,還能夠從索引節點找到文件的相關信息,如果被刪除的數據塊沒有被重新使用,那么就能夠在存儲設備中找回,即便數據無法徹底恢復,也可以利用時間戳來了解系統發生過的數據擦除操作等。如果磁盤數據被覆蓋,就需要利用硬件恢復來完成數據的找回。磁力顯微鏡(MFM)是一種掃描探頭,可以在磁場的作用下獲得磁盤的磁力圖,然后得到磁盤的數據,這種數據恢復方法非常困難,而且成本過高,主要被應用在軍事、國防和重要的政府機構。
綜上所述,數據安全系統中數據的銷毀對于數據的安全性非常關鍵。常規的數據刪除和格式化操作并不能徹底完成數據的銷毀。通過對當今數據銷毀擦除領域相關技術的分析,了解了當前應用較為廣泛的幾類數據銷毀方式,這些方式中物理銷毀最為安全可靠,但是成本代價過高,利用軟件進行數據銷毀都需要利用到數據的覆寫技術。因此,提高數據覆寫效率是提高數據銷毀水平的關鍵。數據銷毀與數據恢復都是計算機技術的重要組成部分,數據銷毀能夠有效保障數據安全,而數據恢復則能夠找回誤刪的數據,可以說二者互為矛盾關系,但是同樣都是保障計算機數據安全的重要技術。