999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

微軟復(fù)合文檔的數(shù)據(jù)修復(fù)技術(shù)

2018-04-09 11:22:40耿浩然
電子技術(shù)與軟件工程 2018年5期
關(guān)鍵詞:存儲

耿浩然

摘 要 隨著科學(xué)技術(shù)和信息技術(shù)不斷發(fā)展,復(fù)合文檔廣泛應(yīng)用于我們的工作生活中,其在給我們帶來便利的同時,也經(jīng)常碰到文件損壞的問題,甚至造成重要數(shù)據(jù)丟失。本文以微軟復(fù)合文檔作為研究對象,針對其文件格式不同的損壞形式進行分析,并提出物理修復(fù)、邏輯修復(fù)、內(nèi)容修復(fù)等方法,經(jīng)實驗驗證本文提出的方法能在一定程度上有效地修復(fù)出關(guān)鍵數(shù)據(jù)。

【關(guān)鍵詞】復(fù)合文檔 文件格式 數(shù)據(jù)修復(fù) 存儲

1 復(fù)合文檔的文件格式

文件格式是指計算機中存儲文件的特殊編碼方式,用于計算機操作系統(tǒng)識別不同的文件類型,比如程序、文字、圖片、視頻等文件,每一種文件格式通常會關(guān)聯(lián)一個或多個擴展名,但也可能不關(guān)聯(lián)固定的擴展名。微軟復(fù)合文檔(以下簡稱復(fù)合文檔)是微軟公司制定的文件格式, 廣泛應(yīng)用于Word、Excel、PowerPoint等辦公文檔中,單一的復(fù)合文檔可以包含多個文本、圖形、聲音、視頻、電子表格數(shù)據(jù)等各種多媒體信息。

復(fù)合文檔的物理結(jié)構(gòu)由文件頭和扇區(qū)組成,文件頭就是復(fù)合文檔最前面的512字節(jié),描述了復(fù)合文檔的文件簽名標(biāo)識、扇區(qū)大小等結(jié)構(gòu)信息,是整個文檔最關(guān)鍵的部分;復(fù)合文檔的其余部分被劃分為大小相等的存儲空間,每一個存儲空間叫做一個扇區(qū)(通常為512字節(jié))。復(fù)合文檔的扇區(qū)分配表相當(dāng)于FAT32文件系統(tǒng)中的FAT表,用于對分配使用的所有扇區(qū)進行編號和標(biāo)識;每一個數(shù)據(jù)流都可以在扇區(qū)分配表中按照順序找到其存儲位置。扇區(qū)分配表的前109個扇區(qū)編號存放在文件頭中,當(dāng)扇區(qū)分配表多于109個扇區(qū),需要附加主扇區(qū)分配表存儲,文件頭中已經(jīng)標(biāo)識了主扇區(qū)分配表的第一個扇區(qū)編號和扇區(qū)總數(shù)。

復(fù)合文檔的邏輯結(jié)構(gòu)類似一個小型的文件系統(tǒng),其由目錄和數(shù)據(jù)流組成;數(shù)據(jù)流相當(dāng)于文件系統(tǒng)中的文件,數(shù)據(jù)流存儲在目錄中;目錄和數(shù)據(jù)流都有名字,一個目錄可以有多個子目錄和多個數(shù)據(jù)流,同一目錄下的子目錄和數(shù)據(jù)流不能重名;每個復(fù)合文檔都有一個叫做“Root Entry”的根目錄。每一個目錄和數(shù)據(jù)流都有一個索引,這些索引存儲在一個單獨的流中,這個流就叫做全局索引流。全局索引流由一系列的索引節(jié)點組成。每一個索引節(jié)點表示一個目錄或數(shù)據(jù)流;索引節(jié)點固定為128個字節(jié),每個扇區(qū)可以包含4個索引結(jié)構(gòu)。

當(dāng)一個數(shù)據(jù)流的大小小于指定值(通常為4096字節(jié)),就叫做短流,短流具有特殊的尋址方式,所有的短流存儲在一個大的數(shù)據(jù)流中,其存儲空間被劃分為更小的扇區(qū)(通常為64字節(jié)),由短流扇區(qū)分配表進行編號和標(biāo)識。

2 復(fù)合文檔的數(shù)據(jù)修復(fù)

根據(jù)復(fù)合文檔的文件格式,針對其不同的損壞方式,數(shù)據(jù)修復(fù)一般分為物理修復(fù)、邏輯修復(fù)和內(nèi)容修復(fù)。

2.1 物理修復(fù)

文件頭修復(fù)。當(dāng)復(fù)合文檔的文件頭損壞時,復(fù)合文檔無法正常使用。文件頭結(jié)構(gòu)體中大多數(shù)內(nèi)容比較容易修復(fù),比如扇區(qū)大小、短流大小、標(biāo)準(zhǔn)流最小值等,比較難修復(fù)的是扇區(qū)總數(shù)、短扇區(qū)總數(shù)、目錄流的首扇區(qū)編號、扇區(qū)分配表的前109個扇區(qū)編號等,單純的文件頭損壞,可以根據(jù)復(fù)合文檔后面的完整部分計算并修復(fù)文件頭結(jié)構(gòu)體。

扇區(qū)分配表修復(fù)。扇區(qū)分配表損壞對復(fù)合文檔的結(jié)構(gòu)完整性破壞最大,其修復(fù)難度也是最大的。最簡單的修復(fù)方法就是先判斷損壞的扇區(qū),然后將損壞的扇區(qū)修復(fù)為-1,即標(biāo)識為未分配的扇區(qū)。判斷依據(jù)就是扇區(qū)分配表中的扇區(qū)編號(每4個字節(jié)組成的有符號32位整數(shù)),其取值范圍必須小于扇區(qū)總數(shù),或者大于-4。

2.2 邏輯修復(fù)

邏輯修復(fù)主要針對全局索引流,根據(jù)全局索引流扇區(qū)鏈和索引節(jié)點的損壞可以分為兩種情況。當(dāng)全局索引流扇區(qū)鏈損壞而索引節(jié)點完整時,修復(fù)原理同上,可以掃描出所有的索引節(jié)點所在的扇區(qū),再根據(jù)其編號構(gòu)造扇區(qū)鏈。當(dāng)索引節(jié)點損壞而全局索引流扇區(qū)鏈完整時,可以參照正常的復(fù)合文檔修復(fù)目錄,因為在所有的Word、Excel、PowerPoint文件中,這些目錄的索引節(jié)點都是相對固定的;但是當(dāng)索引節(jié)點是數(shù)據(jù)流時,其扇區(qū)鏈?zhǔn)咨葏^(qū)編號和大小是最關(guān)鍵的信息,直接影響修復(fù)內(nèi)容的正確率,可以通過掃描扇區(qū)分配表識別所有的數(shù)據(jù)流,再根據(jù)經(jīng)驗嘗試所有的可能性。

2.3 數(shù)據(jù)流內(nèi)容修復(fù)

復(fù)合文檔的數(shù)據(jù)流內(nèi)容和短流內(nèi)容損壞,并沒有破壞復(fù)合文檔結(jié)構(gòu)的完整性,一般都可以正常打開,但是復(fù)合文檔的內(nèi)容已經(jīng)破壞。以Word2003創(chuàng)建的Word文件為例,其中數(shù)據(jù)流“Data”中存儲圖片、視頻等數(shù)據(jù),數(shù)據(jù)流“1Table”中存儲表格,數(shù)據(jù)流“CompObj”中存儲對象數(shù)據(jù),數(shù)據(jù)流“WordDocument”中存儲文字內(nèi)容,數(shù)據(jù)流“SummaryInformation”中存儲Word文檔的摘要信息,數(shù)據(jù)流“DocumentSummaryInformation”中存儲Word文檔的屬性信息。“Data”數(shù)據(jù)流存儲所有的圖片,每個圖片存儲在一個圖片結(jié)構(gòu)體中,圖片結(jié)構(gòu)體的前4個字節(jié)表示結(jié)構(gòu)體大小,圖片結(jié)構(gòu)體頭部偏移d1H處,就是該圖片實體文件的文件頭。假如word文件中有部分圖片文件損壞,可以按照這種方法導(dǎo)出所有的圖片文件,并對損壞的圖片文件進行進一步修復(fù)。

3 復(fù)合文檔數(shù)據(jù)修復(fù)下一步研究方向

對于文件格式和結(jié)構(gòu)化數(shù)據(jù)的研究一直都是數(shù)據(jù)修復(fù)技術(shù)的重要發(fā)展方向之一,本文在國外有關(guān)開源項目研究的基礎(chǔ)上,對復(fù)合文檔的數(shù)據(jù)修復(fù)技術(shù)進行了探討,并利用該技術(shù)實現(xiàn)了復(fù)合文檔的物理修復(fù)、邏輯修復(fù)和內(nèi)容修復(fù)。本文的研究還處于復(fù)合文檔數(shù)據(jù)修復(fù)技術(shù)研究的初步階段,下一步的研究重點是復(fù)合文檔的自動受損評估和修復(fù)機制。

參考文獻

[1]https://baike.baidu.com/item/復(fù)合文檔.

[2]http://sc.openoffice.org/compdocfileformat.pdf.

作者單位

徐州擷秀中學(xué)高三(3)班 江蘇省徐州市 221000

猜你喜歡
存儲
檔案管理中電子文件的存儲探究
條形碼技術(shù)在涂裝生產(chǎn)中的應(yīng)用
云計算與虛擬化
結(jié)構(gòu)化電子病歷的設(shè)計及應(yīng)用
淺敘國產(chǎn)存儲技術(shù)之發(fā)展
某醫(yī)院數(shù)據(jù)中心虛擬化的設(shè)計與實現(xiàn)
煙臺新型自動氣象站數(shù)據(jù)本地存儲的設(shè)計及實現(xiàn)
關(guān)于SQL語言及存儲過程
大型機電設(shè)備出口包裝防護
基于Hadoop的業(yè)務(wù)過程模型管理方法研究
主站蜘蛛池模板: av尤物免费在线观看| 就去吻亚洲精品国产欧美| 嫩草国产在线| 区国产精品搜索视频| 无码一区18禁| 老司机精品99在线播放| 国产精选小视频在线观看| 青草国产在线视频| 另类重口100页在线播放| 日本黄网在线观看| 亚洲第一页在线观看| 国产精品亚洲五月天高清| 亚洲一区二区三区香蕉| 无码免费视频| 国产原创第一页在线观看| 无码一区二区波多野结衣播放搜索| 免费在线a视频| 日韩a在线观看免费观看| 大陆精大陆国产国语精品1024| 久久久久青草线综合超碰| 亚洲成人77777| 亚洲日韩欧美在线观看| 这里只有精品国产| 色老二精品视频在线观看| 亚洲大学生视频在线播放| 制服丝袜一区二区三区在线| 99精品福利视频| h视频在线播放| 九月婷婷亚洲综合在线| 人妻无码中文字幕第一区| 色男人的天堂久久综合| 在线观看免费AV网| 全部无卡免费的毛片在线看| av午夜福利一片免费看| 偷拍久久网| 亚洲男人天堂久久| 制服丝袜亚洲| 亚洲va视频| 3344在线观看无码| 中文字幕乱码中文乱码51精品| 亚洲区视频在线观看| 真实国产精品vr专区| 免费国产不卡午夜福在线观看| 亚洲av成人无码网站在线观看| 日韩国产黄色网站| 欧美成人在线免费| 亚洲精品无码高潮喷水A| 永久在线精品免费视频观看| 亚洲精品你懂的| 91福利免费视频| 最新亚洲人成无码网站欣赏网| 亚洲第一网站男人都懂| 午夜免费小视频| 五月激激激综合网色播免费| 午夜老司机永久免费看片| 亚洲国产欧美目韩成人综合| 青青青视频免费一区二区| 国内精品视频在线| 日韩第九页| 欧美激情首页| 在线免费不卡视频| 在线观看精品自拍视频| AV不卡在线永久免费观看| 九色在线观看视频| 午夜人性色福利无码视频在线观看| 国产成人欧美| 18禁高潮出水呻吟娇喘蜜芽| 欧美日韩精品综合在线一区| 国产00高中生在线播放| 正在播放久久| 欧美国产日产一区二区| 国产激情无码一区二区APP | 777国产精品永久免费观看| 免费一级α片在线观看| 久久久久久久久久国产精品| 日本精品αv中文字幕| 综合色88| 亚洲男人的天堂久久香蕉网| 亚洲人成人伊人成综合网无码| 91丨九色丨首页在线播放| 久久成人18免费| 国产毛片基地|