陸靜
Word有一個保存對話框,里面包含了一大堆類型各異的文檔擴展名。然而很多時候,我們對于這個面板都是一覽而過,并沒有好好看過它。那么問題來了,這些擴展名到底都代表什么意思?

1. Word文檔
特點:體積小、易修復、支持Word高級功能
后綴:.docx
這是日常接觸最多的一種文檔格式,其實也是Word的默認格式。這種文件的擴展名是.docx,是Office 2007以后版本新增加的一個格式。優點很多。首先.docx相比之前的.doc在壓縮比上更高,同樣一份文件保存成.docx后,體積會明顯減小。其次.docx增加了冗余字段,這樣當文檔遭遇破壞時,可以更容易被修復。此外新版Office的一些特性,比如SmartART、圖片樣式等也要比.doc強大很多,更美觀也更加易用。另外如果將文檔的擴展名修改為.zip,還可以像打開文件夾一樣直接提取到文檔里的圖片,這些都是.doc不具備的。
2.啟用宏的Word文檔
特點:通過編程實現傳統Word不具備的功能
后綴:.docm
和上一種格式相比,二者最大的區別就在于“宏”。“宏”是什么?簡單理解是一種編程代碼,通過嵌入到當前文檔中,即可讓該文檔擁有其他文檔無法擁有的功能。舉個例子,從網上下載了一本小說,然而粘貼到Word中發現斷行斷字非常嚴重,這時就可以編寫一小段代碼讓Word自動整理。而像這種帶有編程代碼的文檔,就叫宏文檔。而實現這一功能的編程語言,其實就是大名鼎鼎的VBA。
3. Word 97- 2003文檔
特點:體積大、缺乏修復冗余功能、兼容性佳
后綴:.doc
也許怕直接寫出擴展名大家看不懂,總之微軟在這里費了半天口舌,其實它就是我們剛剛所說的.doc格式。在Office 2007誕生以前,所有的Word文檔都是采用這種格式。雖然以今天的眼光來看,.doc有著體積龐大、沒有冗余和不支持媒體提取等弊端,但由于Office的低版不支持高版原則(即低版本Office無法打開高版本.docx文件),有些特殊環境我們還是需要將文檔保存為.doc格式。
4. Word模板、Word 97-2003模板
特點:適合建立規范化公文
后綴:.dotx/.dot
Word模板和Word 97-2003模板是同一個東西,均為模板文件,其中Word模板的擴展名是.dotx,對應于Office 2017及以后版本,Word 97-2003模板的擴展名是.dot,對應于Office 2003及以前版本。換句話說,和.docx與.doc一樣,同樣也是新老版本的區別。
那么什么又是“模板文件”呢?簡單來說,如果公司對于文檔格式有著專門要求(比如頁眉添加Logo,頁腳標注頁碼,標題4號字,正文5號字……),那么就可以提前做出一套文件,然后保存為.dotx。今后再建立新文件時,只要選擇這個模板就可以了。而且它的一大優點是,即便用戶執行保存命令,也不會影響模板里的內容。
5.啟用宏的Word模板
特點:可以包括特殊功能的Word模板
后綴:.dotm
和宏文檔一樣,啟用宏的Word模板也是通過編程實現一些特殊功能,只不過這一次是作用于模板而不是文件,很簡單。
6. PDF
特點:跨平臺、防篡改
后綴:.pdf
無論是.doc還是更先進的.docx都解決不了惡意篡改問題。當然你可以通過密碼或文檔權限解決這個問題,但.doc非開源限制又讓文檔的使用范圍大大縮小。這里就不得不提到,另一種特殊的文檔格式———PDF了。簡單來說,PDF有2個優勢:不易篡改和跨平臺使用。
PDF類似于圖片但又不是圖片,打開PDF后會發現每一個文字都能選擇卻無法編輯,事實上這種情況在商務應用中會有很大優勢,很多重要的標書、合同、報價函等都會轉成PDF傳遞,看中的正是PDF文件的不可篡改性。
此外PDF文件也能在不同平臺間無差別打開,無論是Windows,MacOS,Android,iOS,都可以展現出文檔的原始相貌,不必擔心字體、字號和排版等問題。甚至這一特性還被一些設計師采用,通過將一些設計好的海報模板轉換成Word格式,發送給普通用戶修改,之后再另存為PDF格式,就能直接拿到打印店印刷了,清晰度絲毫不比PS差。
7. XPS文檔
特點:微軟的跨平臺作品,在與PDF的競爭中已落敗
后綴:.xps
相比PDF,XPS的知名度就低多了,其實它是微軟為了競爭PDF所開發的一種文檔格式。和PDF一樣,XPS也擁有跨平臺、不易篡改、容易讀取(比如IE就可以直接打開)等優勢,且由于是微軟提出,因此在某些功能上與Office組件結合更加緊密(比如在Office中設置了IRM訪問權限,轉換為XPS后依舊保留)。
然而盡管有著這樣或那樣的優勢,但XPS已經是一款失敗的文檔格式,現實中使用這種格式的場景極少,不建議大家采用。
8.單個文件網頁、網頁、篩選過的網頁
特點:HTML格式,適合網絡發布
后綴:.mht/.htm/.htm
有時我們會將一些資料發布到網上,這就需要將文檔保存為網頁格式了。Word提供了3種不同的網頁文件格式:單個文件網頁、網頁和篩選過的網頁。
單個文件網頁:只生成一個文件(擴展名為.mht),圖片、CSS和HTML會全部放入這個MHT文件中。整個過程有點像PPT里內嵌字體,最終生成的MHT體積很大,但省去了煩心的相對路徑與絕對路徑問題。
網頁:生成一個HTML文件和一個媒體文件夾,好處是方便用戶快速展開里面的圖片,而且HTML的兼容性也是最棒的,不過二者需要同時移動。
篩選過的網頁:生成結果類似于網頁,同樣也是一個HTML文件和一個媒體文件夾。它的不同之處在于會刪除Word里一些不相關標志,而通過CSS控制網頁。
9. RTF格式
特點:跨平臺文檔格式,支持編輯
后綴:.rtf
RTF也是一種跨平臺文檔格式,和.doc這種封閉格式不同,RTF可以在很多平臺甚至寫字板中輕松打開。與PDF和XPS不同,RTF是允許用戶進行相關編輯的,而且也會把文檔中一些格式保存下來。換句話說,它其實是融合了PDF與TXT的各自優點,而且比XPS更通行。不過RTF不支持很復雜的格式,一些不被支持的格式會在保存時被丟棄,所以更傾向于內容方面的傳遞。
10.純文本
特點:最通行的文本格式,體積小、不會中毒
后綴:.txt
“純文本”其實就是TXT了,這是一種非常通行的文本格式,早在DOS時代就已經有了它的身影。TXT一般用于保存文本信息,比如文件資料、備忘錄和小說等,很多地方都能看到TXT的身影。由于它的高通用性,幾乎可以被任何軟件所讀取(如瀏覽器、程序和APP),完全不必擔心閱讀器的問題,要比PDF,XPS等方便很多。此外TXT還擁有體積小、不會中毒等特性,唯一的問題就是無法保存格式。
11. Word XML,Word 2003 XML,strict open xml
特點:主要用于程序間數據交換
后綴:.xml/.docx
XML是一種通用化標記語言,它的簡單易行讓其幾乎成為數據交換的唯一公共語言,很多編程語言都能直接讀寫XML文件。比如讀取一份文檔資料,傳統的.doc或.docx由于規則封閉,一般的編程語言是無法讀取的,而轉換成XML則可以解決這個麻煩。
XML與我們熟知的HTML淵源很深,但二者并非1.0與2.0的關系。HTML語法松散主要用于網頁編輯,XML語法嚴謹更側重數據格式化存儲。至于Word保存菜單里的“Word XML文檔”和“Word 2003 XML文檔”,同樣也是Office版本的差異。
12. Opendocument文本
特點:跨平臺免費文檔格式
后綴:.odt
ODT是由OpenOffice軟件生成的一種電子文件格式,由于OpenOffice的自由軟件身份,使得它在Windows,Linux,MacOSX,Solaris等操作系統中都有很多擁簇。和PDF一樣,ODT也支持格式排版,能夠在不同平臺間提供近乎一致的顯示效果。不過和RTF一樣,它也是允許用戶編輯的,這一點是它和PDF的最大不同。
作為一款辦公軟件,Office體量之龐大從這篇文章便可見一斑。除了要兼顧自身功能外,還要同時滿足不同環境、不同用戶的信息交換需求。