李 云
(新鄉學院圖書館,河南 新鄉 453003)
據不完全統計,目前電子書的格式有近30種。比如 ,EXE、PDF、CHM、BRM、PDB、TXT、UMD、JAR 等 。在國外比較知名的電子書格式有索尼公司Reader的專有格式BBeb、亞馬遜公司Kindle的專有格式AZM、微軟公司的HLP格式、CHM格式和Adobe公司中的PDF格式等。雖然部分電子書可以兼容其他一些格式,但是通常都需要相關軟件的轉換。當然,國外也有諸如EPUB這樣的開放格式標準。EPUB格式由亞馬遜公司、Adobe公司、美國圖書館協會、蘭登書屋、索尼公司等聯合開發。然而,迄今為止,EPUB格式還未被業界完全接受。
在國內,電子書格式同樣呈現出“群雄割據”的狀態。比如,清華同方公司的CAJ格式、北大方正公司的CEB、XEB格式、華康公司的WDL格式、維普公司的VIP格式、超星公司的PDG格式、上海通力公司的ABM、BOK格式,以及國家圖書館的NLC格式等。此外,書生公司、博庫公司等也有自己的電子書格式。
電子書格式不統一帶來的問題是:其一,使用的不便利性。比如,如果讀者從網上購買了微軟公司MSReader格式的電子書,就需要同時下載并安裝相應的軟件。又比如在國內,超星公司的電子書只能用SSReader來閱讀。即使是同一家公司的電子書產品,也存在類似的問題。比如,方正公司電子書的格式是CEB,需要Apabireader軟件閱讀,方正自己生產的手持閱讀器也不能下載其本公司的電子書。其二,增加了閱讀成本。由于電子書格式不兼容,讀者在閱讀不同公司生產的電子書時,就需要購買不同的電子書閱讀器或者付費下載不同的軟件。其三,造成資源的浪費。格式不統一,使得電子書生產商每年都要投入資金用于其本身電子書格式的維護,出版社同樣要按照各個電子書生產商的電子書格式制作不同的電子書,這都提高了生產代價。其四,信息的傳播受阻。電子書格式的不兼容,制約了其內容的廣泛共享。其五,版權管理的弱化。由于沒有統一的格式標準,使得對電子書版權的監管形同虛設,這也是當前電子書存在嚴重侵權問題的原因之一。其六,不利于共贏發展。由于各個電子書生產商都堅持自己的電子書格式,使得各自的市場規模都難以得到拓展。比如,亞馬遜公司試圖將Kindle的專有格式AZM打造成行業標準,但是卻在很大程度上受到了EPUB格式的擠壓。其七,影響后續服務。比如,許多電子書的數據與圖書館的書目MARC格式不兼容,不利于圖書館對電子書服務工作的開展。
20世紀90年代,泛歐書業、美國出版商協會就在書刊電子貿易中推廣技術標準,比如EDI、ONIX等。進入21世紀,部分國家層面的標準得以頒布。比如,美國的《數據詞典——數字靜態圖像的技術元數據》、《數字對象標識結構》等。OEBF(Open eBook Forum)和 EBX (The Electronic Book Exchange)Working Group是目前國際上制定電子書標準的兩個主要組織。OEBF成立于1998年,又稱“開放電子書論壇”,目標是研發非專利性的電子書系統格式,OEBF系列標準規定了eBook的文件格式與結構,保證了電子書文檔可正確顯示在任何閱讀系統中。OEBF在1999年發布了基于HTML與XML的OEB1.0標準,該標準結合 XML1.0標準、HTML4.0標準、Dublin Core和USMARC描述語言與unicode字符集的一些標準,為閱讀器廠商、出版商、作者和用戶提供了初步的指南。2001年7月,OEBF發布了OEBF1.01標準,對舊版本中的模糊和錯誤的概念作了糾正。
2005年后,OEBF更名為 “國際數字出版論壇”(International Digital Publishing Forum,IDPF)。IDPF已經發布了三項標準,即開放容器格式1.0版(Open Container Format V1.0,OCFV1.0)、 開放出版物結構(Open Publication Structure,OPS)2.0 版和開放包裹格式(Open Packaging Format,OPF)2.0 版。這三項標準共稱為EPUB標準,其主要內容是:OPS2.0提供開放式電子書內容的標準,保障電子書跨平臺閱讀;OPF2.0提供描述電子書內容單元的標準,提供更多結構和語義來描述電子出版物,主要同元數據、文件清單、主線、指南與漫游組成,存放在OPS文件中;OCFV1.0將電子書所有相關的OPS文件、OPF文件按規范要求放入容器中,建成一個后綴名為.epub的壓縮文件。作為一個開放格式,EUBP具有良好的兼容性,可以自動對內容重新編排。同時,EUBP允許電子書生產商將其電子書格式轉換成其他格式,并支持數字版權管理(DRM)。目前,EPUB格式有了許多成功運用的案例。比如,亞馬遜公司的下屬子公司Lexcycle開發的閱讀軟件Stanza,Adobe公司發布的Adobe Digital Editions(ADE)等。除軟件外,國外支持 EPUB的閱讀器逐步增多。比如,艾利和公司的iriver story、巴諾公司的Nook、羅技公司的Plastic Logic等。
2002年,美國出版協會AAP(Association of American Publishers)頒布了“開放式電子圖書標準方案”(Open eBook standard project), 方案中強調了數字對象標識碼 (DIO)、ISBN以及從現有數字對象創建電子書的作用。此外,EBX Working Group在2000年7月發布了0.8版標準,提出了電子書從出版、發行、銷售到使用全過程中版權保護的技術方案。
在美國之外,其他許多國家同樣在推動電子書格式的標準化工作。比如在韓國,使用最多的電子書格式是Adobe公司的PDF格式。但是由于PDF格式一經制作就不能修改,不容易擴展,而且PDF是Adobe公司的專有格式,因此韓國將基于XML的EBKS(KSX6100)電子書格式確定為國家標準。該格式具有公開性、兼容性與可擴展性,能夠對文件進行結構調整。但是,該標準仍然是一個比較寬泛的格式規范,還不能完全解決電子書格式兼容的問題。
1998年起我國在國家質量技術監督局、全國信息技術標準化研究所等部門主持下開始了電子書標準的制定工作。2001年9月,北京大學計算機技術研究所與方正公司聯合承擔了國家“863”計劃“多媒體數據的版權保護技術”課題研究。2002年,《開放式電子圖書出版物結構》(GB/Z 18906-2002)、《電子圖書閱讀器通用規范》(GB/T 18787-2002)得以頒布?!堕_放式電子圖書出版物結構》對電子圖書的內容進行了描述,用于確保各種格式的電子書可以在不同電子書平臺上讀取?!峨娮訄D書閱讀器通用規范》規定了電子閱讀器的技術要求、試驗方法、檢驗規則等,適用于各種類型的電子閱讀器和便攜式閱讀設備。然而,目前這些標準已經不能適應電子書發展的需要。
2005年5月,電子書產業系統認證標準 “NKWOLF”頒布。2007年底新聞出版總署啟動了《數字資源唯一標識符(DOI)預研》項目。同年,信息產業部對《非結構化操作置標語言》(UOML)項目立項,該標準建立了一個抽象出版物格式模型,使數字內容的存儲不受格式的影響。2008年10月,該標準成為國際產業聯盟組織(OASIS)的官方標準,并于2009年得到國際標準化組織(ISO)的立項。
2010年3月5日,全國信息技術標準化委員會發布通知,成立“電子書標準工作組”,重點推動相關基礎標準以及內容質量、版式規范、管理服務、版權保護等方面的標準制定工作。隨后,電子書標準的基礎組、設備組、格式組、平臺組、電子課本組等專業領域的工作小組得以成立。2010年12月13日,國家標準化管理委員會正式下達國家標準化公益科研項目《電子書標準體系研究》和電子書設備規范、格式規范、標識、元數據等四項國家標準制、修訂項目。據悉,我國電子書項目的核心標準,將在一年之內完成。
我國電子書格式標準正在努力向國際先進標準靠攏。比如,方正Apabi的CEBX格式就是以OEBF格式標準為依據,能夠保留原文件的字符、字體、版式與色彩等信息,比PDF格式具有更強的數據交換與解析能力。又比如,國內著名的電子書網站掌上書苑以EPUB格式為基礎,推出了EPUB Reader閱讀軟件。在硬件方面,支持EPUB格式的閱讀器有翰林公司的eReader、聯想公司的天璣iBook等。
電子書格式標準化是電子書產業發展的現實要求。鑒于出版商參與電子書出版的熱情不高,而電子書生產商又力求將自己的封閉的格式標準轉化為行業標準,甚至是國家標準的狀況,我國電子書格式標準化建設應采取政府引導,電子書產業鏈上各主體為主導的推進模式。一方面發揮政府在電子書標準建設中的組織能力、控制功能、權威發布的作用,另一方面發揮產業鏈上各主體在資金、技術等方面的優勢。特別是對電子書產業鏈中各主體的地位不可忽視,因為這些主體既是標準的執行者,又是標準的體驗者,他們的意見不僅來自于對國際先進做法的準確把握,還來源于腳踏實地的實踐經驗。
電子書格式標準化建設要處理好引進和自力更生的關系。一方面,在電子書發展中應積極引進、借鑒、消化國際標準,力求同國際標準接軌。但是,參與國際標準化首先是有門檻的,加入相關組織需要交納不菲的會員費和專利費,我國大多數生產商未必能承擔得起。其次,國外的技術與標準未必能完全滿足我國中文電子書出版的需求,中文電子書無論從信息符號、編排規范,還是從流通渠道、讀者的閱讀習慣等方面,跟國外電子書都很不一樣。因此,要協調好引進和自建的關系,立足國內,放眼國際,創建出既有國際競爭力,又適合國情的電子書標準。
統一電子書格式標準要注重協調各方面的利益關系。比如,清華同方公司就認為,如果建立一套新的電子書標準,將意味著其在電子書格式開發上的巨額投資無法收回,而且將面臨新的投資。又比如,方正Apabi依靠自己強大的技術力量研發了較為完整的電子書格式標準,也不愿放棄這些已有的成果。標準是整條產業鏈的問題,標準是產業鏈條上各方主體利益協調與平衡的結果。任何電子書生產商試圖壟斷格式標準或者阻礙標準統一的做法都不僅損害產業鏈上其他主體的利益,而且最終會損害自身的利益。2003年,曾與微軟、Adobe并稱“電子書三巨頭”的Gemstar公司,終因受其電子書格式封閉之累,黯然退出市場。對照之下,我國遼寧出版集團的“掌上書苑”采用國際通用的OEB標準,能閱讀XML、HTML、TXT等多種格式的電子書,從而把握住了發展的空間。可以講,標準化建設的核心問題是在如何選擇適宜的路徑來達到格式兼容這個目的的過程中協調與平衡各主體的利益關系。
還應該認識到,電子書格式的標準化、統一化不是唯一化,標準化、統一化的目的是兼容化。不同的電子書格式有其不同的特點與功能,帶來不同的閱讀體驗,強求使用某種,或者某幾種格式標準是不符合實際的。比如,PDF格式頁面美觀、圖像清晰,而EXE、TXT、HTM格式則制作簡單,對閱讀軟件要求不高,適合于自助閱讀與手機閱讀,另外有許多電子書格式更適合于公式、圖表、多媒體文件的處理。所以,標準化的著眼點是格式之間的兼容,或者提供易于不同格式轉換的平臺,使讀者通過不同生產商的電子閱讀器或軟件可以閱讀多種格式的電子書。
[1]臧國全.網絡出版的有關標準研究[J].圖書情報工作,2003(1):105-110.
[2]路云強.呼喚我國電子圖書統一標準[J].科技文獻管理,2009(4):35-42.
[3]鄭瀅瑜,叢挺,繆婕.電子書格式標準研究[J].出版科學,2010(4):90-93.
[4]張書卿.數字出版物格式標準化之路有多長[J].出版參考,2008(9):11.
[5]張海濤,趙準勝.電子圖書的發展趨勢[J].情報科學,2001(11):1220-1222.