摘要:二維條碼是一種高密度、高信息含量、價廉可靠的計算機可以直接識別的便攜式數據文件。本文提出將電子文件的內容及元數據存儲在二維條碼中,附著在紙質文件上,形成紙質電子文件,這樣在電子文件從產生到永久保存的整個生命周期中的各個階段都可以通過解碼設備掃描條碼,讀取條碼中的信息并將信息保存到本地。可有效解決歸檔、移交環節中信息的重復錄入,避免多次錄入中的信息差錯,實現電子檔案的長期保存、信息共享,提高檔案管理水平。本文的研究結果證明將二維條碼技術應用到檔案管理當中是可行的,必將對檔案管理的現代化、標準化以及提高效率產生積極的影響。
關鍵詞:二維條碼;電子檔案;檔案管理
1 背景
1.1 二維條碼相關概念
二維條碼:區別于傳統的一維條碼,二維條碼是在二維方向上表示信息的條碼符號,因此其存儲容量比傳統的一維條碼有了飛躍性的提高,數千個字符能夠被存儲到一個郵戳大小的條碼符號中,是一種簡潔而廉價的信息存儲方式。
1.2 二維條碼技術在檔案管理中的實現模型
在檔案管理中引入二維條碼,實質是將紙質文件、元數據、電子文件封裝在一起。步驟如下:
一、將電子文件及其元數據信息存儲在二維條碼中;
二、將二維條碼打印在電子文件對應的紙質文件上,形成電子文件、元數據、紙質文件封裝在一起的紙質電子檔案;
三、通過掃描設備掃描紙質檔案上的二維條碼;
四、對掃描得到的二維條碼進行解碼,還原出對應的電子文件及其元數據。
由于檔案管理涉及的單位、軟件系統眾多,在生成二維條碼之前,電子文件應轉換為可長期存取的統一格式,而元數據也應遵循統一的標準,以利于在檔案管理各階段各用戶的使用。
由于二維條碼一經生成,不可更改,而元數據在文件流轉過程中不斷增加、變更,所以紙質電子文件在流轉到新部門時,使用者(包括檔案室工作人員、檔案館工作人員)應根據元數據的不同,將變更、增加的元數據轉換為二維條碼,附加打印在紙質文件上。
1.3 檔案管理中引入二維條碼技術的意義
二維條碼作為信息的另一種表示形式,是不依賴計算機網絡和數據庫存儲、轉移信息的一種方法,是實現文件、檔案等信息的存儲、攜帶、傳遞并識讀的理想手段。將之引入檔案管理中,可較好地解決當前檔案管理中出現的問題。
1.3.1 采用二維條碼技術可解決電子檔案易更改的問題
將電子檔案轉化為二維條碼,再打印到紙張上,形成紙質電子檔案,則可封存電子文件形成的原始狀態信息,二維條碼一經生成,不可改動,可解決電子檔案易更改的問題,是電子文件真實性保障的重要工具。
二維條碼因為是直接對原文二進制或ASCII碼進行編/解碼,所以支持任何語言和文字。而且在電子化的過程中不會丟失任何信息。
1.3.2 采用二維條碼使電子檔案可長期保存
采用二維條碼技術,將電子檔案固化在紙質介質上,相當于電子檔案的載體與紙質檔案相同,可長期保存。紙質電子檔案攜帶方便,不怕折疊,保存時間長,又可復印傳真,做更多備份[2]。二維條碼有錯誤修復能力,即使載體保存不善,印刷的文字、條碼已有污損,只要破損面積不超過整個條碼符號的50%也可照常恢復數據。
1.3.3 采用二維條碼技術可實現紙質檔案與電子檔案的同步管理將二維條碼引入檔案管理,形成紙質電子檔案的技術,方便檔案人員對紙質檔案和電子檔案的統一管理。檔案部門對紙質檔案的管理歷史悠久,有許多行之有效的方法,電子檔案丟失的可能性就小多了。二維條碼相當于在電子檔案管理系統與紙質檔案管理系統之間建立通道,使人們可以容易地從一種檔案找到相同內容的另一種檔案,方便利用。
1.3.4 采用二維條碼系統可提升檔案信息錄入的質量與效率
在辦公系統中加入二維條碼生成控件,將文件的著錄信息生成標準的二維條碼,在檔案部門只需要掃描設備就可將電子文件信息識別出來,不需鋪設網絡、不需考慮軟件對接,對公文系統影響最小,容易實現,而且二維條碼一次生成,可多次使用,可以保證著錄信息的準確,減少重復勞動。
1.4 本文選擇PDF417碼
二維條碼有許多不同的編碼方法,本文決定采用PDF417碼作為檔案管理二維條碼技術應用軟件的碼制。主要原因是在公文系統中公文系統已使用PDF417碼。而許多機關也已購置了二維條碼掃描設備。為節約硬件、軟件投入,與公文系統保持一致,檔案部門也采用PDF417碼是合理的選擇。
1.5 二維條碼只適合以件為整理單位的文書檔案
PDF417碼存儲空間雖然比一維條碼大得多,但也有限,只有1K左右,而且存儲的信息越多,尺寸越大,不利于識讀器識別。所以二維條碼只適合以件為整理單位的文書檔案,其信息較少,有可能存儲在二維條碼中。
1.5.1 以頁為單位存儲
電子文件以頁為單位,將每一頁的內容存儲在二維條碼中,附著在每一頁紙質文件上。這樣不但可以降低文件大小,而且有利于使用者只選擇需要的頁進行掃描利用。
1.5.2 可采用宏PDF417碼
宏PDF417碼是一種變形的PDF417碼制形式,當文件內容太長,無法用一個PDF417碼表示時,可用包含多個(1—99999個)條形碼分塊的宏PDF417碼來表示。
2 研究內容
本文重點研究三個問題:根據二維條碼特點,選擇電子檔案應轉換為何種格式,制定《電子文件元數據二維條碼使用標準》,考慮文件形成部門、檔案館、檔案利用者的實際需求,設計二維條碼檔案管理軟件的功能。
2.1 電子檔案長期存取格式選擇
二維條碼一經產生,就不可更改,所以在生成前,先需將電子文件轉換為可長期存取的文件格式。本文選擇PDF文件格式。
2.2 制定《電子文件元數據二維條碼使用標準》
采用二維條碼作為電子檔案存儲與共享的載體,就必須對電子檔案數據進行標準化。檔案管理涉及的系統眾多,二維條碼起著在各系統間進行有效的數據交換的作用。只有實現數據的標準化,才能真正實現信息共享和業務協同,電子檔案數據標準化已成為檔案管理中應用二維條碼的關鍵環節。在制定元數據標準時,應與已有的相應的國家標準保持一致。本標準直接使用《電子文件管理細則第一部分:文書電子文件元數據方案》,兼容文書部門所使用的《機關公文二維條碼使用標準》。
制定標準時,需要在通用與易用間取得平衡。二維條碼容量有其限制,所以存儲的元數據應盡可能簡練。從目前已經制定的國家標準中選取通用性、基礎性和共性的數據元素,作為本標準數據元素的主要內容。
本文設定電子檔案已經轉換為PDF格式了,可將電子簽名、文檔創建環境等無用數據元素去除。
將本標準的版本號暫定為“GB0626-2008”,幾按此標準生成的二維條碼,存儲的數據的前十一位必須是“GB0626-2008”。這樣在讀取數據時,就可按此規范轉換數據了。
本標準采取動態存儲方式,以…”作為數據元素的分隔符,以^|”作為條碼內容的結束符。這與《機關公文二維條碼使用標準》一致。
本標準在數據框架結構上借鑒了國家標準《GB/T20163-2006中國檔案機讀目錄格式》,把一條記錄劃分為四個區:記錄頭標、記錄目次區、數據字段區、記錄分隔符。
數據樣例如下:
GB0626-20080010004000000050004000064006000400009^文件^2008^永久^|
其中,前11個字節“GB0626-200}”是記錄頭標,表明遵循《電子文件元數據二維條碼使用標準》。從第12個字節到第一個“^”之間是記錄目次區,每12個字節是一個目次項。
001 0004 00000,005 0004 00006,006 0004000ll
00 1 0004 00000表示是編號為001的數據元素,數據長度為4,起始地址從“0”開始,起始地址就是第一個…”后。005 0004 00006表示是編號為005的數據元素,數據長度為4,起始地址從“6”開始;006 0004 00011表示是編號為001的數據元素,數據長度為4,起始地址從“11”開始。

采用這樣的結構,變固定的字段長度為變長,變固定的字段數量為可變的數量,變固定的記錄長度為不定長的記錄長度,實際著錄是多長字節就是多長字節而不會造成存儲空間的浪費,這對于存儲空間有限的二維條碼尤其有利。而采用關系型數據庫格式、XML格式、HTMU格式、文本格式等時,部有多余字符。
2.3 建立基于二維條碼的檔案管理系統
研究二維條碼的應用技術也就是幫助用戶解決如何建立基于二維條碼的應用系統、怎樣將二維條碼技術整合進現有應用系統之中等問題。目前二維條碼生成識讀技術已經相當成熟,在文書、檔案管理系統中實施二維條碼應用關鍵點在于如何與原有的系統結合。
2.3.1 二維條碼測試平臺
二維條碼測試平臺的功能是:測試軟件開發商開發的各二維條碼檔案管理軟件及硬件設施是否符合國家標準。只有通過檔案部門網站上的測試,各檔案管理軟件、硬件設施才可以投入市場。該平臺的使用者是檔案部門,以保證軟件符合國家標準,數據統一規范。
2.3.2 文檔一體化系統相關環節功能設計。
2.3.2.1 生成正式文件
使用二維條碼的生成技術,將文件轉換為PDF格式并與著錄信息一起轉換為二維條碼,再加入到電子文件的棚應位置,最終生成正式的帶有二維條碼的紙質文件。為保證著錄信息的準確完整、文件信息的長期可讀,應將以上流程設計到辦公自動化系統中,由系統給形成者提要求,不完成此工作,無法進入下一個流程。
2.3.2.2 收文登記
利用二維條碼的識讀技術,自動采集電子文件及其著錄信息,減少重復勞動,提高效率與質量,是原收文登記的“改良”,在管理上實現電子文件將與紙質文件的合拍與一致。如果收到的紙質文件上的:維條碼是遵循《機關公文二維條碼使用標準》,也應該能識讀。但《機關公文二維條碼使用標準》數據項不全,應按照《標準》補充著錄。
2.3.2.3 歸檔
檔案室在將文件整理、裝盒之后,確定了盒號、件號、類別之后,按《標準》補充著錄相關元數據信息,將檔案室所著錄的元數據轉換成二維條碼,打印在標簽上,粘在文件上。如歸檔的文件是從外單位來的,無二維條碼,無電子文件,應進行數字化,將數字化的信息及元數據轉換為二維條碼,粘貼于文件上。
2.3.2.4 移交入館
檔案館在接收檔案時,如果是有二維條碼的紙質文件,對二維條碼掃描,還原為電子文件進入原文數據庫,還原為元數據進入目錄數據庫。將檔案進行整理(查重、重新定盒號),上架,在檔案入庫房確定上架位置后,再按《標準》補充著錄元數據,打印:維條碼,以保證二維條碼的內容足夠完整,方便以后利用管理。
3 總結
由于二維條碼具有成本低、信息可隨載體移動、不依賴于數據庫和計算機網絡等優點,非常適合我國檔案管理部門數據來源復雜、底子薄、計算機網絡投資難度較大的特點,可以預見它將在文檔一體化領域有著極為廣闊的應用前景和巨大的市場空間。
參考文獻:
[1]張偉,文字圖表等一般載體上的信息電子化的方法及其系統[P]中國發明專利,CNl3965382003-02-12。
[2]二維條碼的應用[DB/OL],[2005-28-27],http://wwwenpot,com.cn/zhishi/barcodeC01,htm。
[3]政府行業文印中心“二維條碼制作”解決方案政府工作報告政府工作報告[DB/OL][2008-02-09】http://www founder,com cn/Solution/2008-01/19/content-5483,htm。