
摘 要:檔案數(shù)字化是當(dāng)前乃至今后各級各類檔案館面臨的一項長期工作內(nèi)容和工作方向,是數(shù)字檔案館建設(shè)的基礎(chǔ)。本文以武漢大學(xué)為例,探討了檔案數(shù)字化服務(wù)外包的具體要求和標(biāo)準(zhǔn)。
關(guān)鍵詞:檔案 數(shù)字化 數(shù)字檔案館 服務(wù) 外包
中圖分類號 G270.7 文獻(xiàn)標(biāo)識碼 A 收稿日期 2019-05-28
★作者簡介:劉秋華,武漢大學(xué)檔案館技術(shù)室,碩士研究生,從事檔案信息化工作。
Abstract The digitization of archives is a long-term work content and work direction faced by archives at various levels at present and in the future, and it is the basis for the construction of digital archives. Taking Wuhan University as an example, this paper discusses the specific requirements and standards in the digital service outsourcing of archives.
Keyword archives; digitization; digital archives; service; outsourcing
館藏檔案數(shù)字化是一項長期的勞動密集型工作,除了需要大量經(jīng)費(fèi)支持外,還需要投入大量的人力、物力,因此很多檔案館都選擇采用檔案數(shù)字化服務(wù)外包,通過招標(biāo)方式,選擇合作的意向公司,將館藏檔案數(shù)字化整體打包給公司進(jìn)行全程的數(shù)字化處理。
檔案數(shù)字化主要包括檔案整理、數(shù)字化掃描及圖像處理、目錄錄入、原文掛接、數(shù)字化成果移交以及簽訂安全保密協(xié)議等相關(guān)環(huán)節(jié)。檔案館應(yīng)對所有工作環(huán)節(jié)提出明確的具體要求和量化標(biāo)準(zhǔn),確保檔案數(shù)字化服務(wù)外包項目的順利推進(jìn),保障數(shù)字化成果達(dá)到預(yù)設(shè)要求和標(biāo)準(zhǔn)。
一、檔案整理要求
1.調(diào)卷出庫,從庫房提取需要加工的檔案實(shí)體,逐卷清點(diǎn),并填寫調(diào)卷單,雙方責(zé)任人交接簽字。
2.對案卷進(jìn)行整理、分件、填寫及核對題名、編排頁碼,要求做到卷內(nèi)目錄、題名、頁碼清晰、準(zhǔn)確、完整,對卷內(nèi)目錄有更改或沒有卷內(nèi)目錄的檔案要求重新輸出卷內(nèi)目錄。
3.對裝訂物影響掃描工作進(jìn)行的檔案,先行拆除裝訂物,同時注意保護(hù)檔案不受損壞。
4.對于破損嚴(yán)重、無法直接進(jìn)行掃描的檔案,先行高清拍照及全手工修復(fù),再行數(shù)字化處理。
5.對于折皺不平影響掃描質(zhì)量的原件,先行壓平或熨平等后再行數(shù)字化處理。
6.掃描工作完成后,拆除過裝訂物的檔案要求重新裝訂,注意保持檔案實(shí)體的排列順序與卷內(nèi)目錄順序一致,做到完整、準(zhǔn)確、無遺漏。
7.歸還入庫,雙方責(zé)任人交接簽字。
8.在項目實(shí)施過程中,確保檔案實(shí)體的安全與完整,避免人為損害與遺失。
二、實(shí)體檔案錄入要求
1.遵循標(biāo)準(zhǔn)。國家檔案局《檔案著錄規(guī)則》(DA/T18-1999)、《民國檔案目錄中心數(shù)據(jù)采集標(biāo)準(zhǔn) 民國檔案著錄細(xì)則》(DA/T20.1-1999)、湖北省檔案局《湖北省文書檔案目錄數(shù)據(jù)庫結(jié)構(gòu)與著錄細(xì)則》(鄂檔〔2004〕46號)等。
2.著錄項要求。
(1)一般錄入要求。案卷級要求錄入檔號、全宗號、歸檔年度、分類號、案卷號、案卷題名、保管期限、密級、總件數(shù)、總頁數(shù)、立卷單位、起止日期、歸檔時間、備注等,卷內(nèi)目錄要求錄入檔號、全宗號、歸檔年度、分類號、案卷號、卷內(nèi)順序號、題名、文號、責(zé)任者、形成時間、保管期限、密級、載體類型、頁數(shù)、頁號、立卷單位、內(nèi)容摘要、備注、主題詞等著錄項,要求建立數(shù)據(jù)項完備、數(shù)據(jù)準(zhǔn)確的案卷級、文件級目錄數(shù)據(jù)庫。字段長度、格式要求及題名信息等應(yīng)符合檔案館現(xiàn)行檔案管理信息系統(tǒng)要求。
(2)細(xì)化錄入要求。對于校報、周刊要求輸入到每一條新聞標(biāo)題,一份報紙對應(yīng)一條電子目錄;《國立武漢大學(xué)一覽》、《畢業(yè)紀(jì)念冊》要求錄入到每一個文件標(biāo)題和每一張照片標(biāo)題;部分學(xué)籍檔案,比如高考招生錄取名冊、派遣名冊、檔案轉(zhuǎn)遞單、發(fā)證冊等,頁面上含多個人名的,要求錄到每個人名,一頁對應(yīng)一條電子目錄。
3.對數(shù)字化之前已經(jīng)建立的目錄數(shù)據(jù)庫進(jìn)行核對,發(fā)現(xiàn)錯漏以及不合規(guī)范要求的目錄數(shù)據(jù)進(jìn)行修訂、完善。
4.實(shí)體檔案案卷目錄、文件目錄要求與機(jī)讀目錄一一對應(yīng),準(zhǔn)確率達(dá)100%。
三、檔案具體掃描參數(shù)及要求
1.掃描模式及分辨率要求:要求采用平板高精掃描儀以及全彩色掃描模式,分辨率不低于300dpi,對于字跡偏小、文字密集、清晰度較差、當(dāng)前頁含照片或圖片的檔案等,分辨率提高至600dpi。對于含正規(guī)印刷體、OCR識別率高的檔案實(shí)體應(yīng)采用OCR識別技術(shù)(主要指校報、周刊、公文等),要求準(zhǔn)確率達(dá)到90%,掃描后提供雙層PDF文件。
對于薄透與字跡褪變檔案的數(shù)字化,要求使用相同大小白紙襯底,再行掃描;字跡褪變檔案掃描時,需要調(diào)整亮度、對比度等參數(shù),以掃描后形成的圖像中文字清晰為準(zhǔn)。遇有字跡完全褪色(只剩劃痕)或復(fù)寫紙字跡且發(fā)生浸染時,可掃描該頁檔案反面,再做鏡像文件。
2.文件存儲格式要求:TIFF、JPG、PDF。
3.命名規(guī)則,遵循《湖北省紙質(zhì)檔案數(shù)字化操作規(guī)程》,以“檔號+卷內(nèi)順序號”的形式命名。
4.掃描件與原件一一對應(yīng),無錯漏,圖片信息完整、無色差,數(shù)字化加工處理過程嚴(yán)格遵循國家檔案行業(yè)標(biāo)準(zhǔn)《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》、《湖北省紙質(zhì)檔案數(shù)字化操作規(guī)程》,對紙質(zhì)檔案掃描形成的圖像應(yīng)作質(zhì)量檢驗、糾偏、去污、去邊、拼接等處理,同時最大化地完整保留檔案原始幅面的內(nèi)容和大小,確保形成的圖像清晰、完整、不失真,不影響圖像的利用效果。
5.采用網(wǎng)絡(luò)版的數(shù)字化加工系統(tǒng),具備“隨機(jī)掃描抽檢”功能,能將掃描抽檢相關(guān)信息記載到系統(tǒng)中。
四、電子檔案文件的處理與掛接要求
1.對于經(jīng)OCR識別的單份紙質(zhì)檔案文件要求提供雙層PDF文件,并以該文件進(jìn)行掛接;照片檔案以JPG文件進(jìn)行掛接;其他紙質(zhì)檔案文件要求以多頁P(yáng)DF文件進(jìn)行掛接。
2.掛接的每一份電子檔案文件要求與原實(shí)體幅面大小相同,經(jīng)數(shù)字化處理后所含的內(nèi)部頁面版面也應(yīng)相同,圖像居中。
3.所有掛接的民國檔案(除正規(guī)出版物外)的電子檔案文件均應(yīng)作“武漢大學(xué)檔案館”數(shù)字水印處理后再行掛接,照片檔案可適當(dāng)降低分辨率至300dpi(原件需保留作永久備份之用),所有數(shù)字化形成的目錄數(shù)據(jù)與圖像數(shù)據(jù),經(jīng)過質(zhì)檢環(huán)節(jié)確認(rèn)為“合格”后,方可以在線方式掛接到數(shù)據(jù)服務(wù)器。
4.掛接處理好后的電子檔案文件,要求達(dá)到不需再次處理即達(dá)到激光打印機(jī)能清晰打印的程度。
五、檢查與驗收
檢查與驗收應(yīng)包括檔案整理與著錄、目錄數(shù)據(jù)、圖像數(shù)據(jù)及掛接等內(nèi)容。檢查方式按數(shù)據(jù)加工批次隨機(jī)抽檢,抽檢率不低于20%,要求合格率達(dá)100%。抽檢合格率不符合要求的,該批次檔案全部退回返工,直到達(dá)到驗收要求。
具體驗收及評判標(biāo)準(zhǔn)見下表:
六、數(shù)字化后電子檔案的移交與校驗
數(shù)字化服務(wù)外包項目完成后,要求公司以三種形式、三種規(guī)格提供三套完整的數(shù)字化電子檔案資源。
1.一套通過現(xiàn)行檔案管理信息系統(tǒng)實(shí)現(xiàn)全文掛接后的電子檔案,含“武漢大學(xué)檔案館”數(shù)字水印的在線文檔,要求準(zhǔn)確率達(dá)到100%,用于對外服務(wù)。
2.一套檔案級刻錄光盤,內(nèi)含兩套完整的電子檔案文件,一套以頁為單位形成的數(shù)字化加工處理好后的檔案原件掃描件(未作降低分辨率處理、未加數(shù)字水印);另一套是以件為單位形成的全部電子檔案文件(未加數(shù)字水印),作長久保存之用。
3.一套移交硬盤,所含內(nèi)容與本項第2條同,作長久保存之用。
七、現(xiàn)場管理及安全保密要求
1.公司資質(zhì)方面,要求數(shù)字化服務(wù)公司具有一定規(guī)模、管理制度健全、社會信譽(yù)好、經(jīng)驗豐富、具備專業(yè)的檔案數(shù)字化加工資質(zhì)和檔案安全保密資質(zhì),最好有從事民國檔案及相關(guān)檔案數(shù)字化服務(wù)外包經(jīng)歷(需提供相關(guān)的佐證材料)。
2.與公司簽訂安全保密協(xié)議,注明保密工作內(nèi)容、注意事項及違約責(zé)任。
3.所有進(jìn)場人員要求相對固定,分工明確,且技術(shù)嫻熟,有多年從事檔案數(shù)字化工作經(jīng)驗,項目進(jìn)行過程中不得隨意更換人員。其中負(fù)責(zé)檔案整理的人員要具備一定的檔案專業(yè)知識,熟悉檔案整理流程,有一定的民國檔案文字(繁體字和毛筆字)辨識功底。
4.要求制定科學(xué)規(guī)范的數(shù)字化加工流程,所有環(huán)節(jié)有專人負(fù)責(zé),責(zé)任到人。
5.加強(qiáng)現(xiàn)場管理,包括人員管理和場所管理,所有檔案數(shù)字化加工人員上崗前應(yīng)接受保密安全培訓(xùn),簽訂保密承諾書;加工現(xiàn)場安裝監(jiān)控設(shè)備,場外配備專門的儲物柜,用于工作人員存放私人物品。所有入場設(shè)備,必須進(jìn)行嚴(yán)格登記,項目進(jìn)行期間不得擅自帶入或帶離工作場所,項目完工驗收后在檔案館技術(shù)人員的監(jiān)督下對其存儲內(nèi)容進(jìn)行檢查并作相應(yīng)的銷毀處理。項目現(xiàn)場計算機(jī)除必要的網(wǎng)絡(luò)接口外,其他所有數(shù)據(jù)接口全部封閉,服務(wù)器設(shè)置密碼,由專人管理。項目現(xiàn)場只能搭建有線工作網(wǎng)絡(luò),不得搭建無線網(wǎng),工作網(wǎng)絡(luò)、所有使用設(shè)備均必須與互聯(lián)網(wǎng)物理隔離。
6.檔案館安排專人進(jìn)行不定期現(xiàn)場巡查,發(fā)現(xiàn)問題及時告知公司項目負(fù)責(zé)人,督促公司糾正解決。
7.嚴(yán)禁公司將數(shù)字化的檔案電子目錄信息及電子檔案文件提供給第三方。
參考文獻(xiàn)
[1]檔案著錄規(guī)則(DA/T18-1999)[R].
[2]紙質(zhì)檔案數(shù)字化規(guī)范(DA/T31-2017)[R].
[3]企業(yè)數(shù)字檔案館(室)建設(shè)指南.