999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

古籍文獻數字化加工系統硬件解決方案

2017-04-19 17:52:41陳英敏
卷宗 2016年12期
關鍵詞:系統

摘 要:古籍數字化與古籍整理、文獻保護、文化傳承緊密相關。文章從古籍數字化的概念與意義談起,詳細介紹了古籍數字化的加工流程,并從系統硬件配置入手,完整地設計并實現了一種通用古籍文獻數字化系統的構建。

關鍵詞:古籍數字化;系統設計

1 古籍文獻數字化的概念與意義

古籍在各類文獻中獨具特色。以國家圖書館為例,其古籍文獻資源數量龐大,種類齊全,既包括甲骨、金石、簡帛、輿圖、善本等珍貴特藏,也包括圖書、期刊、報紙、縮微文獻等傳統普通古籍文獻類型。無論線裝古籍,還是碑帖拓本、古地圖,所有古籍文獻資源都蘊含著獨特的文獻價值、藝術價值,彰顯著古老文明的魅力。據文化部統計,全國公共圖書館系統收藏古籍2717.5萬冊件,其中善本229.5萬冊件[1]。如此豐富的古籍資源,為古籍數字化建設提供了可供開采的豐富寶藏,成為數字圖書館資源建設不可缺少的重要內容。

古籍數字化就是從利用和保護古籍的目的出發,采用計算機技術,將常見的語言文字或圖形符號轉化為能被計算機識別的數字符號,從而制成古籍文獻書目數據庫和古籍全文數據庫,用以揭示古籍文獻信息資源的一項系統工作[2]。

古籍文獻數字化可以降低原件丟失和損失的風險。古老的文獻、照片都可以轉換成數字化文獻,避免讀者直接使用原件,以減少或避免原件損失的機率,同時也可以擴大原始文獻的利用范圍。古籍文獻數字化后,可以產生較原件可靠而功能性更強的數字資源,這將有利于開展古籍文獻研究,從而擴大研究范圍。例如:對手稿字跡的鑒別,對圖畫、照片的放大瀏覽等等。古籍數字化是數字圖書館資源建設的重要組成部分,數字圖書館推廣工程將在全國范圍內依托圖書館館藏優勢,建成內容豐富、類型多樣的公共文化資源庫群。

2 古籍文獻數字化加工系統工作流程

古籍文獻數字化加工系統的工作流程一般可大致分為六個部分:文獻整理、圖像掃描、圖像處理與質檢、文字識別與質檢、數據標引與質檢、數據整理。其中,“文字識別與質檢”根據加工需求為可選流程。圖1為古籍文獻數字化加工系統工作流程,各類古籍文獻依據類型的差異在數字化細節上會有所不同。

根據古籍文獻數字化加工系統工作流程圖可以得出,完成古籍文獻加工的單條流水線主要包含以下幾個環節:

(1)文獻整理:待加工的文獻存放在專門的資料管理室,由相關人員統一上架登記,保護文獻安全;需借出做加工和歸還的文獻需要登記入冊,統計書目信息和文獻數量;

(2)圖像掃描:按照加工要求對古籍文獻進行掃描,對掃描圖像進行命名、旋轉等;

(3)圖像處理:應用專用圖像整理工具,自動檢查整理圖像的DPI與圖像模式,主要包括批量進行傾斜校對,調整傾斜度、統一畫布尺寸、調整dpi、去除黑邊等操作、糾正文件名命名、建立圖像索引等,處理完成后導入數字化加工管理系統進行數據自動分發與流轉,系統會在流水線上自動派發任務;

(4)OCR識別:應用專業OCR識別軟件依照文獻數字化加工要求進行全文或特定的文字識別;

(5)OCR數據質檢:完成字體切分、校對,從而做到一字一框,精確對位,同時進行聚類校對,將一批次中所有同一個字的字形聚集到一起,選出與標準字庫不一樣的那一個進行標紅,為下一步錯字修改做準備;完成錯字修改,操作員通過管理客戶端可以實時讀取到上一步的校對結果,并進行錯誤修改,修改完的字體會有高級人員校對;如遇操作員識別不了的字體,也可留給高級人員糾正。

(6)版式還原:包括原有版式編輯還原、XML排版、PDF排版、調整字體、字號、字間距、標題格式等內容;

(7)成品全檢:根據文獻數字化加工項目的特點,應用成品檢查工具,對每批完成數據進行成品檢查。對出錯的部分,按照誰做誰修改的原則,由管理系統返回給操作員進行修改。

3 古籍文獻數字化加工系統設計

參照古籍文獻數字化系統工作的一般流程,可以將加工系統設計為包含軟硬件運行平臺、數字化專用采集和輸出設備、數字化加工管理軟件等幾大部分。整個古籍文獻數字化加工系統硬件架構中將包含服務器、存儲設備、加工工作站(終端PC機)、各類型掃描儀及網絡集成等。

3.1 古籍文獻數字化加工系統拓撲結構圖

3.2 古籍文獻數字化加工系統軟件

古籍文獻數字化加工系統軟件可分為數字化加工管理系統軟件和文獻數字化生產系統軟件兩大部分。軟件系統部署在服務器端和工位的PC機端。目前市面上成品數字化管理及生產系統軟件很多也比較成熟,可以依據古籍文獻數字化的具體要求直接采購使用。

3.3 古籍文獻數字化加工系統服務器設計

古籍文獻數字化加工系統服務器可設計為數據庫及管理服務器2臺,互做雙機熱備,部署數據庫、中間件、文獻數字化生產系統和數字化加工管理系統。其中一臺兼做數據封裝服務器和數據自動處理服務器,另外一臺兼做元數據控制服務器和FTP服務器。由于有頻繁的數據處理,因此這2臺服務器建議為大內存和多CPU。文獻數字化加工系統服務器2臺,參考配置如下:

☆4路PC服務器,配4顆Intel8核CPU。

☆內存至少為128GB,硬盤至少配2塊1TB SAS 高速盤,做RAID1

☆至少配2個千兆網口,1個萬兆光口

☆配DVD,冗余電源和風扇。

3.4 古籍文獻數字化加工系統存儲設計

采用IP-SAN磁盤陣列作為加工系統存儲。目前各家IP-SAN廠商已研發出自己的卷共享軟件并能免費提供,并且其iSCSI口已支持到萬兆(10G)。iSCSI技術是一種新儲存技術,該技術是將現有SCSI接口與以太網絡(Ethernet)技術結合,使服務器通過網絡交換機可與IP-SAN儲存進行數據交換。文獻數字化加工過程中,由于有多路的請求對存儲數據進行大量頻繁的數據讀寫,存儲控制器的緩存大小對響應性能尤為重要,因此要求存儲系統至少需要128G緩存,且具備一定的擴展能力。存儲系統IP-SAN的具體要求如下:

☆雙控制器,緩存為128G,有至少一倍以上的擴展能力;

☆提供至少8個iSCSC 10G接口;

☆一定容量的SAS高速硬盤用于數據庫區和數據頻繁交換區;

☆一定容量的SAS 低速硬盤用于掃描和加工數據的保存;

☆免費提供原廠的卷共享軟件和管理軟件。

3.5 古籍文獻數字化加工系統網絡設計

根據以上硬件系統設計,加工系統網絡交換設備應滿足2臺配有萬兆光口的服務器連接,8個iSCSI口IP-SAN連接,同時提供相應數量的千兆網絡端口,能滿足古籍文獻加工區工位PC終端網絡接口的連接需求。

3.6 古籍文獻數字化加工系統PC終端設計

依據古籍文獻數字化年加工量要求,可相應配置加工系統終端PC機數量,具體配置如下:

☆CPU:Intel I5,內存8G,硬盤1TB

☆2個千兆網口,配DVDRW

☆19寸液晶顯示器、鍵盤、鼠標

☆預裝Windows7 32bit操作系統軟件。

3.7 古籍文獻數字化加工系統掃描儀設計

古籍文獻數字化加工系統中服務器、存儲、終端PC和網絡集成這些硬件部分是通用的,主要的差異化來源于數字化加工的古籍文獻類型所帶來的區別。古籍文獻資源種類繁多,具有尺寸大小不一、載體材質各不相同等諸多特點,這就要求古籍數字化加工系統要依據古籍文獻的資源類型,采用不同的前端掃描輸入設備。

(1)2A0幅面彩色古籍仿真掃描儀(適合大幅面文物、藝術品、古籍、圖書、報紙、字畫、畫冊、地圖等稿件)

主要性能參數指標:

☆頂置式掃描頭,非接觸掃描,

☆承稿臺可掃描幅面:≥1800mm×1200mm ,承稿臺采用特殊耐磨的合成材料,采集過程不會損害古籍原稿,

☆光學分辨率調節范圍:≥300Dpi至1000Dpi,

☆全自動設定:對焦、曝光時間、黑白平衡、幅面探測、自動裁切頁面等

☆輸出: (彩色)≥42-bit,(灰度)≥12-bit,(黑白)≥1-bit

輸出圖像格式:TIFF、TIFF G4、TIFF Multipage、TIFF LZW、DNG、PNG、JPEG、JPEG2000、PDF等等

(2)A1幅面彩色掃描儀(適合文物、古籍、圖書、報紙、字畫、地圖等單頁或裝訂成冊稿件)

主要性能參數指標:

☆頂置式掃描頭,臺式非接觸掃描,自動開啟式玻璃面板托書臺

☆最大原件尺寸:880×640 mm(超A1)

☆光學分辨率:600×600 dpi

☆掃描速度(彩色,A1):6.5秒/300dpi,12.3秒/600dpi

☆掃描模式:36 位彩色,12 位灰度,1 位黑白二值

☆原稿厚度:書本厚度最大為240mm,打開最大尺寸為1070 x675 mm

☆掃描方式:高解析度掃描鏡頭,8 線對/毫米,高精度掃描頭鏡頭,不失真,景深達50 毫米/2英寸

☆輸出圖像格式:TIFF 不壓縮,TIFF G4,JPEG,JP2,PDF,多頁TIFF,BNMP,PCS

(3)A2幅面彩色古籍仿真掃描儀(適合古籍、報紙、字畫、地圖等單頁或裝訂成冊稿件)

主要性能參數指標:

☆頂置式掃描頭,臺式非接觸掃描,帶完整的托書臺,自動開啟式玻璃壓稿臺

☆最大原件尺寸:635×460mm(超A2)

☆光學分辨率:600×600dpi

☆掃描速度(彩色,A2):3.5秒/300dpi,6.0秒/600dpi

☆掃描模式:36位彩色、12 位灰度,1 位黑白二值

☆原稿厚度:書本最大厚度為150毫米

☆掃描稿臺:連機書稿臺(可選90 度開合電動壓稿玻璃)

☆掃描方式:自動對焦,景深達50 毫米

☆輸出圖像格式:TIFF ,TIFF G4,JPEG,JP2,PDF,多頁TIFF,BNMP,PCS

(4)A3幅面零邊距掃描儀(適合裝訂成冊的普通古籍掃描)

主要性能參數指標:

☆進紙方式:平臺式,邊距:不超過2mm,影像感應器:CCD 影響感應器

☆光學解析度:600 dpi,灰階模式:8 位元,彩色模式:24 位元

☆最大紙張規格:11.8 x 17 英吋 (299 x 431 公厘)

☆掃描速度: B&W@200 dpi, A3 : 7 秒

(5)V型彩色古籍仿真掃描儀(適合高精度古籍、拓片、輿圖、卷軸、實物拍照)

主要性能參數指標:

☆頂置式掃描頭,臺式非接觸掃描,帶完整的托書臺

☆最大原件尺寸≥455×315mm(超A3)

☆光學分辨率≥600×600dpi

☆掃描模式: 36位彩色,12位灰度,1位黑白

☆原稿厚度:書本最大厚度≥150毫米,可承受重量≥20公斤

☆掃描稿臺:V型臺可120°調整,V型玻璃臺由掃描程序自動控制升降。

☆掃描方式:自動對焦,景深≥50 毫米

☆全自動設置:對焦,曝光時間,白平衡,格式檢測

☆圖像加強:糾偏,閾值,消手指,曲率校正

☆輸出圖像格式:TIFF, TIFF G4, 多頁 TIFF, TIFF 12 Bits, JPEG, BMP, JPEG 2000, PDF,多頁 PDF

以上列舉了目前市場主流的各類幅面掃描輸入設備類型及主要性能參數指標,在古籍文獻數字化加工系統搭建時可以依據古籍文獻類型有針對性配置選用。

4 結語

本文從系統架構的角度給出了古籍文獻數字化系統硬件設計實現的一個通用方案。古籍文獻數字化加工系統的生產流程是古籍文獻的掃描、存儲、OCR識別、標識、質檢、成品等工作。作為文獻數字化生產系統,除了硬件設備本身要具有實用、易搭建、可擴展、故障率低、維護方便等特點之外,畢竟文獻數字化還是一個有人參與的復雜過程,文獻數字化的掃描工作是快速機械化的,而成品古籍數字資源的生產是由人工加軟件完成,這兩者之間存在著加工能力的不同,而整個生產又在一個統一的管理系統中完成,因此這兩個環節之間相應的硬件設備要做好匹配。當然還包括應用軟件與服務器性能的匹配,掃描及加工古籍數字資源容量與存儲容量的匹配,在統一管理下的加工系統生產與網絡環境的匹配,另外還包括了加工場地生產環境(溫度、濕度、新風)與生產設備的匹配等等,實際系統搭建的時候只有充分考慮到這些差異化的因素,做好各分系統之間的協調配置,才能保證古籍數字化加工系統工作全流程的順暢高效。

參考文獻

[1] 張志清 .國家圖書館古籍保護的歷史、現狀和任務[M]. 杭州: 浙江省古籍出版社,2008: 7.

[2] 毛建軍.古籍數字化的概念與內涵[J].圖書館理論與實踐,2007,(4):82-83.

作者簡介

陳英敏(1972-),男,國家圖書館數字資源部工程師,主要研究方向為文獻數字化加工。

猜你喜歡
系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
基于UG的發射箱自動化虛擬裝配系統開發
半沸制皂系統(下)
FAO系統特有功能分析及互聯互通探討
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
一德系統 德行天下
PLC在多段調速系統中的應用
主站蜘蛛池模板: 一本大道在线一本久道| 91免费片| 欧美三級片黃色三級片黃色1| 欧美一级黄片一区2区| 亚洲av日韩av制服丝袜| 亚洲狠狠婷婷综合久久久久| 天堂岛国av无码免费无禁网站| 亚洲人成色77777在线观看| 亚洲第一页在线观看| 亚欧成人无码AV在线播放| 亚洲成a人在线观看| 少妇精品久久久一区二区三区| 国产国拍精品视频免费看| 亚洲精品自在线拍| 日韩av无码精品专区| 日韩无码黄色| 超薄丝袜足j国产在线视频| 国产在线日本| 亚洲欧洲日韩综合| 国产爽爽视频| 国产97色在线| 日韩欧美国产区| 国产毛片基地| 亚洲黄色片免费看| 国产精品漂亮美女在线观看| 亚洲精品在线影院| 99999久久久久久亚洲| 凹凸国产分类在线观看| 另类专区亚洲| 99久久国产自偷自偷免费一区| 国产手机在线观看| 无码国内精品人妻少妇蜜桃视频| 亚洲一级色| 99人体免费视频| 成人一级黄色毛片| av无码久久精品| 亚洲综合色婷婷| 欧美亚洲日韩中文| 人与鲁专区| 国产精品999在线| 亚洲开心婷婷中文字幕| 好紧太爽了视频免费无码| 亚洲日本一本dvd高清| 日韩视频福利| 制服丝袜一区| 欧美97欧美综合色伦图| 毛片免费在线视频| 91福利国产成人精品导航| 国产成人1024精品下载| 午夜毛片免费看| 亚洲美女高潮久久久久久久| 国产精品国产三级国产专业不 | 亚洲男人的天堂网| 久久精品电影| 国产91精品调教在线播放| www.91在线播放| 国产在线拍偷自揄拍精品| 青草视频久久| 精品人妻AV区| 一区二区偷拍美女撒尿视频| 国产资源站| 国产福利在线免费| 国产福利一区在线| 久久a级片| 免费a级毛片视频| 国产微拍精品| 日韩精品免费一线在线观看| 亚洲侵犯无码网址在线观看| 一级全免费视频播放| 日韩美毛片| 99精品热视频这里只有精品7| 国产超碰在线观看| 在线毛片免费| 国产欧美日韩资源在线观看| 亚洲国产无码有码| 欧美国产在线看| 热99精品视频| 亚洲无码电影| 特级精品毛片免费观看| 国产精品人成在线播放| 黄色一级视频欧美| 色婷婷综合在线|