朱亞玲 程 華
(長春市圖書館,吉林 長春130021)
偽滿文獻是指1932-1945年期間,日本帝國主義在侵略我國東北地區時產生的特殊文獻資料,內容反映了偽滿時期的政治、軍事、外交、經濟、教育、思想文化、宗教等各方面的內容,真實地記錄了日本政府在東北地區實行愚民政策和殖民教化的歷史。
偽滿文獻經過近90 年的聚散沉淀,絕大部分被東北各大文獻機構收藏,就東北地區而言,大連圖書館、吉林省圖書館、黑龍江省圖書館、長春市圖書館、遼寧省圖書館、沈陽市圖書館等都是偽滿文獻的收藏重地。據不完全統計,收藏量約為20萬種左右,載體形式涵蓋圖書、期刊、報紙、調研報告、檔案材料、音頻、視頻等。
隨著時間的推移,偽滿文獻的老化速度逐年加重,紙張出現了不同程度的酸化現象,尤其是年代久遠的文獻發黃、碎裂嚴重,文獻的再生性保護需求迫在眉睫;偽滿文獻內容涉及20 世紀前半期日本侵華時期中國和東亞各國的軍事、政治、經濟、社會等資料,是研究中國近代史、世界近代史、中日關系史和第二次世界大戰史的極為珍貴的文獻史料,其數字化建設勢在必行。
以東北三省范圍內省、市公共圖書館為研究對象,筆者重點對偽滿時期文獻的數字資源建設現狀,包括數據庫的規模、類型、特點等進行了調研,發現了諸多問題。
各館書目建設基本完成,但分類標準與著錄程度各異。在分類標準上,有的館采用中圖法分類,有的館采用東北法分類;在著錄程度上,各館基本完成了語種、題名、出版發行、載體形態、附注內容、中圖分類等基本著錄項。遼寧省圖書館、哈爾濱市圖書館部分書目增加了摘要、主題、相關信息[1];吉林省圖書館完成了期刊的題名、出版發行項、載體形態項、起止卷期、責任者、出版周期等基本項。但是,在著錄的語種及形式上,有中文、有日文,有簡體、有繁體,各館不一。
各館數字化建設剛剛起步。長春市圖書館對館藏5000余冊偽滿時期文獻進行了初步的數字化加工,累計掃描120 萬余拍,存儲為為TIF、JPG、PDF 格式,提供館內局域網檢索、全文下載服務;吉林省圖書館數字化偽滿文獻100萬拍,部分文獻進行了元數據錄入,尚未提供數據庫檢索使用。東北地區偽滿文獻數字化工作尚處于摸索、嘗試階段,各館尚無聯合、統一的合作建設及共享服務方案。
各館偽滿文獻數字化開發層次較低,共享性差。首先,鑒于系統不能識別偽滿舊日文語言文字,即使是先期進行數字化加工的圖書館,也只是通過掃描方式把圖書以圖片格式進行數字化,尚未將PDF 格式轉換成文本,只是以PDF 格式圖片儲存在數據庫中。如,長春圖書館建設的偽滿時期數據庫,主要提供局域網站式瀏覽、下載功能,無法實現題名、主題詞、關鍵詞、全文檢索等功能;吉林省圖書館在建的數據庫,正在進行元數據錄入工作,數字化建設的標準正處于摸索階段。
各館雖然完成了偽滿文獻的編目工作,但由于各館分頭建設,書目存在著重復建設、難以共享的問題;各館數字資源建設尚處于起步階段,尚未達成分工協調的建設機制,缺乏合作共建共享意識;各館使用的建設平臺也不一致,如長春市圖書館使用的系統是北京超星有限公司開發的地方特色資源建設系統;吉林省圖書館使用的是匯文集成系統,各館數字化建設處于自建自用狀態,尚未實現共建共享的建設局面。
應用云計算技術,可以打破各圖書館間在系統平臺、資源存儲、網絡安全之間的壁壘,對東北地區公共圖書館的偽滿文獻信息資源進行高效整合、優化共享。基于各館偽滿文獻的數字化基礎,可以在對編目數據進行系統化梳理、查重、豐富、完善的前提下,構建云服務平臺,全面提供偽滿文獻聯合編目、資源導航、原文鏈接、全文檢索等資源共建共享服務[2]。
平臺設計采用基于云計算基礎設施上的SaaS云服務模式,各圖書館可以在各種設備上通過客戶端進行界面訪問,用戶不需要管理或控制任何云計算基礎設施,包括網絡、服務器、操作系統、存儲等。平臺采用J2EE 的多層體系架構,基于SOA標準規范,提供開放的、統一的XML 接口標準;通過數據交換建立底層結構,協同支持各館的同構/異構系統、應用軟件、數據庫資源等,實現云平臺與其他應用系統之間無縫對接,實現偽滿文獻資源的共建和共享。
如圖1所示云服務模型框架分為基礎資源層、服務管理層、應用層。
(1)用戶服務層:提供WEB 客戶端、手機移動APP及微信信息服務功能。
(2)平臺服務管理層:由資源層、服務管理層組成,數據資源層管理偽滿信息書目信息、全文數據庫、統計數據庫等;服務層由偽滿文獻加工系統、偽滿文獻信息發布系統、偽滿文獻資源檢索系統、資源統一檢索系統、應用分析系統和信息安全管理系統、用戶管理系統、統計管理系統、任務管理系統組成,支撐平臺這些應用功能的實現。
(3)基礎資源層:提供數據與設備硬件支持,包括虛擬機資源池、網絡數據資源池和本地數據資源池,還有服務器、存儲設備和網絡設備等。

圖1 東北地區圖書館偽滿文獻云服務平臺模型
根據東北地區圖書館偽滿文獻的建設需要,最主要的是實現聯合編目、資源共建共享功能,同時提供統一檢索、全文服務[3]。
(1)一站式服務功能。平臺集成東北地區各公共圖書館的偽滿文獻資源,用戶可通過統一的云服務用戶入口,查找各圖書館相關文獻資源,含聯合編目信息、文獻全文等。
(2)系統各服務端的無縫連接功能。云服務架構允許用戶通過web客戶端、移動服務端APP及微信公眾號獲取。云平臺通過整合各圖書館的各類文獻管理平臺,實現資源的統一管理、統一調度,各系統之間數據共享,實現統一的信息發布及檢索功能。
(3)分類檢索功能。一是按照中圖分類法進行檢索;二是通過館藏地點分別檢索;三是按題名、關鍵詞、文摘、作者、出版時間、任意詞等進行檢索。
(4)智能推送功能。根據用戶檢索數據及用戶行為,如根據用戶的列表、標簽、評論、喜愛的圖書館、個人興趣進行自動聚類,通過數據挖掘與分析,推送用戶感興趣的個性化信息。
(5)數據處理及統計功能。提供數據在線備份、同步功能,包含上傳和下載網絡資源,文本、圖片及多媒體資源格式在線轉換;提供數據統計分析服務,含數據使用量統計、讀者需求反饋及滿意度測評數據等。
(6)互動交流功能。各圖書館工作人員可以針對信息進行序化和處理控制及經驗分享,同時,用戶同樣可以進行線上咨詢、信息搜索與互動溝通。
充分發揮各圖書館的人力、物力、財力優勢,依托各省圖書館學會,嘗試建立東北地區偽滿文獻資源建設專業委員會,通過整體規劃、有序組織,整合業界專家、學者負責資源建設規劃、指導、咨詢等工作,為共建共享提供組織保障。此外,下設協調工作辦公室,協調各館人才、資金、設備管理,選擇具有資源、技術優勢的圖書館做牽頭單位,以實例示范進行啟動籌建,測試成功后全面推廣。
鼓勵動員多館合作,共建共享,是推進偽滿文獻數字化建設的關鍵。為此,要考慮到各館的建設重點。一是發揮各館的優勢,擇優選擇技術力量較強的圖書館,負責云服務平臺的規劃及建設;二是進行差異化建設,對偽滿文獻進行查重、篩選,避免重復建設;三是科學合理地評價各館所做出的努力和貢獻,根據各館的技術投入、人員投入、資金投入、文獻數字化數量、共享文獻比例等,制定績效評價機制;四是可考慮將偽滿文獻資源共建共享參與度納入到圖書館評估標準和業績成果標準,推進資源建設的可持續性發展。
在項目建設初期,各館應摸清所使用元數據的基礎情況,參照國家公共數字文化工程《地方圖書數字化加工規則(2019)》,遵循元數據加工標準、圖像數字化標準和命名規則、TXT 文本標準、數據庫標準等相關要求,補充及完善相關數據。
針對偽滿時期文獻加工中所面臨的文獻數量龐大、加工周期長、翻譯成本高等特點,可策劃采用網絡眾包模式實施。首先,對于文獻掃描、數據著錄、數據存儲等基礎性工作,可通過非定向網絡眾包模式,通過網絡平臺,非定向眾包給普通網絡用戶;其次,對于文獻全文識別、舊日文翻譯、數據分析與挖掘等專業性、技術性工作,定向眾包給具有相關知識儲備的專業人士。所有眾包用戶遵從統一的管理規則進行管理,通過線上領取任務包,接收技術工作標準及培訓、定時完成任務并提交作業,通過評估驗收并進行網上結算。
偽滿文獻數字化作為一項系統性工作,涉及到技術平臺、組織管理、社會合作等各個方面,東北地區公共圖書館應充分發揮各館的資源優勢,嘗試和探索云服務模式,實現結構合理、運營高效的服務機制,同時,需要與社會合作,在資源整合、服務開發、跨平臺應用、宣傳推廣等方面,強化網絡眾包的應用,形成共建共享、多元互動、運行高效的資源服務格局,以提升公共圖書館偽滿文獻數字化、特色化服務效能。