□劉海燕
大數據時代依托互聯網的云計算服務,對海量分散的數字化信息進行深入檢索,通過物聯網技術實現將涉及到工作學習當中的信息實現智能化操作[1]。面向數字環境,人類社會開始步入以數字化為核心、以互聯網為基礎、以智能化為目標的大數據時代。伴隨著現代信息技術迅猛發展及其在圖書館的廣泛引用,信息交互越發便利地給圖書館數據庫的建立帶來巨大的變化。隨著圖書館信息服務體系建設的深入,圖書館已進入全面數字化轉型時期,資源建設從紙質資源為主轉向以數字資源為主[2]。讀者對圖書館紙質資源和數字資源的單一服務已不再滿足,對深層次的數字資源服務的需求越來越明顯。圖書館不斷推進的數字資源建設,對圖書館利用現代信息技術去挖掘和建設具有地域特色性的館藏數字資源的要求也不斷提高。為滿足讀者多樣化的知識需求和共享的需要,對資源進行智能化、專業化的管理和建設,以推動圖書館不斷向前發展。本文基于大數據環境背景下,以武漢城市文化文獻數據庫建設為例,對基于地方文化的特色數據庫的建設意義、原則、構思以及相關思考進行探討。
特色數據庫的建設是為了滿足讀者對資源的個性化需求,按照一定的標準和規范依托館藏資源進行資源數字化,對特定主題的信息進行有序的收集、整理、分析、評價、存儲等,形成特定主題的特色資源庫[3]。伴隨著社會經濟的高速發展,在城市化進程過程中,有關城市文化建設的研究逐漸升溫。文化是城市的靈魂與精神支柱,也是一個民族源遠流長的血脈。文化具有天然的可數字化性和易傳播性,它見證了城市和國家的歷史榮耀和滄桑,是人類社會的共有財富。運用“互聯網+”的思維與傳統進行深入融合,也使得對傳統資源進行數字化升級改造顯得越發迫切。城市文化是社會成員在城市發展進程中創造出來的具有鮮明特點的物質財富和精神財富,其標志性的內在價值既可以體現在建筑物造型上,又可以體現在傳統文化上,更可以體現在各種設施和所形成的久遠文化的綜合沉淀上。文化不僅是城市的魅力,還是城市長盛不衰的“軟實力”[4]。城市文化貫穿于城市發展始終,能夠對體現城市精神和特質的思維方式、建筑形態、經濟環境和特質資源等文化特征進行反映,具有超越時代的內容和精神[5]。
武漢作為歷史文化名城,有著豐富的文化底蘊。在大數據環境背景下,建立武漢城市文化文獻資源庫,通過互聯網思維和手段對城市文化進行提煉,是實現城市文化數字長期保存和互聯網推廣的一項重要措施。通過構建武漢城市文化文獻數據庫實現文獻資源收集和索引,實現城市文化數字化展示,提升城市文化認同感,方便城市歷史文化研究工作者調研考察,增強城市核心競爭力[6]。高校圖書館在引領城市文化建設中既是滿足城市發展內在需求,也是高校圖書館職責所在。主要體現在:第一,高校圖書館擔負著傳播科學文化、傳承人類文明的重任,具備多年積聚的資源,使其在城市文化建設中具有得天獨厚的優勢。高校圖書館在履行高校“人才培養、科學研究、服務社會”承擔著重要作用,將這種優勢延伸到城市文化建設中,對收集本地文化知識、保存城市文化、記憶城市歷史、傳播地域文化等方面仍可以發揮積極而重要的作用。第二,高校圖書館在推動城市文化建設有著不可推卸的責任和使命,其擁有豐富的館藏資源和城市文化建設相關的人才儲備,能夠為城市文化建設提供有力保障。第三,高校圖書館推動城市文化建設也是其拓展服務空間的新機遇,通過與城市文化建設相融合,在增進城市人文內涵、提升城市“軟實力”的同時,還能直觀地體現高校圖書館的價值和作為,推動圖書館綜合服務能力的提升,為自身發展爭取良好的機會。
武漢城市文化文獻資源庫建設依托省內各兄弟院校圖書館、公共圖書館、相關職能部門及研究機構收藏和建設本地文獻資源的優勢,立足于江漢大學圖書館,收錄各類相關文獻信息資源,全面系統地揭示武漢的城市文化。由于信息資源具有分散性,運用技術手段將與武漢城市文化相關的分布于不同機構和載體的文獻資源進行系統收集,經篩選、加工后進行有效組織。為武漢城市文化的不同類型資源實現有序存儲,方便用戶查詢、利用和充實資源,在處理好知識產權和數據安全等問題的前提下,武漢城市文化文獻資源庫的建立充分考慮到開放管理和互動交流等功能。力爭將此數據庫建設成為具有武漢特色的數據庫,為相關研究單位及武漢市政府提供比較豐富的文獻信息資源。
(一)總體架構。武漢城市文化文獻數據庫主要包括武漢名人、論學雜述、方志史料及歷史文獻四個子庫。其中武漢名人庫是收集武漢市各個領域的著名人士;論學雜述庫是收集關于武漢市城市文化方面的期刊及網絡文獻;方志史料庫是收集關于武漢市的地方志文獻;歷史文獻庫是收集武漢市城市文化方面從古至今的圖書(武漢城市文化文獻數據庫的總體架構如圖1所示)。

圖1 武漢城市文化文獻數據庫的總體架構
數據庫的分類架構在遵循《中圖法》分類體系的基礎上,借鑒了搜索引擎的分類方法,四個子庫下面又劃分不同的一級類目,分別建立資源導航庫、武漢名人庫、論學雜述庫和歷史文獻庫,并提供瀏覽、檢索、下載等各種服務形式。
在總體架構下,逐步實施各級各類專題數據庫及子庫的建設。盡管各子庫之間形式上保持獨立,但邏輯上底層數據不可避免地存在關聯關系,例如武漢名人庫中關于某位名人的研究可能關聯于論學雜述庫中的文獻。在權限管理模塊上優化數據邏輯,使各子庫之間高內聚但又保持必要關聯關系,達到業務層面相互獨立,減少數據冗余,提高系統可靠性和穩定性的目的。

圖2 數據庫整體結構圖
武漢城市文化文獻資源庫的建設涉及期刊、圖書、圖片、音頻、視頻、網絡資源等多種載體。具體的子庫中,數據存在形式多樣化的特點(例如:在論學雜述子庫中,可能存在學術論文、圖書、報紙、互聯網等多種形式的文獻)。在底層數據存儲以及上層接口描述上采用CALIS公布的文獻描述規范進行標準化描述。將單一兼容性字段模板擴展為論文模板、圖書模板、報紙模板、互聯網模板以及兼容模板。同時,為保障數據錄入質量,細化數據審核的管理流程。強化審核員職能,審核范圍明確化并對審核意見進行存檔化。通過對資源進行有效處理和關聯分析,實現以內容主題為單元,最終將武漢城市文化文獻數據庫建成一個縱橫交錯的資源網。
(二)資源的收集與整理。武漢的文化歷史悠久,戲曲、文學、美術、雜技、文博、民間工藝等各種文化藝術門類比較齊全,內容豐富,地域特色鮮明。經過歷代文化人士的不懈努力,文化建設不斷推陳出新,在全國具有重要地位。武漢城市文化文獻資源庫的建立在資源搜集上,一方面可以對現有館藏資源進行數字化,另一方面可以對互聯網上各類型學術資源進行搜集。對搜集到的資源進行梳理和分類,建立對數據質量進行審核的機制,通過標準化和規范化的流程對資源進行整理并納入數據庫。對體現武漢城市文化的相關文獻資源的館藏情況進行梳理,在充分展開文獻調查的同時也需注重建立對資源拓展的征集渠道。考慮到資源存在分散性,在充分利用互聯網搜集文獻資源的同時,還可以與各高校圖書館、公共圖書館、博物館及相關機構進行征集。具體可以包括以下方面。
1.館藏數字化加工。按照文獻的分類架構,從圖書館現有館藏中關于武漢城市文化的圖書文獻從各個閱覽室抽調集中,主要涉及的類別有地方志K269.631、地方風俗習慣K892.463、地方劇I236.63、地方文學作品I218.63、地方文學史I209.963、武漢城市文化與文化事業G127.63以及區域地理、名勝古跡、市縣史志等,共計圖書1,839種,2,834冊,形成專門的武漢城市文化文獻閱覽室。同時,對抽調出的專題圖書進行數字化搜集,對沒有電子版的專題圖書進行數字化加工。還可以充分利用圖書館的館際互借、文獻傳遞等功能,多途徑、多渠道對各類資源進行復制、掃描、拍照、摘抄、剪輯、轉錄等,經篩選審核后一并納入數據庫中。
2.數據庫資源收集。資源是圖書館的立足之本,是圖書館展開各類型服務的保證。充分利用圖書館購買的學術數據庫中收錄的相關學術資源包括地方志、文史資料、電子期刊、電子圖書等,按照分類架構,從各種已購買的電子資源中下載相關方面的文獻資料,按照字段進行錄入并分別進行標引。
3.互聯網資源搜集。網絡也是獲取具有地方特色文獻資料的一個重要渠道。可以充分利用搜索引擎,查找相關的權威網站,收集具有地方特色的專題數字化資源。除了獲取各類型的學術資源,也不能忽視學術資源以外的網絡資源,充分利用網絡展開搜集下載,或借助Spider、Robot等專用軟件進行自助搜索抓取,并對下載的資源明確標注下載出處。由于網絡資源各種信息和數據的真實性和價值性參差不齊,為保證數據及資料的有效性、準確性以及權威性,需要對文獻材料進行鑒定和選擇。并從各種不同類型的文獻資料中挖掘和提煉具有武漢特色的文獻材料。
4.資源公開征集。加強多部門合作機制,通過與各圖書館、博物館、檔案館以及地方史志辦等部門建立相關聯系,征集需要的圖片、文檔、音視頻等資源,包括一些非正式出版的內部資料、各種文獻匯編等灰色文獻。還可通過自媒體發布征集函的形式面向社會大眾征集武漢城市文化相關資料。
5.用戶自主上傳。增加用戶自主上傳的通道,在武漢城市文化文獻數據庫發布后,用戶可以自行注冊,對其在訪問過程中發現數據庫為收錄的資源可以自行上傳,經后臺管理人員審核通過后進行規范化描述和分類并作為數據庫資源發布。
大數據時代的數據具有更新快速、種類多樣、數量龐大以及處理復雜的特點。如果有效利用大數據,則可以為決策及個人生活帶來很大的便利,不僅可以減少投入,而且還可以根據數據信息作出有效的決策。
(一)拓展數字資源范疇。圖書館長期以來都非常重視資源建設,但基本局限于對圖書、期刊、報紙、學位論文、會議論文、專利、標準、科技報告等文獻型資源上。武漢城市文化文獻數據庫的建立,不應局限于處理利用數據庫和本館資源數字化,更應該以大膽創新、勇于探索精神,結合大數據環境下的思維,對政府信息以及專題報道等信息進行搜集,對用戶使用數據資源以及網絡搜索的行為信息進行信息采集。
(二)提升數字資源廣度。數據雜亂多樣是大數據的一大特點,圖書館單純以文獻信息服務難以滿足用戶深層次的需求,在服務上,采用以文獻服務為主的資源整合轉向以綜合信息服務為主的資源整合也是必然的趨勢。將圖書館的數字資源與社會資源進行有機關聯,把文獻信息、政府信息、網絡信息和用戶信息等進行整合,進一步滿足用戶需求。
(三)明確建設的目標和方向。本著“人無我有,人有我精”的原則,從本地實際出發,深度挖掘城市文化的特點和內容,突出鮮明的地方特色和區域特性。高度重視和培育特色資源的建設方向,提供長效機制和中遠期規劃。
(四)加強區域合作交流。大數據時代,信息資源分散而雜亂,特色資源數據庫的建設單靠一方的力量是遠遠不夠的,更需要發動社會的力量,共同參與制作。加強與公共圖書館、高校圖書館、博物館及相關機構的交流合作,充分實現區域內資源的共建共享,保證資源的完整性和特色性,方能進一步推動地方特色數據庫的持續發展。
高校圖書館是一個城市文化體系重要組成部分,能夠充分發揮、利用本地特色的文獻信息資源的作用,為城市文化建設提供多樣性的文化與信息服務。武漢城市文化文獻數據庫有助于豐富高校圖書館的特色館藏建設,有助于深入展開武漢城市文化研究,更有助于宣傳和傳承武漢城市文化,提升城市文化“軟實力”。武漢城市文化特色文獻數據庫作為一個特色專題數據庫,建設過程有其復雜性和系統性。高校圖書館充分發揮人才和技術優勢,建立協調機制,多方聯系各種社會資源,大膽嘗試、勇于創新,在城市文化建設中發揮積極的作用。