張文亮 敦楚男
(遼寧師范大學政府管理學院 遼寧大連 116029)
隨著數字圖書館標準化工程建設的深入,如何對下一階段標準規范體系進行高效的開發成為必須解決的問題。數字圖書館標準規范內容體系框架的研究由來已久,張曉林、肖瓏等學者早在2003年就對我國數字圖書館標準規范的建設框架加以描述[1]。此后,諸多學者在標準規范體系研究中添磚加瓦,觸及標準規范內容的各個方面[2-4]。這類研究的主要研究對象側重各類數字圖書館標準規范項目的體系結構[5-7]。近些年,隨著國家整體規劃的要求以及數字圖書館標準規范建設的整體性需要,關于全國數字圖書館相關標準規范體系的研究受到了廣泛的關注[8-9]。然而,當前的研究成果對于我國數字圖書館相關標準規范內容體系缺乏定量的研究。
因此,本研究通過運用文本分析法與共現網絡分析法對數字圖書館標準規范體系內容要素進行定量分析,分析現行標準規范內容體系的完成情況,構建我國數字圖書館標準規范體系框架,并基于現行情況對未來一段時間數字圖書館相關標準規范編制重點領域作出預測。
對數字圖書館現行標準進行統計能夠有效發現標準規范體系建設的完成情況,探討未來一段時間標準內容體系建設的研究編制方向。本部分采用文本分詞的方法對標準名稱進行關鍵詞拆分,對這些關鍵詞作匯總分析,并通過文本中的高頻關鍵詞進行共現分析,以期對現行標準建設情況進行歸納總結,從而明確我國數字圖書館標準規范體系的重點研制方向。
為全面調查我國數字圖書館標準規范編制情況,項目選取全國信息與文獻標準化技術委員會(簡稱文標會,TC4)現行標準、全國信息技術標準化技術委員會(簡稱信標委,TC28)現行標準、全國文獻影像技術標準化技術委員會(簡稱文影標,TC86)現行標準、全國圖書館標準化技術委員會(簡稱圖標委,TC389)現行標準以及我國數字圖書館標準規范建設現行標準機構項目成果進行統計,其中全國文標會建設成果為80條,全國信標委建設成果為1 060條,全國文影標建設成果為79條,全國圖標委建設國家標準成果為9條、行業標準成果30條,“中國數字圖書館標準規范”項目建設成果164條,國家數字圖書館工程標準規范成果35條,全國文化信息資源共享工程標準成果15條,高等教育文獻保障系統標準成果156條,軍隊數字圖書館標準成果16條,黨校圖書館標準成果16條,總計1 660條。此外,依照各委員會在編制標準時對標準條目進行的直觀區分,直接對標準前綴進行統計,詞條數大于10的詞條前綴有8個,包括信息技術703條、信息處理53條、縮微攝影技術51條、信息與文獻30條、識別卡42條、軟件工程23條、信息處理系統21條、信息技術服務16條、系統與軟件工程10條。
以上是我國現行數字圖書館標準的全部成果,對這些內容進行分詞處理獲得的關鍵詞可全面反映當前標準的建設情況。具體方法為將標準成果的中文標準名稱匯總到統一文檔,人工對名稱文本進行分詞處理(使用ROST等主流中文文本分詞軟件效果并不理想),去除“與”“的”“第X部分”等并無分析意義的關鍵詞以及“信息技術”等不能有效對標準分類描述且影響共現效果的關鍵詞進行詞頻統計,利用Ucinet社會網絡分析軟件進行關鍵詞共現分析。
2.2.1 詞頻分析
對拆分后的關鍵詞進行分析比較,能夠有效地確定當前建設的主要內容,關鍵詞出現的頻次越多,越能體現出數字圖書館標準規范的核心建設領域。

表1 數字圖書館標準規范成果詞頻>20的關鍵詞
標準成果關鍵詞經初步篩選后共納入1 788個關鍵詞,詞頻總計8 876個。從表1可以看出編碼字符集、字型所代表的數字對象加工標準,系統、開放系統互連、信息交換所代表的數字圖書館系統互操作,元數據、著錄所代表的信息資源描述與組織標準是我國標準規范建設的核心建設方向;服務標準、接口等技術相關標準也是我國標準規范建設的重要內容。
此外,對近年數字圖書館相關標準的實施情況進行統計也能夠看出標準規范領域的研究狀況以及外來編制趨勢。因此,本研究還對近三年已實施以及即將實施的數字圖書館相關標準規范進行了統計,如表2所示。數字圖書館相關標準共計294條,從中能夠清晰地看出數字圖書館系統相關標準、服務相關標準、軟件相關標準是近幾年數字圖書館標準體系的重點編制范圍。

表2 近三年數字圖書館標準規范成果詞頻>10的關鍵詞
2.2.2 數字圖書館現行標準關鍵詞共現圖譜分析
本研究利用Ucinet社會網絡分析軟件對關鍵詞進行可視化分析,得到的關鍵詞共現網絡圖譜如圖1所示,在關鍵詞共現網絡中,每一個節點代表一個關鍵詞單元,單元節點的大小代表該關鍵詞在網絡中的重要程度[10]。

圖1 數字圖書館標準規范成果關鍵詞網絡共現圖譜
由圖1能夠看出我國數字圖書館標準規范體系中重點研究編制的幾個方向:首先,左下角小團體有中心度最高的關鍵詞“編碼字符集”,它代表的資源對象加工、物力資源數字化方向標準是標準規范體系建設以來編制最為集中、最為重要的標準;左側“信息處理”關鍵詞所聚類的小團體,代表著與信息處理相關的軟硬件編制標準;中間“信息”“服務”“元數據”“資源”“描述”等關鍵詞共同構建了信息資源組織、描述相關標準;右上方“系統”等關鍵詞所建設的小團體代表了數字圖書館平臺系統所需要的相關標準;右側“開放系統互聯”小團體強調了數字圖書館系統互操作等方面的標準;右下方小團體主要側重于信息通訊、信息交換等方面的標準內容;此外有幾個數字圖書館相關小團體游離于整個體系之外,主要有關于數字圖書館學習教育、數字圖書館信息設備、數字圖書館工程監理等方面。
依據對我國數字圖書館現行標準規范的文本分析及共現分析結果,我國當前數字圖書館標準規范內容體系主要是以數字資源對象數據標準、數字資源元數據標準、數字資源組織管理標準、數字圖書館服務標準、數字資源長期保存標準、數字圖書館系統平臺建設標準、數字圖書館管理與評價標準七種類型標準規范為基本框架,通過借鑒、參考國際標準、國家標準、行業標準、地方標準、機構標準進行構建,內容涵蓋數字資源揭示、組織整合、數字圖書館相關技術、數字圖書館服務、管理及評估等諸多方面,見圖2。

圖2 我國數字圖書館標準規范體系框架
自我國建設數字圖書館并依照數字圖書館工作組織需求建設相關標準規范以來,鑒于國外數字圖書館建設時間較早、建設完成度較高、體系較為完備,我國各級數字圖書館標準體系在建設過程中對美國、歐洲等國外數字圖書館標準項目借鑒較多。因此,我國數字圖書館更容易與其他國外系統進行聯系、互操作。此外,我國數字圖書館標準規范體系在建設過程中注重標準融合,例如將相關標準體系進行融合,國家標準、行業標準、地方標準、機構標準相互參考引用等。我國數字圖書館通過大量理論與實踐結合的項目案例,已經初步建設形成了集國家性、區域性、商業性、個體性于一身的數字圖書館建設服務體系[11]。各個層級的數字圖書館既有建設的共同性,也有建設的獨特性。我國數字圖書館標準體系主要分為國家標準層、行業標準層、地方標準層、機構標準層四個層級。這種劃分并非基于標準規范的性質,而是主要基于標準規范的適用范圍。其中國家標準層主要指在數字圖書館領域中達成共識,適用于國家體系內數字圖書館系統工作的基礎或核心標準;行業標準層主要指在某一系統數字圖書館建設與運行過程中適用的標準,在我國,這一類標準主要是針對以國家圖書館為首的公共圖書館系統、以CALIS為首的教育系統、以中科院等科研機構為首的科學系統、黨校系統、軍隊系統數字圖書館的具體實踐情況建設的;地方標準層又可以稱之為區域標準層,主要指適用于地方數字圖書館特色館藏建設的標準規范,其主要目的在于將各地域特色文化成果納入數字圖書館體系之中;機構標準層主要指一部分企業的內部技術性標準和獨立數字圖書館項目中主管機構制定的規范性文件,其主要目的在于將企業、機構的特性、需求具體落實于其數字圖書館項目的建設中,保證數字圖書館運作過程的規范性、易用性。
我國數字圖書館內容體系基本框架主要有七個方面,即數字資源對象、數字資源元數據、數字資源組織管理、數字圖書館服務、數字資源長期保存、數字圖書館系統平臺、數字圖書館管理與評價。
3.2.1 數字資源對象標準
數字資源對象標準是數字圖書館標準規范體系的核心標準,其主要意義在于對原始館藏文獻的大規模數字化加工,是傳統圖書館轉向復合圖書館、建設相應數字圖書館的必要標準,其標準規范的編制涵蓋了國家標準、行業標準、地方標準、機構標準,體系建設較為全面。數字資源對象數據標準包括內容編碼、對象標識、數據格式三個部分。內容編碼部分主要是對文字、圖像等數據內容進行計算機編碼和標記所涉及的形式標準;對象標識部分主要是對數據對象進行唯一標識符命名,標識資源身份;數據格式包括文本、圖像、視頻、音頻等多媒體數據內容的讀寫模式標準。
3.2.2 數字資源元數據標準
數字資源元數據標準是對某類數字資源進行具體描述時所有規則的集合,是數字圖書館數據資源互操作以及系統間資源共享的基礎。國際上元數據的相關標準較為完善,我國元數據標準在編制的過程中對此參照較多,并在此基礎上形成了具有我國資源特色的各類型元數據標準。數字資源元數據標準主要包括核心元數據、專門元數據、管理元數據等多種元數據標準。
3.2.3 數字資源組織管理標準
數字資源組織管理標準是為提高數字資源利用率,提升用戶使用效率而制定的相關標準。該標準通過構建知識框架、增加相關資源參照,使數字圖書館中的資源體系更加緊密,使用戶和其他數字圖書館系統能夠有效地發現、選擇和利用數字資源[12]。數字資源組織管理標準主要包括知識管理、語義關聯、版本管理等方面。
3.2.4 數字圖書館服務標準
圖書館服務的標準化指的是圖書館用戶服務過程中,通過對相關服務標準的制定、實施以及對標準化原則和方法的運用,使服務質量定量化、服務方式正規化、服務過程程序化,使圖書館用戶得到優質服務的過程。圖書館服務標準的制定代表著圖書館以資源為基礎,以技術為手段,以用戶服務為導向的建設趨勢。隨著數字圖書館建設的推進,我國各級數字圖書館標準規范體系也制定了相關服務標準。數字圖書館服務標準主要涉及數字圖書館資源發布、檢索服務、虛擬參考咨詢服務、文獻傳遞服務、統一認證服務等相關服務所遵循的標準規范。
3.2.5 數字資源長期保存標準
隨著數字技術的飛速發展以及Internet的迅速普及,數字資源急速增長。與資源增長速度相比,數字圖書館保存技術與能力卻相對滯后,不能滿足實際工作的需要。數字資源保存管理與數字資源使用存在的問題也日益加劇。數字資源的長期保存是數字圖書館在進行數字資源建設中面臨的重要問題。數字資源長期保存標準是為數字圖書館數字資源的長期保存與利用建立的相關標準,其內容主要包括數字資源保存策略、數字資源封存標準、保存元數據等。
3.2.6 數字圖書館系統平臺建設標準
數字圖書館系統平臺是直接面向數字圖書館管理者與用戶的交互平臺,它只有符合當前各類技術標準,才能夠與其他數字圖書館系統或相關軟件進行更好的銜接,使數字圖書館的應用范圍更廣、功能性更強。數字圖書館系統平臺建設標準主要包括系統間互操作標準以及接口、集成規范。系統間互操作能夠使不同系統間進行相互使用和數據交換;接口與集成規范保證了用戶利用數字圖書館平臺的操作環境。
3.2.7 數字圖書館管理與評價標準
數字圖書館管理與評價是數字圖書館循環建設與持續更新的保障,其標準規范的建設專門針對數字圖書館建設中的各類管理規劃問題。在數字圖書館管理方面主要包括數字安全管理標準以及標準規范體系運營管理標準等部分;在數字圖書館評價方面主要包括數字圖書館建設主體評價標準、數字圖書館用戶評價標準以及上級主管部門評價標準三個部分。
3.3.1 整體性建設標準規范內容體系
對現行標準規范體系內容進行內容分析可知,我國數字圖書館標準規范建設的內容主要集中在實體資源數字化、數字資源處理等針對信息資源本身的相關標準上。而反觀近三年的標準規范編制工作,技術、服務、管理方向的標準得到了標準編制組織的格外關注,資源相關標準編制修訂的內容并不多。各類型數字圖書館項目以及標準規范組織在進行標準編制時有各自的側重,但是對于我國數字圖書館整體標準規范內容體系,我們在構建時應當強調規范體系建設的整體性,確保整個體系沒有明顯的短板。
3.3.2 標準規范體系內容細化
我國標準規范體系建設從無到有,經歷了近二十年的發展,標準規范內容建設基本達到了全覆蓋。但是由于編制研究中過于強調快速應用以及大館建設、中小館應用等建設理念,我國數字圖書館標準規范內容成果在精細程度、分層服務方面暫時還無法達到發達國家數字圖書館建設的水平[13]。在標準應用過程中,由于用戶群體、圖書館層級的差異,數字圖書館相關標準進行具體應用的效果并不理想。因此,在未來標準內容修訂過程中,應當在現行標準規范的基礎上,根據標準具體的應用對象進行專門性優化,提升標準規范的使用效果。
3.3.3 加強非結構化信息對象相關標準建設
隨著網絡技術與人類生活的不斷融合,網絡信息資源不斷壯大,非結構化數據呈現指數化增長,數字圖書館用戶對于此類數據的重視程度不斷提升。2010年,美國國會圖書館宣布“自2006年3月推特成立以來,每條推文都將在國會圖書館進行數字化存檔”[14],標志著數字圖書館領域對用戶創造的非結構化信息關注的開始。我國標準規范組織對非結構化數據的標準規范編制有一定的規劃[15],但是對于數字圖書館方向非結構化數據標準涉獵較少。因此,在互聯網海量數據與日俱增的情況下,非結構化數據對象相關標準的建設刻不容緩。
我國數字圖書館標準規范歷經二十年的建設探索,各圖書館領域組織機構、相關標準化技術委員會、諸多數字圖書館相關企業起到了關鍵性的推動作用,形成了涵蓋國家標準、行業標準、地方標準、機構標準四種等級,七種類型標準規范的體系框架,基本保證了數字圖書館各項工作的順利進行。然而,數字圖書館標準規范體系的總體框架之中也存在著一些薄弱的環節。未來一段時間,在整體性建設環境下細化標準規范內容體系,應當成為數字圖書館標準體系建設的重點內容。
(來稿時間:2018年5月)