(國家圖書館 北京 100081)
在數字圖書館發展新時期和“大數據”時代背景下,需要將分散游離于各數字圖書館之間的資源及服務進行有效集成并協同,以提高數字圖書館海量文獻數據的處理能力和服務能力。唯一標識符作為數字資源的條形碼,〔1〕它采用機器可以識別的一串數字描述資源,對數字資源進行統一標識,貫穿于數字資源采集與加工、服務與保存等環節,將數字資源的生命周期的管理進一步簡單化、標準化、規范化。
國外唯一標識符技術經過近二十年的發展,陸續出現了標識互聯網資源的URI/URN/URL,〔2〕標識連續出版物、圖書等文獻的 SICI〔3〕/BICI〔4〕/PII〔5〕,標識數字對象的 DOI〔6〕等多種形式的標識不同載體的唯一標識符規范和應用。由于大多標識符方案和技術僅僅定義了標識符名稱空間及標識符構成機制,尚未形成包含規范、應用、管理等完整的唯一標識符服務體系。基于HandleSystem技術〔7〕的DOI唯一標識符服務體系,在DOI國際標準〔8〕支撐下,形成了以命名、申請、授權、注冊、解析、變更為功能核心,以全球注冊中心、本地服務為主體框架的名稱服務體系,目前在全球已有10個注冊代理機構,在數字出版行業得到了廣泛的應用。〔9〕
在國內,有些機構直接納入到國外唯一標識符服務體系,開展中文數字資源的唯一標識符服務;〔10〕也有一些單位自主研發了唯一標識符的應用功能和命名規則。〔11〕唯一標識符技術在公共圖書館領域的應用與研究尚處起步階段,隨著圖書館數字資源種類和數量的不斷增多,數字資源的網絡服務愈發重要,正逐漸成為公共圖書館的主要服務內容,而數字資源在管理及服務上的問題也日益凸顯。
唯一標識符規范、系統的建設是國家數字圖書館工程的重要內容,國家圖書館以推廣工程為平臺,利用已有的建設成果,聯合全國各級公共圖書館共同探索和創新,構建涵蓋唯一標識符的標準、應用和管理機制等環節的完整的唯一標識符體系,以實現對全國公共圖書館數字資源的統一標識和規范管理,促進跨區域跨平臺的資源調用和系統集成。
( 1 )實用性
唯一標識符體系應選用高可靠性的存儲、設計高效的查找策略、使用合理的通訊協議、設計滿足用戶需求的服務模型、采用高效靈活的分布式架構進行體系的規劃和研究。確保各省、市圖書館可獨立完成本地數字資源唯一標識符的注冊和管理,可及時對數字對象的URL地址進行更新,避免資源鏈接的“死鏈”現象。
( 2 )穩定性
唯一標識符體系應面向互聯網用戶采用多鏈路方式提供高效、穩定的唯一標識符解析服務,服務終端與服務提供者之間通過建立簡單、快捷的鏈接通道,保證服務的穩定性。在單個節點出現故障時,可以通過中心節點作為橋梁建立鏈接,不會影響整個體系,確保資源的及時、準確定位。
( 3 )擴展性
唯一標識符體系應具備軟硬件層面的擴展能力,能夠通過增加硬件設備和優化軟件策略的方式來提高處理能力。在業務層面,應立足公共圖書館,具備向出版單位、研究機構、博物館等全國其它有需要的單位提供公益性的唯一標識符注冊和解析服務能力,促進跨系統、跨機構的資源鏈接和共享利用。
( 4 )兼容性
唯一標識符體系應能夠實現圖書館多版本、多復本數字資源的注冊和解析,只要提供與數字對象相關的元數據,各圖書館的應用系統就可以定位相應的資源,能夠有效促進圖書館間的業務融合。此外,唯一標識符體系還應該兼容唯一標識符的相關國際標準,提供規范的解析接口,保證在業界的持續競爭力。
唯一標識符體系的建設首先要考慮公共圖書館數字資源的建設情況,制定出科學、規范、適用的唯一標識符命名規則、注冊規則和解析規則,指導系統平臺的建設。通過系統平臺完成標識全國公共圖書館的所有數字資源,形成能夠容納國家圖書館、省級館、市級館的總分式唯一標識符體系,實現唯一標識符的統一規劃和服務。同時,在國家圖書館的協調組織和各級公共圖書館的積極配合下,建立公共圖書館共同參與的多層管理體系,形成一套完善的運行和管理機制,保證各服務節點的協調工作和穩定運行。
為保證唯一標識符體系的安全、穩定,國家圖書館參照HANDLE系統的體系架構,采用分布式的服務框架,按照“國家-省-市”三層架構進行設計,既能保證每個服務節點的獨立管理,系統高度自治,還能提高系統的可靠性,不會因為單個節點的故障導致服務的中斷。如圖1所示,最上層為頂層服務,由中心節點提供,管理n個分支服務節點,對各分支服務節點進行命名授權和管理。在頂層節點下,具有多個唯一標識符的二級服務節點,各服務節點可接收本地范圍內注冊機構的申請和審批,各注冊機構即為實際提供唯一標識符注冊服務的實體服務機構;二級節點下可繼續發展三級服務節點,滿足市級及以下圖書館的數字資源注冊需求。頂層服務采用星型結構同步各子層圖書館的系統配置信息,通過分層模式逐層同步各省、市唯一標識符信息,保存各子層提交的注冊數據,提供唯一標識符的查詢功能,在其他節點出現故障時,直接提供解析服務,保證系統的穩定性。

圖1 唯一標識符體系框架
唯一標識符體系以分級注冊和統一解析的模式對外提供服務。各服務節點不僅負責本地區有唯一標識符注冊需求的機構申請和管理,還要負責本地唯一標識符的解析服務。各注冊機構為直接進行唯一標識符注冊和管理的單位。
唯一標識符體系的構建應該以標準化和開放性為原則,從標準規范、技術平臺、服務體系和管理體系四個方面進行建設。
公共圖書館數字資源唯一標識符標準規范的建設包括數據格式的標準化、資源種類的標準化、命名規則的標準化、注冊數據的標準化等等。
根據文化部統計數據,2012年全國共有縣級以上獨立建制的公共圖書館3076個。〔12〕唯一標識符體系需要能夠覆蓋和服務所有的公共圖書館,還要保持不同圖書館數字資源之間的通用性、交互性以及不同應用系統之間的互操作,因此,研制唯一標識符標準規范是建設唯一標識符體系的重要前提。國家圖書館自2002年以來,一直跟蹤國內外唯一標識符相關標準規范的前沿動態,并于2010年正式發布了《國家圖書館數字資源唯一標識符規范和應用指南》。〔13〕2012年參與了文化部行業標準“數字對象唯一標識符”規范的研制工作,同年國家圖書館也開展了公共圖書館唯一標識符命名規則的制定工作,采用“前綴/后綴”的方式進行命名,前綴和后綴各段采用英文半角“.”分隔,如“108.ndlc.2.1100009031010001/T1F24.003171449”。前綴包括四段,分別為國家區域代碼、國家數字圖書館代碼、服務節點代碼以及注冊機構代碼;后綴為綜合信息編號和系統內部標識號,主要體現了該資源的種類、文件格式等基本信息。
唯一標識符系統平臺的建設是建立唯一標識符體系的基礎。根據《國家圖書館數字資源唯一標識符規范和應用指南》,國家圖書館進行了唯一標識符系統的前期需求調研和應用調研,于2011年啟動了“國家圖書館數字資源唯一標識符系統”項目,〔14〕系統主要用于數字資源唯一標識符的注冊、管理和服務,它不僅是國家數字圖書館工程的一個核心配套子系統,也是推廣工程軟件平臺建設的一項重要內容。唯一標識符系統按照數據層、應用層和服務層三層結構進行設計,如圖2所示,數據層依托ORACLE數據庫存儲和管理唯一標識符的注冊數據,并利用ORACLE全文檢索技術提供高效的檢索能力;應用層采用J2EE架構,簡化并規范了應用系統的開發與部署,采用標準的WebService接口實現了異構平臺間的互通,有力保證了唯一標識符系統與各省、市圖書館業務系統的整合;服務層面向用戶提供唯一標識符的注冊、解析、機構管理以及數據管理等服務。

圖2 唯一標識符系統結構圖
服務體系建設是唯一標識符體系的核心環節,主要定義了一套兩層的服務模型,即注冊服務層和解析服務層。
( 1 )注冊服務
國家圖書館為唯一標識符體系的中心節點,各省、市圖書館原則上都需要搭建系統環境,省級圖書館為二級服務節點,市級圖書館為三級服務節點。各省、市圖書館根據數字資源建設情況,可以建立唯一標識符的注冊中心,獨立完成本地唯一標識符的注冊和管理。
公共圖書館之外其它有唯一標識符注冊需要的單位,利用相應服務節點軟硬件平臺,申請成為注冊機構,各注冊機構獲得命名授權后方可進行授權范圍內唯一標識符的注冊。
( 2 )解析服務
唯一標識符體系面向全球提供中文數字資源的唯一標識符解析服務。唯一標識符解析包含正向和反向兩種解析模式,正向解析是通過唯一標識符獲取資源的URL地址,該服務面向包括互聯網用戶在內的所有用戶開放;反向解析是通過查詢注冊數據的相應字段獲取資源的URL地址,該服務僅面向注冊機構的用戶開放。
唯一標識符解析體系采用分層解析的策略,系統根據唯一標識符的命名規則,首先選擇指定的服務節點進行解析,如果該服務節點存在異常,則利用中心節點進行二次解析。通過唯一標識符的解析體系,可以實現資源的穩定定位,一個數字化對象的標識符一經產生就永久不變,不隨其所標識的數字化對象的存儲地址等屬性的變更而改變,保證數據在互聯網上的穩定性。
管理體系建設是唯一標識符體系運行的重要保障。建立高效、穩定的管理體系不僅可以實現各級節點數據和機構的有序運行,還可以保障公共圖書館唯一標識符各服務節點的安全穩定。
國家圖書館作為唯一標識符體系中心節點的管理者,提供唯一標識符系統的整體運行策略、標準規范、協調管理、技術支持等保障服務,作為國內唯一標識符行業代表與國際相關機構溝通聯系。管理對象主要為服務節點,負責服務節點的申請、審批和考核工作,并對其提供技術和業務等各方面的指導,保存服務節點成功注冊的唯一標識符數據。
服務節點是唯一標識符體系的重要實施運作機構。服務節點對本節點命名授權下的注冊機構進行管理,負責注冊機構的申請、審核、技術支持和業務培訓工作,為注冊機構提供賬號維護和唯一標識符的注冊、解析、管理和修改等多種服務。各服務節點應配合中心節點完成體系運行的各項輔助工作,協調并處理與注冊機構之間、注冊機構與注冊機構之間的各類數據協同的問題。
注冊機構作為唯一標識符注冊的實體,向相應的服務節點申請,待審批通過以后,注冊機構獲得服務節點分配的操作賬號后,對唯一標識符進行數據注冊、修改、刪除等操作,并自動逐級同步至中心節點備案存檔。
近十年來,國內學者一直在跟蹤和研究唯一標識符技術,已經從理論研究逐漸過渡到應用層面。然而,在圖書館領域,專業技術人才的缺乏和經費支持力度不夠,唯一標識符技術的前期研究僅在少數圖書館開展,其推廣和應用緩慢。
國家圖書館依托數字圖書館推廣工程,聯合全國各級公共圖書館共同建立起推廣工程唯一標識符體系,形成公共圖書館行業的唯一標識符標準規范,以指導行業唯一標識符數據、系統和管理的建設;研制出系統平臺,實現了行業內唯一標識符申請、注冊、解析等各流程的一整套系統平臺應用,以及通過接口擴展兼容國內外平臺,為公共圖書館數字資源的集中揭示和統一調度提供相應的應用支撐;制定出數據、系統、運行的配套管理機制,為唯一標識符在全國各地順利開展應用服務提供行之有效的保障。唯一標識符體系的建成,將推動各地數字圖書館建設的進一步完善,促進全國公共圖書館服務水平的提升。同時,建設我國具有自主知識產權的唯一標識符體系,還可以擺脫公共文化服務領域對國外系統和平臺的技術依賴,這對于保證我國公共文化信息安全也具有重要的戰略意義。
2.R.Moats.URNSyntax.May 1997.http://www.ietf.org/rfc/rfc2141.txt
3.ANSI/NISO Z39.56-1996 Serial Item and Contribution Identifier.http://www.niso.org/apps/group_public/download.php/6514/Serial%20 Item%20and%20Contribution%20Identifier%20%28SICI%29.pdf
4.SICI and BICI: Identifiers for Serials and Books.https://www.google.com.hk/#newwindow=1&q=BICI+SICI&safe=strict
5.Publisher Item Identifier. http://www.ch.ic.ac.uk/ectoc/ectoc_pii.html
6.Digital Object Identifier System. http://www.doi.org
7.Handle System. http://www.handle.net/documentation.html
8.ISO 26324:2012.Information and documentation--Digital object identifier system.http://www.doi.org/ISO_Standard/sc9n475.pdf
9, 10.DOI: Registration Agencies. http://www.doi.org/registration_agencies.html
11.CALIS數字對象唯一標識符命名規范.〔2007-10-09〕http://lib.njtu.edu.cn/pub/bjtu/xswhjl/gnpx/P020071009509903283516.doc
12.全國第五次公共圖書館評估定級綜述.〔2013-09-13〕 http://ceshi.mcprc.gov.cn/sjzz/shwhs_sjzz/shwhs_gzdt/201309/t20130923_391926.htm
13.孫坦等.國家圖書館數字資源唯一標識符規范和應用指南.北京:北京圖書館出版社,2010
14.童忠勇,李志堯,孫秀萍.國家數字圖書館數字資源唯一標識符系統的設計與實現. 圖書館學研究,2013(21):53-58