歐陽寧,王 瑩,謝麗佳(中國藥科大學圖書館)
隨著互聯網的普及,數字對象的內容、生成方式和格式越來越多。數字對象唯一標識符作為互聯網環境下標識及解析數字對象的一種內容識別符系統,[1]具有唯一性、永久性、多重鏈接等特點,能在網絡環境下對數字對象進行標識、定位及管理。[2]數字對象唯一標識符分為靜態和動態兩種類型,如ISBN、ISSN、ISRC等是靜態唯一標識符,而 URL、DOI、CIDF等屬于動態標識符。兩種標識符都有特定的構成規則和專門的管理機構,區別在于靜態標識符缺乏基于網絡的解析,而動態標識符具有網絡環境下分布式解析與管理的機制,是可產生行為的、可解析的、可鏈接的標識符。[3]
動態唯一標識符的特性,決定了應用動態唯一標識符是未來網絡環境下對信息資源進行鏈接及共享的發展趨勢之一。[4]而在動態唯一標識符中,DOI(DigitalObject Identifier)是圖書出版行業公認的唯一標識符事實標準,它的產生是針對ISBN、ISSN及URL標識的局限性,力圖通過唯一標識符、元數據、應用系統的結合,在數字環境下對內容對象進行標識和解析。[5]目前,國外很多大型出版社和全文數據庫均采用DOI作為文章的唯一標識,如Elsevier、Springer、JohnWiley&Sons等,國際 DOI基金會(InternationalDOIFoundation,IDF)已經分配并解析了幾千萬個DOI號碼,并且越來越多的機構在加入這個聯盟中。
盡管多數國外出版社均采用DOI作為文章的唯一標識符,但因其昂貴的費用,所以很多國家也在試圖擺脫IDF的控制并在本地建立類似的解析系統及相關服務。[6]如,中文DOI是在IDF之下注冊的,在國內萬方與IDF共同開展中文DOI的注冊登記工作。可是萬方中文DOI系統與DOI處于不平等的地位,永遠要給IDF交費,目前中國每年需要交納100多萬元的高額費用。[7]2002年,我國科技部科技基礎條件平臺專項資金項目“我國數字圖書館標準規范建設”的子項目“數字資源唯一標識符應用規范”課題組提出建立中國本土的唯一標識符解析框架CDOI系統,[7]并于2012年由中華人民共和國文化部發布并實施《WH/T 48-2012數字對象唯一標識符規范》。[8]本文對CDOI結構及具體的編碼規則進行分析討論并提出自己的設想,希望能拋磚引玉,吸引學者們從更多的角度對CDOI的標識符系統方案進行研究與推廣。
DOI是美國全國研究創新聯合會根據美國出版協會的要求研發的數字對象唯一標識符,以Handle System解析系統作為支撐,在1997年法蘭克福圖書博覽會上首次亮相,后逐漸成為數字資源命名的事實標準。[9]DOI根據數字對象的內容,通過水印或其他技術將數字內容與唯一標識符永久關聯。[10]DOI的結構式為:
與URL不同,DOI實際上是一種URI(Universal Resource Identifier) 或 URN (UniversalResourceName),DOI的多重解析功能可以指向多個相關的URL以及其他類型的元數據,為用戶提供了更多的選擇和便利(見圖2)。[11]DOI的唯一性和持久性,保證了它能提供準確、高效的檢索質量。

圖2 DOI的多重解析
2007年初,中國科學技術信息研究所和萬方數據聯合向IDF申請取得了DOI的中文注冊權,并在此基礎上成立了中文DOI注冊中心,成為中文信息服務領域的第一個IDF組織下的中文代理。
由上表可以看出,中文DOI在后綴中使用多個節點。第一個節點用一位英文字母代表內容的類型,第二個節點可使用ISO標準的標識符方案(如ISBN、ISSN、ISRC等),后面的節點依次為論文的年期號、圖書的章節號、圖片編號、表格編號等。多個節點的應用使中文DOI后綴編碼清楚明了。另外,在中國使用中文DOI解析代理服務器http://dx.chinadoi.cn進行解析,比使用IDF的DOI代理服務器的解析速度更快。[12]
CDOI系統于2012年發布并實施,是基于Handle技術體系建立的數字對象唯一標識符規范體系框架,目標是在國際開放的技術標準和協議的基礎上,建立一個既能與國際主流唯一標識符體系兼容、實現互操作,又能在發展政策、管理運行機制等方面不受制于國外某個商業化系統的唯一標識符體系。[13]CDOI與DOI兼容但獨立于DOI,不受DOI管理規則的約束。
CDOI由前綴與后綴兩部分組成,并用斜線號“/”分開,前綴由兩個層次的命名授權段組成(見圖3)。

圖3 CDOI前綴構成
WH/T 48-2012標準規定,CDOI是一個無任何含義的字符串,能分配給任何類型、格式、載體的對象,如:文本文檔、數據集、錄音帶、音視頻文件等,并且CDOI名稱字符串以及前后綴元素的長度都沒有限制。在同一個前綴元素下的每個后綴都是唯一的,可以是一個順序號,也可采用其他ISO標準的標識符方案,或者非ISO標準但被廣泛認可和使用的標識符方案,以及系統自定義的標識符方案等。[8]
CDOI規范中關于前綴命名的授權由兩個層次的命名授權段組成;CDOI名稱擴展規則規定,當前綴中第二個層次的命名授權段(由唯一標識符專門管理機構分配的注冊機構代碼部分)不能滿足實際中對注冊機構分類和唯一標識的需求時,可對其進行擴展,CDOI解析系統應在技術上支持新的命名授權段分配法。WH/T 48-2012標準規定命名授權段擴展的語法為:name-autority[.sub-name-authority*]。[8]
隨著科技的迅速發展與深入,資源的類型及數量激增,僅僅是通過機構注冊代碼已經很難準確地表達復雜數字對象。例如,曾經發現同一出版社兩種不同的圖書居然注冊同樣的ISBN,若不對名稱進行擴展,這兩種圖書所分配的CDOI號將無法分辨。早在1998年,G.Cleveland就提出,對作者進行唯一標識與為書籍賦予ISBN號一樣重要。國內外相繼有學者一直在研究人員唯一標識符的重要價值與作用,若對數字對象的責任者進行標識,必然大大提升標識符的唯一性。因此本文建議CDOI名稱擴展時采用人名代碼方案。
根據WH/T 48-2012標準,CDOI雖然名稱字符串以及前后綴元素的長度都沒有限制,但是根據超文本傳輸協議HTTP/1.1(RFC 2616)3.2.1,CDOI名稱的長度不宜過長。因此,CDOI前綴中第二個層次的命名授權段擴展所標識的責任者應取排名第一位的人名,團體責任者可仿個人。人名代碼系統有多種選擇,如漢語拼音、著者號碼等,也可參考國內外已研發的科研人員唯一標識符系統。本文采用四角號碼著者標識系統來舉例,作為CDOI命名授權擴展段的人名代碼。如國家圖書館收藏的一本ISBN為978-7-5034-6986-2的梁啟超的著作,可標識為cdoi:CDOI.011001.3334/isbn.9787503469862,其中3334是梁啟超在四角號碼系統里的著者號,這樣CDOI的唯一性大大加強。“機構注冊代碼+人名代碼”方案不僅可以用來表示并幫助識別、定位數字對象的唯一身份,還可以在后期通過二維碼等工具創建持久穩定的“機構+責任者”鏈接。
WH/T 48-2012規定,后綴可以是包含任何字母和數字的字符串。[12]雖然可以將編目信息包含在CDOI編碼中,但是將這些信息包含在系統中沒有語義含義。較為可行的是將其他系統中應用的標識符方案引用到CDOI自身標識符中,如果表示對象同時被多個其他標識符方案標識,可重復著錄資源標識符字段。我國雖已采用多項ISO標準,但除ISBN、ISSN和ISRC外,其他類型如古籍、網絡資源等如何分配標識符系統并未推廣。為避免標識符過長,本文建議CDOI的后綴非ISO標準可參考Calis的《信息資源名稱規范列表》中資源的英文簡稱(見表2),[14]后或隨機生成流水號,或注明網址。但網址中若含有URIdingyide保留字符、不安全字符,應對其進行十六進制編碼。[12]

表 2 信息資源名稱規范列表
二維碼與條形碼一樣,都是CDOI的一種體現形式,二維碼是用某種特定的幾何圖形按一定規律在平面分布的黑白相間的圖形記錄數據符號信息的,是近幾年來移動設備上超流行的一種編碼方式。[15]二維碼的特點是信息容量大,持久耐用。
因此,同一個數字對象不論是紙質版、 PDF版或HTML版都應共享同一個二維碼,只要在使用CDOI的鏈接形式(即CDOI解析服務器地址+CDOI號)制作二維碼時,在頁面中加入不同的鏈接,指向同一數字對象的不同格式。這樣既能方便讀者下載,又能實現對數字對象利用率的跟蹤。另外,根據CDOI描述對象性質的不同,可以一種刊物設計一個二維碼;可以一本書設計一個二維碼;也可以一篇文章設計一個二維碼;文章中的圖、表也可設計個二維碼;或者根據CDOI中的人名代碼將同責任者的資源集中設計成一個二維碼等,手機掃描后自動鏈接到URL地址。
每個數字對象的CDOI一經確定后終身不變,通過二維碼,其對應的數字對象信息以及URL地址都可以更改,只要及時在CDOI系統中進行更新即可。隨著圖書館界對二維碼研究的深入以及二維碼自身安全性技術的發展,未來的CDOI系統也許會開啟二維碼新時代。
綜上所述,國內的數字對象唯一標識符目前有三條道路:一條是向IDF付費并成為注冊代理;另一條是所有的中文數字資源都在中文DOI系統上;還有一條就是自主開發并使用中文數字資源唯一標識符系統CDOI。原則上我們應堅持并大力推廣CDOI,這也是為中國出版界、圖書館界共同遵守的唯一標識符規范打下基礎。[3]但是目前CDOI系統尚在發展之中,并且利益的不均衡多少會造成目前CDOI在國內推廣應用上的困難。CDOI的規范體系的建設與應用,需要國家相關部門的支持,需要出版界和圖書館界的聯合與合作。[16]
[參考文獻]
[1]祝清松.國內外數字對象唯一標識符應用現狀述評 [J].情報科學,2012(8):1254-1257.
[2]毛軍,等.URI和數字對象唯一標識符[J].現代圖書情報技術,2003,19(2):9-12.
[3]宋文,等.CDOI規范及在國家圖書館的應用[J].現代圖書情報技術,2008(10):1-5.
[4]劉怡辰,等.科技期刊論文參考文獻著錄DOI的重要性[J].科技與出版,2013(11):90-91.
[5]胡新平.文獻資源云平臺構建研究[J].情報理論與實踐,2012,35(4):81-84.
[6]毛軍,等.試論我國數字資源唯一標識符發展戰略[J].現代圖書情報技術,2005,21(2):1-4.
[7]任瑞娟,等.中文DOI路在何方——從參考文獻著錄與DOI的關系探討中文數字對象唯一標識符的發展方向[J].中國圖書館學報,2010(2):115-121.
[8]WH/T 48-2012,數字對象唯一標識符規范[S].北京:中華人民共和國文化部,2012.
[10]竇建爽.日本CIDF的實施及對我國數字內容標識符的影響研究[J].中國環境管理干部學院學報,2010(6):75-78.
[11]潘松華.CrossRef在數字圖書館中的應用[J].圖書館理論與實踐,2005(6):63-65.
[13]夏翠娟.數字對象唯一標識符DOI與 CDOI[EB/OL].[2017-06-02].http://www.docin.com/p-961199408.html.
[14]CALIS數字對象唯一標識符命名規范[EB/OL].[2017-05-31].http://www.doc88.com/p-779438 3815020.html.
[15]趙迪,李振婷.二維碼技術在OTO商業模式中的應用分析[J].中國管理信息化,2014(9):90-92.
[16]蔡焰輝.DOI系統在數字圖書館建設中的應用[J].情報探索,2010(4):89-91.