莫琳芳,李 喆,林永麗,王映紅,張陣陣,甘輝亮
?
·綜述與講座·
數字對象唯一標識符的應用與發展現狀
莫琳芳,李喆,林永麗,王映紅,張陣陣,甘輝亮
數字對象唯一標識符;元數據;解析系統;期刊數字化
細心的讀者會發現,自2016年1月起《海軍醫學雜志》發表的文章參考文獻著錄格式發生了改變,在原有的參考文獻條目后增加了一項編碼,即數字對象唯一標識符(digital object unique identifier,DOI)。隨著大數據時代的來臨,互聯網技術及計算機技術飛速發展,很容易獲取海量的空間目標數據,面對海量的空間數據,人們很難獲取到所要的信息,造成了“數據豐富而信息匱乏”的現象,主要體現在找不到所要的目標,以及檢索到的數據不能滿足需求。分析其原因,在于空間目標存在多種編碼體系,生產者和用戶來自不同的領域,很難實現對目標一致的定位。因此,必須為空間目標進行統一的標識,建立數據生產者和使用者的聯系。DOI作為數字化對象的識別符,對所標識的數字對象而言,相當于人的身份證,具有唯一性[1]。DOI一方面通過數字對象唯一性標識技術對數字對象進行識別和注冊,利用目標標識檢索技術準確地找到目標;另一方面通過地理本體知識的應用,建立了地理信息的語義溝通方式,按照應用本體知識重新組織生產數據,使用戶全面高效地從空間數據庫獲取所要的信息,為空間信息共享開辟了新思路[2]。
DOI包括4個組成要素,即標識符、元數據、解析系統和規則, 通過這些要素,DOI能夠提供數字對象與其元數據,提供數字對象與數字對象(邏輯上相關)之間具體物理位置的鏈接。
1.1DOI的編碼方式
根據美國標準ANSI/NISO Z39.84-2000 DOI的編碼方案規定,一個DOI是由前綴和后綴兩部分組成,其結構式為:
以《海軍醫學雜志》2015年第36卷第1期第1篇解汝慶文章為例,其DOI標識為:10.3969/j.issn.1009-0754.2015.01.001
10.為DOI的特定代碼;
3969為《海軍醫學雜志》DOI注冊代理機構的代碼;
j為雜志(journal)縮寫;
issn.1009-0754為《海軍醫學雜志》的ISSN;
1.2.2 調查方法 培訓專業的調查員,統一說明問卷,保證調查一致性;采取預調查,對問卷進行完善;發放問卷前,告知孕產婦調查目的、內容及問卷填寫方法;采用自填或當面詢問兩種方式完成調查問卷,當場填寫回收。
2015.01.001為2015年第1期第1篇。
1.2元數據
元數據是DOI的組成要素,是促進DOI服務多樣化的必需要素,是有效管理數字權益的基礎。一個完整的標識系統,不僅要標識其在網絡上的入口位置,還要有該位置上對象的具體信息,如所描述資源的題目、載體、作者等相關信息。所有注冊的DOI都要求具有最低限度的核心元數據的聲明,并且公開發布,允許任何用戶的訪問。這種公開是單向的,也就意味著任何用戶都可以免費查詢其所對應的元數據, 但是如果需要從相關的元數據,如題名、作者等,而反向查詢對應的DOI,目前還暫不能實現[4-5]。
1.3解析系統
DOI以2種技術為基礎:handle system和indecs元數據。handle system是用于因特網信息的命名、解析和管理的技術平臺;Indecs元數據是用于在電子商務環境下實現數據互操作的元數據框架。handle system技術包含了多重解析(multiple resolution)的功能,即一個DOI不僅指向一個統一資源定位符(uniform resource locator,URL),還可以指向多個URL,以及URL以外的其他各種類型的元數據。實際上,DOI可以認為是一種統一資源標識符(universal resource identifier,URI)或統一資源名稱(universal resource name,URN),是信息的數字標簽和身份證[4]。DOI的多重解析功能,使得在解析出多個URL時,可以選擇離用戶最近的一個鏡像站點下載數據;同時,還能鏈接到該資源的許多相關信息。多重解析不僅確保了對資源的訪問, 而且有利于資源的深度利用[4-5]。
2.1DOI可實現跨平臺檢索給文章或內容在DOI平臺注冊了DOI號后,可以通過http://dx.doi.org/網站快速定位到其所在網址,方便了檢索查詢,實現了資源的網絡共享,有利于讀者獲得相關資源,提高文章或內容的影響力[7]。
2.2DOI可提高出版的時效性優先數字出版可以提高出版的時效性,提前幾周乃至幾個月快速刊出論文,如果針對數字出版的論文注冊DOI,印刷出版前將論文發布至期刊自身網站或合作檢索系統,這樣文章即可以快速的傳遞最新信息,而且更有利于讀者通過DOI進行檢索瀏覽[8-9]。
2.3期刊可在二次文獻中標注DOI號通過DOI號,可以跨平臺、快速便捷關聯到期刊相關的文獻,進行查詢,方便文獻的快速獲取[10-12]。現行的國際標準ISO690-2010《信息和文獻——參考文獻和信息資源引用指南》中,除規定了電子文獻的著錄內容及格式,還明確指出,對電子文獻,如果具有DOI號,應給予著錄[13]。
2.5DOI具有兼容性DOI系統中,不論何種計算機操作系統,在處理同一數據時能保持處理結果一致,且能與不同時期的技術系統兼容。
2.6DOI可以動態更新DOI系統可對其所包含的元數據、應用和服務功能進行快速和簡便的動態更新,這有利于讀者快速獲得最新信息。
3.1國外情況國外的數字文獻生產商較早采用標識符來標識其出版的電子文獻,并形成了很多在不同環境下應用的標識符方案。例如:ISBN、ISSN、國際標準文本代碼(international standard text code,ISTC)、出版物件標識符(publisher item identifier,PII)等。這些標識符方案大多僅僅定義了標識符名稱空間及標識符構成機制,未構成一個完整的包含解析系統的標識符系統。
美國出版協會(the Association of America Publishers,AAP)于1994年成立了非營利性組織IDF,并制定了DOI的標準以及相應的解析系統handle system[9]。2000 年,CrossRef 成為由IDF授權的DOI 唯一注冊機構,它維護著DOI查詢系統,從而保證其他參與其中的出版商、圖書館、研究者或銷售商能夠實現內容的自動鏈接[14]。超過90%的國外出版商加入了CrossRef系統, 包括主要數字文獻生產商,如Elsevier、Blackwell、JohnWiley、Springer等,他們采用DOI來標注各種類型的內容, 將其廣泛應用于圖書、期刊、學位論文、科學數據、會議記錄、政府文檔、教學參考、會議論文、醫學案例和視頻資料等, 甚至包括各種文獻中的圖表等諸多科技信息資源[15]。 CrossRef利用DOI來實現不同出版商出版的在線學術資源之間高效而可靠的交叉鏈接。根據CrossRef的統計,截止2007年3月2日,參加CrossRef聯盟的出版社和學會已達2 335個,圖書館1 188個,覆蓋的刊物16 884種,發放的DOI數量達到驚人的25 325 745個。截止2012年12月,加入CrossRef的出版社及學會達4 387個,圖書館1 901個,注冊刊物27 791種,發放的DOI總量超過5 500萬。截止2013年4月,單月DOI發放量高達近63萬,檢索量達到3 272余萬次[16-18]。
目前, 西文DOI的發展和應用已經比較成熟,許多機構加入其中, 其中包括了如Elsevier、Springer、JohnWiley&Sons等世界信息服務業巨頭,如Cambridge University Press等小型、非贏利性的行業協會或學會;如CABI Publishing等的二次文獻出版社;如世界衛生組織出版社之類的國家機構或國際組織;以及如日本科技信息所(JST)和德國科技圖書館(TIB)等一些信息服務機構[19-20]。目前,DOI擁有8個RA和幾百個使用單位,跨越了美國、歐洲和澳大利亞以及一些非英語國家,應用領域也擴展到多部門,形成了比較完整的命名、申請、注冊、變更等管理機制,DOI的解析系統發展也比較成熟。
3.2國內情況目前,國內DOI使用處于初級階段,基本上都是一些自定義的標識符方案,尚未形成成熟統一的標識符解析系統。1998年,同方知網在《中國學術期刊(光盤版)》中最先使用了相對規范的唯一標識符。重慶維普期刊全文數據庫和中國醫學科學院合作試驗了SICI的標識方案,進一步實現文摘庫和全文庫的直接鏈接。自2001年起,中國科學院文獻情報中心、國家圖書館等機構開始關注和研究DOI在中文信息資源方面的應用,并承擔了科技部“數字對象唯一標識”課題研究,為中文DOI的推廣和應用奠定了基礎[21]。2007年,中國科學技術信息研究所和萬方數據聯合向IDF申請,取得了DOI的中文注冊權,并在此基礎上成立了中文DOI注冊中心,成為中文信息服務領域的第一個IDF組織下的中文RA。2010年9月至2014年3月,僅與同方知網簽約的優先出版的科技期刊達1 349 種,優先出版科技論文20.587 2萬篇[22]。
趙玲秀[23]根據中文DOI網站發布的信息,對中文DOI的注冊數量、注冊期刊數量和類型、DOI解析等進行分析,結果顯示,至2011年,DOI注冊的核心期刊有376 種,占DOI 注冊期刊總量的27.9%,占2010年版《中國科技期刊引證報告(核心版)》中收錄期刊(共1 946種)的19.3%,核心科技期刊注冊量不足期刊總量的1/5,并且存在著網站數據更新滯后、常用全文數據庫及題錄數據庫不能進行DOI解析,以及元數據準確性不高等問題。
中華醫學會系列雜志編排規范明確規定,中華醫學會系列雜志從2009年第1期開始出版的雜志論文全部使用“10.3760”前綴加注DOI。除消息類稿件外,其他文章均需標注DOI,標注于每篇文章首頁地腳的第1項。中華醫學會系列雜志自2015年第1期起,全部雜志論文的參考文獻引用均需標注該文獻DOI[24]。我刊自2015年第1期起,也遵照該規定執行。
目前,國內大型數字期刊生產商不同程度地使用了DOI,但同國外發展程度相比, 國內的應用仍處于初級階段, 表現在以下幾個方面。
(1)國內的DOI沒有形成統一規范。唯一標識符僅在各自資源范圍內發揮作用, 一旦脫離各自的數據庫, 唯一標識符便成為沒有意義的字符串。目前我國應用唯一標識符的數字期刊出版商主要有同方知網、重慶維普和萬方數據,三者之間并沒有建立統一的標準,各個生產商使用的唯一標識符各異。這導致了中文DOI網站會以不同的注冊關鍵詞公布數據,一旦離開各自的數據庫就很有可能搜尋不到相應資料。不統一的數據內容不僅會造成檢索的不便,同時也會造成數據保存混亂,最終檢索到的數據也會有較大偏差[23,25]。
(2)核心期刊DOI注冊不足。根據田海江等[22]調查發現,在被統計的248種期刊中,已經加入中文DOI的有59種,僅占總數的23.79%。紙質期刊印刷DOI的有43 種,其中能進行全文回溯的僅有4 家,而且已加入中文DOI的59種期刊中,核心期刊僅有21種,占被統計248種期刊總數的8.47%。
(3)DOI的應用層次較低。目前國內DOI的作用僅限于對內部數字對象的標識,尚未建立相應的解析系統和管理機制,元數據提取的準確性不高。國內大多數期刊目前提取元數據仍以手工方式為主,根據中文DOI組織公布的元數據列表,一篇論文從所載期刊到起止頁碼的元數據有23項之多,操作的時間滯后,耗費的人力物力巨大。DOI并不僅僅是一串字符,它是由背后一套完整的機制和系統來保障的,國內目前在科技文獻源頭生產過程中的技術力量缺乏、標準不統一等問題都直接影響后期的元數據采集復用等過程的準確率和數據的使用率[22]。
DOI對數字出版環境有著重要的推動作用。它能溝通出版物和數據庫,有助于實現國際上不同文種信息間的有效融合,延伸同行業中個體間的鏈接空間和合作空間,為鏈接學術研究不同范疇和領域提供了可能[26]。通過DOI與其他標準和技術的集成應用,可以實現知識鏈接從封閉系統向開放系統的轉移,并使鏈接的資源不斷多樣化[27]。從遠期發展看,DOI可能會導致出版業的變革,推動各種基于DOI管理的新數據供應商的產生[28]。因此,積極發展中文DOI系統具有重要意義。中文DOI系統要及時更新數據,在數量迅猛發展的同時提高質量,完善DOI解析,以促進中文數字資源與西文數字資源鏈接與共享的實現。
[2]崔紀鋒,邢春曉,張勇.基于DOI 的空間數據標識及重組織[C].香港:Proceedings of 2011 International Conference on Fuzzy Systems and Neural Computing(FSNC 2011 V5),2011:426-430.
[3]張光威. 提高論文引用率行之有效的工具--數字對象標識符(DOI)[J]. 海洋地質與第四紀地質,2008, 28(4):72,84.
[4]宋丹輝,徐寬.數字對象惟一標識DOI的發展與應用研究[J].圖書館學研究,2006,(8):29-32. DOI:10.3969/j.issn.1001-0424.2006.08.009.
[5]谷琦.數字對象惟-標識DOI的應用研究[J].現代情報, 2009, 29(5):73-76. DOI:10.3969/j.issn.1008-0821.2009.05.020.
[6]周永立.數字版權保護和資源標識問題[J].編輯學刊,2011,(3):83-85. DOI:10.3969/j.issn.1007-3884.2011.03.028.
[7]賀德方,張旭.服務于科技信息資源共享的數字對象唯一標識應用研究[J].現代圖書情報技術,2007,(8):26-29. DOI:10.3969/j.issn.1003-3513.2007.08.006.
[8]吳立宗,王亮緒,南卓銅,等. DOI在數據引用中的應用:問題與建議[J].遙感技術與應用, 2013, 28(3):377-382.
[9]姚戈,王淑華,王亨君.大數據時代DOI的應用意義與中國科技期刊應用現狀[J].編輯學報, 2014, 26(1):63-65.
[10] 宋靜,倪東鴻.如何規范著錄帶有DOI的文后參考文獻[J].編輯學報, 2012,24(1):49-50.
[11] 陳鵬,盧怡,江敏,等.科技期刊參考文獻中DOI的著錄與規范[J]. 學報編輯論叢, 2014,(0):116-119.
[12] 尚利娜,牛曉勇.我國學術期刊參考文獻中DOI著錄現狀分析[J].中國科技期刊研究,2015,26(5):484-487. DOI:10.11946/cjstp.201501050013.
[13] 王衍,陳蓓. 文后參考文獻著錄規范發展趨勢探析[J]. 圖書情報工作, 2012, 56(9):101-104.
[14] 潘松華. CrossRef在數字圖書館中的應用[J]. 圖書館理論與實踐, 2005,(6):63-65. DOI:10.3969/j.issn.1005-8214.2005.06.027.
[15] Park S, Zo H, Ciganek AP, et al. Examining success factors in the adoption of digital object identifier systems[J]. Electron Commer Res Appl, 2011, 10(6):626-636. DOI:10.1016/j.elerap.2011.05.004.
[16] CrossRef[EB/OL].[2007-04-25].http://www.crossref.org.
[17] Crossref.[EB/OL].[2013-01-05].http://www.crossref.org.
[18] Crossref中文官網[EB/OL].[2013-05-07].http: ∥www.crossref.org.cn.
[19] Jan Brase.德國國家科技圖書館科學內容DOI注冊中心研究進展[J]. 中國科技資源導刊, 2008, 40(1):37-39,64. DOI:10.3772/j.issn.1674-1544.2008.01.007.
[20] 蔡焰輝.我國數字資源唯一標識符的發展與應用研究[J].情報探索,2009,(4):62-64. DOI:10.3969/j.issn.1005-8095.2009.04.024.
[21] 田海江,呂建斌,王維朗,等.DOI系統在中國期刊應用的問題及展望[J]. 科技與出版, 2014,(4):105-109.
[22] 趙玲秀.中文DOI系統期刊注冊現狀[J].中華醫學圖書情報雜志, 2011, 20(12):43-45. DOI:10.3969/j.issn.1671-3982.2011.12.014.
[23] 劉冰,游蘇寧,石朝云.數字對象標志符在中華醫學會系列雜志中的應用[J]. 編輯學報, 2009, 21(3):229-231.
[24] 洪瑞. DOI對期刊出版及傳播的影響[J].新聞傳播, 2012,(6):15-16.
[25] 姚長青,喬曉東,趙蘊華,等.DOI在精品科技期刊全文數據庫中的應用[J].中國科技資源導刊, 2008, 40(1):13-15,21. DOI:10.3772/j.issn.1674-1544.2008.01.002.
[26] 賀德方. 知識鏈接發展的歷史、未來和行動[J]. 現代圖書情報技術, 2005,(3):11-15. DOI:10.3969/j.issn.1003-3513.2005.03.003.
[27] 錢建立,吳廣茂.DOI對網絡出版格局的影響[J].編輯學報, 2008, 20(5):431-433.
(本文編輯:彭潤松)
單位]200433上海,海軍醫學研究所
甘輝亮,電子信箱:ganhl2000@sohu.com
G255.2
A
10.3969/j.issn.1009-0754.2016.04.033
[1]何朝暉. 數字資源的“條形碼”[J]. 圖書館工作與研究, 2003,(5):29-31.
2016-04-08)