999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中外文獻數據庫資源與知識服務探析

2016-05-14 11:23:50趙曉黎孫濟慶李楠
現代情報 2016年8期

趙曉黎 孫濟慶 李楠

〔摘要〕本文從數字出版和知識服務技術的角度,對中外文獻數據庫進行比較分析,發現由于發展歷程不同,導致中外文獻數據庫的特征形式不同,在資源和知識服務方面存在差異。

〔關鍵詞〕中外文獻數據庫;文獻資源;知識服務;技術服務

DOI:10.3969/j.issn.1008-0821.2016.08.001

〔中圖分類號〕G25074〔文獻標識碼〕A〔文章編號〕1008-0821(2016)08-0003-07

〔Abstract〕This article compared and analysed the literature databases at home and abroad from the perspective of digital publishing and technology service.It was found that as the development history of the databases were different,the characteristics of Chinese and foreign literature database were different either.So there were differences in resources and knowledge service.

〔Key words〕chinese and foreign literature database;literature resources;knowledge service;technology service

對文獻數據庫的研究是專業領域關注的重點之一,其研究主要探討數據庫的檢索功能、資源收錄情況、檢索效率與服務功能[1-5]。而文獻數據庫作為數字出版的具體產品形態之一,還缺乏從其原始出版的角度對其進行探究。本文擬以中外科技文獻全文數據庫為研究對象,選取國外SpringerLink數據庫和ScienceDirect數據庫,以及國內使用較為廣泛的萬方數據庫和維普數據庫,以數字出版為視角,探析中外科技期刊全文數據庫資源的差異;通過研究對比知識服務技術方面的不同,探索技術應用前景;為相關領域的專業人員了解中外科技文獻全文數據庫、為國內數據庫的深入發展提供借鑒。

1中外文獻數據庫的出版差異探析

11中外數據庫發展歷程

中外數據庫的發展歷程有較大的差異,形成了不同的特征。從國外文獻數據庫出版發展歷程看,其與紙質文獻具有很清晰的出版脈絡。數據庫出版的產品都以紙質文獻出版為基礎,主要文獻數據庫的出版商基本就是紙質文獻的出版社。因此,憑借著深厚的內容資源,這些傳統出版商根據自身的特點和優勢,形成了文獻資源規模大、品種穩定、文獻更新速度快等特征。如,德國的施普林格集團以及荷蘭的愛思唯爾集團,都是大型的數據庫出版商。他們旗下的SpringerLink和ScienceDirect數據庫是傳統的出版集團進行數字化轉型的成果之一。

同發達國家相比,我國數據庫產業起步較晚,90年代進入市場化運作[6]。我國傳統出版商規模較小,擁有的內容資源有限,因此缺乏進行數字化轉型的動力。在我國,形成了一批第三方文獻資源集成的數據庫商。萬方數據庫和維普數據庫都是由科技公司主導的文獻資源集成的數字出版形態。他們將傳統出版商或其他機構的內容資源集成在一起,形成一個專門提供各種類型電子文獻資源的集成平臺,而不是內容出版者。從出版的角度來講,萬方數據庫和維普數據庫并不是真正意義上的數字出版。其優勢在于集成資源數量規模要大于國外文獻數據庫;但其內容更新速度受到出版社的阻礙,往往容易產生很多知識產權的糾紛,影響文獻收錄的穩定性。

12文獻資源探析

內容資源是文獻數據庫的基礎。中外全文數據庫的發展歷程不同,導致這些文獻數據庫的數據源也有很大不同。

121文獻資源的數據源差異

國外文獻數據庫由出版集團主導,因此其數字資源大部分是出版集團自身的紙質出版物,他們是文獻數據庫的數字資源來源和基礎。如ScienceDirect數據庫將愛思唯爾出版社出版的2 500多種期刊和11 000多種圖書數字化出版。而SpringerLink數據庫的數字資源也大部分來自施普林格出版集團出版的2 000多種學術期刊和超過7 000多種圖書數字出版產品。

相比之下,國內的主要文獻數據庫數字資源來源于對已出版的紙質文獻進行二次加工,使之數字化。如萬方數據庫和維普數據庫就是將紙質文獻資源掃描后進行數字化處理,形成數字資源。

122文獻的數量與品種差異

國外全文數據庫收錄的大部分都是出版集團出版的刊物,數量是有限的。而國內全文數據庫屬于集成平臺,形成的期刊資源規模更大。

SpringerLink數據庫是目前全球最大規模的電子圖書數據庫,目前可檢索到圖書約為210 000本。而ScienceDirect數據庫包含34 000余種圖書,且數量不斷增長。國外數據庫的電子圖書更新速度也較快,2016年5月檢索發現數據庫中已經出現2016年出版的新圖書。萬方數據庫中收錄了約為48 000余種圖書,但早在2013年12月6日停止更新,而維普數據庫沒有收錄圖書。

國內的集成平臺收錄的期刊資源規模比國外更大,如萬方數據庫,除了收錄期刊論文,還收錄了包括專利、報告、地方志等內容在內的多種資源。另外,國外數據庫出版商同時出版的期刊和圖書被收錄在同一數據庫,但國內數據庫的電子期刊和電子圖書是分開收錄的。國內數據庫的文獻資源擴展取決于數據庫商的版權談判能力與規范化程度。

123數字資源時滯性的差異

由于數字資源與紙質資源形成方式不同,國內數據庫文獻具有明顯的時滯性。而以數字出版為主體的國外數據庫往往不存在時滯現象。筆者于2016年5月9日,在ScienceDirect數據庫中,以愛思唯爾出版集團出版的期刊《Omega》為對象,查看其在數據庫中的最近更新。檢索發現:最新的文章于2016年4月30日以在編文章(article in press)的形式出現在ScienceDirect上,也就意味著《Omega》期刊已經錄用該論文,同時分配有DOI號碼,可以立即被引用。而在SpringerLink數據庫中,以《Academic Psychiatry》期刊為例,檢索到最新刊載的文獻為2016年5月第2期40卷,另外,在線優先出版的文獻更新到2016年5月8日。國外數據庫均不存在數字文獻的時滯現象。

排除掉國內全文數據庫的優先出版情況,筆者以《情報理論與實踐》及《情報雜志》兩種期刊為例,于2016年3月8日,分別在萬方數據庫和維普數據庫進行檢索查詢,發現:在萬方數據庫中,《情報理論與實踐》的最新一期為2016年3月刊,而《情報雜志》的最新期刊則為2016年1月刊;維普數據庫中,《情報理論與實踐》最新一期為2016年3月刊,而《情報雜志》則為2015年2月刊。紙質期刊實際出版時間與網上電子資源出版時間的時間差至少為2個月。國內文獻數據庫的電子資源具有一定的時滯性。

中外文獻數據庫在時滯性上的差異,原因在于:

(1)由于是第三方集成,在版權交易過程中為了保護傳統出版社的利益,保證紙質文獻的經濟效益,數據庫中的電子文獻必須晚于傳統紙質出版物的發行;

(2)第三方集成平臺將整合的各類文獻資源數字化,并存儲至數據庫中需要一定時間,因此會出現一定的滯后性。

124OA期刊出版的差異

國外全文數據庫在開放獲取運動中扮演了重要的角色,在開放獲取開始被學術界認識和利用的過程中,各大文獻數據庫出版商也積極出版OA期刊和論文,實現學術的無邊界共享,推動了開放獲取運動的發展[7]。

SpringerLink數據庫包含了3個開放獲取出版平臺。以BioMed Central Group為例,在BMC出版的280多種經同行評議的開放獲取期刊中,有近180種期刊被SCI收錄,其中175種期刊獲得影響因子。而在ScienceDirect中的3800多種電子期刊,有500多種是開放獲取期刊。

國外全文文獻數據庫出版OA期刊的數量較多,占數據庫期刊總量的比重也較大,這說明經過較長時間的發展,OA期刊在國外得到了一定的認可,發展態勢良好。國外文獻數據庫中出版的OA期刊經過嚴格的同行評議制度,被SCI收錄,具有較高的影響因子和學術影響力。

像萬方和維普這類全文文獻數據庫,由于是第三方集成,沒有出版權限,缺乏自行出版的OA期刊,只能提供OA期刊和論文的鏈接。目前我國提供OA期刊資源的平臺主要有中國科技論文在線及中國科技期刊開放獲取平臺,這些平臺支持OA期刊的出版,也整合各種中外的OA資源。萬方數據庫中提供約為270萬篇OA論文的鏈接,這些OA論文主要來源于DOAJ、PubMed、SRP等平臺。

2中外文獻數據庫知識服務技術探析

隨著知識交流的加深,文獻數據庫除了提供大量優質、及時的文獻資源,深化多元化的知識服務成為文獻數據庫技術新的發展方向。數據關聯與計量可視化是知識服務技術應用的主要方向,本文擬從此角度對中外文獻數據庫開展知識服務作探析。

21文獻數據庫中的數據關聯

文獻數據之間的關聯是文獻數據庫采用知識服務技術的主要方式,此類關聯可分為文獻外部特征關聯與文獻內容特征關聯[8]。

211文獻外部特征關聯

文獻外部特征的關聯,是指通過文獻作者、機構、刊名等文獻外部特征數據相互之間的關聯。從其特征分析這是一種淺層次的關聯,主要通過文獻固有的外部特征詞的相互匹配。此類關聯目前在中外文獻數據庫中具有普遍性,如作者關聯。

數據庫中的作者關聯可以是同作者的文獻關聯,或是相關作者關聯。

同作者的文獻關聯,即可反映某一作者所著的所有文獻。這是作者關聯中最常見的關聯模式。通過這種關聯,可以查閱到數據庫收錄的該作者的所著文獻,從而了解某一作者的研究內容及研究現狀。

有些數據庫還提供同作者的信息關聯,關聯到作者的信息中,除了作者單位、聯系方式等,還包括作者的H指數、總發文量、總被引量等信息。這些信息是判斷作者影響力的直觀指標。

相關作者關聯,即關聯到與某文獻內容相關的其他文獻的作者。這種相關性是基于合作、引證或內容相似等關系形成的。若兩個或多個作者之間合著過文獻,則認為該兩個或多個作者存在合作相關關系;在相互引證的文獻中,某些研究內容可能有相似或重合的部分,即可認為這些文獻的作者存在著引證的相關關系;而內容相似則是從文獻整體內容上,如果某兩篇或多篇文獻中包含相似或相同的主題特征詞,則認為這些文獻的作者存在關聯。

以萬方數據庫為例,通過文獻《當前階段我國科技期刊數字出版盈利模式探析》一文,得到的結果頁面顯示“作者”可以實現跳轉(見圖1);任意點擊某作者,顯示出數據庫中收錄的該作者所有的文獻(見圖2)。另外,萬方數據庫中的“相關學者”為讀者提供了與原文獻作者相關的學者,這種相關性是通過原文獻中前兩個關鍵詞的“或”關系得到的,“相關學者”數量較多。

作者關聯是數據庫常見的關聯形式。通過這種關聯可以很好地掌握某一作者的具體研究內容及關注點;通過“相關作者”了解在該研究領域內其他相關的研究人員,并可以繼續了解這些學者的具體研究內容及關注點。通過這種循環往復的關聯過程,使得以“作者”為中心的各種知識如網狀鋪開,知識的關聯性得到加強,從而擴大了檢索的范疇。

212文獻內容特征關聯

內容特征關聯是基于文獻內容主題領域之間的關聯。根據不同的關聯方法,筆者將其分為3個層次,內容關聯由淺到深可分為:引文關聯、特征詞關聯以及內容擴展關聯。

(1)引文關聯

引文雖然也可歸屬于文獻的外部特征,但其卻可以反映文獻主題領域。引文關聯是基于文獻外部特征性質的淺層次的內容關聯。通過引用和被引的角度,使得相關文獻關聯起來,形成文獻知識鏈,不僅可以追溯到文獻的知識源頭,還可以掌握課題知識領域發展的脈絡和方向[9]。

在現有的中外數據庫中,包含了非常豐富的引文關系。在文獻顯示頁面可以找到文獻的引用文獻及引證文獻。通過這些引用和引證文獻,還可以了解文獻之間的共引關系及同被引關系等。

以ScienceDirect數據庫為例,文獻Digitisation of publishing:Exploration based on existing business models共69條參考文獻,這其中能被ScienceDirect數據庫收錄或實現跳轉的都可以直接關聯(見圖3)。除此之外,文獻的引證文獻(見圖4)也被列出,點擊每篇文獻,則會跳轉到具體的全文中,點擊“view more articles”,則會跳轉至Scopus數據庫,顯示出所有引證文獻的題錄信息。圖3ScienceDirect數據庫中的參考文獻的關聯

圖4ScienceDirect數據庫中引證文獻的關聯

中文數據庫也有類似的引文關聯功能。但中外數據庫中最大的差異在于:提供具體引文信息的數據庫有所不同。萬方數據庫和維普數據庫得引文關聯都是通過數據庫內部提供,這是因為國內數據庫是第三方集成平臺,擁有大量的文獻集成資源,這些關聯的引文都收錄于數據庫內部。而國外的數據庫是由出版商主導的數字出版,收錄的文獻包括本出版集團出版的文獻、以及少數其他出版集團的文獻;而一篇文獻的引用文獻或引證文獻涉及的范圍很廣,同時被該數據庫收錄的可能性較小,因此需要跳轉至其他數據庫。如ScienceDirect數據庫就是利用Scopus隸屬同一家公司實現在ScienceDirect中引文關聯,再由Scopus鏈接至具體文獻的全文內容。

(2)特征詞關聯

特征詞是文獻中反映文獻內容特征的詞。在中外數據庫中,普遍包含的特征詞之間的關聯,主要有關鍵詞關聯及相關詞關聯。

中文數據庫中的關鍵詞是作者對文獻內容特征標引的詞,是文獻中客觀存在的詞。關鍵詞往往反映了一篇文獻的主要研究內容。國外數據庫中的特征詞包含了作者關鍵詞和數據庫標引詞。在國內數據庫中,關鍵詞關聯的主要形式是基于相同關鍵詞的文獻關聯,即關聯到其他以該關鍵詞標引的文獻。以維普數據庫為例,點擊具體的關鍵詞,就會顯示出所有以該關鍵詞為標引的其他文獻的題錄信息(見圖5)。圖5維普數據庫中關鍵詞關聯

相關詞關聯是另一種特征詞關聯的關聯形式。中外數據庫在此關聯中略有差別。

如萬方數據庫中的相關詞關聯是指“相關檢索詞”關聯。在萬方數據庫中,系統會推送出多個與該文獻相關的檢索詞(見圖6)。圖6萬方數據庫中的相關詞關聯

在SpringerLink數據庫中的相關詞關聯是指“相關概念”關聯,文獻中包含的某些概念或相似概念都會被列舉出來。這些概念往往都經過規范化處理。讀者通過相關概念詞,可關聯到該概念的其他文獻。從一篇文獻挖掘出一部分相關概念,再將這些概念融合到其他文獻中,再通過其他文獻發掘其他相關主題概念詞,從而形成一種主題網絡,了解主題之間的關系,查閱與研究有關的文獻整體概貌,以提升數據庫的知識服務水準。

(3)內容擴展關聯

內容擴展關聯屬于深層次的內容特征關聯。其主要是通過某一篇文獻內容,分析該文獻所屬研究領域,提取具體研究內容概念,實現與類似研究文獻之間的關聯。

由于內容擴展關聯技術難度較大,目前中文數據庫對內容擴展關聯功能應用處于起步階段。相較之下,國外數據庫的內容擴展關聯有一定程度的應用。以SpringerLink數據庫為例,該數據庫提供某篇文獻的研究主題以及所屬行業領域(見圖7)。這些主題及行業領域都是以主題詞表進行規范化標引的,專業性較強。通過一篇文獻,就可以清楚了解該文獻研究包含的主題,了解該文獻涉及的產業領域,通過這些關聯,還可以找到該研究主題或產業領域的其他相關文獻,從而擴展了原文獻的內容。

從引文關聯到特征詞關聯再到內容擴展關聯,是中外數據庫中內容關聯由淺入深的關聯。也是數據庫知識服務技術應用由淺入深的具體表現,中外數據庫都在利用各種技術進行深化數據庫的知識服務。

22文獻數據庫中的計量與可視化

計量功能主要是應用文獻進行計量分析與評價,從直觀的數字形式來表達文獻內涵的規律。可視化應用則是對圖7SpringerLink中內容擴展關聯

文獻內涵的知識或計量的結果圖形的形式表達,以更直觀地表達出數據或知識之間的關系。

221數據庫的計量功能

文獻計量是中外數據庫中的較為普遍采用的功能。從整體上分析,計量功能的應用主要分為兩種:一是簡單的計數統計。這種計量方式普遍存在于中外數據庫中,如文獻瀏覽量、下載量、學者發表的文獻數量等,這些客觀數據是反映用戶行為,不經過模型計算,并且隨時間的動態變化。

另一種計量是指特定模型下計量評價分析,提供的數據指標往往是經過計算過程的得出的,也是一種動態數據,其具備評價功能。如H指數,可評價學者的學術能力;影響因子可了解期刊的學術影響力等。

目前中文數據庫都是采用數據庫內部數據完成計量功能,而國外數據庫則是利用外部計量工具完成計量,如利用bookmetrix,對SpringerLink數據庫中的圖書信息進行計量。

222數據庫的可視化工具

為了增強用戶體驗,更直觀表達數據之間的相互關系,可視化處理成為中外文獻數據庫重要的發展的趨勢之一。可視化主要包括3種形式[10]:縱向可視化,用于表示某一特征的隨時間變化的狀態;橫向可視化,用于表達在同一時間狀態下不同特征之間的相互關系;交叉的可視化,則將縱向時間軸與橫向特征軸相結合后的總體數據狀態。

國內數據庫對可視化運用較多,各種簡單計數統計都可以用縱向或橫向可視化表示。如在維普智立方中,以“文獻數據庫”為檢索對象,則可分別進行橫向與縱向圖形展示;利用360°網絡圖,則可將多種橫向分析進行交叉分析,得到包含如研究領域、機構、所屬學科、作者、題名、期刊等文獻特征的網絡關系圖,以此了解各個文獻特征之間的關系及關聯情況。圖8萬方數據庫“文獻數據庫”的360°網絡圖

而國外數據庫內部的圖形展示有一定局限。如,SpringerLink數據庫中,利用可視化功能可進行主題詞關聯,分析文獻主題概念詞之間的關聯信息以及相關的文獻信息。圖9SpringerLink數據庫中可視化關系圖

由于可視化功能受到越來越多的重視,因而數據庫商專門編輯出版了一些專業化的文獻計量與可視化工具,如Citespace、HistCite等,這些工具可將從數據庫中導出的文獻數據進行分析并進行可視化處理。

3結語

本文從出版角度分析了中外文獻數據庫不同的發展歷程,可以發現國外文獻數據庫是以數字出版為主,多以出版集團的出版物為主構成數據庫的文獻資源。由于出版機構有嚴格的同行評議制度,文獻質量都能得到很好的控制。而國內文獻數據庫基本屬于第三方文獻集成的數據平臺,匯集各類資源運用數據庫技術提供服務,其并不擁有文獻的版權。但由于集成的原因,導致數據源、文獻時滯性和有關OA期刊的出版,都有很大的不確定性。

正是由于發展歷程的不同,也導致了中外文獻數據庫在數據關聯與計量可視化應用方面存在較大差異。國外數據庫是出版集團主導的,因此更加注重數據庫的內容資源的加工質量,引文關聯、計量與可視化基本都是通過外部專業軟件來進行的。而國內數據庫以科技公司為主導,偏重技術層面,在內容加工方面缺乏經驗;而在擴大數據庫的使用功能,多樣化各類文獻的關聯,開發計量和可視化功能等方面具有一定優勢。

參考文獻

[1]章亞娟.互聯網上三種外文期刊數據庫的文獻檢索比較研究[J].圖書情報工作,2003,(5):77-79,86.

[2]袁小翠.網絡信息搜集工具分析之CNKI與重慶維普的比較[J].科技廣場,2012,(4):156-159.

[3]江洪,王微.國內外數據庫平臺用戶信息服務功能比較研究[J].圖書館學研究,2014,15:72-77,83.

[4]譚捷,張李義,饒麗君.中文學術期刊數據庫的比較研究[J].圖書情報知識,2010,(4):4-13.

[5]王軍輝,李丹亞,余希田,等.國內外部分文獻數據庫檢索系統相關文獻功能淺析[J].中華醫學圖書情報雜志,2010,(5):68-71.

[6]羅曼.數據庫出版發展研究[D].武漢:武漢理工大學,2013.

[7]初景利,李麟.國內外開放獲取的新發展[J].圖書館論壇,2009,29(6):83-88.

[8]王曰芬.面向知識服務的信息分析及應用研究——以文獻數據庫為來源[J].情報理論與實踐,2011,(3):54-57,34.

[9]周健.網絡文獻數據庫知識服務功能及其評價研究[D].鄭州:鄭州大學,2012.

[10]趙丹群.試論學術期刊文獻數據庫計量分析功能的開發[J].圖書情報工作,2008,(10):45-47,96.

(本文責任編輯:馬卓)

主站蜘蛛池模板: 黑色丝袜高跟国产在线91| 免费xxxxx在线观看网站| 99精品免费欧美成人小视频| 2020国产精品视频| 国产精品九九视频| 女人18毛片久久| 国产高清无码麻豆精品| 91在线激情在线观看| 色偷偷一区| 四虎成人精品在永久免费| AV老司机AV天堂| 亚洲色偷偷偷鲁综合| 99青青青精品视频在线| 波多野结衣久久精品| 亚洲国产成人精品青青草原| 97精品国产高清久久久久蜜芽 | 国产成a人片在线播放| 日本三区视频| 亚洲一区二区三区国产精品| 亚洲无码高清免费视频亚洲| aⅴ免费在线观看| 中文字幕永久视频| 爱爱影院18禁免费| 综合社区亚洲熟妇p| 亚洲欧洲日韩久久狠狠爱| 99青青青精品视频在线| 久草美女视频| 国产伦片中文免费观看| 亚洲成年网站在线观看| 亚洲精品欧美重口| 国产成人综合亚洲网址| 成人永久免费A∨一级在线播放| 久久先锋资源| 国产流白浆视频| 国产玖玖视频| 啪啪免费视频一区二区| 国产美女自慰在线观看| 国产主播喷水| 伊人久久大香线蕉综合影视| 亚洲欧洲日产无码AV| 日韩人妻少妇一区二区| 国产精品网曝门免费视频| 99中文字幕亚洲一区二区| 99久久精品免费视频| 国产成人精品一区二区三在线观看| 亚洲人成网站观看在线观看| 久久久久无码精品| 亚洲国产第一区二区香蕉| 精品伊人久久久香线蕉| 国产丝袜第一页| 国产91无码福利在线| 亚洲精品国产日韩无码AV永久免费网 | 亚洲国产欧洲精品路线久久| 99热这里只有精品免费| 欧美精品成人| 在线国产三级| 2022精品国偷自产免费观看| 国产成人亚洲无吗淙合青草| 青青草原国产精品啪啪视频| 国产精品亚洲专区一区| 免费人成在线观看成人片| 欧美精品1区| 亚洲男人的天堂在线观看| 老司机精品一区在线视频| 国产精品免费久久久久影院无码| 乱色熟女综合一区二区| 成年A级毛片| 2020国产精品视频| 日韩人妻精品一区| 男人天堂伊人网| 国产原创自拍不卡第一页| 欧美激情第一区| 99热这里都是国产精品| 欧美亚洲日韩不卡在线在线观看| 久久综合亚洲色一区二区三区| 欧美黄色a| 国模沟沟一区二区三区| 国产午夜一级毛片| 亚洲第一视频网站| 在线欧美a| 91九色国产在线| 亚洲自偷自拍另类小说|