文/湄洲灣職業技術學院 鄭劍雄
圖書情報領域數據引用行為分析
文/湄洲灣職業技術學院 鄭劍雄
本文對圖書情報領域數據引用行為進行分析,為了能得到科學確切的結論,本次研究采取了等距抽樣法和內容分析法,對《中國圖書館學報》《情報學報》《大學圖書館學報》這3種權威期刊中的數據引用展開研究。從研究中發現,數據引用中存在很多問題,例如引用數量過少或是引用過多、不規范數據的大量引用等問題,近幾年雖然有所好轉,但仍需要進一步改善。
圖書情報;數據引用;行為分析
隨著數據在科學研究中的重要性越來越突出,數據管理與共享工作受到了重視和提升。但在實際引用中,管理機制以及評價機制等不夠完善,數據管理與共享工作的技術不夠成熟,規范性較差,加之作者以及管理機構的不重視,導致數據引用行為還存在一些問題。為了解決這些問題,需要對圖書情報領域數據引用行為進行調查分析。
本次研究采用等距抽樣法,對《中國圖書館學報》《情報學報》和《大學圖書館學報》這3種圖書情報權威期刊進行了統計研究,研究的對象為這3種學報在2003至2013年11年間的1290篇論文,這3種期刊的每期論文發表數量相近,在領域內具有一定的權威性。
運用內容分析法來研究這些論文的數據引用情況,因為在數據引用期間格式不夠規范,導致其在識別期間只能人工識別,不能應用機器。在進行人工識別之前,培訓標引員掌握明確細致的數據處理規范和基本的標注方法,給兩個標引員提供相同的樣本材料進行標注,并把標注結果進行比較,以確保分析結果的客觀可靠。數字在論文中的出現很明顯,也是數據引用的基本特征,但是并不是所有的數字都是數據引用,如由數字組成的公式就不是數據引用,此外還有其他復雜情況,需要準確判斷、認真分析。
合理對數據引用以及事實陳述進行區分,相比較數據引用來講,事實陳述過多包含背景介紹,所以經常出現一些數字形式。如“1997年、三年來”等,并不是數據引用。有時數據引用和事實陳述的邊界比較模糊,很難辨別。需區分數據引用與數據提供。有的時候數據并不是引用的,而是論文作者自己提供的,是其獨立的研究成果。分析這類數據需要認真閱讀文獻。把文獻計量學作為主要研究方法的作者,會大量分析數據,這種情況也不屬于數據引用。
數據的引用情況根據實際情況以及問題,可以從規范、部分引用角度劃分,同時還包含無引用。對于規范引用一定要保證其完整,并且可以從中尋找到原始數據,對于這種形式比較常見的為標注或是參考文獻。其中的部分引用是指數據信息不完整,只有大致的數據來源,難以找到原始數據。如“麥肯錫公司調查發現”。無引用是完全不知道數據來源,只是簡單的羅列數據,如“據統計”“據調查”等。
(一)總體數據及分析。通過對11年間3種權威期刊數據引用情況進行分析,可以發現在2008年以前論文平均的數據引用次數是1到2次,到了2009年引用次數有了大幅度的提高,到了2013年,平均每篇論文數據引用達到了2.7次,這說明圖書情報研究領域越來越重視數據引用。在這11年間,3種權威期刊的論文的數據規范引用比率,介于50%和80%,平均規范引用比率為67%。其中2003和2004這兩年的規范引用比率低于50%,2012年規范引用比率高于80%,是這11年間最高的??偟膩碚f,2008年之前的規范引用比率較低,到了2009年后規范引用比率大幅度上升。此外這3種權威期刊在這11年間部分引用比率較低,但無引用比率還是很高,這說明人們越來越重視數據的規范引用,但不規范的數據引用行為仍然存在。
(二)期刊比較分析。在這十一年間《中圖學報》的論文刊載量雖然在逐年減少,但其平均每篇論文數據引用次數在2009年后大幅度提高,不規范引用的行為逐漸下降,最終低于規范引用的行為。根據上述內容可以看出,《中圖學報》在2009年期間數據引用至關重要,在此之后,數據引用的幅度逐年遞增?!洞髨D學報》的論文刊載量較為穩定,在這11年間平均每期刊登20篇論文,其規范引用比率由2007年的50%提高到70%,仍需提高?!肚閳髮W報》的每期論文數量雖然在逐漸下降,但論文的頁數和篇幅都有所增加,這些論文不僅包括文字,還有很多圖、表、公式等,論文質量有明顯的提高。但是論文的數據引用次數不高,這說明科研數據沒有被充分利用,在2008年以后其論文規范引用情況增多??偟膩碚f,這3種期刊在2008年以后,引用次數、規范引用情況都有所提升,《情報學報》的表現最明顯。
(三)論文比較分析。通過調查分析可知,這3種權威期刊的論文數據引用次數較少,大多在5次以下,數據引用行為在論文中的普遍程度還不高。通過對這些論文的分析還發現,數據引用行為多的論文主要是以資料提供為主要內容的,很少有論文以數據為基礎進行寫作。這一情況的產生原因是相對于原始數據、數據的比較和借鑒,人們更重視論文的研究寫作方法和成果。即使有的論文提供了數據,這些數據成果也因為各種原因,沒有得到廣泛的引用。
(一)數據引用的數量過少。根據上述闡述以及近些年的信息技術應用分析來講,在圖書資源管理過程中,信息技術起到重要作用,這擴展了圖書館信息服務的領域,方便了相關學者的研究。當然對期刊的質量也提出更加嚴格的要求,期刊中涉及的學術、數據以及信息等都要保證準確,并且具有可探索價值,正因為如此,期刊發展開始朝著成熟的方向進步,引用期刊的數量也在不斷增加。當然其中也存在一定的問題,大量數據沒有得到有效利用,數據的可獲得性較差。大量數據沒有得到有效利用。信息化時代下,數據庫的種類、數量在不斷增多,數據庫提供的數據、信息也十分豐富。但是人們剛進入信息化時代,還沒有學會合理利用這些數據、信息,不能在豐富的信息中獲得更多有用的情報。數據信息資源的結構不夠合理,導致信息內容繁雜,不能很好地為需要者提供有效的信息,并且科研數據方面也需要進一步改善。學術研究期間,學生需要大量的研究數據進行分析,在數據研究結束之后,還需要將這些數據進行科學整理,將其進行公布,但在實際公布,很多數據已經不是原始數據。這使后來研究相關論題的學者,只好重新收集處理數據,大大降低了科研效率,浪費了大量的人力、物力和財力。要解決這個問題就要建立完善成熟的激勵機制,促進科研中數據信息的交流分享,改變部分學者保密數據的心理。數據可獲取性不高。圖書館中的文獻資料主要分為兩種:紙質文獻與數據庫文獻。數據庫文獻與紙質文獻相比,能更有效地查找文獻,但是運用數據庫描述介紹文獻大多根據關鍵詞、引文,而很少通過文獻的題名、卷期和機構。
(二)不規范數據的大量引用。當前不規范引用數據的情況大量存在,在寫作過程中需要引入文獻,也會引用到數據,雖然已經說明了數據來源,但因為缺乏數據引用規范和數據應用格式的認識,導致數據引用不規范、信息著錄不完善。標注數據來源時較為隨意,導致論文作者和原始數據很難查找。當前作者、期刊和相關機構缺乏對數據引用規范性的認識,使論文的數據引用不規范,或處于“默認式”境地。所謂不規則數據引用,其在引用上主要劃分為非規范、無引用。很多寫作人員在進行寫作的過程中雖然引用了相關數據,但并沒有對這些數據及其來源進行規范引導和清晰解釋。數據的引用格式也存在問題,使數據信息不能在論文中全面展示。無引用。很多作者在寫論文時,沒有詳細標注引用數據及其來源。針對這種情況,學術期刊等機關應該建立完善數據引用規范,作者也要重視這個問題,對引用數據進行類似參考文獻的標注。為了解決這個問題,作者應該明確聲明介紹數據的來源,相關部門建立完善數據引用的格式、規范,并把這些格式、規范統一,這種方式便于數據組織和檢索
總之,圖書情報領域的數據引用對圖書管理等工作非常重要,在科學管理基礎上,逐漸開始朝著規范化以及嚴謹化方向轉變,雖然期間存在一些不規范引用的情況。產生這些問題的原因主要有數據公開程度低、可獲得性差,機構和作者不夠重視等。要解決這些問題就要建立規范穩定的數據倉儲,制定規范的數據引用格式,建立完善激勵機制,鼓勵數據共享,使數據引用進一步發展,推動我國的科學研究走上新的臺階。
[1]宮磊.圖書情報領域數據引用行為分析[J].經營管理者, 2016(24).
[2]丁楠,丁瑩,楊柳等.我國圖書情報領域數據引用行為分析[J].中國圖書館學報,2014,40(6):105-114.
[3]白娜娜.我國圖書情報領域數據的引用情況[J].中國管理信息化,2015,18(16):214.
[4]王愷.淺析我國圖書情報領域數據引用現狀[J].人才資源開發,2015(20):115.