[摘要]本文將2003年至2007年間在中文期刊發表的關于異質數據庫的論文作為研究對象,采用文獻計量學的方法進行統計,從論文數量、年代構成、期刊分布、主題及作者分布等方面,分析了異質數據庫的發展情況。
[關鍵詞]異質數據庫;數據庫論文;文獻計量學;統計分析
[中圖分類號]G250.74 [文獻標志碼]B [文章編號]1005—6041(2010)01—0075—03
1 引 言
我國對異質數據庫的研究始于上世紀90年代中期。統計和分析我國異質數據庫的研究文獻,有利于了解國內該領域的研究現狀,預測今后的發展趨勢。

本文在《中國期刊全文數據庫》和重慶維普《中文科技期刊數據庫》兩個數據庫中,以“數據庫”“異質數據”“異質信息”“異質數據庫”等為檢索詞,檢索出2003--2007年間期刊上發表的有關異質數據庫研究論文共有946篇。以Word、Access及Excel為數據處理工具,剔除重復記錄和與引文分析無關記錄得出事實數據,然后采用文獻計量學方法,對這些論文在通過論文數量、年代、期刊分布、主題分析、作者分析等五個方面的信息進行分類統計和分析研究,指出該學科的研究動態和研究熱點,預測學科的發展趨勢,為異質數據庫的發展提供數據參考。
2 論文數量及年代分析
根據異質數據庫論文年發表量的統計分析,可更深入地了解該學科與專題的研究發展狀況。通過對異質數據庫文章發表年代的統計分析,可以從時間的概念上了解該學科、專題研究的發展歷程。在2003--2007年這5年間,我國中文科技期刊共發表有關引文分析研究的論文946篇,各年異質數據庫研究論文的年代分布見圖1。
從圖1可以看出,異質數據庫研究的發文量從2003--2007年呈逐步上升趨勢,表明異質數據庫的開發研究逐年受到重視。從年發表論文量來看:2003--2005年發表論文量均在200篇以下;2006—2007年發表論文量在200篇以上,并且這兩年的發文量約占發文總量的50%。
3 期刊分布
3.1 期刊類別及發文比例分布
據統計,異質數據庫研究從2003--2007年共有946篇論文,分別發表在210種期刊上。從期刊類型分布來看,異質數據庫研究論文的刊載具有既分散又相對集中的特點。其分散性表現在:946篇論文分別刊載于210種刊物上,平均每種刊物載文4.5篇。其相對集中性表現在:201種期刊中,圖書情報類期刊的種數為72種,占期刊總數的34.3%;發文量為645篇,占發文總量的68.3%。而學報和其他類刊物共有138種,占期刊總數的65.7%,發文量為301篇,僅占發文總量的31.7%。因此,統計結果表明,圖書情報類期刊是異質數據庫研究文獻的主要來源(見表1)。


3.2 主要期刊分布
從論文的期刊分布來看,按載文量由大到小的順序依次排列,經累積載文量計算發現前25種期刊所載論文數為654篇,占論文總數的61.1%,是異質數據庫研究的重要情報源(見表2)。
4 主題分布
文獻研究主題是文獻內容的主要特征,通過對論文研究主題的統計分析,可以揭示出異質數據庫的研究現狀、方向和特點,認識現有的優勢和劣勢,明確今后的研究重點和發展趨勢。通過對異質數據庫論文研究主題的統計分析,得出特色數據庫研究主題分布情況(見表3)。
表3中多專題論文是指研究的主題既涉及異質數據庫,還涉及其他方面的研究;單專題論文主要論述的是異質數據庫。但這種分類是相對的,單專題論文有時也涉及異質數據庫研究的幾個方面,因此,只有依據論文的側重來選擇主題進行歸類統計。從主題分布統計結果來看,有關異質數據庫間資源共享的論文數為241篇,占論文總量的25.5%。是近五年研究的主要內容。其次是“異質數據庫系統構建研究”,論文數為215篇,占總量的22.7%;“數據庫技術”論文為123篇,占文獻總量的13%;“應用”占11.7%。從以上數據可以看出異質數據庫文章的研究主要集中在如何實現共享和數據庫技術的對接與系統建設方面,應用方面的研究還是比較缺乏,應加強在這方面的研究與探索。
5 作者分析
5.1 核心作者分布
五年間包含合著者在內共有著者1678人(次)參與了異質數據庫的討論分析,以第一著者計算有647人,可見,從事引文研究的著者隊伍較龐大。依據普賴斯定律,把發文4篇以上的著者定為引文研究的核心著者,以第一著者統計發文量,得出核心著者分布情況(見表4)。
從統計結果看,如以發文4篇以上(含4篇)的著者為特異質數據庫研究的核心著者,發文4篇的著者為3人,僅占著者總數的0.46%。這表明異質數據庫研究還沒有形成核心作者群,還有待于該研究領域的專家學者進行更深入系統地研究,使異質數據庫研究持續穩定的發展。
5.2 著者合作度
在946篇論文中共有1678人(次)合著論文271篇,合著度達1.56,合著率為28.6%,合著率相對較高,這是由于數據庫的開發建設需要多學科人員的合作。而獨著論文有675篇,占論文總數的71.4%,表明異質數據庫研究仍以個人研究為主。隨著特色數據庫開發研究的深入,越來越需要各學科、各部門的合作,需要專家學者在今后的研究工作中注意加強合作,使異質數據庫的研究工作進一步朝著多學科合作的方向發展。
5.3 著作地域分析
從統計數據看,異質數據庫研究論文的作者分布在全國29個省、市、自治區,著者地域分布較廣泛。從下表論文著者省份分布來看,處于首位的北京市著者為124人,其次是湖北112人、廣東97人、江蘇86人、湖南78人、山東75人、四川65人。這7個省份的著者都超過了60人(次),在異質數據庫研究方面具有較強的實力。特別是北京、湖北地區的著者超過100人(次),處于異質數據庫研究的領先地位。
5.4 論文著者單位分析
從在論文著者單位方面分析,大專院校及科學研究單位的發文量處于領先地位,占總發文量的87.32%,其中大專院校占總發文量的51.38%,處于絕對領先地位,是論文的主要生產者(見表7)。由此表明高校人才密集,學術風氣濃厚,學術水平高,是異質數據庫研究的主力軍。