張磊
(南京大學信息管理學院 江蘇 南京 210023)
基于CNKI數據的歷史學學科半衰期探究*
張磊
(南京大學信息管理學院 江蘇 南京 210023)
文章以歷史學為研究對象,通過分類號獲取CNKI中相關文獻數據,計算了歷史學各子學科在2008~2012年間的學科引用半衰期與學科被引半衰期。結論是:從學科引用半衰期來看,歷史學引用半衰期較長,引用多為歷史經典文獻;從被引半衰期來看,其半衰期較長,表明歷史學研究的老化速度慢,且對其他學科有較高的借鑒價值。
學科半衰期;歷史學;引用半衰期;被引半衰期
半衰期是文獻老化的計量指標之一,1944年,戈斯內爾針對科技文獻老化現象,提出了“半衰期”的概念。之后,貝爾納進一步提出通過負指數模型來表征文獻的老化,巴頓等提出了引文曲線的半衰期公式,并將半衰期定義為“在一段時間內已發表的某一學科領域內正在被利用的全部文獻中較新的一半是在多長時間內發表的”。
在我國學術界,羅式勝根據文獻主體范圍的不同,對文獻半衰期進行了繼續劃分,包括文獻、期刊、科學家、國家等半衰期。從數據處理來看,半衰期分為歷時半衰期和共時半衰期,歷時法觀察的是文獻資料變得不再有用或不再有效的過程這樣一個動態的概念,而共時法則將文獻老化視為一種狀態。汪繼南以文學、歷史、哲學、經濟學和法學的各一種期刊為研究對象,調查統計了2003年度引文中所有出自期刊報紙網絡并標注了出版年份的文獻數據,計算得歷史學半衰期為8.05年。白云匯總了CSSCI中20個學科735種期刊2000~2004年的被引半衰期,大于10年的均按10年算,得出歷史學半衰期為8.59年。姜春林等對人文社科領域較權威的17種專業期刊在CSSCI中2003年度的引文數據進行分析,得出歷史學期刊半衰期為10.0年。游毅等獲取了SCI和SSCI中1980~2009年30年間數學、計算機科學、經濟學與歷史學中各40種樣本期刊的引文數據,分別采用插值法和B-K方程法計算得歷史學半衰期分別為8.69年和8.28年,并揭示了30年間科學期刊文獻老化速度總體減緩的趨勢。邱均平等以CSSCI收錄的2006~2008年的所有人文社會科學7大學科引文數據為樣本,用共時法計算得歷史學在2006和2007年的半衰期分別為17.47年和18.45年,并顯示了歷史學的老化并不嚴格遵循負指數函數。
本文從學科角度,以CNKI中收錄的歷史學文獻引文數據為基礎,對歷史學各子學科的半衰期進行計算,并從年度變化角度對歷史學半衰期加以考察,以此反映我國歷史學學科的文獻老化情況。
2.1 數據采集與處理
2.1.1 數據采集
文章以中國圖書館圖書分類法(第四版)歷史學相關分類號為檢索條件,獲取了CNKI中歷史學各子學科近五年(2008~2012)和近十年(2003~2012)的相關數據(見表1)。

表1 歷史學各子學科的總引用數據
從統計結果可以發現,歷史學各子學科的十年總被引數反而小于五年總引用數。究其原因:前者來自于引文庫,該引文庫只收錄了引文中的論文部分,而歷史學論文的引用文獻中論文所占比重只有25%左右;后者是來自于所有歷史學論文中的參考文獻,這其中包括論文、圖書等各種類型的文獻。這就是為什么5年的引文數量遠遠高于10年總被引數量的原因。
2.1.2 數據處理
半衰期的計算方法主要是引文分析法,其他還包括文獻管理統計數據分析法和基于假設的純數學方法等方法。基于引文分析的文獻半衰期計算方法又包括作圖法、公式法和中值法三類。作圖法較為直觀但略粗糙,更精確一些的是俞培果提出的灰色預測模型。公式法主要是指上述提及的負指數模型、B-K方程等。中值法則較為簡單,假設半衰期的整數部分為x年,a=x+1,b=x。則a引文≥50%,b引文≤50%(a引文、b引文為第a、b年的引文累積百分比),半衰期H=x+(0.5-b引文)/(a引文-b引文),本文采用中值法計算半衰期。
2.2 數據總體分布
2008~2012年間,CNKI收錄的歷史學文獻的總引文數據為712738條,其中期刊104029條,博碩士論文608709條。博碩士論文篇均引文量遠高于期刊,約是期刊的六倍。
各子學科中,中國史無疑是主流,引文數占到總數的65%;剩下部分中史學理論(8%)、歐洲史(8%)、美洲史以及世界史引文相對較多,占比均在百分之七八間;亞洲史占4%;非洲史(1%)和大洋洲史(0%)文數最少。
從年代分布上來看,近五年的總引文數呈上升趨勢(除2012年相比2011年引文數略有下降),與發文數的逐年增長有關。從各年總發文數與總引文數發布圖(見圖1)中可明顯看出引文比發文的增長快很多,發文的增長大抵呈與坐標平行的方向緩慢增長,而引文則是斜向上方的快速增長。

圖1 歷史學各年總發文數與總引文數分布
由于2000年以前數據較少,因此只列出自2003年起的數據。可以發現:2003~2012十年間獲得總被引數據410923條;總被引數據中,中國史的占比為86%,這個數據表明歷史學下被引文獻主要是與中國史有關;剩下部分中,史學理論占比為7%;歐洲史為3%;亞洲史和美洲史均為2%;世界史、大洋洲史和非洲史占比最少(0%)。
從各年份的總數來看,總被引數平穩上升,并且在2005~2007以及2009~2011年間有著尤為迅速的增長(見圖2),說明這兩個年份段中歷史學受到相對較高的關注,其他學科對歷史學的參照較多,歷史學內部間的引用也較頻繁。

圖2 歷史學各年總被引數分布
2.3 引用半衰期計算及分析
引用數據分兩類,一部分是期刊引文,另外一部分是博碩士引文,分別按年份進行統計,利用其總引文次數計算各年份的歷史學文獻共時引用半衰期及每個子學科(即大類號)的半衰期。表2顯示了各年份歷史學期刊引文總數情況。

表2 各年度歷史學研究的期刊引文總數
與總引文數一樣,期刊引文總數也是逐年增加的(除2012年相比于2011年略有下降),分布特征也大致與總體吻合:中國史占絕大數,次之為史學理論(這與總體分布略有差異),歐洲史、亞洲史和非洲史為下一梯隊,世界史、大洋洲史和美洲史最少。引文量與學科的熱度有關,熱度越高發文與引文也越多。因此,從期刊數據來看歷史學子學科按學科關注熱度由高到低依次是中國史、史學理論、歐洲史、亞洲史、非洲史、世界史、美洲史和大洋洲史。
本文根據引文時間分布,先以2012年史學理論為例,計算得其各年度的累積引文百分比(見表3)。

表3 2012年史學理論期刊總引文中各年度的累積百分比
使用中值法計算引用半衰期,此處的a=12,a引文=52.26%,b=11,b引文=48.72%。因此半衰期H= 11+(0.5-0.4872)/(0.5226-0.4872)=11.36。類似地可計算出其他子學科各年份的半衰期(見表4)。

表4 各年度歷史學期刊引用半衰期
觀察引用半衰期數據,可以發現:從五年半衰期的變化幅度來看,史學理論、中國史以及作為總計的歷史學變化最小,在10.5~13.5之間浮動;世界史、大洋洲史以及美洲史變化幅度最大,在0~25之間;亞洲史、非洲史和歐洲史變化幅度約在5~25之間(見圖3)。
由此可見:中國史的半衰期變化與整個歷史學的變化趨勢基本同步,進一步證實了中國史在歷史學中的主導地位,2010年半衰期的暫時性縮短則說明當年中國史學界出現新的研究點;史學理論的半衰期逐年增長,2012年有下降趨勢,說明其對老舊文獻的關注度有所下降,對新興文獻關注度上升,由于產生了新的理論熱點話題,舊文獻的累積不足;亞洲史和非洲史的變化趨勢大致同步,非洲史的半衰期一直高于亞洲史,說明其累積文獻較多,前人的研究較豐富,但兩者均在2011年出現半衰期大幅下降的情況,說明在當年出現了新的研究點;歐洲史半衰期總體呈上升趨勢,說明其研究較為飽和,學科正在變得越來越成熟;世界史、大洋洲史、美洲史的三個學科普遍存在的現象是發文及引文均較少,甚至有“零發文”、“零引文”的情況,因此半衰期的變化幅度大,并且不大能通過半衰期的變化反映學科的發展情況,表明相關研究仍處于發展中,有待于國內學者在今后研究中進一步加強。
本文也對博碩士論文的引文數據進行了統計計算,可得各年度及各子學科的半衰期數值(見表5)。
可以發現:與期刊引文一樣,博碩士論文的引文整體也是呈逐年增長趨勢,2012年總引文較之2011年有所下降;子學科中,中國史依然是主流,均值在七萬左右,但其引文數量優勢較之期刊中的一家獨大情況有所削弱;引文量次之的為歐洲史、世界史和美洲史,均值在一萬左右,大致符合總體分布的排序;史學理論引文數五年均值也將近一萬,亞洲史均值為史學理論的一半;引文數較少的為非洲史和大洋洲史,與總體分布保持一致。
從半衰期的變化來看,依舊是以半衰期的變化幅度大小為標桿,將所有學科分為兩大類:史學理論、中國史、亞洲史以及歷史學整體為一類,其半衰期變化幅度相對較小,在8.5~14.5之間浮動;世界史、非洲史、歐洲史、大洋洲史以及美洲史視為另外一類,其半衰期變化幅度在8.5~33.5之間。

圖3 歷史學各子學科近五年期刊引用半衰期變化圖

表5 各年度歷史學博碩士論文總引文及半衰期
根據各子學科的引用半衰期變化圖(見圖4),可以發現:歷史學整體引用半衰期均在10.5以上,體現了其學科的成熟性;中國史半衰期一直在增長中,且半衰期小于歷史學整體,說明其還處在不斷成熟過程中;史學理論相對變化幅度較大,2008~2010年半衰期的上升源自其學科自身的不斷成熟完善,2011~2012年半衰期略有下降并保持穩定,顯示出現有歷史理論的成熟;亞洲史相較于其期刊的半衰期曲線在引文數增長的情況下半衰期變化有所減緩,2008~2011年的快速增長顯示學科的局部不斷成熟,研究不斷被完善,2012年的大幅減少應是新的研究熱點出現造成;大洋洲史與美洲史半衰期仍是在劇烈波動變化中,與其期刊特征一致,說明這兩個學科處在萌發中,沒有特別成熟的理論,研究點也在不斷變動中;非洲史的變化幅度也很大,主要是在2008~2009之間的急劇下降,應是由于研究熱點的轉向引起,2010~2012三年間關于新研究點的文獻趨于飽和,半衰期也隨之穩定;世界史由于引文數的增加,不同于期刊半衰期的大幅波動,博碩士半衰期變化相對穩定;歐洲史只有在2012年半衰期呈下降趨勢,其他年份半衰期基本穩定,應屬合理范圍內的波動,與研究點轉向關系不大。
總的來說,無論是期刊還是博碩士論文,歷史學引用半衰期均在10以上,這意味著歷史學文獻的引文中的一半距今時長超過10年,也即歷史學對經典文獻的關注度較高,對新興的文獻興趣度相對不高。這是學科成熟的表現,不再有特別多的新研究領域出現,著力在現有較為成熟的領域,并且已有較多的文獻積累,所以在引用過程中追根溯源,文獻源更多以原典性著述為主。歷史學又是有長時間積淀的比較強調考據的學科,王國維先生的“地下之學問”與“紙上之材料”相互參證的“二重證據法”即是歷史學重考據的反映。因之,歷史學的傳統即是在原始材料間發現學問的蛛絲馬跡,在引用文獻上會更偏重于歷史經典,半衰期會遠長于一般的理工學科,在半衰期普遍較長的人文科學中也少有半衰期能出其右的學科。具體到各個子學科,中國史是歷史學研究的主流,引文量遠超其他所有子學科。歷史學引用半衰期很大程度上由中國史引用半衰期決定,中國史的古籍經典眾多,廣泛地出現在參考文獻中,拉長了整體的半衰期數值,但同時由于中國史相關文章較多,參考新近出現文章的幾率更大,這又會將引用半衰期縮短了一些。另外,文章還注意到期刊引文數據中,非洲史的半衰期最長,筆者認為原因有二:其一,有關非洲史的研究文獻較少,現下的研究更多地借鑒前人的經驗,時新的文獻無可參照;其二,非洲史相關的源文章及引文數也較少,因此在統計中半衰期失之準確,半衰期數值未能穩定。相比之下,博碩士論文中關于非洲史的研究就多很多,引文數量也具有一定的統計意義,所以引用半衰期數值會低一些。
2.4 被引半衰期計算及分析
被引數據包括2003~2012年CNKI收錄的所有歷史學文獻的被引情況。本文利用此歷時數據計算了歷史學各子學科的被引半衰期(見表6)。

表6 各年度歷史學文獻被引半衰期

圖4 歷史學各子學科近五年博碩士論文引用半衰期變化圖
可以看出,歷史學半衰期隨時間不斷增長,說明學科文獻老化速度變慢,學科的影響力在增強。從半衰期數值上看,被引半衰期最長的是史學理論類的,這類純學術的文章,不免引經據典,而要成為經典性的理論性文獻須得經過時間的檢驗,需要歷史背景下的文化積淀,所以被引周期較長;其次是中國史研究,它是歷史學研究的主流所在,也是被引用最多的子學科門類,因為文獻已有足夠的積累,所以在引用時會多加甄別。對同一問題加以新闡釋時需要借鑒新近的資料,更多地還是要返其本源,從一手材料出發,所以此類被引文獻中年代較遠者相對優先,文獻的持續利用時間長,半衰期長;再就是大洋洲史的研究,因為相關文獻較少,所以時效性不成為引證時的參考因素,現存的文獻都能成為資料,相應地文獻老化速度會慢一些;其他子學科被引半衰期分布大多在8.5左右,分布相對集中,引文行為大致相似,非主流的學科位置造成發文量少,文獻的持續利用時間相對短一些。
對歷史學子學科半衰期變化進行細分,大致分為三類:持續增長型、波動增長型和波動型(見圖5)。持續增長型包括了史學理論、中國史、美洲史以及整個歷史學,特點是每年的半衰期持續增長,引文行為相對穩定,被引年份相對集中,學科研究點持續性強,累計文獻豐富。波動增長型包括了世界史、亞洲史和歐洲史,特點是被引半衰期總體呈增長趨勢,但部分年份有所波動,由于學科自身發展還在完善中,學科熱點累計文獻有待增加,被引年份有所分散。而波動型包括非洲史和大洋洲史,這兩個都屬于相對冷門學科,引文行為不穩定,半衰期波動大,增長趨勢不顯著,學科累積文獻也較少,被引分布規律不明顯。

圖5 各子學科近十年被引半衰期變化折線圖
引用半衰期主要反映的是學科對被引參考文獻的時效要求,引用半衰期較短則意味著該學科對最近發表的文獻較感興趣。一般來說,學科發展越快,該學科的半衰期就越短;半衰期越長,說明學科的發展已進入發展較緩的成熟階段。相比于引用半衰期,被引半衰期更為研究者所注意。學科半衰期一般即是指學科被引半衰期,它反映了學科論文的生命周期及參考價值,是衡量學科文獻老化速度的指標。學科半衰期越長說明該學科文獻被持續利用的時間越長,學科知識更新和老化速度越慢,影響力越深。
將所有子學科以及歷史學科整體的期刊引用半衰期、博碩士引用半衰期以及被引半衰期進行對比,總體上被引半衰期普遍小于引用半衰期,以三個半衰期間具體的數量關系為度量,分所有學科為以下幾類:期刊引用半衰期穩定大于博碩士引用半衰期的學科、期刊引用半衰期與博碩士引用半衰期大小關系相對穩定的學科、期刊引用半衰期或博碩士引用半衰期不夠穩定的學科以及引用半衰期劇烈波動的學科。第一類包括史學理論(K0)、中國史(K2)以及整個歷史學科(History),被引半衰期遠小于兩個引用半衰期,兩個引用半衰期中又以期刊相對較大較穩定(見圖6)。這三個學科都是成熟型學科,因此成熟學科一般具有穩定的半衰期,可以半衰期進行相對準確的學科評價分析。

圖6 歷史學中較為成熟的學科的三個半衰期值分布
而對于第二類,筆者稱之為過渡型學科,具體特點是被引半衰期低且穩定,引用半衰期間的大小關系不穩定。如歐洲史(K5),其半衰期特征與成熟型無甚差異,鑒于其引用半衰期特征與成熟型略有差異,故將其列為中間過渡型(見圖7)。而世界史(K1)的被引半衰期低且穩定,但引用半衰期中的期刊引用行為波動較大,未有明顯趨緩,因此也將其視為過渡型(見圖7)。
剩下的學科即對應上述第三四類。如亞洲史(K3)和非洲史(K4)與世界史半衰期分布差別不大,可視為過渡型的劇烈波動版,同樣有較低的穩定的被引半衰期,而兩個引用半衰期變化波動大,無明顯大小關系(見圖8)。大洋洲史(K6)和美洲史(K7)則是存在零被引零引用的不規則波動的學科(見圖8),由于數據自身問題以及學科自身的冷門性,半衰期無規律分布,不適宜簡單用半衰期進行準確的學科評價。
被引與引用是一個問題的兩種不同視角,理論上來說被引半衰期和引用半衰期應該在數值上相差不會很多,筆者的實際數據反映出的引用半衰期普遍大于被引半衰期。究其原因,首先是數據源的問題。如上述數據采集部分所言,被引數據中缺少被圖書引用的數據,減少了總被引數的同時也改變了被引半衰期。而期刊反映的是學科進展動態,在時效性的要求下引用的大多是靠近發文時間的前沿文獻,這部分的被引半衰期較短;圖書自身的匯集特性決定了其引用的文獻時間跨度較長,并且引用的大多是需要經過一段時間檢驗沉淀的可靠經典文獻,這部分的被引半衰期較長。本文中計算出的被引半衰期是被期刊和學位論文引用的半衰期,不含被圖書引用的半衰期,因此實際所得被引半衰期小于真實值,拉大了與引用半衰期的差距。其次,歷史學被引和引用可分別看作是歷史學被所有學科的引用和所有學科對歷史學的引用,被引半衰期短于引用半衰期的一個解釋是歷史學對其他學科的引用重視經典文獻的參照,其他學科對歷史學的引用重視其新近的發展情況,這也可以體現歷史學作為一門人文科學其基礎性的特質,對其他偏重應用的社會科學和自然科學的影響力較大,其他學科關注歷史學的發展動態;而其他學科的研究進展對歷史學發展影響較小,對其他學科引文老化速度較慢。

圖7 歷史學過渡型學科半衰期分布

圖8 歷史學波動型學科半衰期分布
通過對文獻老化指標——半衰期的定量測度,筆者發現歷史學整體的發展趨勢是已處在學科穩步發展的成熟期,并隨著半衰期的繼續增長還在不斷成熟中。其引用半衰期均值在10年以上,說明其對引用文獻的時效性無甚要求,對熱點關注度不高;期刊引用半衰期長于博碩士論文引用半衰期,在于博碩士論文引文數多,并且對文獻時效性有一定的要求,需要關注研究的最新動向,縮短了引用半衰期。其被引半衰期相較引用半衰期稍短,但也將近10年,也能反映歷史學論文的持續利用時間較長,對經典文獻關注度高,學科發展脫離了初創階段的高增長新引用,文獻有了歷史的積淀,參照價值更高,對其他學科的影響力更大,能反映人文科學基礎性的學科特質。被引半衰期短于引用半衰期的原因一是由于其客觀的基礎學科性質,二是數據源本身不規范及資源缺失引起。而歷史學各個子學科中綜合引用和被引半衰期的變化模式可大致分為成熟型、過渡型以及波動型。成熟型適宜用半衰期進行評價,過渡型則需結合其他定性分析,而對于波動型,半衰期數值的意義則有待商榷。
[1]Burton,R.E,Kebler,R.W.Half-life of Some Scientific &Technical Literatures[J].American Documentation,1960(11):18-22.
[2]羅式勝.文獻半衰期的類型及其應用[J].情報學報,1997,16(1):62-67.
[3]郭紅梅,邵艷娥,何欽成.文獻半衰期研究現狀[J].醫學信息學雜志,2011,32(1):56-59.
[4]汪繼南.社會科學各學科引文的高峰值調查及引文評價的時段性要求[J].情報資料工作,2005(3):81-82.
[5]白云.中國人文社會科學期刊被引半衰期分析研究[J].云南師范大學學報(哲學社會科學版),2006,38(4):127-130.
[6]姜春林,劉則淵.歷時態角度看人文社會科學引文峰值及其引文評價的時間選擇[J].情報科學,2006,24(9):1343-1347.
[7]游毅,索傳軍,鐘晶晶.科技期刊長期老化趨勢與影響因素實證研究——基于4門學科期刊30年引文數據的統計分析[J].圖書情報工作,2011,55(12):140-144.
[8]邱均平,宋艷輝,楊思洛.國內人文社會科學文獻老化規律對比研究——基于Web新形勢下的研究[J].中國圖書館學報,2011,37(5):26-35.
[9]蘇新寧.中國人文社會科學圖書學術影響力報告[M].北京:中國社會科學出版社,2011.
[10]陳云鵬,張寶林.標準文獻半衰期算法及實證研究[J].情報雜志,2012,31(8):94-97.
[11]俞培果.科技文獻老化的歷時研究[J].情報業務研究,1993,10(2):122-126.
Research on the Discipline Half-life of History Studies based on CNKI Data
This paper calculates the discipline half-life(citing half-life and cited half-life)of history studies based on CNKI data.On the basis of discipline citing half-life,it is clear that history studies do not care much about the time of documents and old classic documents are treasured.On the basis of discipline cited half-life,it is clear that the obsolescence of history is long because the history studies have great impact on studies of other social science.
discipline Half-life;history;citing half-life;cited half-life
G250.252
A
10.11968/tsygb.1003-6938.2015045
張磊(1992-),男,南京大學信息管理學院碩士研究生。
*本文系國家社會科學基金項目“以創新和質量為導向的哲學社會科學評價體系實證研究”(項目編號:12BTQ037)研究成果之一。
2015-01-10;責任編輯:劉全根