丁震一
(麗水學院教育學院 浙江麗水 323000)
中文體育類核心期刊作者群洛特卡分布及普賴斯定律研究
丁震一
(麗水學院教育學院 浙江麗水 323000)
為了解中文體育類核心期刊的作者群洛特卡分布情況及與其他學科之間的差異,通過運用文獻資料法、數理統計法對1994~2011年中文體育類核心期刊上發表的論文及作者進行收集整理,并進行洛特卡分布和普賴斯定律分析研究,得出中文體育類核心期刊論文作者的洛特卡表達式f(yx)=0.7232/x2.4767。核心作者為1994年以來發表核心期刊文章6篇以上,中文體育類核心期刊的作者群已基本形成,同時表明中文體育類核心期刊的科學生產率水平相比最高,但高產作者的著文率明顯偏低,建議增加核心刊物數量和載發量,加大對高產作者的激勵政策,以給更多年輕作者發表核心期刊的機會,增進高產作者科學研究的積極性。
核心期刊 論文作者 洛特卡定律 普賴斯定律
1926年6月19日洛特卡(Lotka)在美國的《華盛頓學院雜志》上發表了題為“科學生產率的頻率分布”一文,論述了化學和物理學領域中的論文作者數量與論文數量關系,這種關系可用公式f(yx)=c/x2(c是常數)表示[1-2]。即論文數x與作者的頻率f(yx)之間成反比的關系,在此之后,Lotka又著文指出:寫x篇論文的作者數yx與每一個作者所寫論文數x成反比關系,即:

表1 各期刊論文數量分布

表2 第一作者論文數x與作者數yx 統計

式中:M為論文總數,f(yx)=yx/M是撰寫x篇論文作者的頻率,即:

代入⑴式得

n與c是對應特定學科領域的兩個待定常數。在前面的Lotka定律中,n=2,c=0.6079,后來Vlachy的工作證明,一般1.2≤n≤3.5,n最大可達4.8[3]。對于化學和物理學來說,n=2可能是合理的,而對于其它學科未必如此,n和c這兩個常數受到學科本身特點所制約。
Lotka定律的理論和實際價值在于創造性地揭示了科學論文作者與文獻量之間的數量關系,當代情報學研究中有關科學家生產率的計量理論,都是以Lotka定律為基礎的。在情報科學中,

表3 n值計算用表

表4 單樣本 Kolmogorov-Smirnov 檢驗
(1)文獻資料法;(2)定量分析法;(3)數理統計法;(4)分析比較法。
通過對中國期刊全文數據庫以中文體育類核心期刊的14種期刊(注:其中《中國運動醫學雜志》2004年以前為體育類核心期刊、《山東體育學院學報》2004年至今為體育類核心期刊、《體育文史》后更名為《體育文化導刊》,所以一并計入)的刊名分別進行檢索,收集自1994年以來的第一作者為國內的全部(增刊文章未收集)45689篇論文題錄(文摘、通知、消息、簡訊、會議、講話、簡報等未作統計),分布見表1。
(1)參數n的估計。為了對非線性關系的⑴式中的n進行估計,需要對兩端取對數后,變成lnx和lny的線性關系,即:

對n值采用最小二乘估計得

其中N為考查數據對的值,由表2可知,這里N=51,經計算n≈2.4767。
(2)參數c的估計。對參數c的估計除可以用最小二乘法之外,還有其它方法。其中一種是1985年美國情報學家Pao ML教授在數學家的協助下,提出n不等于2時的逼近c值的計算公式:

式中:當n=2時,c=0.6079,將本文中n=2.4767代入公式⑹得c≈0.7232,由此可得出中文體育類核心期刊1994~2011年共45689篇文章的作者數的洛特卡分布:

為了判明作者和論文的實際分布與理論分布的一致性,還應進行統計檢驗,最終要驗證實測數據是否真正符合洛特卡分布。一般采用非參數檢驗,這里采用K-S檢驗,通過軟件Pasw18.0對數據進行K-S非參數檢驗得到表4。檢驗分布為正態分布。
因此中文體育類核心期刊作者洛特卡分布表達式f(yx)=0.7232/x2.4767,能通過K-S檢驗。足以說明體育學科的發展符合一般科學發展的規律。但通過并不能簡單地就肯定這10余種雜志作為中文體育類核心刊物的可靠性和權威性,還有待于用其他方法進行良性擬合[5]。
原因有這幾方面的因素:(1)只統計第一作者,丟失部分信息;(2)沒有剔除高產作者所帶來的影響;(3)同名作者的存在;(4)根據張賢澳[6-9]、林寶山[10-11]等人研究的結論,研究的著者群過大,對洛特卡檢驗的精度要求也要高,還有待于進行Egghe公式驗證[6]。
美國學者、科學計量學的奠基人普賴斯通過對洛特卡定律的深入研究,成功地對高產著者的科學合理的劃分、高產著者著文量在總著文量中應占的合理比例、高產著者在著者群中應占的合理比例均作出過詳盡的研究,提出了“大約10%的杰出科學工作者發表的論文量占全部論文量的一半”的科學推論。亦即著名的“普賴斯定律”[12]。由于該推論是在洛特卡定律基礎上完成的,所以它基本符合洛特卡原始樣本數據。在一個成熟的著者群中,合理的最佳高、多、低產著者率之比約為1∶3∶6,其合理的最佳著文率之比約為論述這種作者與文獻量的關系服從Lotka定律(分布),頗受人們重視[4]。
中文體育類核心期刊是我國體育學科方面最具權威的學術期刊,它基本上反映了當今我國體育學科領域學術研究的情況。因此,研究體育類核心期刊論文作者的著述特征,對研究體育科學研究隊伍的情況及科學論文生產規律有積極意義。同時也為提高期刊質量提供參考。為了研究體育科技人才的著述特征,給出中文體育類核心期刊論文作者的Lotka分布,需要估算指數n,計算常數c,還要進行K-S檢驗。5∶3∶2[13],依照該科學推論和洛特卡定律對洛氏定律原始數據——中文體育類核心期刊著者群進行劃分,及其各著者群的著者率、著文率情況見表4。

表5 中文體育類核心期刊作者群作者率與著文率指標表
按照普賴斯教授的理論,發表論文數為N篇以上的科學家為杰出科學家,即N=0.749(ηmax)1/2。
ηmax為發表論文最多的作者所發表的論文數,經計算中文體育類核心作者即高產作者為近18余年發表文章6篇,即N≈6。
從表5中不難發現中文體育類核心期刊的作者群已基本形成,但高產作者的著文率明顯偏低,即發表6篇核心期刊文章需要近17年時間,這和我們對體育的科技化要求相差甚遠[14-15]。著文1篇的低產著率僅為50.72%,比其它[16-21]一些學科的期刊都低,表明中文體育類核心期刊的科學生產率水平最高。
(1)中文體育類核心期刊的洛特卡表達式f(yx)=0.7232/x2.4767,即c=0.7232,n=2.4767,此式尚待進一步驗證。(2)中文體育類核心期刊的作者群已基本形成,但高產作者的著文率明顯偏低。(3)按照普賴斯教授的理論,發表論文數為N篇以上的科學家為杰出科學家,即N=0.749(ηmax)1/2。經計算體育類核心作者為近10余年發表文章6篇,即N≈6。(4)在文獻計量學中,認為某一學科領域的科學工作者的科學生產率都是有一定的發展規律的,本文的研究中,著文1篇的即當x=1時,即1994年以來在核心期刊上發表1篇論文的作者為50.72%,相對于物理化學領域的60.79%及其他一些學科都低,表明中文體育類核心期刊的科學生產率水平相比最高。
[1]嚴怡民.情報學概論[M].武漢:武漢大學出版社,1983.
[2]張賢澳.洛特卡定律研究的方法探討[J].圖書情報工作,1995(3).
[3]王崇德.期刊作者的量化研究[J].情報科學,1998(5).
[4]PaoML.Lotka'sLaw[J].AtestingProcedure.Information Processing&Management,1985,21(4):305-324.
[5]張賢澳.洛特卡分布擬合方法的比較研究[J].情報學報,2000(4).
[6]張賢澳.Egghe公式的推廣:基于廣義洛特卡定律的θ與β關系[J].情報學報,2001(5).
[7]張賢澳,李美文.廣義洛特卡定律參數特征的研究[J].情報探索,1996(2).
[8]張賢澳.洛特卡定律研究的方法探討[J].圖書情報工作,1995(3).
[9]張賢澳.林業大學學報論文作者洛特卡分布及辨誤[J].福建林學院學報,1993(1).
[10]林寶山,曲煥云,白福春.用K─S檢驗洛特卡定律著者群的取值范圍[J].圖書館學研究,1996(6).
[11]林寶山,曲煥云.洛特卡定律K—S檢驗的適應范圍[J].圖書館學研究,1994(3).
[12]王聲培,云雅娟.洛特卡定律、普賴斯定律和我國數學科學文獻[J].圖書情報工作,1994(3).
[13]L.埃格希,韓麗風,蘇宜譯.著者-作品關系的特征和洛特卡定律研究[J].情報理論與實踐,1996(4).
[14]楊木森.科技革命與體育運動研究[J].北京體育大學學報,2005(5).
[15]陳俊欽,黃漢升,朱昌義,等.科技全球化背景下我國體育科技發展面臨的挑戰、機遇及對策[J].中國體育科技,2005(1).
[16]李紅.《八一農學院學報》論文作者的洛特卡分布[J].農業圖書情報學刊,1995(5).
[17]楊多立.《云南民族學院學報》論文作者的洛特卡分布[J].云南民族學院學報(自然科學版),1995(1).
[18]魏華.《大連海運學院學報》論文作者服從洛特卡分布的統計分析[J].大連海事大學學報,1994(4).
[19]鄧玲.《西藏民族學院學報》論文作者的洛特卡分布[J].西藏民族學院學報(哲學社會科學版),2002(1).
[20]趙良英,李書全,張宏敏.《水利學報》論文作者的洛特卡分布[J].河北科技圖苑,2000(3).
[21]馮金華.《物理學報》論文作者洛特卡分布[J].延邊大學學報(自然科學版),1996(2).
Chinese sports core periodical authors Lotka distribution and pricelaw research
Ding Zhenyi
(Institute of Education, Lishui University,Lishui Zhejiang,323000,China)
In order to understand the difference between the Lotka distribution of the authors of the Chinese sports core journals and other disciplines through the use of literature, and mathematical statistics published in the 1994~2011 Chinese Sports Core Journal papers and ofcollected, and the Lotka distribution and analysis of Price's law, come to the core journals of the Chinese Sports the Lotka expression f(yx)=0.7232/x2.4767. Core The author is a core journal articles published since 1994, more than six authors of the Chinese Sports Core Journal has been basically formed, also showed that the level of scientific productivity of Chinese sports core journals compared to the highest, but the high yield of Zhu Wen significantly biased low, the proposed increase in the number of core journals and set the amount of fat, increase the high yield of incentive policies, and to enhance the enthusiasm of the scientific research of high yield of the opportunity to more young author published a core journal.
Core periodical;author;Lotka's law;law of Price
G80-05
A
2095-2813(2013)11(c)-0002-03