隨著大科學時代到來,科研合作在廣度和深度上都有更高的要求,高效的合作是科研成果數量和質量的保證。科研成果的署名能夠證明該作者在研究過程中作出了實質性的貢獻,且要求作者對論文負責,因而作者署名作為衡量科研水平和能力的重要依據,逐漸受到重視。人們通常認為完成主要研究工作的第一作者和提供指導支持的最后一位作者,在科研過程中起到舉足輕重的作用,而中間署名的作者僅提供輔助[1]。合著論文的日益增多,引發了濫用署名權等學術不端的現象,以及馬太效應引起的部分學者受到貶低的不公平現象[2-3]。Chao Lu等[4]也基于作者貢獻的測度,探究科研合作中各作者的相互關系。因此,對作者貢獻的特征進行分析,對作者貢獻聲明的規范化及學術評價的科學化有著重要的意義。
1985年,國際醫學期刊委員會[5](International Committee of Medical Journal Editors,ICMJE)提出作者貢獻要素的4個標準。此后,相關組織陸續出現,明確“作者貢獻聲明”的具體規范,科研過程更加公正公平。近年國內一些學術期刊,如圖書情報領域(以下簡稱“圖情領域”)的《圖書情報工作》《數據分析與知識發現》,提出有關作者貢獻的明確要求,并逐漸規范和完善。但我國關于“作者貢獻聲明”的研究較多地停留在探討設立意義[6-8]、設想貢獻要素[9]的初級階段,并逐漸出現貢獻權重算法的研究[10-12]。作者貢獻聲明率先在醫學領域得到發展并逐步規范,且要求作者貢獻聲明的國內期刊主要集中于圖情領域和醫學領域。本文基于這兩個領域的四種期刊,通過對作者貢獻要素的分類,歸納得到作者貢獻的標注體系,并結合學科領域、署名順序、通訊作者等對其進行統計分析及非參數檢驗,探究兩個學科作者貢獻要素分布的差異及原因,了解不同學科領域在科研合作過程中作者的貢獻特征。參考醫學領域的作者貢獻,旨在為作者貢獻聲明在圖情領域的合理發展及其他學科領域中的研究與應用提供借鑒。
國內普遍將作者貢獻大小同署名順序相關聯,這樣做法存在以下不足:(1)科研成果一直是各單位業績評定、獎金發放的參考依據,隨著科研合作增多,部分學者對署名的嚴肅性和重要性缺乏認知,存在濫用、篡改署名等學術失范甚至不端的行為[13-14];(2)單從署名的順序,無法明確合著作者的具體貢獻和責任,也不能由此簡單地判斷作者貢獻的大小[15-16]。
1985年,ICMJE提出作者貢獻要素的4個標準,至今仍不斷作修訂。20世紀90年代以后,美國哈佛大學Harvard Ombudsman Office[17]、英國發表道德委員會[18](Committee on Publication Ethies,COPE)等組織為應對相關實際問題而相繼出現。1999年,Nature首次要求論文刊載需標注“作者貢獻”[19]。2014年我國期刊《數據分析與知識發現》[20]推行“作者貢獻聲明”,隨后《圖書情報工作》[21]《中國全科醫學》[22]等均增加“作者貢獻聲明”版塊。張曉林[23]、Frische[24]、Clement[25]等均對作者貢獻聲明的必要性展開討論,認為科研成果歸所有署名作者擁有,其貢獻應進行明確標示,從而盡可能減少名譽作者的出現。朱大明[26]、Allen等[27]認為貢獻聲明能夠增強作者的責任感,便于讀者了解科研合作過程,有助于學術透明和學術交流。李靜然等[28]認為設立“作者貢獻聲明”能夠激勵科研人員的積極性,約束作者的學術道德,增強監督力度,有效避免不正當行為產生的學術糾紛。作者貢獻聲明逐漸規范和推廣,為本文研究奠定了基礎。
若要對合著作者的貢獻及學術能力進行合理評價,應按照對應的貢獻要素及其權重進行計算。Baerlocher等[29]、Bates等[30]以 ICMJE 為標準,對作者貢獻要素進行歸納和梳理。Bhandari等[31]、張閃閃等[32]通過調研將作者貢獻的進行分類,包括研究主題設計、數據獲取與分析、撰寫論文等,但類別和表述均差異較大,尚未出現統一標準。作者貢獻要素應基于事實進行分類,也應考慮學科特性差異、合著作者數量等產生的影響。Mattsson等[33]也表示對作者貢獻進行評價時,既應考慮論文的合著作者數量,也應考慮其署名順序。
學術界對合著作者的貢獻大小衡量方法不同,從僅計算第一作者貢獻變為對所有合著作者等同對待,再到區別對待的調節計數法。張閃閃[34]將前人的研究分為基于作者數量、作者位置、論文角度等方面的貢獻權重算法。Van Hooydonk[35]、樊玉敬[36]反對使用平分法計算作者貢獻權重,提出基于作者署名順序對貢獻大小進行計算。張明[37]對比分析線性分布和指數分布中合著作者數量對作者貢獻權重的影響。李櫟等[38]、Shen等[39]均提出了不同的作者貢獻率分配算法,能較為公正地對作者的學術影響力進行評價。Feeser等[40]通過研究具體的作者貢獻要素來對合著作者的貢獻大小進行量化。我國學者對作者貢獻權重的研究大都是結合署名順序和通訊作者對貢獻大小的算法作出改進[41-42]。
國外學者針對作者貢獻分布特性進行了深入研究,Larivière V等[43]探究來自PLOS及WOS中不同學科文獻的作者貢獻種類與學術資歷、署名順序的關系。國內對作者貢獻的研究剛剛起步,主要從作者貢獻聲明設立意義、作者貢獻權重運用等方面進行評價,也得出一些有意義的成果。近幾年,逐漸出現對貢獻要素分布特性的研究,如崔林蔚等[44]根據《圖書情報工作》2015~2016年的作者貢獻數據,給出29類作者貢獻要素說明,并結合署名順序對貢獻要素的分布情況進行統計分析。丁敬達等[45]分析比較圖情領域三種期刊中作者貢獻分布與署名次序的關系。本文針對圖情與醫學兩個學科對作者貢獻要素進行歸納總結,綜合考慮學科差異、合著作者數目及署名位置的影響,探究不同學科的作者貢獻特征。
本研究選取圖情領域和醫學領域四種期刊的論文數據,通過相關數據的采集,進行數據分類標注,對作者貢獻情況進行統計分析。研究思路如圖1所示:(1)制定采集規則,使用火車采集器抽取標題、PageUrl、作者、摘要、通訊作者、作者貢獻聲明、年卷期字段存儲至數據庫;(2)統一原始數據格式,去除無法下載、無作者貢獻聲明及非學術性文獻;(3)設計作者貢獻分類標注體系,制定標注規則,并實施數據標注。(4)對標注數據進行統計分析。其一,針對不同學科領域探究不同作者貢獻要素的獨立完成率及分布情況;其二,探究不同合著作者數目下的貢獻程度及貢獻要素分布同作者署名順序的關系;其三,探究不同合著作者數目下,通訊作者的貢獻要素分布特征。
數據庫中具有“作者貢獻”的文章多出現在圖情及醫學領域,Larivière V[46]等發現PLOS中相關文獻集中于生物醫學及臨床醫學領域。《圖書情報工作》《數據分析與知識發現》(原《現代圖書情報技術》)均是圖情領域核心期刊;《中國全科醫學》《世界華人消化雜志》也均是較為權威的醫學學術性刊物。近年四種期刊均出現較為規范的作者貢獻聲明,適合本研究。本文抓取數據的情況見表1。

表1 作者貢獻聲明數據來源及統計
隨后對上述四種期刊的作者合著數目進行簡單統計。圖情領域的獨著文獻占比為19.7%,遠高于醫學領域(0.04%),且圖情領域論文的合著作者數主要集中在2-4人;而醫學領域多數在2-7人,最多達11人。這是由于實驗性較強的學科所需資源和能力相對較多,更傾向于分工合作。為防止數據量過小導致分析結果的普適性較差,本文在涉及作者署名順序時僅選取合著作者在2-5人間的文獻進行研究,對不同學科的作者貢獻進行宏觀統計,但在探究通訊作者的貢獻內容時則使用全部非獨著數據。獲得論文全文數據后,對所需信息進行抽取并存儲至數據庫,主要包括兩部分:(1)題錄信息,即標題、作者、摘要等;(2)作者貢獻信息,即作者順序、通訊作者、作者貢獻聲明等。
2.3.1 作者貢獻分類框架設計
在對相關文獻調研的基礎上[47-50],對期刊所列的“作者貢獻聲明”進行文本切分。利用關鍵詞匹配對切分結果分類,并進行詞頻統計。加以人工的判別和修訂,給出11類的作者貢獻分類框架,分別對應A-K,如表2所示。

表2 作者貢獻分類標注說明
2.3.2 數據標注
根據標注框架并參考論文摘要對作者及其貢獻進行分類標注。本實驗分為兩步:第一步,對每種期刊的前100條數據進行實驗,根據實際情況改進標注標準;第二步,根據改進后的標準重新進行分類標注,并對自信度較低的分類數據進行二次標注,獲得分類標注數據集。利用python編程對分類標注數據集進行處理,結果如表3所示。

表3 作者署名順序及通訊作者標注結果(示例)
學科特性影響作者署名及其貢獻行為。本文對圖情領域及醫學領域中各作者所作貢獻的種類數目進行統計。經非參數檢驗,p值為0.535,大于0.05,兩領域作者貢獻種類數的總體分布不存在顯著差異。兩領域均由于科研協作的需要,多種角色的署名作者較少,而專注于一兩項貢獻的署名作者較多。但醫學領域的研究活動分工更加明確,43%的作者僅完成一項任務。Larivière V等[51]在其研究中也證實生物醫學和臨床醫學是作者貢獻更加分散的學科。相對來說,圖情領域的作者更傾向于完成兩三項工作,最多作出7種貢獻。但署名作者是否都作出實質性貢獻還有待考證。
為更好地探究作者貢獻同學科特性的關系,本文對圖情領域及醫學領域中的作者貢獻分布做宏觀統計,并對不同貢獻要素的獨立完成比例進行探究。如圖2所示,撰寫和修訂是論文發表的重要環節,因此論文起草撰寫和論文修訂審閱也是占比最高的作者貢獻要素。
思路提出、設計研究方案及數據資料收集整理是圖情領域內較為注重的部分。由于學科交叉的影響,系統設計與開發也出現在圖情領域,但僅被8%的文獻所提及。醫學是偏實驗性、應用性的學科,數據及實驗相關的作者貢獻較多,而思路及研究框架設計較少。此外,質量控制與評估作為獨特的貢獻要素為醫學的嚴謹性提供保障。
對圖情領域及醫學領域中貢獻要素的獨立完成率分布進行非參數檢驗,p值為0.001,小于0.05,存在顯著差異。圖情領域中,每類貢獻均有50%以上的文獻由單一作者完成,尤其是思路提出等指導性的任務,這些偏向概念、知識性的貢獻更傾向于獨立完成,也更能體現個人成果。而實踐性相對較強的醫學領域對資源和能力的需求更為豐富,合作現象也更明顯,每項任務一般由多作者合作完成,尤其是實驗實施及數據收集處理,僅有9%的文獻其實驗實施由一位作者單獨完成。
3.2.1 不同作者數目下貢獻程度與署名順序的關系
通常認為作者貢獻大小與署名順序緊密相關。本文分別在合著作者數為2-5人的情況下,對不同署名位置的作者在該研究成果中的貢獻種類數目進行統計。以合著作者是3人的情況為例,如圖3所示,“2種貢獻”代表在不同署名位置下,作出11種貢獻中的任意2種。總體來看,隨著署名順序延后,兩領域中作者貢獻種類依次減少,單一貢獻的作者比例逐漸提高。但醫學領域中22%第一作者作出單類貢獻,而圖情領域中僅3%第一作者貢獻單一。相同署名位置下醫學領域的作者貢獻種類數目普遍小于圖情領域。醫學領域偏重技術、實驗,對各種資源和能力的要求更大,合作作者數目更多,專人發揮專長,每個作者的貢獻廣度則相對較小。作者署名能夠較為嚴格地遵循按照貢獻大小排列的原則。
3.2.2 不同作者數目下貢獻要素與署名順序的關系
依據貢獻種類的多少,并不能全面準確地判斷作者的貢獻大小。因此,本文對不同署名順序下作者的具體貢獻內容作出探究。
整體上作者的署名順序一般可以用第一作者、中間作者以及最后的作者來劃分,并在貢獻要素分布上呈現出一定規律。分別對不同位置下兩領域的作者貢獻要素分布做非參數檢驗,p值均略大于0.05,表明差異并不顯著。以三個作者合作的情況為例,如圖4所示,第一作者作為學術研究的主導者,基本參與并完成大部分研究工作,尤其是數據收集處理、論文起草撰寫以及論文修訂審閱,具有較高的權重。而中間作者及最后的作者則一般負責增補性或指導性的工作,隨著署名順序的延后,數據處理、分析等操作性的貢獻以及論文修訂審閱的比重逐漸提高。此外,圖情領域較為注重宏觀指導性的貢獻,而醫學領域對數據及實驗等操作性貢獻較為關注。在科研評價時應考慮學科特性,分別對不同的作者貢獻賦予不同的權重,彌補僅通過署名位置進行科研評價的缺陷[52]。
一般來說,第一作者是研究工作的主要參與者與論文撰寫者,而學術界對通訊作者的定位卻有一定爭議[53]。有學者認為通訊作者一般是權威專家,僅負責成果發表和稿件的對外通信;也有學者認為通訊作者往往是該研究項目的負責人,是主要研究思想的提出者,是研究的建議者和把關者[54]。為此,本文對通訊作者的署名位置及貢獻內容進行探究。
圖情領域傾向于將第一作者、第二作者作為通訊作者,其中《圖書情報工作》多以第二作者為通訊作者,而《數據分析與知識發現》多以第一作者為通訊作者;而醫學領域較多將署名最后的作者作為通訊作者。通訊作者在兩個領域中的署名順序差異較大,但非參數檢驗結果顯示,在貢獻要素分布上不存在顯著差異。以三個作者合作的情況為例,如圖5所示,通訊作者的貢獻要素分布與其署名位置下作者的貢獻要素分布類似。圖情領域的通訊作者主要作出思路提出、研究方案設計及論文撰寫與修訂等貢獻,而醫學領域的通訊作者主要完成思路提出、實驗實施、論文修訂、質量控制與評估等貢獻??傊ㄓ嵶髡咦鳛閷ν馔ㄐ诺呢撠熑藨媪私庋芯克悸?,參與論文寫作并對文章負責,在醫學領域的科研過程中還應承擔實驗實施等關鍵性任務,其貢獻的重要程度和地位大小不容置疑。
貢獻聲明的出現,有助于讀者更好地了解作者的研究過程,并對署名的透明和規范進行監督,保障作者的合法權益。為給作者署名提供參考,促使作者貢獻聲明在各領域的合理發展,本文從學科特性、署名順序、通訊作者三個角度進行統計分析,探究圖情領域及醫學領域下作者貢獻的特征及規律。
從學科特性來看,除數據處理與論文寫作外,圖情領域更注重思路設計,而醫學領域則更注重實驗實施。兩個領域作者貢獻種類數的總體分布不存在顯著差異,作出少數貢獻的作者較多,但貢獻要素獨立完成率分布的差異十分顯著,醫學領域的合作率相對較高,作者分工更加明確。從署名順序來看,第一作者作為研究的主導者,通常完成大部分實質性工作,尤其是論文寫作;其余作者作出增補性貢獻,更有利于專人發揮其專長;醫學領域中署名最后的作者,其指導作用較為明顯。從通訊作者角度來看,圖情領域的通訊作者多為第一作者、第二作者,而醫學領域的通訊作者一般署名靠后。兩領域的通訊作者貢獻分布差異較小,除思路指導性貢獻外,也參與論文撰寫修訂等實質性工作,通訊作者的重要性不容質疑。
作者貢獻聲明在國內期刊中尚未普及,國內索引數據庫也未做明確要求。本研究僅選用醫學和圖情兩個領域的四種期刊,總體樣本數量較少,可能在一定程度上影響了研究結論,具有一定的局限性。隨著作者貢獻聲明表述的進一步規范,以及更多學科領域期刊對貢獻聲明的采納,筆者將在未來研究中加入經濟學、文學、理學、工學、管理學等學科領域,更加規范和完善作者貢獻分類體系及標注過程,選取更為完整的作者年齡、性別、科研產出等信息進行分析,從而提高作者貢獻特性研究的廣度和深度,為作者貢獻聲明在圖情領域的合理發展及其他學科領域中的研究與應用提供參考。