向 飛 鄭 斌
(《人民珠江》編輯部 廣東 廣州 510611)
科技論文公開發表的目的在于知識分享與傳播,但由于種種原因,部分論文長達數年只是被瀏覽、下載,未被引用到后面的研究中,猶如曇花一現;也有不少論文,不止獲得高下載量,而且頻頻被后來者引用。有關零被引、高被引論文特征的研究中,陳勇等[1]統計了出現次數排名前20 位的零被引論文的題名高頻詞,但具體原因未做深層次分析;駱超等[2]認為高被引論文的典型特征為知名作者、熱點問題和專題綜述;蔡明科等[3]統計分析了普通高校水利類學報零被引論文與互聯網篇均下載量、第一作者屬性、論文類型與主題分布、基金資助等因素的關系,未涉及工程類水利期刊;黃翠芳[4]雖然在2012年以水利工程類科技期刊為研究對象,對2006—2010年的總被引頻次、Web 即年下載率等指標進行了統計分析,但未涉及零被引、高被引頻次的原因分析。
在以上文獻研究結果的基礎上,本文以《人民珠江》2009—2018年發表的論文作為數據源,從Web 即年篇均下載次數、基金論文比、參考文獻數量、作者合作度、題目詞頻等指標使用Excel軟件、語料庫[5]、圖悅進行統計和可視化對比,以期為期刊的稿源篩選、影響力提升提供有益參考。
借鑒普賴斯定律確定核心作者的方法確定高被引論文:N≈0.749×為論文最高被引頻次。選取被引用次數為0的論文,于2021年3月18日在中國知網引文數據庫檢索、下載,剔除資訊類文獻如致謝、稿約、啟事、勘誤等,得到零被引的論文322 篇,高被引的論文230 篇。需要說明的是,零被引論文只是一個相對概念,只能說明一篇論文在研究時間內未出現任何引用。
2009—2018年《人民珠江》發表的論文中,被引頻次最高為88 次,為孟現勇等在2016年7 期發表的《CMADS 數據集及其在流域水文模型中的驅動作用——以黑河流域為例》一文。將代入上式后圓整,得到N=7,即被引次數N≥7的論文確認為高被引論文。
圖1顯示,2009—2018年高被引論文的Web即年篇均下載頻次最低為2015年的188 次,最高為2012年的334次,分別比同期的Web 即年篇均下載頻次平均值119 次、108 次高了57.98%和209.26%;零被引論文的情況則剛好相反,其Web 即年篇均下載頻次最低為2011年的44 次,最高為2017年的110次,分別比同期的Web即年篇均下載頻次平均值89 次、166 次低了50.56%、33.73%。某種意義上來說,Web即年篇均下載頻次大,被引頻次就高。值得注意的是,鑒于網絡下載論文全文需要付費,所以摘要的撰寫就顯得尤其重要。按照《科學技術期刊編輯教程》對摘要的定義,撰寫摘要時,應向讀者提供論文中全部創新內容和盡可能多的定量或定性的信息,重點放在“結果和結論”的撰寫上。

圖1 :Web即年篇均下載頻次之對比
研究數據表明,2009—2018年,基金論文在零被引論文、高被引論文中的占比分別為13.66%、38.70%;同時,高被引占比存在2個峰值,分別出現在2011年、2015年,與此對應的,零被引占比均為0;基金論文比在2014年以后呈明顯遞增趨勢,但高被引占比在2015年以后卻呈下降趨勢。這些提醒編輯部在審稿的時候,對基金論文不可盲目信之而應該客觀對待[6],因為不排除作者投稿時為了順利發表而隨意掛基金項目;而且無基金資助的論文,不乏佳作,比如2008年1期發表的《采用一維水質模型計算河流納污能力中設計條件和參數的影響分析》,沒有受到任何基金資助,在當年發表論文中被引次數卻最高。該文作者從事一線水文工作,在文中分析采用一維水質模型計算納污能力過程中設計條件和參數對計算結果的影響,并討論如何確定設計條件和參數[7]。此類論文邏輯清晰、實用性強,被引次數高在意料之中。
參考文獻反映論文研究工作的背景,是科研工作的聯系性、繼承性與相關性的體現,同時也是論文作者對其研究內容已有研究知識脈絡把握情況的反映,一定程度可以反映科研論文的質量與信息量[8]、[10]。對《人民珠江》2009—2018年零被引、高被引論文的參考文獻數量用Execl 進行統計分析,發現10年里零被引平均引文數量雖然從2009年的3.14 篇增加到2018年的10.76 篇,呈逐年遞增趨勢,但整體增速仍低于高被引論文。參考文獻數量越多,一方面意味著該研究匯總了之前的眾多研究成果,綜合性強,跨學科性高,因而容易吸引多個學科的研究人員的關注,論文的可見度增加,從而使得論文的被引頻次越高。
對2009—2018年零被引論文作者人數用Execl 統計發現,近八成的論文作者數在1-3 人,4 人及4 人以上作者的論文數量則僅為兩成。這10年里零被引論文的作者合作度計算如下:ξ0=∑(零被引論文篇數×作者數)/刊文量= (101×1+91×2+61×3+50×4+13×5+2×6+2×7+2×8)/322=2.36,同樣地計算出高被引論文的作者合作度ξh為2.87。
就統計數據而言,隨著作者人數的增加,零被引占比的下降趨勢明顯,高被引占比除了在作者人數為3時出現一個峰值,整體呈下降趨勢。這說明適當地提高合著規模有利于降低論文零被引現象的發生,因為論文合著現象體現了不同學者之間的學術交流活動,促進了知識的共享與創新。
詞頻分析作為一種定量定性相結合的方法,克服了知識梳理過程中的主觀缺陷,本文用于分析題目主題詞。先進行詞頻統計,將下載的零被引、高被引論文題目的文本文件導入語料庫,生成結果再用Excel 導出,并用圖悅對于載入文本進行詞頻提取和詞語(重要性)權重分析,生成可視化詞頻圖。剔除題目常見的“研究”“分析”等詞,只列出中心詞,零被引、高被引論文題目的高頻詞對比見表1、2,詞頻見圖2。可以發現,零被引論文中,題目出現“工程”“設計”“水庫”的比例排前三位。分析原因,這類題目的論文多為工程實踐類,大多是成熟的理論、方法的應用結果評價,或者是新方法在不同工程中試驗效果的評估[3],論文中提及的思路或方法,缺乏深入研究的必要,而且同類的文章較多,造成零被引。而高被引論文題目詞頻排前三位的是“模型”“流域”“評價”,這表明高被引論文多集中于學科研究的熱點問題,具有一定的理論深度和研究基礎,處于研究的中上游,衍生發展的研究方向可能就多,其被引用的概率就高。

圖2 :零被引、高被引論文題目詞頻(2009-2018年)

表1 :零被引高頻詞頻統計
按照《中國學術期刊影響因子年報(自然科學與工程技術)》2019年版的統計,水利工程期刊共75 本,選排名第一、居中的A、B 期刊與《人民珠江》(PR)進行比較,結果見表3。與執牛耳的A 相比,PR 在ηmax、零被引論文占比、高被引論文占比均明顯處于劣勢,尤其是高被引論文占比,落后A 期刊47.62 個百分點,差距甚大。究其原因,A 為創刊最早的水利專業性期刊,主辦單位在水利行業內具有極高的影響力,學科背景強大,且第一作者多為博士及博士以上學歷[2]。《人民珠江》要追趕先天條件優越的A 期刊,還有很長的一段路要走,還需在提升期刊質量、擴大期刊影響力等方面多花心思、多下苦功。

表3 :三本期刊對比(2009-2018年)
對編輯部而言,減少零被引和提高高被引論文比例的措施建議如下。①嚴格審稿,“三審制”任一環節,都需嚴把質量關,在初審階段,重點審查論文研究選題的科學性、前沿性和創新性和內容的規范性,尤其重視引導作者撰寫規范的中英文摘要;外審階段,定期更新審稿專家庫,甄選負責的審稿專家做稿件質量的把關人,提升外審環節對優秀學術論文的識別能力;終審階段,重點把控論文學術價值能否真正起到助推學科發展的作用,并審視論文的政治性、前沿性、創新性等核心問題[9]。②仔細編校,重視插圖的編輯加工和表格的規范化。一篇優秀的論文,不僅要有內涵,格式也非常重要,美觀的版面、清晰規范的圖表都會給論文加分,讀者的悅讀感也油然而生,引用幾率也會相應增加。③加大宣傳與推廣力度,多樣化推送論文,比如充分利用期刊微信公眾號平臺,及時推送最新出版的論文全文,期刊網站開放期刊全文免費下載通道,方便讀者查詢與下載,從而提升論文傳播效果。④多向知名作者約有關熱點話題的專題綜述。

表2 :高被引高頻詞頻統計
對作者而言,①建議積極參與基金項目的申請,提高論文學術質量;②重視摘要、關鍵詞的撰寫,應摘錄出原文的精華,有較多而有用的定性和定量的信息;③關注研究熱點,注重研究意義,以提高論文的引證價值;④適當地提高合著規模,結合3.4節可知,隨著作者人數的增加,零被引論文的占比明顯減小。
利用文獻計量的方法,借助Excel、語料庫、圖悅等工具,首次分析《人民珠江》在2009—2018年刊登的零被引、高被引論文特點,繪制零被引、高被引詞頻圖。分析自身期刊的零被引、高被引論文,并與行業龍頭期刊進行對比,并非自揭其短,而是在前進的道路上不斷自省,從而更好地前行。該文亦可為同行如何減少零被引論文發表數量、調整選題方向和欄目設置提供有益參考。■