江 霞
我國學術期刊識別偽作者的方法
江 霞
概述我國學術期刊識別偽作者的方法,供同行參考應用,杜絕學術不端。閱讀大量文獻,結合編輯實踐工作經驗,總結分析識別偽作者的方法。認為識別偽作者的方法主要有兩種:一種是利用CrossCheck反剽竊文獻檢測系統、學術不端文獻檢測系統、專業軟件、基于數字指紋的文獻相似度檢測及利用語義角色標注技術等輔助工具判斷抄襲從而識別偽作者;另一種是科技期刊編輯增強責任意識,通過從期刊網站注冊的作者信息、作者工作單位與文章內容吻合度、電話溝通、將每次修改稿的作者署名和排序與原稿進行比對、和通訊作者聯系,審核基金項目與論文關聯度等多種方法自主識別偽作者,這些方法都能從一定程度上杜絕弄虛作假的學術不端行為。認為學術期刊編輯采取多種方法自主識別偽作者外,還需要完善相關管理制度,建立健全法律責任體系,加強高等院校對學生學術道德的培養,提高網絡媒體平臺的自治意識與社會監管能力;同時,編輯要敢于擔責,同行期刊應建立聯盟機制,共同杜絕學術不端。
學術期刊;偽作者;學術不端
[作 者]江霞,南方醫科大學南方醫院《護理學報》編輯部。
“偽”指虛假,與“真”相對[1],偽作者指虛假的論文作者,即論文真正的寫作者并不是署名作者。目前,國內學術期刊論文抄襲、剽竊、弄虛作假等學術不端[2]現象非常普遍。同時,學術不端行為中偽作者的身份與行為較隱蔽,不易識別與判斷。為了凈化學術氛圍,杜絕弄虛作假行為[3],學術期刊需要采取多種手段識別“偽作者”,以確保科技期刊學術論文的科學性。當前,我國學術期刊對學術不端行為的研究主要集中于防范措施及其檢測系統方面的報道[4-13],但針對具體識別“偽作者”的方法研究極少,江霞[14]結合實踐工作經驗,通過從期刊網站注冊的作者信息、作者工作單位與文章內容吻合度、電話溝通等幾種方式識別“偽作者”取得了一定效果。鑒于此,筆者在上述識別“偽作者”的研究基礎上,進一步擴大研究范圍,綜合同仁報道的研究成果,更加全面、深入地整理出我國常用的幾種識別“偽作者”的實踐方法,旨在為學術期刊編輯識別“偽作者”提供參考,現介紹如下。
(一)利用輔助工具識別偽作者
1.CrossCheck反剽竊文獻檢測系統識別法。系統因實現了多語種的文獻檢測功能而在國際上廣泛應用,其操作方法簡單,只要將被測論文傳送到檢測系統,與其儲備數據資源庫或互聯網開放共享資源進行對比檢測,系統就會迅速生成一個相似度報告,顯示被測論文與其他內容匹配的相似百分比,并以不同的顏色標出各相似的文本內容[15]。學術期刊編輯可據此判斷論文是否涉及抄襲,從而識別偽作者。該系統的弊端是只能對語言文字進行比對,還無法對儲備數據庫以外的內容,“高級”抄襲以及公式、圖像、表格等內容進行直觀有效的比對。
2.利用學術不端文獻檢測系統識別法。學術不端文獻檢測系統主要有3種:CNKI學術不端文獻檢測系統、萬方論文相似性檢測系統和武漢大學自主開發的ROST反剽竊系統。編輯只需將目標檢測論文上傳到上述檢測系統,系統就可以快速提供被測文獻與其他文獻的雷同比例,其比對結果包括被測論文雷同的字數與字段長度,雷同文獻的作者及來源,發表時間等。編輯可依據系統生成的檢測報告來判斷抄襲、偽造、剽竊、不當署名等學術不端行為[16]。前2種檢測系統目前在學術界應用比較普遍,ROST反剽竊系統已將研究重點轉向內容挖掘,較少正式運用。編輯可據此判斷論文是否涉及抄襲和是否屬于自身研究成果,從而識別偽作者。上述3種檢測系統的弊端是無法識別同義詞替換、句子語序調整等語義抄襲行為。
3.利用專業軟件進行識別法。
(1)Turnitin剽竊檢測[17]識別法。Turnitin剽竊檢測是一款學術工具類軟件系統,它通過大部分主流瀏覽器接入互聯網,將被測論文與Turnitin背后海量的全球數據庫和網頁內容作比對,迅速得出一個相似度比例和涵蓋大量相關信息的原創性檢測結果。科技期刊編輯可根據這些Turnitin精確定位出的論文中非原創的內容,對論文整體的原創性做出一個客觀判斷,據此識別偽作者。
(2)文本相似性百度檢測法。該檢測軟件是一種可以幫助用戶檢測論文是否為原創的論文相似性檢測工具,用戶只要在輸入區輸入目標檢測論文,然后設置好隨機檢測字數,設置好每次檢測間隔之后,系統就會自動在百度上搜索相關的語句、詞條,如果有相似的內容會很明顯地顯示出來[18]。通過這個程序,可以很方便地了解到一篇論文是否為抄襲,或者抄襲程度如何,從而識別偽作者。
4.基于數字指紋的文獻相似度檢測識別法。為了應對自然語言抄襲,基于漢語詞頻的文本數字指紋的文獻相似度檢測識別法[19]應運而生。該方法是通過對具有參考性的語料庫進行詞頻和字頻統計形成一個 hash詞表,然后基于最大熵原理為任意長度的文本生成一個基于詞頻特征的文本數字指紋,對于任意兩篇文獻可以通過計算對應的兩個數字指紋的Hamming距離來得到一個相似度的估計,進而判斷一篇論文是否為抄襲,或者抄襲程度如何,從而識別偽作者。該方法的不足也是對語義級別的抄襲較難識別。
5.利用語義角色標注技術對學術文獻檢測識別法。利用語義角色標注技術對學術文獻檢測的方法,可以識別同義詞替換、句式調整、語言結構調整等語義級別的抄襲行為。其方法是以句子為最小單位進行文獻的語義相似度檢測;其操作步驟為:提取文獻中所有詞語的上位詞,每篇文獻形成句子—詞—語義角色—上位詞四部圖,通過四部圖確定兩篇文獻的待對比句子[20],進而得出兩篇文獻的語義相似度,判斷論文是否為抄襲,或者抄襲程度如何,從而識別偽作者。這種方法由于受語義角色標注工具和技術的限制,還未能得到廣泛使用。
(二)學術期刊編輯自主識別偽作者
1.從期刊網站注冊的作者信息中識別。目前,很多學術期刊建立了自己的官網,方便作者在網絡平臺在線投稿。一般來講,在線投稿時作者必須要注冊用戶名,填寫作者的真實個人信息。學術期刊編輯只需在審稿過程中提高警惕,認真比對網站注冊的作者信息與論文的署名作者信息是否吻合[14],就可以識別偽作者。
2.從作者工作單位與文章內容吻合度進行識別。大部分學術論文是研究者將理論和專業知識在實際工作中的運用與升華。因此,學術期刊編輯在審稿過程中一定要密切關注作者的實踐經歷,以保證文章內容的真實性與實用性。判斷作者的實踐經歷很重要的信息來源是作者的工作單位[14]。學術期刊編輯在審稿過程中,可以運用自己的專業知識和實踐經驗,打電話與作者溝通,質問有關論文研究目的與意義,資料與數據來源,以及寫作思路與過程等方面的問題,了解作者的實際工作資質、經歷和工作范疇與任務等,經過進一步的交流,編輯可以從作者工作單位及任務中與文章內容的吻合度識別出偽作者。
3.從電話溝通過程中識別。部分學術期刊的作者群由于工作性質較為特殊,作者身份或以男性為主,或以女性為主。如,目前護理工作者絕大多數為女性,對于個人信息顯示為女性,而編輯在審稿過程中與作者電話溝通時,發現實際通話人是男性者,編輯可以要求作者對文章內容進行概括陳述[14],進而核實其作者身份的真實性,以識別偽作者;另外,還有一些利益集團、“槍手公司”代替作者打電話來咨詢論文事宜,也可通過這種電話交流方法判斷通話人是否為偽作者。
4.將每次修改稿的作者署名和排序與原稿進行比對來識別。一篇論文從投稿到發表,基本上都要經歷1次甚至于多次修改。有些作者出于某種原因,在修稿過程中增加、減少或變換作者,或更改作者排序,若作者不主動作出說明,編輯很容易忽略這一環節的審核。在當今以在線電子稿件為主的審稿模式下,尤其是對多次修改的稿件,編輯更加應該重視對作者屢次修改稿署名和排序與原稿進行比對,以識別偽作者。
5.利用和通訊作者聯系進行識別。學術期刊編輯在論文的審理與編輯過程中應與通訊作者進行聯系和溝通,以核實錄用的論文署名是否真正體現了各作者的實際貢獻;通訊作者應對文章進行把關,并屢行監督的責任和義務,同時向編輯部出具所有作者親筆簽名的論文專用使用權授權書,以避免有些署名作者在未知情同意的情況下刊發論文,而被動地成為偽作者。
6.從基金項目與論文關聯度進行識別。目前,許多學術期刊的基金論文比逐年提高,很大一部分原因是高水平作者不斷增加,作者在科研項目中產出了一部分優質論文,甚至于有一些學術質量高的核心期刊,其自身影響力吸引了行業內絕大部分的基金論文,還有很多學術期刊采取免審稿費、免版面費、優先審稿并提前錄用等多種優惠措施拓展了一部分基金論文,以此來提高期刊學術質量從而擴大其影響力。在諸如上述條件的刺激下,很多作者為了能快速刊發論文,將并非基金資助的論文掛上某個科研課題作為基金論文投稿。筆者在審稿過程中,曾經發現有的作者投稿時論文中標明了基金課題名稱及級別,當收到本刊修稿意見要求其出具基金項目相關批文復印件及研究內容與論文關聯度以辨真偽時,作者便稱論文并非基金論文;此外,筆者在審稿過程中還曾發現,某一個時間段內,某一個基金項目名稱會在不同省份、不同單位的不同研究范疇的論文中同時出現,經初步鑒別這一批論文作者之間并無真正的合作研究后,筆者便與作者聯系,要求其提供基金項目相關批文復印件及作者排序、研究內容與論文關聯度等相關資料時,作者便不再與編輯部聯系,有些放棄修稿甚至撤稿;還有部分作者雖然提供了課題立項相關資料,但論文卻是大部分抄襲了基金課題的相關內容且作者并非課題中的主要研究人員。這些現象表明,作者槍手公司或者中介公司,或是朋友“情誼”,提供了關聯度不大,甚至是虛假、偽造的基金項目論文。提示學術期刊編輯審稿、用稿時不能唯“基金論文比”,也不能因非基金論文而錯失了優秀稿件,更需要對標識了基金項目的論文進行嚴格的內容匹配度審核,從中識別偽基金論文及偽作者。
(一)完善科研管理制度,凈化學術氛圍,有利于識別并查處偽作者,杜絕學術不端行為
在當今學術風氣日趨低下的社會環境中,偽作者賴以生存的肥沃土壤是強大的需求量。而刺激這一需求的是現有的評審與用人機制。作者為了發表畢業論文、職稱論文,通過百度搜索找到槍手公司、中介騙子公司高價買論文的事例不勝枚舉。中國高校科技期刊研究會曾代表200多家醫學會員期刊發函并抄送期刊的正規名稱和官網給百度公司,要求百度公司為廣大讀者提供一個健康的網絡環境,恪守相關審核制度,清除相關因競價而在網頁搜索中置頂的假冒網站[21]。但此舉收效甚微,筆者不定期上網去隨便檢索幾家醫學期刊官網,仍然會發現虛假網站置頂橫行,本刊不少作者也曾致電編輯部,稱其投稿至騙子網站后,被收取高額版面費而未收到樣刊,或收到偽劣樣刊后騙子銷聲匿跡。2016年年初,國務院辦公廳發布了關于《國務院辦公廳關于優化學術環境的指導意見》[22],該文件對誠信自律、學術道德,以及學術不端的表現與處理等,作出了明確的定義與規定,要求非常具體。
文件出臺后,很多科研管理單位、高等院校都制定了相關的執行對策,比如有作者反映其所在的大學研究生學院、人事處、科研處等部門綜合意見后發文規定,凡是發現有學術不端行為的論文,研究生不予畢業,晉升職稱者取消申報資格等。比如,我刊發現存在一稿兩投、論文抄襲等學術不端行為者,經與作者溝通不果時,即向其單位反映,單位非常重視并對涉事作者及其導師進行嚴厲批評教育,同時嚴格按單位的學術不端行為的處理規定進行相關處理。這從很大程度上對該校學生和老師進行了一次深刻警示教育,從而能在一定程度上杜絕學術不端,凈化學術氛圍。筆者在審稿過程也發覺,本刊作者的誠信意識有所增強,在投稿或修稿過程中會主動詢問論文屬于會議交流或碩士畢為論文是否可投稿等問題,有些作者投稿時還會附上收集的原始研究資料與數據,有些作者會主動闡述統計學處理方法的過程以及對統計學專業老師致謝等。
目前,在杜絕學術不端行為上,我國還沒有出臺專門的法律來進行規范,而且司法部門也基本不介入學術腐敗案件的調查處理,尤其是對網絡上提供的學術期刊虛假信息的治理與監督更加缺位與無助。因此,識別偽作者,治理學術不端行為,更加需要完善相關科研管理制度,建立健全與之相適應的法律責任體系,加強高等院校對學生學術道德的培養,提高網絡媒體平臺的自治意識與社會監管能力。
(二)學術期刊編輯應有責任擔當,同行期刊應建立聯盟機制,共同杜絕學術不端
遵守學術倫理道德、凈化學術環境、規范論文發表是期刊編輯的重要責任[23]。學術期刊編輯應具有把握論文學術誠信的判斷力,堅持求真務實的編輯精神,除了按照上述多種方法識別偽作者外,更應敢于擔責,自覺在學術論文審稿、期刊出版過程中杜絕學術不端行為;同時,建議同行期刊,尤其是專業相同或相近的期刊,同心協力,簽署學術期刊聯合聲明,對造假嚴重者的論文“終生不用”;對偽作者、一稿多投等學術不端論文,堅決不用;并聯合發表聲明將學術不端行為公之于眾[24],同時通知其所在單位及職稱評審等部門進行嚴肅處理,并聯合同行期刊至少2年內拒絕接受此類作者投稿。通過多方合作,多管齊下,共同杜絕學術不端行為,維護學術誠信與尊嚴。[本文系廣東省科技計劃項目(2015A030302021)]
[1]中國社會科學院語言研究所詞典編輯室.現代漢語詞典[M].3版.北京:商務印書館,2002(增補本):1311.
[2]田美娥.科技期刊的學術不端行為及其預防[J].今傳媒,2009(12):70-71.
[3]江霞,方玉桂,陳伶俐,等.醫學科技期刊應用《科技期刊學術不端文獻檢測系統》判斷抄襲時應慎重對待的幾種情況[J].中國科技期刊研究,2010,21(4):471-472.
[4]劉清海.從來稿基本信息著手發現學術不端的線索[J].編輯學報,2014,26(5):449-451.
[5]劉清海.科技期刊編輯在防范學術造假論文中的作用[J].編輯學報,2014,26(3):258-261.
[6]張旻浩,高國龍,錢俊龍.國內外學術不端文獻檢測系統平臺的比較研究[J].中國科技期刊研究,2011,22(4)514-521.
[7]王宇.學術不端文獻檢測系統研究綜述[J].西南民族大學學報(人文社會科學版),2013(4):236-240.
[8]張敏.學術不端行為:學術期刊編輯的認識誤區與防范策略[J].廣東農工商職業技術學院學報,2009,25(2):81-83.
[9]蔣寅.治理學術腐敗和學術不端行為的思路與對策[J].社會科學論壇:學術評論卷,2009(17):30-63.
[10]黃俊輝,李奉華,闕國鷹,等.基于榮譽制度的誠信教育與早期防范高校學生學術不端行為的探討[J].中國高等醫學教育,2009(10):45-46.
[11]孫瑞灼.對學術不端“零容忍”需要制度保障[J].教育與職業,2009(28):84.
[12]程郁綴,劉曙光.防止學術不端和期刊的責任[J].武漢大學學報(人文科學版),2009,62(5):635-638.
[13]張紅軍,黃健,楊勇,等.高校學術不端行為的防范和措施[J].重慶醫學,2009,38(12):1546.
[14]江霞.科技期刊識別偽作者的方法——以《護理學報》實踐為例[J].編輯學報,2013,25(2):151-152.
[15]林漢楓,賈曉燕,張月紅,等.重視學術倫理是期刊編輯義不容辭的責任——《浙江大學學報》(英文版)初探CrossCheck的工作模式和規范標準[J].中國科技期刊研究,2011,22(3):328-333.
[16]譚華,崔潔.學術不端文獻檢測系統的使用建議[J].編輯學報,2010,22(2):153-155.
[17]不詳.Turnitin剽竊檢測系統[EB/OL].http://baike. baidu.com/link?url=fJiK1paX_cu8OZoCwqSAyY3dREUo2Q2 TNXklEhRKZX6bSCDCzqfHF2IxkUOZ5vHYFDCEclC2rAH5 VWNrfA8Hlq.
[18]不詳.文本相似性百度檢測V1.22官方免費版[EB/OL]. http://www.cncrk.com/downinfo/24906.html.
[19]白如江,王曉笛,王效岳.基于數字指紋的文獻相似度檢測研究[J].圖書情報工作,2013,57(15):88-95.
[20]王曉笛,祝娜,白如江,等.基于語義角色標注的文獻相似度檢測研究[J].圖書情報工作,2014,58(12):130-135.
[21]中國高校科技期刊研究會.關于對中國高校科技期刊研究會醫學期刊官網進行認證和置頂的協調函(附215家醫學期刊官方網址)[EB/OL].http://blog.sciencenet.cn/blog-278395-924483.html.
[22]國務院辦公廳.國務院辦公廳關于優化學術環境的指導意見[EB/OL].http://www.gov.cn/zhengce/content/2016-01/13/content_10591.htm.
[23]葉青,楊樹啟,張月紅.科研誠信是全球永遠的課題——中國科研管理與學術出版的誠信環境[J].中國科技期刊研究,20l5,26(10):1040-1045.
[24]江霞.廣東省醫藥衛生期刊論文責任編輯信息公開狀況研究[J].科技傳播,2016,8(13):41-42.