梅慶玲+郭艷陽



摘 ? ?要: 通過論文相似度檢測系統檢測畢業生的畢業論文在約束學生論文抄襲方面達到了較好的效果,但是不同的論文檢測系統的對比庫不同,對同一篇論文檢測的結果存在差異。這給高校選擇哪種論文檢測系統作為畢業生論文查重的標準帶來了困難。針對這一問題,本文選取若干本屆畢業生的論文,比較這些論文在維普、大雅論文相似度檢測系統中檢測結果的差異性,并分析產生差異的原因。
關鍵詞: 畢業論文 ? ?相似度檢測 ? ?論文檢測系統
畢業論文是對學生大學四年在校學習、實踐等專業知識學習的綜合考核。為了端正學生畢業論文的撰寫態度,督促學生保質保量地完成畢業論文,南京郵電大學通達學院圖書館(以下簡稱“我館”)開通論文相似度檢測系統對2016級畢業生的論文進行相似度檢測。我館開通試用的是大雅論文相似度檢測系統(以下簡稱“大雅檢測系統”)和維普論文檢測系統(大學生版)(以下簡稱“維普檢測系統”)。筆者選取40篇畢業生的論文在維普、大雅論文相似度檢測系統中進行檢測,對檢測結果進行了比較分析。
1.論文樣本選擇與比較方法
1.1論文樣本選擇
從參與論文相似度檢測的同學中選取40位同學的論文,其中20篇選取理工科方向的通信工程、計算機科學與技術、軟件工程、微電子工程、信息工程等專業學生的畢業論文,另外20篇選取文科方向的市場營銷、物流管理、英語、電子商務等專業學生的畢業論文。
1.2比較方法
(1)先使用大雅檢測系統和維普檢測系統對選取的40篇畢業論文進行檢測,檢測結果按照理工科組和文科組分別記錄;
(2)理工科組和文科組分別記錄大雅檢測系統、維普檢測系統檢測的論文相似度及兩個檢測系統檢測結果差,結果差采用大雅檢測系統檢測結果減去維普檢測系統檢測結果;
(3)對每組的20條結果差進行分析,分別以5條、10條、15條、20條數組統計結果差的平均值;
2.結果比較
分別對理工科、文科兩組的檢測結果差進行比較。
2.1理工科組比較結果
2.1.1兩個檢測系統相似度檢測結果比較
通過大雅、維普檢測系統檢測理工科組20篇論文發現,相同論文的檢測結果存在差異,使用大雅檢測結果減去維普檢測結果,相似比差異最高為-30.04%,最低為0.55%,具體結果如表1、圖1所示。
表1 ?理工科組大雅檢測系統與維普檢測系統結果差
圖1 ? ?理工科組兩個檢測系統相似度檢測結果比較
2.1.2兩個檢測系統相似度結果差分段比較
對20條結果差進行分段求和,首先計算前五條結果差之和,然后分別計算前5組、前10組、15組、20組結果差之和,結果取絕對值,保留兩位小數。具體結果如表2、圖2所示。
表2 ? 理工科組兩個檢測系統相似度檢測結果分段誤差
圖2 ? ?理工科組兩個檢測系統檢測結果分段誤差
2.2文科科組比較結果
2.2.1兩檢測系統相似度檢測結果比較
通過大雅、維普檢測系統檢測文科組20篇論文發現,相同論文的檢測結果存在差異,使用大雅檢測結果減去維普檢測結果,相似比差異最高為-53.07%,最低為1.68%,具體結果如表3、圖3所示。
表3 ? ?文科科組大雅檢測系統與維普檢測系統誤差率
圖3 ? ?文科組兩個檢測系統相似度檢測結果比較
2.1.2兩檢測系統相似度結果差分段比較
從圖3可以看出文科組論文在兩個檢測系統檢測的結果誤差較大,對文科組20條數據結果差分別按照5組、10組、15組、20組記錄進行分段求和,不取絕對值,具體結果表4所示。
表4 ? ?文科組兩個檢測系統相似度檢測結果分段平均誤差
2.3結果分析討論
通過大雅和維普檢測系統對文理科兩組數據的比較,可以發現每一篇論文在不同的檢測系統的相似度比都有一定差異,只是差異高低不同而已。
2.3.1理工科組比較結果分析
從表1、圖1可以看出,兩個檢測系統結果差最高為-30.04%,最低為0.55%,同一篇文章大雅檢測相似度高于維普的9篇,反之維普檢測相似度高于大雅的11篇。從表2、圖2可以看出,分段求結果之和,隨著樣本數的增加,兩個檢測系統相似度差異逐漸縮小。說明兩個檢測系統對不同論文的檢測都有相似比高于或低于另外一個檢測系統的情況,隨著檢測樣本數的增加,兩個檢測系統相似度高于或低于對方的情況趨于對等。
2.3.2文科組比較結果分析
從表3、圖3可以看出,文科組兩個檢測系統檢測結果差最高為-53.07%,最低為1.68%,同一篇文章大雅檢測相似度高于維普的4篇,反之維普檢測相似度高于大雅的16篇。在文科組維普檢測的相似比明顯高于大雅檢測系統。從表4可以看出,分段求結果差求和,結果沒有取絕對值,可以看出大雅檢測系統檢測的相似比都是低于維普檢測系統的,隨著樣本數的增加使得差異更明顯。
3.結果差異原因
為何兩個檢測系統對同一篇文章的檢測結果會存在這樣的差異呢?我們對兩個檢測系統及差異比較明顯的文章進行了分析。
3.1檢測的資源種類與數量不同
大雅檢測系統和維普檢測系統擁有各自的資源對比數據庫,它們的資源對比數據涵蓋的資源種類和數量是有差異的,兩個檢測系統資源涵蓋情況詳見表5。
表5 ? ?兩個檢測系統對比庫資源涵蓋范圍
從表5可以清晰看出大雅檢測系統和維普檢系統檢測論文相似度所對比的數據庫資源的種類及數量。維普檢測系統在期刊、學位論文資源方面的數量是高于大雅檢測系統的,大雅檢測系統相比于維普檢測系統最明顯的優勢是擁有中文圖書對比資源。
3.2論文參考的文獻類型影響相似比
對文理科40篇畢業論文在大雅和維普兩檢測系統中進行檢測,結果從圖1、圖3可以看出同一篇論文在不同的檢測系統的相似比都是有或多或少的差異。在表1、表3中我們可以看到同一篇論文檢測,理工科組大雅檢測的相似比低于維普檢測的結果達到30.04%,相似比高于維普檢測的結果為29.75%;文科組大雅檢測的相似比低于維普檢測的結果達到53.07%,相似比高于維普檢測的結果為26.76%;從最高差異來看,理科組兩個檢測系統的結果差比較接近,文科組大雅檢測的最高結果差明顯高于維普檢測系統。
筆者與論文在兩個系統檢測結果差異較大的學生就其所參考的文獻類型做了簡單的交流,從與學生的交流中獲知,在大雅檢測系統檢測相似比較高的學生多數是偏重參考一些電子圖書、雜志報紙等網絡資源,而在維普檢測系統檢測相似比較高的學生偏重于參考的是CNKI、維普期刊數據的期刊、學位論文等。
從表2、圖2可以得出隨著檢測樣本數的增加,理工科組大雅檢測系統和維普檢測系統兩者檢測的相似比結果差逐漸接近。而文科組隨著檢測樣本數的增加,結果差異更趨于明顯,維普檢測系統在文科組的檢測結果明顯高于大雅檢測系統。分析文科組的論文,我校文科專業主要有電子商務、市場營銷、物流管理,學生的畢業論文多數是以實際的電子商務平臺或者營銷案例為主,如淘寶、京東、小米手機營銷等,這些方面的寫作材料,學生需要參考一些最新數據,一般以期刊論文、網絡資源為主。在文科組的相似度檢測對比中,擁有期刊數量較多的維普檢測系統的檢測結果明顯高于大雅檢測系統。
4.論文相似度檢測的困惑
不同的論文檢測數據庫涵蓋的資源對比庫都不同,一些數據庫平臺會與電子雜志社簽署獨家授權的期刊,獨家授權就是通過合法許可,授權給被授權方(合法的數字出版商)獨家使用,未經期刊與被授權方同意,他人無權使用。這樣就造成國內沒有一家相似度對比數據是全面的,不存在任何一家論文相似度檢測系統的檢測結果是最權威的。
目前國內大多數的論文相似度檢測數據庫主要有期刊、學位論文等資源的相似度對比,而沒有圖書資源的對比。大雅相似度檢測數據庫就有相似圖書的檢測,但是對于學術期刊的對比就不如維普、CNKI全面。那么我們在做學術科研論文、學生畢業論文相似度檢測時,到底需不需要重視與電子圖書的對比呢?論文相似度檢測系統的選擇標準是什么呢?
學生在畢業論文檢測過程中會根據學校選擇的相似度檢測系統調整自己的參考文獻類型,學生可能會花很多心思了解該檢測系統的對比資源庫的特點,想方設法降低自己論文在該檢測系統中的相似比,顯然僅通過某一個檢測系統檢測的相似比判斷是否抄襲是有局限的。
5.結語
在國內論文相似度檢測系統眾多,又沒有統一標準對比數據庫的情況下,指定任何一個系統作為標準進行論文相似檢測都無法真正做到公平公正。高校該選擇何種論文相似度檢測系統是需要根據實際綜合考慮的。理想狀態是政府科研管理部門能夠出面籌建資源對比庫涵蓋所有數字資源的相似度檢測系統,統一論文相似度檢測標準。如果沒有統一的檢測數據庫,就需要使用不同的檢測平臺進行檢測,并結合人工評價進行綜合評判,從而才能更好地檢測畢業論文的質量。
參考文獻:
[1]吳均,江潤林,張曉琴.利用學術不端檢測系統研究科技論文中存在的問題[J].中國科技期刊研究,2010(05):636-639.
[2]電子雜志社有關負責人就學術期刊獨家授權相關問題答記者問.http://www.cnki.net/gycnki/daobao/cnkidaobao33/daobao33_8.htm.
[3]羅瑞,唐璞,舒安琴,石蕓.兩種學術不端檢測系統對醫學論文檢測結果的差異性研究[J].天津科技,2014(12):71-73.
[4]趙冬梅.基于已發表論文的學術不端檢測系統的分析研究[J].河北科技圖苑,2015(06):50-53.
[5]陳燕,丁嵐.學術不端檢測系統缺陷分析[J].中國出版,2014(16):12-14.
[6]徐仲.兩種學術不端檢測系統的差異性及問題討論[J].圖書館理論與實踐,2014(08):20-22.
本文相關研究獲得江蘇省現代教育技術研究2016年度立項課題(課題編號2016-R-46827)和揚州市社科聯重點課題《一帶一路戰略下揚州開放型經濟發展研究》資助。