張昕
〔摘 要〕目前高校層出不窮的學術(shù)造假現(xiàn)象使得學術(shù)道德下降和科學精神匱乏,本文以高校經(jīng)管類本科畢業(yè)論文作為研究對象,針對論文質(zhì)量管理中的事前控制階段,以論文抄襲檢測系統(tǒng)的檢測結(jié)果作為基礎(chǔ)數(shù)據(jù),運用統(tǒng)計分析和粗糙集進行數(shù)據(jù)挖掘,尋找論文質(zhì)量事前控制的外部和內(nèi)部影響因素,并提出了如何通過控制這些因素來提高經(jīng)管類本科畢業(yè)論文質(zhì)量,杜絕抄襲等學術(shù)不端行為的發(fā)生。
〔關(guān)鍵詞〕論文質(zhì)量;抄襲檢測;影響因素;粗糙集
DOI:10.3969/j.issn.1008-0821.2012.01.008
〔中圖分類號〕G642.477 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)01-0032-06
Analysis on Impact Factors of the Quality Control of
Graduation Thesis of the Graduate Based on Rough SetZhang Xin
(School of Management,Tianjin Normal University,Tianjin 300387,China)
〔Abstract〕Academic fraud is currently the endless stream of the phenomenon of university academic and moral decline and make the lack of scientific spirit.In this paper,as a college administered by the undergraduate thesis study,paper quality management for the control period prior to the detection of plagiarism detection system results as the basic data,using statistical analysis and rough set data mining,looking for quality pre-control study External and internal factors,and proposes how to control these factors to improve the quality of undergraduate thesis,put an end to plagiarism and other academic misconduct occurred.
〔Key words〕thesis quality;plagiarism testing;impact factors;rough set
1 問題提出與解決思路
近年來,我國高校學術(shù)造假現(xiàn)象越來越嚴重,這種行為不但違背了學術(shù)道德和科學精神,而且使得整個學術(shù)環(huán)境變得浮躁和急功近利。這種現(xiàn)象的泛濫和其后果的嚴重性使得整個學術(shù)界從上到下都在努力地進行監(jiān)管和治理。面對科研創(chuàng)新的需求,我們需要培養(yǎng)大批具有學術(shù)道德和科學精神的科研人員,而這種培養(yǎng)應從本科學習階段就要開始,對于學術(shù)造假的監(jiān)管也要從本科畢業(yè)論文做起,所以越來越多的高校開始應用各種論文抄襲檢測系統(tǒng),對本科畢業(yè)論文進行檢測。但這種監(jiān)管屬于事后控制,為了進一步提高畢業(yè)論文質(zhì)量,杜絕抄襲、拷貝等學術(shù)不端現(xiàn)象的發(fā)生,學校更應加強事前和事中控制,才能對幫助學生建立良好的學術(shù)道德、嚴謹?shù)目茖W精神起到真正的作用。
本文針對上述提出的問題,用統(tǒng)計分析與粗糙集,對所調(diào)研學院的畢業(yè)本科論文檢測結(jié)果的數(shù)據(jù)進行分析與挖掘,通過專業(yè)間的對比分析找到影響高校本科畢業(yè)論文質(zhì)量事前控制的外部因素,通過論文相關(guān)信息的分析找到影響高校本科畢業(yè)論文質(zhì)量事前控制的內(nèi)部因素。希望這些因素為各高校本科畢業(yè)論文質(zhì)量事前控制工作提供其管理的關(guān)鍵點。
2 調(diào)查樣本的選取
本研究選取了某管理學院所設(shè)5個專業(yè)的本科畢業(yè)論文學術(shù)不端檢測結(jié)果數(shù)據(jù),共選取樣本420個,其中專業(yè)1樣本107個,專業(yè)2樣本92個,專業(yè)3樣本113個,專業(yè)4樣本83個,專業(yè)5樣本25個。
專業(yè)1是所調(diào)研學院特色+品牌專業(yè),設(shè)有2個班;專業(yè)2是由所調(diào)研學院的專業(yè)1和專業(yè)5各分出一個方向而重新組合的專業(yè),設(shè)有2個班;專業(yè)3是所調(diào)研學院最傳統(tǒng)的專業(yè),設(shè)有2個班;專業(yè)4是所調(diào)研學院高考錄取分數(shù)最高的專業(yè),設(shè)有1個班,此外該專業(yè)有輔修生;專業(yè)5是所調(diào)研學院學科建設(shè)最強的一個專業(yè),設(shè)有1個班。
3 本科畢業(yè)論文質(zhì)量事前控制的外部影響因素分析
3.1 各專業(yè)論文查重率檢測結(jié)果的統(tǒng)計分析
根據(jù)該學院所在學校規(guī)定,查重率小于等于30%的論文通過檢測,查重率大于30%的論文屬于不同程度的抄襲行為,需對論文進行修改后方可參加答辯。所以本研究以查重率30%為界限,對各專業(yè)畢業(yè)論文檢測結(jié)果進行了匯總,如表1所示。表1 各專業(yè)畢業(yè)論文查重率檢測結(jié)果匯總
專業(yè)查重率人數(shù)專業(yè)查重率人數(shù)1≤30%58>30%494≤30%56>30%272≤30%67>30%255≤30%21>30%43≤30%76>30%37
根據(jù)上表所匯總的數(shù)據(jù),結(jié)合各專業(yè)選取的樣本量大小,可得到各專業(yè)查重率超過30%在其所有被檢測學生中所占的比例,如圖1所示。
從圖1可知,專業(yè)1查重率超過30%的學生占所有檢測學生的比例最高,其次是專業(yè)3和專業(yè)4,而專業(yè)5是該比例最小的。
這個結(jié)果與各專業(yè)基本情況產(chǎn)生了很大的反差,出乎意料的是:一是作為所調(diào)研學院特色和品牌的專業(yè)1,其中具有不同程度抄襲行為的論文占到了將近50%;二是作為所調(diào)研學院高考錄取分數(shù)最高的專業(yè)4,這種情況也達到了將近1/3。但這個結(jié)果也有意料之中的發(fā)現(xiàn),就是作為所調(diào)研學院學科建設(shè)較強的專業(yè)5,雖然其參與檢測的人數(shù)相對較少,但具有抄襲行為的論文僅占到總數(shù)的0.16%,并且由此專業(yè)分出一個方向而組成的專業(yè)2,也相對情況好些。
3.2 外部影響因素與事前控制的要點分析
從上述分析,結(jié)合本研究調(diào)研時了解到各專業(yè)的具體情況,可找到導致上述情況產(chǎn)生的一些外部影響因素,而這些因素就是在畢業(yè)論文質(zhì)量管理事前控制中需要把握的關(guān)鍵點。
3.2.1 專業(yè)的學生人數(shù)
查重結(jié)果從差到好進行排序,排在第一和第二位的分別是專業(yè)1和專業(yè)3,這兩個專業(yè)都是所調(diào)研學院人數(shù)偏多的專業(yè),而排在最后一位的是專業(yè)5,是所調(diào)研學院人數(shù)最少的一個專業(yè)。原因是學生人數(shù)偏多的專業(yè),畢業(yè)論文指導教師所帶的學生人數(shù)較多,導致畢業(yè)論文質(zhì)量出現(xiàn)問題。所以,學校及學院教務(wù)部門每年需對畢業(yè)生較多的專業(yè)進行嚴格監(jiān)控與管理,如對這些專業(yè)的畢業(yè)論文全部進行檢測,以此來督促這些專業(yè)的指導教師對畢業(yè)論文的嚴格要求與監(jiān)督、學生對畢業(yè)論文的充分重視和認真態(tài)度。
3.2.2 學科建設(shè)程度
從專業(yè)5的良好表現(xiàn)以及專業(yè)2的較好表現(xiàn),可以看出,專業(yè)學科建設(shè)加強的同時會促進學術(shù)風氣建設(shè)的不斷提高,使得指導教師對學生論文要求越來越嚴格,學生受到教師的耳熏目染和身傳言教,也會提高其對學術(shù)原創(chuàng)性的重視。
3.2.3 輔修專業(yè)的畢業(yè)論文
作為高考錄取分數(shù)最多的專業(yè)4,其生源應該是5個專業(yè)中最好的,但查重結(jié)果卻不盡人意。本文在尋找原因的過程中發(fā)現(xiàn),該專業(yè)共選取了83個樣本(包括輔修專業(yè)的學生22個),而輔修專業(yè)學生查重率超過30%的人數(shù)達到13人,占到59.09%,其抄襲行為比任何一個專業(yè)都嚴重,這是因為這些學生與本專業(yè)學生相比專業(yè)知識相對薄弱。而專業(yè)4本專業(yè)學生的畢業(yè)論文參加檢測的有61篇,其中14篇有抄襲行為,占到22.95%,比專業(yè)2的情況還要稍好一些,僅差于專業(yè)5。所以,對于有輔修學生的專業(yè),教務(wù)部門需要重視輔修專業(yè)的畢業(yè)論文監(jiān)控工作,同樣也可對輔修專業(yè)的學生畢業(yè)論文進行全部檢測。
從上述3點分析,可知作為學科建設(shè)較強的專業(yè)5查重結(jié)果比較理想的原因所在,也可找到生源最好的專業(yè)4查重結(jié)果較差的原因所在。而專業(yè)1和專業(yè)3之所以查重結(jié)果不理想,一部分原因可歸結(jié)為學生人數(shù)較多導致。但專業(yè)2學生人數(shù)也相對較多,為何沒有出現(xiàn)專業(yè)1和專業(yè)3的情況。尤其是專業(yè)1作為品牌專業(yè),為何會出現(xiàn)目前的結(jié)果。本文接下來將通過進一步的數(shù)據(jù)挖掘?qū)ι鲜鲞@些疑問進行探究。
4 本科畢業(yè)論文質(zhì)量事前控制的內(nèi)部影響因素分析
4.1 專業(yè)1和專業(yè)3論文查重率檢測結(jié)果的統(tǒng)計分析
專業(yè)1樣本中涉及到的指導教師共11名,以101~111作為指導教師的代號。將11名教師所指導的畢業(yè)論文的檢測結(jié)果統(tǒng)計如下,見表2。
根據(jù)表2所匯總的數(shù)據(jù),可得到專業(yè)1每位教師所指導的畢業(yè)論文中查重率低于30%和超過30%各占比例,如圖2所示。表2 專業(yè)1畢業(yè)論文檢測結(jié)果匯總
指導教師查重率人數(shù)指導教師查重率人數(shù)101≤30%7>30%4107≤30%6>30%2102≤30%8>30%4108≤30%3>30%11103≤30%2>30%6109≤30%7>30%4104≤30%3>30%5110≤30%6>30%5105≤30%5>30%3111≤30%3>30%5106≤30%8>30%0圖2 專業(yè)1各教師所指導的畢業(yè)論文查重率低于30%和高于30%各占比例
從圖2可知,專業(yè)1中的教師103、教師104、教師108和教師111都出現(xiàn)了查重率超過30%的論文所占比例高于查重率小于30%的論文所占比例,其中以教師108和教師103最為嚴重;其他不存在這種情況的教師中,教師106所指導論文的查重結(jié)果最好,全部為查重率低于30%,不存在論文抄襲情況;此外,教師110雖然所指導論文中查重率低于30%的比重高于查重率高于30%的比重,但僅是略高于,相差很近。
從統(tǒng)計數(shù)據(jù)分析,雖然能總結(jié)出上述這些結(jié)論,但導致這些情況發(fā)生的原因卻不得而知,接下來本文將利用粗糙集的方法對專業(yè)1所有查重率超過30%的樣本進行數(shù)據(jù)挖掘,找出導致查重率偏高的原因,得出論文質(zhì)量的影響因素,將此作為提高論文質(zhì)量工作的關(guān)鍵點進行監(jiān)控。
4.2 專業(yè)1論文質(zhì)量事前控制的內(nèi)部影響因素分析
4.2.1 方法的選取
首先,本科畢業(yè)論文質(zhì)量的影響因素非常多,且這些因素又存在著太多的不確定性因素,導致所搜集的這些數(shù)據(jù)又未必都對論文質(zhì)量產(chǎn)生重要影響,存在一定的噪音。其次,所搜集到的這些數(shù)據(jù)都是離散型的,且可能存在不精確甚至不完整的問題。鑒于上述考慮,本文運用粗糙集這種較新的軟計算方法,對這些數(shù)據(jù)進行處理,根據(jù)這些不確定甚至不完整的信息進行推理,找出主要是哪些內(nèi)部因素影響了本科畢業(yè)論文的質(zhì)量,以及它們是如何影響的,影響程度又如何。
4.2.2 數(shù)據(jù)處理
我們從原有的420個樣本中,只選取了屬于專業(yè)1的107個樣本,其中有19個樣本查重率為零,沒有顯示出基本信息,故有效樣本88各。每個樣本的基本信息主要包括性別、論文字數(shù)、指導教師、選題類型和查重率。現(xiàn)將每個樣本的這些信息都進行數(shù)字化處理,為此有如下設(shè)置:
從表5可發(fā)現(xiàn)如下規(guī)律:(1)從查重率為3的幾個樣本可看出,男生比女生更容易出現(xiàn)嚴重抄襲的情況;(2)從樣本可看出,論文字數(shù)超過1萬字的論文更容易出現(xiàn)查重率較差的情況;(3)從樣本可看出,查重率為1的都是選題類型為生產(chǎn)實踐和社會經(jīng)濟的論文;(4)從樣本可看出,查重率為2和3的都是選題類型為經(jīng)典的論文。
此外,對于指導教師這一內(nèi)部影響因素,如前文所述,專業(yè)1中的教師103、教師104、教師108和教師111所指導論文的查重率結(jié)果相對不好,其中以教師108和教師103最為嚴重,而教師106所指導論文的查重結(jié)果不存在抄襲問題。根據(jù)表3所反映的信息,結(jié)合指導教師的具體情況,我們可發(fā)現(xiàn):接近退休年齡的指導教師所帶的畢業(yè)論文更容易出現(xiàn)問題;指導學生偏多的教師也較容易出現(xiàn)論文質(zhì)量問題。
4.3 專業(yè)1論文質(zhì)量事前控制的要點分析
從上述分析,可發(fā)現(xiàn)對某個專業(yè)而言,其畢業(yè)論文質(zhì)量的內(nèi)部影響因素:學生性別、論文字數(shù)、選題類型、指導教師。只有控制好這些關(guān)鍵點才能做好畢業(yè)論文質(zhì)量管理的事前控制工作。而針對這些內(nèi)部影響因素如何進行控制,本文建議如下:
(1)在論文指導中需明確指出:論文選題應更多偏重于真題真做的生產(chǎn)實踐和反映現(xiàn)實問題的社會經(jīng)濟方面的論文,盡量避開經(jīng)典題目;論文字數(shù)要求控制在6 000~10 000之間,不易過長。
(2)對指導教師:①根據(jù)學校和專業(yè)具體情況,明確指出指導學生人數(shù)的上限;②可根據(jù)指導教師的具體情況,如年齡、專業(yè)等,適當調(diào)整指導學生的數(shù)量。
(3)在事中管理控制中,要加強對男性學生論文質(zhì)量的監(jiān)控,加強對年齡偏大和所帶人數(shù)偏多的教師論文指導工作的監(jiān)督。
5 結(jié) 論
本文基于統(tǒng)計分析和粗糙集,對所調(diào)研學院的本科畢業(yè)論文查重結(jié)果進行了數(shù)據(jù)挖掘,從而找到了本科畢業(yè)論文質(zhì)量的外部和內(nèi)部影響因素。首先,外部影響因素主要是3個:專業(yè)的學生人數(shù)、學科建設(shè)程度、輔修專業(yè)的學生人數(shù);其影響方式是:專業(yè)的學生人數(shù)較多將導致查重結(jié)果相對較差,輔修專業(yè)的學生人數(shù)偏多會導致本專業(yè)論文查重率變差,學科建設(shè)較好的專業(yè)論文查重率相對較好。其次,內(nèi)部影響因素主要是4個:學生性別、論文字數(shù)、選題類型、指導教師;其影響方式是:男生比女生的論文相對查重率結(jié)果更差;論文字數(shù)偏多的相對查重率結(jié)果更差;選題類型為經(jīng)典的論文查重結(jié)果更差;不存在抄襲行為的論文基本選題類型都為生產(chǎn)實踐和社會經(jīng)濟;接近退休年齡的和指導人數(shù)偏多的教師所指導的畢業(yè)論文查重率結(jié)果更差。
本文所研究內(nèi)容希望對具體負責本科畢業(yè)論文質(zhì)量管理工作的部門有所啟示和幫助,但本文僅選取了一所學校進行調(diào)研,必然導致所研究問題具有一些特殊性,但這種研究思路和方法可以應用到其他學校的畢業(yè)論文質(zhì)量管理工作中。
參考文獻
[1]黃海蓉.提升畢業(yè)論文質(zhì)量的關(guān)鍵過程控制點技術(shù)研究[J].中國校外教育:理論,2009,(3):58.
[2]姚志紅.從畢業(yè)論文選題看提高學生畢業(yè)論文質(zhì)量的對策[J].蘭州教育學院學報,2010,26(6):214-216.
[3]張祖慶,姜雅莉.本科畢業(yè)論文質(zhì)量實證分析[J].科技信息,2010,35:19-20.
[4]陸玉梅.經(jīng)管類本科畢業(yè)論文質(zhì)量的調(diào)查與分析[J].江蘇技術(shù)師范學院學報,2010,16(10):105-108.
[5]吳平.新建本科院校畢業(yè)論文(設(shè)計)管理和教學環(huán)節(jié)對應性研究[J].赤峰學院學報:漢文哲學社會科學版,2010,31(12):194-196.
[6]邢澤晶,馬維軍,張旭.高校畢業(yè)論文全過程管理與系統(tǒng)實現(xiàn)探析[J].黑龍江教育學院學報,2010,29(12):22-23.
[7]劉清.Rough集及Rough推理[M].北京:科學出版社,2001,8:40-95.