鄧瑋+蔡春玲+雷剛
摘 要:在這個網絡信息技術飛速增長的時代,高校在課程學習驗收成果的形式是也開始電子化。但與此同時,由于電腦的易操作性,抄襲現象也伴隨而來。我們采用了兩種簡單的操作方法,實現了二個小軟件。通過監測關鍵字,統計個數比對以及截屏監測作業制作過程來大致判斷有無存在抄襲。實驗研究表明軟件能初步判斷出學生作業中是否有可能抄襲。
關鍵詞:電子作業 檢測抄襲 關鍵字 截屏 距離計算
【中圖分類號】G434
1引言
隨著計算機應用的普及,高校正在逐步實現作業的電子化和網絡化。這種作業形式的改革有效減少了教育資源浪費,教師工作任務量,提高了效率,使教與學得到了互動。作業的電子化是高校教學改革發展趨勢,同時帶來的負面影響則是加重抄襲現象,這就成為作業改革受到嚴重困擾的主要因素。所以研究一款減少抄襲現象發生的技術對作業質量的提高具有重要意義
2 國內外現狀分析
大學作業抄襲在國內外已十分常見。中國青年報在調查中對2340人進行的一項調查顯示,82.7%的人認為大學生作業抄襲現象普遍,45.5%的人感覺“非常普遍”。在國外,Cramster.com網站中包含數百本教科書附加答案,學生僅需月付少量金錢,便能輕松解決作業。
中國學者付兵在《基于信息隱藏技術的電子作業防抄襲研究》《網絡環境與機房環境下電子作業反抄襲策略》這些篇論文中提到,他采用了信息隱藏算法對作業文本嵌入原創信息,對作業進行片段拷貝檢測,從而準確定位抄襲源。西米蘇里州立大學的J. Evan Noynaert教授在論文《Plagiarism Detection Software》中指出“Plagiarism detectionsoftware is a powerful tool in the fight against plagiarism.”并提出軟件從三個方面來檢測抄襲:Quiz methods ,Writing style methods以及Comparison with original sources。
在這些理論和實踐的基礎上,探究出一個方便直接的防抄襲系統,對大學生未來可持續發展都有積極的作用。
3 系統設計的主要設計思路
3.1設計方向
兩個主要的設計方向:動態截屏和檢查關鍵字個數。
3.2具體設計思路
3.2.1采用QT軟件設計兩個獨立的客戶端,分別為教師與學生使用。
3.2.2 教師端的采用QT的file讀取技術,任意選擇兩個文件讀入軟件,統計文件中指定關鍵字的個數,利用算法得出兩篇作業關鍵字個數的相似度,若相似度過高則可大體判斷為抄襲。
3.2.3 學生端采用QT的圖像截取技術,用定時器自動將電腦整個屏幕截圖以圖片格式保存在一個文件夾中。通過截圖可判斷做作業過程中學生是否出現異常操作。若短時間內截圖中作業內容變化大或者截圖中出現正在用瀏覽器搜索網絡上的作業等,則可能存在抄襲。
4 研究過程
4.1圖片定時記錄以及存儲
由于圖像信息修改較為麻煩,能較真實的還原事物本質,則在研究過程中,著重利用Qt Creater中現有的針對圖形圖像處理的QPixmap類,運用其已有的grabWindow()函數,通過參數的設定,最終對學生電腦在作業時的整個屏幕進行捕捉記錄,并利用saveScreen()函數將捕捉到的圖像信息以系統時間為命名方式存儲在文件夾中,較為真實的還原了學生的作業過程。為了提高記錄效率,后期利用Qtimer類以1min/張的頻率進行圖像信息的存儲。
4.2內容對比檢測
在數學中,空間向量的模越短,則兩點坐標越相近。基于這一性質,系統羅列了電子作業中大部分可能用到的關鍵詞,并按照其字符串長度進行排序,形成一個n維數組arr[n]。其次,對需進行比較的電子作業進行關鍵詞的提取,記錄各個關鍵詞的數量,并按照數組arr[n]中元素的排列方式形成兩組n維數組a[n]和b[n]。那么就等同于得到了2個三維坐標,在空間向量中,我們可以利用數學公式(1)求出二個向量之間的模,從而得到兩點間的距離,為了增加檢測結果的可信度檢測程序中錄入了50余個關鍵字。
公式1 計算距離的公式
根據d的數值大小來判定相對比的兩份電子作業相似性。我們設定了一個指定的闕值,當得到的結果d的數值小于等于該指定闕值5時,則可判定為疑似抄襲。
結束語
現如今的中國高等教育的教育模式基本類似于“師傅領進門,修行靠個人”,在經歷過快節奏的高中生涯后,自由的大學生活給大學生帶來巨大的心理反差,許多人不再專心于專業課程學習,漸漸荒廢學業,致使畢業時前途迷茫,遺憾蹉跎。
本項目的研究主要以檢測大學生是否抄襲作業,使大學生獨立自主完成專業作業,培養個人良好素質習慣。為社會輸送更多學而有成的專業能手。提高高等教育培養出優秀人才的比例。對自身以及社會都有良好的影響。
本研究的特點,它是具有一定實用性的檢測軟件??梢詮亩鄠€方面來判斷抄襲,容易操作,簡單,可行性大。
參考文獻:
[1]付兵.基于信息隱藏技術的電子作業防抄襲研究.長江大學計算機科學學院:1-5.
[2]祁俊.王曉英.抄襲檢測系統對計算機類電子作業的影響分析.青海大學:1-3.
[3]化柏林.抄襲檢測系統將給中國學術界帶來的變化.科技導報, 2009,27(12),107.
[4]胡秋芬.電子作業防拷貝技術比較研究.浙江越秀外國語學院, 2013,34(6):59-60.
[5]李建軍.反抄襲軟件的局限及學術打假之策.編輯之友·術業,2010,6:87-91.
[6]羅國輝.反抄襲系統的設計與實現.開發研究與設計技術,2007,1615-1616.
[7]石陸魁,張軍,陳飛,李金釗.匯編語言程序相似性檢測混合算法.河北科技大學報,2011,32(2):139-142.