劉強 鄧曉衡

【摘 要】文章分析了高校當前本科畢業設計管理的現狀,基于畢業設計的動態管理過程,將原本復雜繁瑣的過程進行優化,通過互聯網技術實現使其簡單化、智能化。文章對畢業設計管理平臺相關功能進行了分析,并對核心功能選題模塊中用到的Gale-Shapley婚姻匹配算法、相似度檢測模塊中涉及的網絡爬蟲、正文提取算法、分詞算法、相似度檢測算法進行了論述。系統基于B/S模式架構,并通過設計移動APP,使用戶可以通過各類終端提交畢業設計過程資料,極大地方便了畢業設計管理工作。
【關鍵詞】畢業設計管理;婚姻匹配;網絡爬蟲;相似度檢測
【中圖分類號】TP311.52 【文獻標識碼】A 【文章編號】1674-0688(2016)11-0037-03
0 引言
進入21世紀以來,互聯網技術迅速發展,給各類產業實現信息化提供了必要條件。作為走在時代前沿的高等學校,信息化建設步伐也相對較快,寬帶校園、數字化校園、移動校園、智慧校園等信息化建設項目應運而生[1]。
畢業設計作為高校必備的教學環節之一,如何實現信息化已經受到各高校的重視。由于畢業設計持續周期較長,中間環節多而雜;再者,在當前就業形式下,學生在畢業設計期間基本要在參加招聘會和畢業設計之間來回奔波,由于學生所在地的不確定,加上當前互聯網技術日益發達,采用B/S結構的軟件實現畢業設計全過程的監控管理,有著迫切的需求和較好的實用價值[2-3]。
同時,由于互聯網技術的發展,網絡共享資源日益豐富,學生接觸的信息面越來越廣,網絡文檔對畢業設計各環節的影響也越來越大,甚至有學生直接下載論文應付了事。面對這些學術不端行為,如何進行管控,也需要信息化手段進行輔助[4]。
設計實現一個畢業設計管理平臺,并引入移動互聯網應用,使教師、學生、管理員通過系統完成畢業設計全階段的工作,對畢業設計監控管理有著現實的意義,對提高高校教學水平、提高畢業生質量有著重要的意義[5]。
1 系統分析
1.1 系統總體架構
畢業設計管理系統主要是針對畢業設計全過程的監控,并且設置不同的角色來進行分類管理。系統充分利用互聯網和移動互聯網的優勢,使管理過程實現網絡化、智能化。
平臺主要使用PHP完成服務器端腳本的編寫,使用MYSQL數據庫對畢業設計期間產生的各種數據進行分析和管理??紤]到當前移動互聯網的發展狀況,以及畢業設計期間學生找工作對畢業設計工作的影響,平臺設計實現了一個基于android平臺的移動APP,方便學生和教師隨時隨地了解畢業設計信息。移動APP由JAVA開發,而為了實現數據的統一性,移動APP對系統數據訪問仍舊采用PHP編寫的API完成。利用PHP編寫API也為后期實現IOS應用提供了方便[5]。
1.2 功能需求分析
畢業設計網絡化管理平臺設計是面向全校的一個開放式畢業設計管理,因此畢業設計平臺包含的角色有學生、教師、系部管理員、院管理員、超級管理員。因為平臺是基于Web模式的,所以學生和老師在具備Internet訪問條件的任何地點都可以訪問系統。
1.3 業務流程分析
系統是根據教師和學生在整個畢業設計過程中所經歷的階段和各階段工作任務的特點而開發的,并根據信息系統特點,對部分流程進行了優化。優化后畢業設計流程如圖1所示。
畢業設計工作的14個環節首先從發布畢業設計通知、啟動畢業設計系統開始,按照執行的先后次序,依次被分為選題階段的教師資格申報、課題申報、選題、下達任務、開題報告;其次是整個畢業設計中間環節的檢查,包括前期、中期、提交、檢測、評閱等;最后階段則是論文答辯、論文修改和各類材料的歸檔。當學生完成開題,畢業設計課題即成為貫穿畢業設計過程的主線[6]。
2 系統設計與實現
2.1 系統功能設計
根據對畢業設計的總體調研及分析,將畢業設計系統分為基礎信息管理、參數設置、教師信息管理、學生信息管理、課題信息管理、分組信息管理、文檔管理、數據管理、相似度檢測、評閱管理、新聞管理11個功能模塊[6],畢業設計系統總體功能模塊圖如圖2所示。
畢業設計管理平臺采取分角色的權限控制,對不同的功能模塊,不同的用戶進入之后,將具有不同的訪問權限和不同的結果顯示。
2.2 系統實現相關算法
2.2.1 自動分組
指導教師通過導師資格審核、完成課題申報,且經過系管理員審核通過后,學生即可進行課題的選擇。在課題選擇和分組時,考慮到大多數高校都要求一人一題,因此我們優先采用了一對一匹配算法,也就是一個學生可以選擇一位最滿意的教師,而教師也可以選擇自己心儀的學生,有人把這種算法稱之為Gale-Shapley算法,也稱之為婚姻匹配算法[7]。
婚姻匹配算法并不能直接應用于畢業設計系統,必須進行相應的改進。這是因為在選題和分組時,假設把學生看成“男方”N,課題看成“女方”M,通過選題過程后,會出現N對M有滿意度,但是M對N卻沒有滿意度,因此無法直接進行婚姻匹配。這就需要考慮只利用N對M的滿意度程度對課題志愿進行排序,然后完成課題的自動分配[7]。
課題選擇時,每個學生最多可以選擇3個課題,學生可以根據自己的意愿對課題進行排序,分別設置為第一、二、三志愿,當進行課題分組時,首先依據課題,得到課題選擇的滿意度序列,以滿意度序列作為分組順序。當出現多個學生都很中意某個課題時,而引入第二個排序種子——選題時間,如果選題時間排序也無法區分,則系統產生“隨機數”種子,輔助排序來完成課題的分配。如果自動分組完成,仍有學生沒有分配到課題,則由管理員手動調劑志愿,保證每個學生都能夠選擇到課題。
2.2.2 網絡爬蟲的設計
在畢業設計系統中引入網絡爬蟲是基于相似度檢測的需要。同時,因為本系統設計的服務對象是高校內部師生,所以不需要高強度的網絡爬取。當指導老師申報完成課題之后,系統設計的分詞算法對畢業設計課題進行分詞,提取其中的關鍵字。通過這些關鍵字把與課題相關的資源都爬取下來。爬蟲在爬取網頁時,找到最匹配的網頁,比如直接有對課題相關描述的網頁,然后依此網頁為種子,只要是跟該網頁URL地址有聯系(超級鏈接)的網頁都一一收集過來,再以收集到的網頁為種子,收集其他網頁,周而復始,把所有的網頁都收入庫中。
2.2.3 構建論文檢測庫
(1)構建網頁庫。畢業設計系統中的爬蟲程序有專門的線程負責將網頁存取到磁盤,而且會對每一個抓取的網頁給予一個計算出的簽名,該簽名是唯一的。爬蟲網頁存入磁盤,構建一個網頁庫WEBpages,而且把系統所用的URL地址、網頁相關參數等保存進數據庫。
(2)歷年論文入庫。本系統在設計過程中,除了對互聯網數據進行收集入庫外,還把近年所有學生的畢業設計論文、開題報告等文檔資料入庫。學生通過本系統提交論文時,將進行一次內部檢測,避免學生出現交叉抄襲的情況出現。
2.2.4 正文提取
在相似度檢測時,WORD文檔、PDF文檔、網頁中的有些標記是不被識別的,或者說沒有存在的實際意義。因此,在進行檢測時要把腳本程序、樣式表等去掉,例如把網頁中的HEAD、div等使用正則表達式去掉,同時替換些標記,從而取得網頁的正文,這樣可以很方便地進行分詞,進而完成相似度對比。
2.2.5 分詞的功能的設計與實現
畢業設計系統中的相似度檢測主要是對中文進行比對,因此側重點也是中文分詞。中文分詞則是指按照一定的規則將一個中文語句串分割成若干個關鍵詞的過程。關于分詞技術,算法眾多,在畢業設計管理平臺中我們選取了基于字典的分詞技術,就是獲取一段文字后先進行分割,分成N個小段,比如以“,”或者“?!弊鳛榉指顥l件,然后再對每一段進行處理。處理的過程比較簡單,使用正向匹配,從第一個字開始,然后查字典,如果字典存在這個字,就表示分詞成功;如果不存在,則指針向后一位再查字典,直到整句話分詞完成。
2.2.6 相似度識別功能的設計與實現
中文字符串分詞及相似度匹配的算法形式有很多。在畢業設計系統的相似度識別中,為了得到2個字符串的相似程度,我們采用二元變量來判斷與比較。首先對學生提交的論文進行分詞處理,然后把處理完成的數據與論文檢測庫的分詞結果集進行匹配,最后得到相似的程度。
3 結論
在系統設計過程中,我們參考了各類畢業設計的通用流程,最后結合湖南工業大學對畢業設計過程的全部需求定制開發而成,同時對部分流程根據信息化的需求進行了優化,并且已經在實際的操作中運行了4年,在這4年中,根據技術的進步和管理需要,我們對系統進行了部分優化。系統目前已經基本滿足了高校畢業設計管理的全過程需求,對畢業設計管理工作起到了很好的規范作用。
參 考 文 獻
[1]徐莉.信息化已經上升為國家戰略[J].中國教育信息化,2013(7):6-10.
[2]梁金明.基于WEB的畢業設計管理與監控系統設計[J].四川理工學院學報(自然科學版),2011(5):537-540.
[3]初作瑋.畢業設計選題系統[D].長春:吉林大學,2010.
[4]龔云飛.本科畢業設計學術不端防治體系的構建[J].黑龍江教育(高教研究與評估),2014(10):79-80.
[5]王爽.高校網站站群管理系統的設計[J].西安文理學院學報(自然科學版):2011(4):77-79.
[6]廖成香.基于Web的畢業設計信息管理系統設計開發[D].廣州:廣東工業大學,2005.
[7]鄧蔚之,劉強,等.優化的Gale-Shapley算法在學生選課問題中的應用[J].湖南工業大學學報,2013(1):22-24.
[責任編輯:鐘聲賢]