張予露 王吉富 李志坤 邊緣 賴申婷 李瑞改



摘 要:近年來,來華留學生人數呈逐年遞增的趨勢,這大大增加了管理者對留學生學業情況、人身安全以及國家安全管理的難度。如何對潛在的安全問題進行預警,在安全事故發生前及時采取有效的預防措施成為各高校國際交流學院的重要問題。本系統采用決策樹算法中的ID3算法建立留學生安全預警模型,將學生信息作為數據,找到可能發生安全事件的學生,并對這類學生進行預警。本系統的設計可以促進各學校留學生安全管理工作的順利開展,同時也能夠防患于未然,加強對留學生人身安全以及國家安全的保障。
關鍵詞:來華留學生;安全預警;預警系統;預控文章編號:2095-2163(2019)04-0248-04 中圖分類號:TP391.7 文獻標志碼:A
0 引 言
中國經濟的發展,使世界各地的學生希望來華進修。根據教育部2017年發布的數據,2017年來華留學生有48.92萬人,這些人來自204個國家和地區,就讀于全國935所高等院校,中國已成為世界第三、亞洲最大留學目的國[1]。留學生人數的增多,導致留學生管理難度加大,同時來華留學生安全事故時有發生,不僅威脅到留學生個人,還可能危及國家安全,因此留學生的安全問題也成了一個重點問題。目前,中國大多數院校沒有留學生安全預警措施。為此,研發設計了留學生安全預警系統。
1 研究背景
最近幾年,中國逐漸提高的教育水平使越來越多的外國學生希望來中國進修,致使來華留學生人數不斷增加,與此同時,留學生影響國家安全以及高校安定的各種不和諧因素也隨之增加。如留學生之間的文化背景差異、宗教信仰沖突、生活變故等等,使維護涉外治安穩定工作面臨著嚴峻的挑戰。卓婭·安尼瓦爾在研究高校留學生管理問題及對策時指出,這些問題可能會導致留學生在學業,人身安全等方面出現問題[2]。此外,部分來華留學生對中國法制觀念淡薄,再加上部分高校對其管理強度不夠,使得部分留學生不能適時得到正確的引導和幫助,導致來華留學生違法犯罪案件增多,違反學校規章制度、破壞社會治安事件增多,甚至還出現威脅到其他留學生及中國公民人身安全事件,安全管理任務日益繁重。為適應新的形勢,注重留學生安全管理機制研究,完善留學生安全管理體系,提高留學生管理人員的管理能力和工作效率,促進來華留學生安全管理的科學化、高效化成為亟待解決的問題。
信息技術可以幫助留學生安全管理工作,進行安全預警,提高工作效率。在留學生安全管理機制研究方面,劉芳對高校留學生安全管理問題及其對策進行了深入的研究[3],闡述了預警機制的重要性,同時對于留學生在華期間所發生的突發事件、文化沖突、意外傷害等危及到人身安全的問題建立預警機制。預警機制能夠提前發現產生矛盾的原因,管理人員可以提前做好措施,減小安全事件的影響范圍甚至避免安全事件的發生,做到從出現事件再補救到提前預警避免事件發生的轉變。戰浩楠在探究新時期來華留學生管理工作策略時提到要建立留學生突發事件的預防機制[4]。
段偉,江欽徐對來華留學生突發事件預警防控機制的建構進行了深入的研究[5],闡述了留學生安全預警機制的必要性,凡事預則立,不預則廢,從安全事件管理的目的和效果來說, “未雨綢繆”遠勝于“亡羊補牢”。安全事件管理的最好方式是將危機扼殺在搖籃里,增強對安全事件的管理,最重要的是加強對安全事件的預測,這樣做可以及時對潛在的安全事件進行預警,提前消除安全隱患,同時在危機發生時提高管理人員的反應速度,盡快找到解決辦法,以降低安全事件造成的損失。目前,雖然在留學生信息管理自動化系統開發方面有很多研究案例,同時各高校都意識到安全管理與預警的重要性,但是在針對留學生人身安全和保障國家安全的預警與管理等方面,還沒有成型的系統出現。因此為了加強對安全事件的預警防控,本課題組設計了留學生安全預警系統,以保障留學生學業完成、人身安全和國家安全。
2 留學生安全預警系統模型設計
2.1 預警流程
本系統將預警分為3個方面:學業預警、個人人身安全預警、國家安全預警,每個方面分為2個預警等級,分別為安全和不安全。運用決策樹分類算法對留學生進行安全預警。本模型中將所有學生數據中的80%作為訓練數據,剩下20%作為測試數據,訓練數據的輸入需要特征和結果,而測試數據只需要輸入特征,最后通過分類器得到的結果與其原本數據進行比較,獲得模型的準確率。若是經模型判斷該學生在任意一個或幾個方面需要進行安全預警,則本系統將立刻向該學生的負責老師發送預警信息。
2.2 決策樹算法概念
決策樹是通過向訓練數據進行學習,獲得特征變量和輸出變量在不同取值下的訓練數據分類以及數據預測規律;是一種帶有特殊含義的樹結構,其每個根結點(非葉子結點)代表數據的一種特征標簽,然后將數據按照不同的特征值劃分為幾個子集,得到的每個子集均為這個根結點的子樹,重復該過程,最終得到決策樹的每個葉子結點即為數據的最終類別。決策樹的常用算法主要有ID3、C4.5、CART等,本模型采用ID3算法。
2.3 決策樹學習過程
(1)特征選擇。表示在訓練數據的特征里選擇一項看作當前節點的分類標準,根據不同的特征量化評估標準,得到不同的決策樹算法。
(2)決策樹生成。根據所選擇的特征量化評估標準,從根節點開始從上至下生成子節點,直到數據集不可分為止。
(3)剪枝。為了盡量對訓練樣本進行正確分類,決策樹一般通過主動剪枝來降低過擬合的風險,基本的剪枝策略有預剪枝和后剪枝2種。
2.4 ID3算法
ID3算法是Ross Quinlan發明的一種最為常用的決策樹算法,對ID3算法來說,總是傾向于生成小型的決策樹,但也不一定每次都生成最小的樹型結構,因為這是一個啟發式算法。在信息論中,期望信息越小,那么信息增益就越大,從而純度就越高。ID3算法是一種以信息增益來量化評估屬性,選擇增益最大的屬性進行分裂的算法。
可以采用信息熵來度量樣本“純度”。假定當前樣本集合D中第k類樣本所占的比例為pk,則D的信息熵定義為:
2.5 留學生安全預警模型
留學生安全預警模型采用決策樹算法中的ID3算法。以學業安全預警模型為例,可得到如圖1所示的決策樹。
2.6 預測結果分析
該模型的實驗環境為MATLAB,測試中將收集到的數據中的80%作為訓練數據,20%作為測試數據。得到預測結果如圖2、圖3、圖4所示,測試結果正確率分別為75.79%、97.99%、86.93%。
3 留學生安全預警系統設計
3.1 留學生安全預警系統架構
按照系統設計目標,留學生安全預警系統的總體架構設計如圖5所示。留學生管理與安全預警系統的用戶類型包括系統管理員、教師、宿舍管理員、學生4類。系統由數據采集與存儲子系統、留學生安全預測與評價子系統、預警子系統等組成,相關信息通過數據庫進行存儲。數據采集與存儲子系統由可以采集留學生信息的前端系統構成,系統應用asp.net框架、數據庫技術等采集留學生各項信息,實現對留學生數據的監控和歷史對比分析。
3.2 留學生安全預警系統功能
工作主要流程為:系統通過留學生信息前端采集子系統進行數據的獲取,采集方式為教師或管理員將曠課、成績等數據手動輸入系統,或在學生使用系統進行請銷假時自動記錄請銷假數據。同時,留學生安全測評與評價子系統對每名學生的學業、人身安全和國家安全進行在線預測,如果預測結果為需要預警,則立即通過預警子系統將該學生預警信息發布給其對應的管理員和教師用戶。系統功能結構如圖6所示。
3.3 系統實現
本系統采用的集成開發環境是Microsoft Visual Studio,運用C#語言開發,數據庫管理系統采用SQL Server 2008 R2。系統運行效果界面如圖7、圖8所示。
4 結束語
本文主要設計了留學生安全預警系統,具有很重要的現實意義,一方面,可以對潛在的安全問題預警,在安全事故發生前及時采取有效的預防措施;另一方面可以使留學生管理工作更加高效、全面。
參考文獻
[1]教育部. 2017年全國來華留學生數據發布[EB/OL]. (2018-03-31).https://www.mxbang.cn/archives/6072.
[2] 婭·安尼瓦爾. 淺談高校留學生管理的問題及對策[J]. 學理論,2011(34):199-200.
[3] 劉芳. 高校留學生安全管理對策研究[J]. 教育觀察, 2013, 2(19):19-21,47.
[4] 戰浩楠. 新時期來華留學生管理工作策略探究[J]. 邊疆經濟與文化,2014(1):124-125.
[5] 段偉,江欽徐. 來華留學生突發事件預警防控機制的建構[J]. 現代教育科學,2014(4):127-131,144.