杭州職業技術學院 吳功才 鄭何敏
據中國政府官網統計數據顯示,從2001年開始,我國普通高校畢業生人數持續增長,2018年全國普通高校畢業生為820萬人,比2017年多出25萬,就業形勢非常嚴峻。一方面是每年數以百萬的畢業生就業信息沉積于信息服務器之中,一方面是年復一年日益嚴峻的就業形勢,為教育信息的管理提出了一個新的研究課題:大數據挖掘技術在高校畢業生就業中的應用。即利用挖掘技術對已有的往屆畢業生就業信息加以數據挖掘、分析,挖掘出有價值的就業模型和就業規律,從而實現“精準”就業。教育部早在2016年3月就下發了《關于開展全國普通高校畢業生精準就業服務工作的通知》[1],所以研究數據挖掘在高校畢業生精準就業中的應用正合當前的就業形勢和導向。
數據挖掘(Data Mining)是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數據挖掘的主要技術流程為:數據清理、數據集成、數據選擇、數據變換、數據挖掘、模式評估、知識表示[2],如圖1所示。

圖1 數據挖掘的技術流程
數據挖掘在高校就業中的應用可以理解為:通過對高校畢業生就業信息的數據集特征進行分析研究,對數據采用合適的清理、集成、選擇和變換等數據預處理技術,然后采用相應的適合畢業生就業信息數據集特征的數據挖掘算法對就業數據進行數據挖掘、分析,挖掘出有價值的就業模型和就業規律,從而為畢業生就業工作提供一定的參考、借鑒和指導作用。
數據挖掘主要可以通過對就業信息進行主成分分析、聚類分析、關聯規則、決策樹和回歸分析等技術處理,實現高校就業工作有指導的招生、有方向的培養、精準的推薦、準確的就業預測,應用模型如圖2所示。

圖2 數據挖掘在精準就業中的應用模型
通過對畢業生的生源地、性格特征、入學成績、入學英語成績等學生屬性和就業質量間進行關聯規則數據挖掘,從而發現“畢業時可能最容易就業的”的新生。尤其是在具有自主招生權限的學校不一定非要遵循“高分錄取”的單一招生政策,有良好的個性、有優良的英語基礎的學生可能更值得錄取。總之,通過對就業信息的數據挖掘形成一個“更具就業優勢”的招生指導方針。
通過對畢業生信息和就業質量進行關聯規則數據挖掘,從而發現“最難就業的那一類畢業生”的屬性特征。通過對“最難就業的那一類畢業生”和“就業最理想的哪一類學生”進行對比,可以指導目前在校的“準畢業生”向“就業最理想的哪一類學生”的方向培養。通過有目的的培養“準畢業生”具有“就業最理想的哪一類學生”的屬性特征,實現更高的畢業生就業率和更好的就業質量。
精準推薦主要體現在:向學生精準推薦招聘意向高的招聘單位、聘單位精準推薦滿意度高的畢業生。
● 向學生精準推薦招聘意向高的招聘單位
通過對畢業生基于生源地、成績、英語能力、計算機能力、政治面貌等相關屬性進行聚類分析實現對學生的精準分類,然后通過“這類學生更合適、更愿意到那些單位就業”的統計分析,實現更好的、更準確的向畢業生推薦就業單位,或者為學生尋找就業單位提供參考和建議。雖然這種方式還處在比較簡單的層次,但也可以得了非常好的效果。
● 向招聘單位精準推薦滿意度高的畢業生
與上面類似,通過對招聘單位基于注冊資本、企事業性質、企業涉及的行業、企業的歷史年限等相關屬性進行聚類分析實現對招聘單位精準聚類,實現向招聘單位推薦“這類單位很可能會滿意”的畢業生。
隨著學生數量、就業行業、影響就業因素的多元化和就業管理的提高,高校管理者對畢業生就業趨勢的預測以及學生培養模式的改進越來越多的依賴于畢業生就業信息分析的結果。這其中最有效的信息分析的手段就是對就業信息進行有效的數據挖掘,利用決策樹技術對影響大學生就業的多種因素進行多層次、多角度的分析和比較,挖掘這些數據中所蘊含的有價值的信息,最后形成準確的就業數據模型,從而準確的就業前景預測。
數據挖掘的操作對象是數據,沒有足夠、合適的數據對于數據挖掘技術而言就猶如“巧婦難為無米之炊”。數據挖掘在高校畢業生精準就業的應用中存在如下的幾個問題:
● 數據采集和數據共享問題
畢業生就業信息來之于全國各大高校在每年的畢業季申報的就業數據以及單位的招聘信息。因此,就業數據和招聘信息的真實性、數據的格式、數據內容的取舍在很大程度上都依賴于企業、高校以及各地的教育主管部門。企業、高校和各地教育主管部門對就業數據的要求不一,會造成數據的格式、數據的內容多樣化,嚴重降低數據的可挖掘性。同時,考慮到多種原因,高校和企業可能會在數據申報上隱瞞不報或漏報少報,造成數據挖掘的價值流失。
● 數據安全
在數據申報和數據挖掘的過程中,如何防止數據流失和數據安全是一個比較棘手的問題。這其中包括畢業生就業信息、就業單位信息的加密和安全保護等問題。
● 數據挖掘平臺的建設問題
其中包括數據挖掘平臺的主體歸屬、平臺的建設經費來源數據挖掘成果的分配和共享以及數據挖掘平臺的可持續運行等問題。
隨著大數據挖掘、人工智能技術的普及和廣泛應用,數據挖掘技術在高校畢業生就業工作的應用必定會越來越廣泛。相信通過正確、合理的運用數據挖掘技術,高校就業工作一定可以實現有指導的招生、有方向的培養、精準的推薦、準確的就業預測。
[1]王美麗.大數據時代高校精準就業服務工作研究[J].思想理論教育,2016(6):84-88.
[2]Jiawei Han,Micheline Kamber,Jian Pei著.數據挖掘概念與技術[M].北京:機械工業出版社,2012:4-5.