陳琛 鄭亦菲 楊潔 劉小云



關鍵詞:畢業生;就業;新冠肺炎疫情;就業率;數據挖掘
0 引言
疫情對我國經濟和生產生活秩序產生了影響。一方面,部分企業受疫情影響,用工需求銳減;另一方面,近幾年全國高校畢業生人數不斷上升,畢業生就業壓力持續增大。“穩就業”“保就業”成為高校就業工作的主要目標[1-2]。
高校網絡就業系統應主動適應疫情常態化、大學擴招和就業市場不斷細分發展的現狀,與時俱進,建立起一套有效的大數據智能就業信息管理系統,為用人單位和畢業生搭起一個有效的橋梁。使用人單位能通過一個統一穩定的平臺直接向高校的畢業生發布招聘需求信息,降低錄用成本;畢業生可以通過高校平臺獲得真實可信的招聘信息,切實提升畢業生的就業成功率;高校可以使用該系統記錄、管理和跟蹤畢業生的就業簽約情況和其他就業信息,對往屆畢業生的就業信息進行有效的統計和分析,為應屆畢業生提供就業渠道參考、職業發展方向建議和行業發展需求信息的作為就業參考。同時,在該系統內,高校也可以利用現有成熟的爬蟲技術,及時獲取各大招聘網站的招聘信息,實時收集就業市場的招聘信息,對海量招聘信息進行數據挖掘,實時了解勞動力市場的需求和變化,一方面,可以及時跟進市場變化,對畢業生進行切實有效的就業指導;另一方面,可以在符合學術要求的前提下適時調整教學計劃,培養更加適應就業市場需要的人才。
1 目前就業信息管理系統普遍存在的問題
1.1 招聘信息分散,缺乏有效的查詢和統計數據
目前部分高校招聘網站的模式主要是以信息展示為主,包括招聘企業信息發布、招聘會信息和招聘企業廣告等。招聘信息分散、未歸類,畢業生要在發布的招聘信息中花費大量的時間和精力去搜索和匹配,尋找合適自己的招聘信息。
1.2 高校對學生的就業信息統計普遍缺乏有效的信息化管理手段
部分高校設置了就業指導中心或就業辦,主要功能為向學生提供就業信息以及幫助學生完成畢業、就業等相關手續。對于就業信息普遍采用傳統人工方式,通過統計三方協議等方式進行統計,耗費大量的人力物力財力;就業信息未使用統一的電子化檔案進行管理,仍以紙質保存或者散亂的零星電子檔案為主,信息分散,查閱統計起來困難重重,難以對畢業生實際就業去向進行長期的跟蹤和統計。
1.3 已有的就業信息系統落后于技術的進步,就業指導不能跟上勞動力市場的變化
部分高校已有的就業信息系統,但只是簡單地實現信息展示的功能。一方面,缺乏對畢業生去向的統計,難以提供有針對性的專業就業路徑介紹;另一方面學校提供的就業指導缺乏對實時就業市場需求數據的分析,缺乏對勞動力市場變化的實時監控,對就業市場的趨勢,行業的需求情況只能大致把控,無法對畢業生進行全面實時精確的就業指導。
2 衛生人才智能就業信息系統的設計與實現
2.1 系統功能模塊設計
高校智能就業信息系統主要分為3個模塊,管理員管理、畢業生求職模塊和輔導員管理模塊。
系統主要的功能設計如圖1。
2.2 管理員模塊
管理員模塊主要包括系統管理、新聞管理、招聘信息管理、招聘會信息管理、就業統計和就業市場信息采集系統等模塊。
2.2.1 系統管理模塊
對整個系統進行賬號、權限管理。
2.2.2 新聞管理模塊
管理員可以在該模塊中發布新聞,新聞管理。
2.2.3 招聘信息模塊
對招聘信息進行發布和管理,并對招聘企業信息
進行維護。
2.2.4 招聘會信息管理模塊
發布招聘會信息,進行招聘會信息管理。
2.2.5 就業統計模塊
該模塊包括兩個部分,歷年就業信息統計和歷年招聘信息統計兩個子模塊。管理員可以查詢歷年招聘信息統計和畢業生歷年就業情況。
2.2.6 就業市場信息采集挖掘系統模塊
國內眾多學者的研究表明,勞動力市場的大數據具有極大的研究價值,能顯示勞動力市場的需求。史珍珍的研究指出互聯網的勞動力市場大數據具有動態性、及時性等特點,能用來分析傳統調查數據無法分析的問題[3];李鳳春等的研究指出隨著大數據網絡信息時代的到來,就業創業指導工作大數據網絡信息化的有效應用是未來發展的必然趨勢[4];宋齊明(2018) 通過對網絡招聘信息的研究也表明高校在人才培養中重視通用性能力的同時,也需提高針對性[5]。此模塊下使用網絡爬蟲定期獲取本地常用招聘網站的招聘信息,對進行就業市場不同崗位招聘數量等情況進行統計和數據挖掘,供高校調整專業配置,改進教學計劃提供參考。
2.3 畢業生求職模塊
畢業生使用學號登錄,查看學校發布的各項新聞公告和招聘會信息;搜索、查看和收藏招聘信息。系統會根據畢業生的個人簡歷和歷史行為向畢業生推薦合適的就業崗位。畢業生可以維護個人簡歷,向感興趣的招聘公司電子郵箱發送自己的簡歷,申請參加自己感興趣的招聘會,更新自己的就業情況。
2.4 輔導員模塊
輔導員對所管理學生的就業情況進行輔助更新、查看就業情況統計。
3 系統實現
3.1 系統實現
本系統使用B/S結構,后臺使用主流的后臺開發框架SpringBoot(SpringMVC+Spring+MyBatis),前端使用了Bootstrap 和VUE 等前端框架,數據庫使用MySQL,網絡爬蟲和部分數據分析部分使用Python語言完成。
3.2 推薦系統算法實現
本系統采用的是基于內容和基于協同過濾的加權混合推薦算法進行TOP-N招聘信息推薦。
基于內容的推薦算法的主要是通過計算求職者求職目標和個人簡歷與招聘信息之間的特征匹配度,從而把匹配程度最高的招聘信息推薦給用戶[6]。這種推薦方式非常適合系統中新數據的冷啟動。基于招聘職位的協同過濾推薦的推薦算法則記錄畢業生對不同職位進行的點擊瀏覽、收藏和投遞簡歷等行為信息,通過所有畢業生對某個招聘信息的歷史行為信息計算招聘信息之間的相似度,根據用戶的歷史偏好預測當前用戶還沒有表示偏好的職位信息,計算得到一個排序的職位列表作為推薦。
3.2.1 基于內容的推薦算法
基于內容的推薦算法,系統選取畢業生個人簡歷信息和求職意愿中的意向崗位、學歷、外語水平、持有技能證書、意向工作地點和最低可接受年薪等為特征,均為結構文本,匹配招聘信息中的崗位、最低學歷要求、外語水平、所需技能證書、工作地點和崗位起薪等特征集合。畢業生求職意向和招聘信息之間的關系可以描述成一個m × n 的矩陣,Uij(i ∈ [1,m ],j ∈ [1,n ])表示在該特征時求職意向與招聘信息是否相匹配,如果相匹配,如求職地點和招聘信息工作地點一致即表示相匹配則Uij=1,否則Uij=0,那么對于每一個招聘信息,都可以用一個向量Vi = (Ui1,Ui2,Ui3,...Uin )U來描述它。
由此可以使用余弦相似度來計算求職信息與招聘需求之間的關聯度,即計算畢業生對于招聘信息的偏好程度,公式如下:
其中,Uik 和Vjk 分別表示畢業生意向模型和招聘信息向量在k 維度上的值。
3.2.2 基于招聘信息的協同過濾算法
系統記錄畢業生對招聘信息的點擊瀏覽、收藏和投遞簡歷的行為信息,其中點擊瀏覽是隱式反饋,收藏和投遞是顯式反饋,通過畢業生感興趣的招聘信息來查找相似招聘信息,并將相似招聘信息推薦給畢業生。招聘信息之間的相似度計算公式為:
3.2.3 加權型的混合方式
通過對系統數據集及用戶行為分析,決定使用基于內容和用戶協同兩種推薦算法的加權混合,得到TOP-N推薦,公式如下:
其中,α 為基于內容的招聘信息偏好預測的權重,(1 - α) 表示基于協同過濾算法中招聘信息預測的權重。在畢業生數量不變,招聘信息量較少時,使用基于內容算法進行的預測較為準確,招聘信息量較大時,使用基于協同過濾算法進行的預測較為準確。
4 結束語
近幾年,畢業生就業難度明顯提升,高校畢業生就業問題已成為一個大型的系統工程。畢業生和高校應正確、積極地面對當前就業市場的復雜局面,妥善解決畢業生就業問題需要畢業生、高校和社會的共同努力[7-10]。該智能就業信息系統的建立,有利于畢業生更精準地獲取招聘信息,也有利于高校實時了解就業市場需求和學生就業情況。一方面便于高校根據就業市場變化和歷年就業情況進行統計、數據挖掘,了解勞動力市場動態,在遵循學術變化的規律的前提下,適時合理地調整人才培養方案和教學大綱,更好地滿足就業市場的需求;另一方面便于高校更好地為畢業生提供更加專業和個性化的就業指導。通過這個系統,招聘單位和畢業生之間也能更直接更方便地建立聯系,提升畢業生的就業效率,節省大量的人力物力財力。