趙力衡 李麗華



摘要:隨著機器學習技術的迅速發(fā)展,機器學習的分析方法也逐漸深入到社會各個領域中,成為行業(yè)分析的最重要手段之一。在學生就業(yè)前,使用機器學習方法分析學生已掌握的就業(yè)技能,能幫助學生明確自己的就業(yè)方向和職位,能顯著提高學生的就業(yè)機會。鑒于此,提出使用機器學習中FP關聯規(guī)則模型來分析學生掌握的技能與不同職位的匹配度,就可以分析出學生適合的職位。實驗結果表明,所提方法能較準確地分析出不同學生所適合的職位,可作為學生就業(yè)分析的有效依據。
關鍵詞:大數據;機器學習;就業(yè);tf-idf;畫像
中圖分類號:TP391 文獻標識碼:A
文章編號:1009- 3044(2019)34-0190-02
當前很多學生在就業(yè)時都存在著迷茫,不知道什么工作適合自己,不知道自己能勝任什么樣的工作;在招聘網站上尋找工作時,看到眾多眼花繚亂的技能要求,卻很多都不甚了解,不知道自己能勝任哪些工作職位。這些都源自學生對自身所學技能和工作所需技能不了解所造成的。
本文從分析學生自身所掌握的技能與不同工作崗位所要求的技能出發(fā),通過機器學習方式尋找同一行業(yè)方向的相似工作崗位所需的技能,使學生了解到當前行業(yè)所需的技能到底是怎樣的,有什么樣的趨勢,然后通過分析學生個人自身掌握的技能向學生推薦其工作領域。從而幫助學生提升自己能力,并提高找到適合工作的機會,為學生未來的發(fā)展提供一個參考。
1 模型分析
1.1 職位通用技能組
實際工作中總會遇到各種不同的項目和問題,這就要求應聘者必須具備處理復雜問題的多種技能。因此,通常一個職位對技能的要求并不是單一的,而是一系列的相關技能的組合,以大數據開發(fā)工程師為例,該職位通常會要求應聘者具備Spark,Hadoop,Kafka等一系列分布式數據處理的相關技能,如下表所示:
由表1可知,不同招聘信息中同一職位中要求的職業(yè)技能通常是一組相關的技能,這些技能有的在多個招聘信息中多次出現,如表中的Spark和Hadoop等,另一些技能則僅在某個或少數招聘信息中出現,如Perl、MySql。后者所需的職位不多,應聘者即便掌握也不易在應聘中遇到;而前者則具有普遍性,掌握后能符合多數招聘信息需求,這部分技能才是文中進行職位匹配所關注的。因此,通過FP關聯模型將同一職位中常用的相關技能提取出來形成該職位的通用技能組,如下圖所示:
1.2 個人就業(yè)技能畫像
要實現對精確到個人的職位推薦,還需要了解每個應聘者所掌握的就業(yè)技能。對于學生,這些技能通常來自于課程學習,或者從課外項目或假期實踐中學到。因此,個人就業(yè)技能畫像數據就來自以下兩個方面:
1)與學校教務處的課程學習數據庫連接,按專業(yè)獲取每個學生所學課程,從中提取出相關課程所教授的技能;
2)當學生登錄系統(tǒng)時,在個人賬號中補充自己在課程之外所掌握的技能。
系統(tǒng)中,學生在課外掌握的技能即使以課程內技能補充的形式記錄,也可能因為輸入者對技能的理解不一致等原因導致同一技能被以不同的名稱等形式重復輸入。因此,兩處數據源中的數據可能存在重復或同一技能不同名稱等問題,所以還需對數據整合并通過TF-IDF詞頻分析和ALS模型進行數據清洗,清洗后就得到了個人就業(yè)技能的畫像,如下圖所示:
1.3 職位推薦
職位推薦不但需要向該學生推薦匹配度最高的職位,還需要為該學生分析出對指定職位仍欠缺的技能。
當向學生推薦匹配度最高的職位時,使用學生所掌握的技能和每個職位的通用就業(yè)技能組進行匹配。由于是與職位的通用技能匹配,因此不再考慮技能的支持度與置信度。比較學生掌握的技能與FP模型中每個職業(yè)的通用技能組中的技能,以技能匹配個數為標準,匹配個數最多的一個或多個職位就是與該學生最吻合的職位,如圖3所示:
上圖中左側是推薦的職位,右側是學生所掌握的該職位中的通用就業(yè)技能。從圖2中可以看出,與圖2中學生所掌握的技能最匹配的是大數據開發(fā)工程師、大數據開發(fā)負責人、大數據存儲工程師三個職位,每個職位的通用技能組中都有五個技能是該學生所掌握的。這也是該學生掌握的技能中與職位通用技能匹配最多的個數,因此認為這三個職位最合適該學生。
當學生表露出對某一職位感興趣時,還需要分析該職位的通用就業(yè)技能組中的哪些技能是該學生沒有掌握的,以此提高學生對自己需要掌握的技能樹的認識。將學生感興趣的職位的通用技能從FP模型中提取出后,再與學生所掌握的技能進行對比,就可以知道該學生為應聘該職位所需要的努力方向了。重新選擇另一個只學習了較少大數據知識的學生應聘算法工程師、Web開發(fā)工程師和大數據工程師進行技能分析,分析結果如下圖所示:
從圖4中可以看到系統(tǒng)分析出了該學生應聘這三個職位還需要掌握的技能。
通過系統(tǒng)分析,就能很清楚地看到學生所適合的職位,以及應聘某個職位時還需要掌握的技能。這就為學生進入職場時對自身的認識和就業(yè)方向提供了一個可靠的參考。
2 結束語
實驗結果表明,所提方法能較準確地通過學生自身掌握的技能和招聘信息中不同職位的通用技能組的匹配來分析出每個學生所適合的職位,以及應聘某個職位時應聘者所具有的優(yōu)勢和欠缺的技能,從而為不同的學生提供一個精確到個人的就業(yè)參考。
參考文獻:
[1]孫怡帆,潘昆峰,孫正陽,等.大學生畢業(yè)去向預測的思路與方法——基于機器學習算法的嘗試[J].教育學術月刊,2019(5).
[2]李佐軍,大數據時代下關聯規(guī)則興趣度挖掘在就業(yè)分析中的應用[J].軟件工程,2018(9).
[3]趙力衡,陳虹君.基于機器學習的招聘信息中就業(yè)技能提取的應用分析[J].電腦知識與技術,2019(13).
[4]姜紹俊,大數據支撐下的機器學習算法[J].電腦知識與技術,2018(2).
[5]王芳,申貴成.機器學習算法在用戶行為中的應用[J].電腦知識與技術,2017(9).
【通聯編輯:唐一東】
收稿日期:2019-08-16
基金項目:基于機器學習的學生就業(yè)技能研究(2018JCKY0019)
作者簡介:趙力衡(1976-),男,四川成都人,高級工程師,碩士,主要研究方向為大數據、物聯網;李麗華(1985-),女,重慶人,副教授,碩士,主要研究方向為物聯網。