999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于行為特征及關系網的大學生就業推薦算法研究

2023-06-25 10:36:16王煜龍楊凌雯
無線互聯科技 2023年7期

王煜龍 楊凌雯

摘要:大學生行為特征和企業特征為就業推薦算法提供了建模依據,其實現方式為采集數據、提取特征、訓練算法模型。數據采集階段需進行分類和預處理,確保數據格式、數值等符合要求。文章依托深度神經網絡,提取了大學生行為序列特征,建立了PRHN推薦算法的理論模型。關系網可充分發掘學生數據和企業數據的圖譜結構,有助于提升PRHN就業推薦算法的命中率,改善推薦集內的企業排序。因而可將關系網融入推薦算法,輔助完成推薦任務,提升算法性能和效果。

關鍵詞:行為特征;關系網;大學生就業;推薦算法

中圖分類號:TP391.3文獻標志碼:A0引言當前,國內已經研究出多種大學生就業推薦算法,其出發點和理論依據各有差異。筆者查閱文獻后發現,基于大學生行為特征的就業推薦算法研究相對較少,且相關理論模型中未充分考慮學生關系網和企業關系網對就業的影響。鑒于此,本文針對大學生行為特征及關系網開展就業推薦算法研究工作,旨在優化理論模型。

1基于行為特征的大學生就業推薦算法1.1算法框架大學生的行為特征能夠反映其職業偏好、能力特點以及綜合素養,在就業服務中以行為特征為線索,借助推薦算法為其匹配適宜的企業,精確求職范圍,進而提升求職效率和成功率,相關算法的邏輯框架如圖1所示。顯然,該算法的核心邏輯是提取大學生基本信息和行為模式信息,形成學生行為特征,然后按照特定的邏輯在學生行為特征和企業特征之間建立聯系,最終產生適合學生的企業推薦集。

1.2數據采集和處理大學生就業推薦算法涉及大量的學生信息和企業信息,研究時引入關系型數據庫MySQL,存儲各類基礎數據。

1.2.1學生信息采集數據庫中以表區分不同類型的數據,每一張表中設計多個字段,學生信息可分為5張表,表名稱及其字段的注釋信息如下:

(1)學生基礎信息表。涉及字段為姓名、性別、年齡、民族、籍貫、院校名稱、專業名稱、政治面貌、學業狀態。

(2)學業成績信息表。主要字段為專業課成績、英語四級成績、英語六級成績、計算機等級考試成績、平均績點、專業綜合排名、從業資質考試成績(如法律職業資格考試、注冊會計師考試)。

(3)校內活動信息表。主要字段包括班干部、學生社團、校內文藝活動以及各類校內活動的起止時間。

(4)獎助信息表。表內字段為助學金、獎學金、獲取時間。

(5)競賽信息表。字段為競賽名稱、競賽類別、競賽時間、競賽名次。

1.2.2企業信息采集企業分布在不同地區,因而學生難以直接與企業溝通人才需求信息。為收集企業信息,采用網絡爬蟲技術抓取企業相關的網頁信息。由于網絡信息的質量參差不齊,為防止收集到無效信息和虛假信息,將信息抓取的重點選定為企業信用查詢類網站,如愛企查、天眼查,然后將抓取到的網頁信息存儲為兩種表。

(1)企業基本信息表。

企業基本信息表主要字段包括經營狀態、成立日期、注冊資本、所屬行業、參保人數、企業規模、企業類型。該表主要存儲長度較短、內容明確的字段信息。

(2)企業描述信息表。

企業描述信息表主要字段為企業名稱、地址、經營范圍、信用評價。

1.2.3數據預處理初步收集到的學生信息可能存在不完整、不合規范、空缺等情況,企業信息可能存在開業異常、信用評價低等情況。數據預處理的任務包括3個,其一是通過算法篩除缺失值過多的學生和企業信息,防止其入庫占用資源;其二是填補部分缺失的數據;其三是離散字段編碼。

正則表達式按照特定規則篩選、替換或者校驗各種字段信息,可用于剔除無效的學生信息和企業信息。當整體信息較為完善而個別字段缺失時,可將缺失的信息填充為空或者-1。企業基本信息表和學生基本信息表中的字段不存在優先級問題,數據呈現明顯的離散性,編碼時采用One-Hot(獨熱編碼)技術[1]。等級考試和課業成績均存在上限和下限,因而按照最大最小原則,進行標準化處理。

1.2.4學生行為特征提取以學生行為特征為線索實現就業推薦時,要先提取學生行為特征信息,其關鍵是在相關信息內建立邏輯關系。以學生校內活動行為特征為例,校內文體活動、班干部任職、參與學生社團、提供志愿者服務均屬于校內活動的范疇,特征提取的方法為按照活動起始時間進行排序,形成學生校內活動軌跡。

1.3算法實現原理研究利用了深度神經網絡構建推薦算法的理論模型——PRHN算法,該模型框架分為3層,其功能和實現原理如下。

1.3.1嵌入表示層在算法實現過程中需將學生基本特征信息、行為特征信息、企業特征信息轉化為程序可理解的數學語言,由于數據離散性特征突出,故使用集合進行匯總。例如,將學生集合記為S,其中的第i名學生記為Si,該學生對應的特征信息記為Gi,則Gi的集合表示方法如式(1)所示。

嵌入表示層中需對One-Hot編碼的離散數據進行特殊處理,降低其向量維度,避免出現無效的神經元,方法為在G學生特征集合中的離散特征元素中增加嵌入向量。

1.3.2序列語義層學生行為特征多為一系列事件的集合,并且事件按照時間或者其他邏輯線索進行排序,形成事件序列,語義序列層用于提取此類事件信息。綜合對比CNN模型、LSTM模型以及Self-Attention模型,最終采用適宜分析序列元素內部關聯性的Self-Attention模型[2]。該模型是神經網絡中的研究熱點,可稱為自注意力機制,在提取行為序列信息時,能夠對每一個事件進行位置編碼,從而在一系列事件中建立順序。企業的描述性文本信息也在Self-Attention模型的處理范圍內。

1.3.3深度預測層深度預測層的主要作用是在學生信息和企業信息間建立交互機制,從而依據學生基本特征信息和行為特征信息形成推薦集。其網絡層包括兩部分,特征交叉網絡用于特征交互,前饋網絡用于強化非線性擬合能力。深度預測層利用神經元非線性作用函數Sigmoid預測學生能否匹配企業,匹配度預測結果記為r,其表示方法如下。

1.4算法檢驗

1.4.1試驗數據(1)學生信息。

以國內某高等院校2018年和2019年的4 898名本科畢業生為研究對象,重點采集兩類信息。第一類是學生基本特征信息和學生行為特征信息,入庫前進行數據預處理。第二類是學生就業單位信息。試驗思路為利用本次建立的推薦算法為學生匹配企業,然后推薦幾種就業單位。

(2)企業信息。

利用Python編寫爬蟲,收集到1 987家企業的特征信息,同樣進行數據預處理,將符合試驗要求的數據存入數據庫。

1.4.2試驗過程試驗數據分為測試數據、訓練數據以及驗證數據3類。訓練數據的作用是通過反復訓練,建立和優化算法模型,因而占比較大,將80%的數據用于訓練算法模型。測試數據用于推薦算法的功能測試,為算法改進提供方向。驗證數據用于全面檢驗優化后的推薦算法。試驗中使用HR(命中率)和MRR評價推薦算法的實際效果。MRR用于評價推薦幾種企業排序的合理性,如果學生就業意向靠前的企業排在推薦幾種比較靠前的位置,證明推薦算法取得了較好的效果[3]。在試驗過程中,筆者同步對比深度神經網絡推薦算法(PRHN)、RF推薦算法、P2CF推薦算法以及APJFNN推薦算法的實際效果。

1.4.3結果分析通過對比發現,PRHN推薦算法在HR和MRR兩項指標上均取得最佳排名,超越了其他同類算法,在不同的數據集上表現出穩定性,命中率HR至少比第二名提高了3%,MRR比第二名高出2%,足以證明PRHN算法達到了較好的推薦效果。

2基于關系網的大學生就業推薦算法優化2.1優化方向基于大學生行為特征的推薦算法僅僅考慮了學生和企業兩個維度的因素,然而現實生活中的就業影響因素往往更加復雜。例如,地域和城市對大學生的就業選擇影響突出。PRHN推薦算法中未能充分應用這些重要因素。關系網在日常生活中運用廣泛,可通過建立數據關系網引入更多的實體元素。將關系網融入推薦算法能夠有效填補學生和企業之間的空白信息,從而避免算法模型難以處理稀疏數據的情況。

2.2構建關系網根據現實經驗,大學生就業中的關系網包括3類:一是學生間的關系網,二是企業間的關系網,三是學生和企業間的關系網。以下分析前兩類關系網的構建方式。

2.2.1學生關系網提取方式同班、同宿舍、同專業、同社團、同組比賽均可作為提取學生關系網的依據。學生基礎特征信息中涵蓋了專業、班級、社團參與情況等信息,可借助算法匹配關鍵詞,從而在學生之間建立關系網。

2.2.2企業關系網提取方式企業關系網更加復雜,其評價維度更加多元化。從企業類型的角度而言,常見的企業包括制造業企業、互聯網企業、娛樂服務類企業,可按照企業類型建立關系網[4]。從企業規模的角度而言,企業包括大型企業、中型企業、小微企業,因而亦可將企業規模作為建立關系網的依據。

2.3關系網絡及圖增強推薦算法

2.3.1問題描述

2.3.2建立模型(1)建模思路。

在推薦算法中融入關系網時,增加了算法的任務量,在原本的推薦任務上新增了關系網嵌入任務,由此產生了新的推薦算法模型——GPRN,其特點為借助關系網增強推薦效果,關系網嵌入任務起到輔助推薦任務的作用。GPRN推薦算法建立在PRHN推薦算法的基礎上。

(2)子模塊。

① 學生子模塊(PRHN-S)。該子模塊的數據來自PRHN推薦算法中的學生數據集,分為兩類,一類用于表征學生的行為特征,呈現方式為事件序列,另一類為學生基本信息。兩類數據的離散度較高,需通過嵌入層降低向量維度,并利用交叉網絡實施交互處理。

② 企業子模塊(PRHN-C)。該子模塊的數據來自PRHN推薦算法中的企業數據集,處理方式與PRHN-S模塊基本相同。

(3)推薦任務。

GPRN算法的推薦任務實現邏輯與各個子模塊的功能基本相同,當學生數據和企業數據輸入系統之后,PRHN-S子模塊和PRHN-C子模塊分別處理對應的學生數據和企業數據,使其在結構上滿足兩個子模塊的要求。然后再將處理后的結構化數據投入模型,進行訓練,建立學生和企業的匹配函數,該函數的變量為學生和企業,將學生記為Si,企業記為Ci,則函數中輸入的數據分別為Si對應的兩種學生屬性數據和Ci對應的兩種企業屬性數據[5]。推薦任務的結果為企業和學生的匹配度。

3結語基于大學生行為特征的就業推薦算法以深度神經網絡為理論模型,首先在實現層面采集學生基礎信息和行為序列信息,同時獲取企業相關的基礎信息,所有數據要進行預處理,剔除無效信息,然后按照PRHN模型開展嵌入處理,提取大學生行為序列特征和企業特征,最后再實施深度預測。在PRHN模型的基礎上引入關系網,可進一步改善數據結構,提升推薦算法的命中率和結果排序。

參考文獻

[1]張婳.基于深度學習的大學畢業生就業推薦方法研究[D].重慶:重慶郵電大學,2021.

[2]廖鳳露.基于個性化偏好的大學生就業推薦算法研究[D].重慶:重慶大學,2019.

[3]黃俊萍.基于推薦算法的大學生就業管理系統[J].信息技術與信息化,2021(11):6-9.

[4]于文華.基于大數據的大學生就業創業指導系統[J].微型電腦應用,2021(9):37-39,43.

[5]王云婷.基于協同過濾的高職院校就業推薦系統的研究與開發[D].銀川:寧夏大學,2018.

(編輯 王雪芬)

Research on employment recommendation algorithm for college students based on

behavioral characteristics and relationship networksWang? Yulong, Yang? Lingwen

(Luoyang Vocational College of Science and Technology, Luoyang 471822, China)Abstract:? College students’ behavior characteristics and enterprise characteristics for the employment recommendation algorithm to provide a modeling basis, the implementation is to collect data, extract features and train algorithm model. In the stage of data acquisition, classification and preprocessing are needed to ensure that the data format and numerical value meet the requirements. The feature of college students’ behavior sequence is extracted by depth neural network, and the theoretical model of PRHN recommendation algorithm is established. The network can fully explore the graph structure of student data and enterprise data, which helps to improve the hit rate of PRHN’s algorithm and the ranking of enterprises in the recommendation set. Therefore, the network can be incorporated into the recommendation algorithm to assist the completion of the recommendation task and improve the performance and effectiveness of the algorithm.

Key words: behavioral characteristics; network; employment of college students; recommendation algorithm

主站蜘蛛池模板: 香蕉久久国产超碰青草| 欧美亚洲一区二区三区在线| 午夜不卡视频| 亚洲第一成年网| 亚洲青涩在线| 欧美人与牲动交a欧美精品| 国产97公开成人免费视频| 精品久久综合1区2区3区激情| 国产亚洲精品va在线| 高清久久精品亚洲日韩Av| 精品黑人一区二区三区| 成人综合网址| 五月天综合婷婷| 国产高清又黄又嫩的免费视频网站| 无码一区二区三区视频在线播放| 亚洲日本www| 亚洲无限乱码一二三四区| 久久精品亚洲专区| 国产情精品嫩草影院88av| 91香蕉国产亚洲一二三区| 日本精品影院| 9966国产精品视频| 国产免费网址| 毛片一级在线| 成年片色大黄全免费网站久久| 人妻少妇乱子伦精品无码专区毛片| 国产精品成人免费综合| 亚洲成肉网| 91免费国产在线观看尤物| 亚洲天堂日韩在线| 国产夜色视频| 国产97视频在线观看| www.91中文字幕| 欧美精品啪啪一区二区三区| 国产高清在线精品一区二区三区| 老色鬼久久亚洲AV综合| 国产v精品成人免费视频71pao | 国产色爱av资源综合区| 日韩第一页在线| 亚洲精品无码日韩国产不卡| 精品久久久久无码| 精品91自产拍在线| 欧美中文字幕无线码视频| 午夜无码一区二区三区在线app| 日韩小视频在线观看| 99国产在线视频| 日韩不卡高清视频| 九九视频免费在线观看| 国语少妇高潮| 亚洲中文久久精品无玛| 在线观看国产黄色| 国内精品久久人妻无码大片高| 中国丰满人妻无码束缚啪啪| 国产午夜无码专区喷水| 久热99这里只有精品视频6| 扒开粉嫩的小缝隙喷白浆视频| 午夜视频在线观看免费网站| 91年精品国产福利线观看久久| 日韩亚洲高清一区二区| 亚洲欧美激情小说另类| 亚亚洲乱码一二三四区| 亚洲综合二区| 国产成人综合在线观看| 成人综合在线观看| 国产亚洲精| 国产95在线 | 中文字幕va| 最近最新中文字幕在线第一页| 欧美成人手机在线观看网址| 久久国产精品娇妻素人| 免费人成网站在线高清| 操国产美女| 欧美日韩导航| 国产中文在线亚洲精品官网| 99手机在线视频| 欧美日韩精品在线播放| 制服丝袜在线视频香蕉| 欧美中文字幕一区| 国产精品亚洲五月天高清| 99re经典视频在线| 成人欧美在线观看| 亚洲日韩国产精品无码专区|