999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)視域下網(wǎng)絡(luò)招聘數(shù)據(jù)信息挖掘的研究

2021-04-26 04:13:12張長華
科學(xué)技術(shù)創(chuàng)新 2021年10期
關(guān)鍵詞:詞匯信息研究

張長華

(河北建材職業(yè)技術(shù)學(xué)院,河北 秦皇島066000)

信息技術(shù)的快速發(fā)展,改變了傳統(tǒng)崗位招聘模式,從線下招聘逐漸向網(wǎng)絡(luò)招聘方向發(fā)展,大部分企業(yè)的招聘信息均借助網(wǎng)絡(luò)平臺(tái)發(fā)布[1]。隨著時(shí)間的推移,網(wǎng)絡(luò)招聘數(shù)據(jù)越來越多。目前,部分高校通過對(duì)招聘數(shù)據(jù)信息進(jìn)行統(tǒng)計(jì)分析,設(shè)計(jì)人才培養(yǎng)決策方案[2-3]。為了加深對(duì)招聘數(shù)據(jù)信息的剖析,各大高校陸續(xù)引入數(shù)據(jù)挖掘技術(shù)展開探究。本文以數(shù)據(jù)分析類崗位為例,對(duì)該崗位招聘特征信息挖掘進(jìn)行研究。

1 數(shù)據(jù)獲取

本研究對(duì)我國多家招聘網(wǎng)站進(jìn)行調(diào)研,選擇網(wǎng)站在招聘行業(yè)的權(quán)威性、崗位招聘相關(guān)信息數(shù)據(jù)量、數(shù)據(jù)抓取難度等指標(biāo)作為指標(biāo)進(jìn)行綜合對(duì)比,最終確定本次研究數(shù)據(jù)來源,包括前程無憂、獵聘網(wǎng)、智聯(lián)招聘、拉勾網(wǎng)。采用數(shù)據(jù)挖掘技術(shù),在這4個(gè)網(wǎng)絡(luò)平臺(tái)中挖掘與崗位招聘特征相關(guān)的信息,如果某條信息符合特征信息標(biāo)準(zhǔn),則立即抓取,并生成信息抓取統(tǒng)計(jì)表[4]。該表中含有崗位所在城市、工作經(jīng)驗(yàn)、全職/兼職、最低學(xué)歷要求、崗位領(lǐng)域、福利待遇、崗位標(biāo)簽、職位描述等關(guān)鍵詞及其相關(guān)信息。

2 研究方法

本研究根據(jù)數(shù)據(jù)字段特點(diǎn),對(duì)崗位描述文字進(jìn)行劃分,形成多個(gè)分詞詞集,經(jīng)過聚類分析和詞頻統(tǒng)計(jì),為TF-IDF 計(jì)算和數(shù)據(jù)可視化處理提供可靠數(shù)據(jù)。如圖1 所示,為崗位招聘特征信息挖掘研究思路。

圖1 崗位招聘特征信息挖掘研究思路

3 實(shí)驗(yàn)設(shè)計(jì)

3.1 數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理是決定了數(shù)據(jù)挖掘結(jié)果精準(zhǔn)度的重要環(huán)節(jié),為了盡可能提高挖掘結(jié)果精準(zhǔn)度,本研究在此環(huán)節(jié)構(gòu)建了詞匯庫,將設(shè)定的信息挖掘關(guān)鍵詞匯添加到這個(gè)詞匯庫中,從而避免數(shù)據(jù)在預(yù)處理期間分解。以下為數(shù)據(jù)預(yù)處理具體流程:

第一步,添加自定義停用詞詞典。根據(jù)崗位招聘調(diào)整情況,在詞典中定義已經(jīng)停止招聘的崗位、企業(yè)等相關(guān)信息對(duì)應(yīng)的詞匯,在自定義功能欄中完成。

第二步,添加自定義詞典。根據(jù)崗位招聘調(diào)整情況,在詞典中定義新增加的崗位名稱、企業(yè)等相關(guān)信息對(duì)應(yīng)的詞匯。

第三步,分詞去停用詞。根據(jù)崗位招聘調(diào)整情況,去除崗位描述修改詞匯,避免專業(yè)短語在分詞過程中出現(xiàn)詞匯分解情況。

第四步,根據(jù)詞性不同,分別標(biāo)注。

3.2 崗位福利待遇權(quán)重

本研究在分析崗位描述性關(guān)鍵詞在文本集中的重要程度時(shí),選取TF-IDF 算法作為研究工具,通過數(shù)據(jù)計(jì)算,得出結(jié)論。其中,TF 計(jì)算數(shù)值為詞頻,一般情況下,對(duì)此部分?jǐn)?shù)據(jù)采取歸一化處理。假設(shè),關(guān)鍵詞為ti,則任一詞匯對(duì)應(yīng)的TF 數(shù)值計(jì)算方法如下:

公式(1)中,mk,j代表中文經(jīng)過分詞處理以后出現(xiàn)的頻率總和;mi,j代表關(guān)鍵詞出現(xiàn)的頻率。模型中,IDF 數(shù)值表示反文檔頻率,該項(xiàng)指標(biāo)計(jì)算公式如下:

公式(2)中,|{j:ti∈di}|代表文件數(shù)目,且文件中含有關(guān)鍵詞;|D|代表文件總數(shù),其中文件來自文本集。

利用公式(1)和公式(2)計(jì)算獲取TF 數(shù)值和IDF 數(shù)值以后,計(jì)算崗位招聘關(guān)鍵詞對(duì)應(yīng)的TF-IDF 數(shù)值,計(jì)算方法:兩數(shù)值的乘積。

采用上述計(jì)算方法完成數(shù)據(jù)預(yù)處理,分別統(tǒng)計(jì)崗位招聘福利待遇字段相關(guān)信息,在詞頻統(tǒng)計(jì)端輸入這部分信息,而后計(jì)算TF-IDF 數(shù)值。按照數(shù)值大小排序,選擇排名前21 名關(guān)鍵詞作為分析指標(biāo)。為了掌握各個(gè)招聘網(wǎng)站崗位招聘特征基本情況,創(chuàng)建4 個(gè)文件,用來存儲(chǔ)各個(gè)招聘網(wǎng)站信息,形成福利待遇基本信息文件系統(tǒng)。

3.3 網(wǎng)絡(luò)招聘崗位描述

本研究對(duì)招聘崗位描述的探究,以相似性原理作為研究基礎(chǔ),綜合對(duì)比多種崗位描述方法,最終選擇K-means 算法,主要原因是該方法的描述結(jié)果比較客觀,支持文本向量化處理。

K-means 算法在本次研究中的應(yīng)用,主要用于崗位需求詞匯的聚類分析。在應(yīng)用之前,構(gòu)建Word2Vec 模型,量化文本。而后,按照關(guān)鍵詞向量值不同,開啟崗位需求詞匯聚類分析模式。

依據(jù)相似性原理,選擇各個(gè)關(guān)鍵詞之間的向量間距作為判據(jù),對(duì)相關(guān)詞匯進(jìn)行聚類分析。其中,向量間距的計(jì)算,本研究應(yīng)用歐式距離計(jì)算方法,設(shè)計(jì)以下計(jì)算公式:

分類中心的定位決定了聚類分析精準(zhǔn)度,為了盡可能精準(zhǔn)定位,本研究增加了迭代處理次數(shù),采用動(dòng)態(tài)迭代方法加以處理。其中,下一次迭代處理建立在上一次迭代聚類計(jì)算結(jié)果基礎(chǔ)上,依據(jù)調(diào)整后的mean 數(shù)值,確定分類中心。關(guān)于類簇中心的計(jì)算公式如下:

公式(4)中,Ck代表編號(hào)為k 的類簇,該類簇?cái)?shù)據(jù)總和記為|Ck|。

當(dāng)算法應(yīng)用達(dá)到一定迭代次數(shù)以后,需要停止迭代。目前,應(yīng)用比較多的方法有兩種:一種為設(shè)置固定的迭代次數(shù),在已知迭代處理次數(shù)需求情況下應(yīng)用,不適合應(yīng)用至本研究。另外一種迭代方法集準(zhǔn)則函數(shù)、誤差平方為一體,通過構(gòu)建以下函數(shù)模型:

公式(5)中,K 代表類簇?cái)?shù)量。利用此公式計(jì)算聚類數(shù)值時(shí),向設(shè)定參數(shù)σ,對(duì)比數(shù)值σ 與數(shù)值ΔJ 數(shù)值大小,如果ΔJ<σ,那么當(dāng)前公式(5)計(jì)算結(jié)果為最終聚類計(jì)算結(jié)果。依據(jù)此計(jì)算數(shù)值,準(zhǔn)確劃分崗位描述詞匯的類別。

4 實(shí)驗(yàn)結(jié)果分析

4.1 崗位福利待遇統(tǒng)計(jì)

關(guān)于崗位福利待遇信息的挖掘,采用TF-IDF 統(tǒng)計(jì)法挖掘數(shù)據(jù)并計(jì)算,從而掌握崗位福利待遇在權(quán)重分布情況。本次研究選取21 個(gè)關(guān)鍵詞作為信息挖掘指標(biāo),利用公式計(jì)算TF-IDF數(shù)值,結(jié)果如表1 所示。

表1 福利待遇權(quán)重統(tǒng)計(jì)表

4.2 崗位聚類分析

本次應(yīng)用測試,在操作界面上自定義詞典,分詞去除停用詞,對(duì)“數(shù)據(jù)分析崗位”詞頻進(jìn)行統(tǒng)計(jì),選擇頻率出現(xiàn)比較高的關(guān)鍵詞作為分析指標(biāo),輸入K-means 算法中,有效劃分崗位需求類型。其中,類別數(shù)量設(shè)定為5 類,同時(shí)在數(shù)據(jù)挖掘界面展示高頻排名前15 關(guān)鍵詞。如圖2 所示為聚類分析結(jié)果。

圖2 中,第一類聚類分析結(jié)果涵蓋了崗位業(yè)務(wù)能力,以產(chǎn)品運(yùn)營能力為首,對(duì)分析報(bào)告、需求分析提出了一定要求。第二類聚類分析結(jié)果以學(xué)歷、專業(yè)、專業(yè)課程為主。第三類分析結(jié)果以崗位技能掌握情況作為招聘核心。第四類和第五類分析結(jié)果分別統(tǒng)計(jì)了個(gè)人能力、招聘企業(yè)信息。

5 結(jié)論

大數(shù)據(jù)時(shí)代的到來,為招聘數(shù)據(jù)信息統(tǒng)計(jì)提供了有利工具,利用數(shù)據(jù)信息挖掘軟件,開發(fā)招聘數(shù)據(jù)信息統(tǒng)計(jì)方案,使得數(shù)據(jù)信息得以最大化利用,幫助各大高校明確當(dāng)前市場招聘情況。本文以“數(shù)據(jù)分析崗位”招聘信息為例,提出招聘信息統(tǒng)計(jì)研究。統(tǒng)計(jì)結(jié)果表明,此類崗位對(duì)從業(yè)經(jīng)驗(yàn)1 年至3 年的人才需求量較大,福利待遇方面,當(dāng)前公司給予的條件與人才需求基本相符,對(duì)求職者的業(yè)務(wù)能力、個(gè)人綜合素質(zhì)、崗位技能等要求較高。

猜你喜歡
詞匯信息研究
FMS與YBT相關(guān)性的實(shí)證研究
遼代千人邑研究述論
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
本刊可直接用縮寫的常用詞匯
EMA伺服控制系統(tǒng)研究
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會(huì)信息
本刊一些常用詞匯可直接用縮寫
主站蜘蛛池模板: 日本黄色不卡视频| 中文字幕亚洲综久久2021| 亚洲无码高清一区| 国产97公开成人免费视频| 日韩a级毛片| 天天综合亚洲| 欧美97欧美综合色伦图| 亚洲高清在线天堂精品| 免费在线a视频| 色香蕉影院| 国产波多野结衣中文在线播放| 搞黄网站免费观看| 青青操视频免费观看| 人禽伦免费交视频网页播放| 国产91透明丝袜美腿在线| 谁有在线观看日韩亚洲最新视频| 四虎成人免费毛片| a级毛片免费网站| 视频二区中文无码| 日韩欧美国产成人| 一个色综合久久| 国产午夜一级毛片| 国产在线观看成人91| 久久精品视频一| 激情五月婷婷综合网| 日日噜噜夜夜狠狠视频| 国产精品99久久久久久董美香| 亚洲天堂日韩在线| www.av男人.com| a天堂视频在线| 天堂av综合网| 亚洲精品卡2卡3卡4卡5卡区| 视频二区国产精品职场同事| 在线免费观看AV| 国产成人久视频免费| 国产精品va免费视频| 久草视频福利在线观看| 亚洲国产欧美目韩成人综合| 高清乱码精品福利在线视频| 91网红精品在线观看| 国产一区亚洲一区| 亚洲人成网址| 亚洲精品视频在线观看视频| 97人人做人人爽香蕉精品| 又大又硬又爽免费视频| 久久综合九九亚洲一区| hezyo加勒比一区二区三区| 精品自窥自偷在线看| 亚洲首页国产精品丝袜| 久久精品国产免费观看频道| 人人看人人鲁狠狠高清| 国产精品久久久久婷婷五月| 日本不卡在线视频| 91年精品国产福利线观看久久| 丁香婷婷综合激情| 久久视精品| 精品91视频| 99伊人精品| www中文字幕在线观看| 精品午夜国产福利观看| 理论片一区| 亚洲大尺码专区影院| 尤物特级无码毛片免费| 久久久久夜色精品波多野结衣| 香蕉蕉亚亚洲aav综合| 亚洲色精品国产一区二区三区| 国内丰满少妇猛烈精品播 | 国产一区二区三区日韩精品| 久久久久久国产精品mv| 国产www网站| 婷婷午夜影院| 韩国v欧美v亚洲v日本v| 一级香蕉人体视频| 国产精品女人呻吟在线观看| 午夜视频免费一区二区在线看| 国产成人精品免费视频大全五级| 日本午夜影院| 国产成人免费手机在线观看视频| 国产成人精品一区二区不卡 | 夜夜操天天摸| 亚洲swag精品自拍一区| 黄色污网站在线观看|