999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop平臺的崗位推薦系統(tǒng)設(shè)計(jì)

2019-11-12 11:38:42顧軍林劉瑋瑋陳冠宇
現(xiàn)代電子技術(shù) 2019年20期

顧軍林 劉瑋瑋 陳冠宇

摘 ?要: 針對當(dāng)前學(xué)生擇業(yè)難而學(xué)校人才培養(yǎng)無法滿足當(dāng)前社會(huì)實(shí)際需求的問題,提出基于Hadoop平臺的大數(shù)據(jù)就業(yè)崗位推薦系統(tǒng)。該系統(tǒng)利用爬蟲技術(shù)爬取互聯(lián)網(wǎng)招聘網(wǎng)站上的海量崗位信息,并對崗位信息進(jìn)行整理、清洗、分析,HBase作為數(shù)據(jù)存儲(chǔ),將數(shù)據(jù)制作成圖表,給用戶直觀體驗(yàn);根據(jù)用戶提供的用戶技能為用戶篩選出合適的崗位,實(shí)現(xiàn)崗位的精確推薦。

關(guān)鍵詞: 崗位推薦; Hadoop平臺; 爬蟲技術(shù); 信息處理; HBase; 功能實(shí)現(xiàn)

中圖分類號: TN911?34; TP391.1 ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼: A ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2019)20?0123?05

Design of post recommendation system based on Hadoop platform

GU Junlin, LIU Weiwei, CHEN Guanyu

(Engineering Technology Research and Developent Center of Electronic Products Equipment Manufacturing of Jiangsu Province, Huaian 223003, China)

Abstract: In allusion to the problems that it is difficult for students to choose jobs and the talent training in schools cannot meet the actual needs of the current society, a big data employment post recommendation system based on Hadoop platform is proposed. The crawler technology is used in this system to catch the massive post information in the Internet recruitment website, and then sort, clean and analyze it. The HBase is used as data storage to put the data into charts to give users an intuitive experience. The appropriate post is selected for the user according to the skills provided by him to achieve accurate job recommendation.

Keywords: post recommendation; Hadoop platform; crawler technology; information processing; HBase; function realization

0 ?引 ?言

時(shí)代迅速發(fā)展,人們已經(jīng)步入大數(shù)據(jù)時(shí)代,大數(shù)據(jù)通過對海量數(shù)據(jù)的分析,從而得出一個(gè)數(shù)據(jù)走向,相比隨機(jī)采樣式數(shù)據(jù)分析,結(jié)果更可靠更有說服力[1]。如今,就業(yè)問題讓許多人頭疼,其中有幾個(gè)原因[2?3]:一是中國人口數(shù)量龐大,崗位的狀態(tài)接近飽和;二是許多就業(yè)者不能認(rèn)識到當(dāng)前的行業(yè)的狀況,在學(xué)校中也缺少對行業(yè)、崗位狀況的了解,再就是不能認(rèn)識到自己,不知道自己的所學(xué)能勝任什么工作[4?6]。本文實(shí)現(xiàn)目標(biāo)是構(gòu)建一個(gè)基于Hadoop平臺的大數(shù)據(jù)就業(yè)崗位推薦系統(tǒng),利用爬蟲[7]技術(shù)爬取互聯(lián)網(wǎng)招聘網(wǎng)站上的海量崗位信息,并對崗位信息進(jìn)行整理、清洗、分析、聚類、存儲(chǔ),數(shù)據(jù)制作成圖表,給用戶直觀體驗(yàn)。根據(jù)用戶提供的用戶技能來為用戶篩選出合適的崗位,應(yīng)用大數(shù)據(jù)推薦算法實(shí)現(xiàn)崗位的精確推薦,以幫助用戶從茫茫崗海中迅速找到合適的崗位,讓擇業(yè)目的性、準(zhǔn)確性更加突出。

1 ?系統(tǒng)架構(gòu)架構(gòu)設(shè)計(jì)

根據(jù)系統(tǒng)需求設(shè)計(jì)系統(tǒng)的架構(gòu)如圖1所示。

項(xiàng)目采用前后臺分離開發(fā)模式。后端主要專注于控制層(Restful API)、服務(wù)層、數(shù)據(jù)訪問層;前端專注于前端控制層(Nodejs)、視圖層、相互協(xié)作、高度配合。系統(tǒng)主要分為以下兩個(gè)部分:

1.1 ?Xq?Server服務(wù)端設(shè)計(jì)

Xq?Server負(fù)責(zé)從招聘網(wǎng)站上的海量崗位中爬取有用的崗位數(shù)據(jù)進(jìn)行整理、清洗、分析、聚類、存儲(chǔ),為前端調(diào)用提供數(shù)據(jù)支撐。Xq?Server詳細(xì)運(yùn)行流程如圖2所示。

圖1 ?系統(tǒng)架構(gòu)圖

圖2 ?Xq?Server運(yùn)行流程圖

Xq?Server部分中有兩大重要接口:一個(gè)是Service接口;一個(gè)是Server接口。每個(gè)功能模塊都有一個(gè)Service,各功能模塊的Service都實(shí)現(xiàn)了Service的接口。系統(tǒng)中各Service類如圖3所示。

1.2 ?Xq?Client客戶端設(shè)計(jì)

Xq?Client:負(fù)責(zé)崗位推薦、數(shù)據(jù)的顯示,從MongoDB中讀取數(shù)據(jù)繪制前端圖表。Xq?Client部分有崗位推薦功能,推薦部分入口是LearningController的getJytj()方法,該方法接收用戶傳遞過來的技能信息和技能積累時(shí)間,然后調(diào)用JobAnalysisReposity類中的getJytj()方法獲得推薦數(shù)據(jù)返回給用戶。

崗位推薦類結(jié)構(gòu)如圖4所示。

圖3 ?各Service類結(jié)構(gòu)

圖4 ?崗位推薦類圖結(jié)構(gòu)

圖5 ?Xq?Client運(yùn)行流程圖

1.3 ?HBase系統(tǒng)數(shù)據(jù)庫設(shè)計(jì)

網(wǎng)絡(luò)爬蟲爬取的招聘崗位數(shù)據(jù),存儲(chǔ)表“job_internet”初始設(shè)計(jì)為2個(gè)列族:RAW_DATA和TAG_DATA,分別保存爬取的原始數(shù)據(jù)和標(biāo)簽獲得原始數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗之后,保存為列族PERCEPT_DATA,存放感知數(shù)據(jù)。job_internet結(jié)構(gòu)如圖6所示。

“job_internet”表中列族RAW_DATA,TAG_DATA,PERCEPT_DATA數(shù)據(jù)描述如下:

圖6 ?job_Internet表列簇功能描述

圖7 ?從job_Internet中分出不同的類別,每個(gè)類別作為一張表

2 ?系統(tǒng)功能模塊實(shí)現(xiàn)

2.1 ?崗位數(shù)據(jù)收集模塊

崗位分布統(tǒng)計(jì)的實(shí)現(xiàn)步驟如下:

1) 爬取崗位信息;

2) 將原始數(shù)據(jù)存入HBase數(shù)據(jù)庫;

3) 清洗崗位信息;

4) 清洗后數(shù)據(jù)存入HBase數(shù)據(jù)庫;

5) 統(tǒng)計(jì)崗位分布結(jié)果。

數(shù)據(jù)收集中間結(jié)果:

1) job_internet表RAW_DATA列簇(一條)如圖8所示。

圖8 ?RAW_DATA中一條數(shù)據(jù)

2) job_internet表TAG_DATA列簇(一條)如圖9所示。

2.2 ?崗位數(shù)據(jù)清洗模塊

清洗崗位信息,規(guī)范化原始數(shù)據(jù),并根據(jù)崗位名分成多張HBase表,數(shù)據(jù)清洗中間結(jié)果效果圖如圖10所示。

2.3 ?崗位統(tǒng)計(jì)模塊

統(tǒng)計(jì)崗位分布結(jié)果,根據(jù)HBase中清洗后的數(shù)據(jù),將所有的崗位按照不同方式統(tǒng)計(jì),包括:崗位地區(qū)分布、崗位薪資分布、崗位學(xué)歷分布、崗位經(jīng)驗(yàn)分布、公司的性質(zhì)分布、公司的規(guī)模分布等,將統(tǒng)計(jì)的數(shù)據(jù)存入MongoDB,崗位薪資分布圖如圖11所示。

2.4 ?崗位聚類模塊

崗位聚類模塊將所有的崗位先分大類,如:開發(fā)、運(yùn)維、架構(gòu)等,在大類下,將相似度高的崗位聚合,產(chǎn)生有高代表性的可指定個(gè)數(shù)的崗位。

1) 崗位聚類模塊效果圖如圖12所示。

2) 崗位聚類模塊核心代碼如下:

圖12 ?崗位聚類模塊效果圖

2.5 ?崗位推薦模塊

1) 崗位推薦效果圖如圖13、圖14所示。

主站蜘蛛池模板: 亚洲成aⅴ人在线观看| 久久青草免费91观看| 91毛片网| 在线观看网站国产| 免费人成黄页在线观看国产| 国产区精品高清在线观看| 国产精品无码一区二区桃花视频| 亚洲精品无码不卡在线播放| 日本91视频| 欧美午夜性视频| 欧美国产综合色视频| 国产精品人莉莉成在线播放| 免费国产高清精品一区在线| yy6080理论大片一级久久| 久久女人网| 伊伊人成亚洲综合人网7777 | 日韩高清欧美| 99久久国产精品无码| 一级一级一片免费| 精品伊人久久久香线蕉| 国产超薄肉色丝袜网站| 亚洲毛片一级带毛片基地| 青草视频免费在线观看| 亚洲毛片一级带毛片基地 | 午夜毛片免费观看视频 | 嫩草国产在线| 国产精品免费福利久久播放| 日韩高清一区 | 日本在线亚洲| 欧美激情伊人| 久久黄色视频影| 国产精品露脸视频| 狠狠色综合网| 91破解版在线亚洲| 欧美啪啪精品| 毛片卡一卡二| 国产精品久久久久鬼色| 亚洲男人天堂网址| 亚洲国产清纯| 91色在线观看| 麻豆精品久久久久久久99蜜桃| 国产精品福利导航| 99久久国产综合精品2023| 人妻丰满熟妇啪啪| 毛片手机在线看| 一级毛片视频免费| 国产午夜无码片在线观看网站| 第一区免费在线观看| 亚洲一本大道在线| 无码人中文字幕| 在线色综合| 中文国产成人久久精品小说| 免费jjzz在在线播放国产| 亚洲色婷婷一区二区| 亚洲欧美精品一中文字幕| 亚洲免费黄色网| 欧美三级视频网站| 欧美亚洲欧美区| 国产精品太粉嫩高中在线观看| 婷婷在线网站| 四虎成人精品| 亚洲,国产,日韩,综合一区| 99热免费在线| 亚洲第一成网站| 中日无码在线观看| 国产欧美成人不卡视频| 久久semm亚洲国产| 久久久久国产精品免费免费不卡| 亚洲人成色在线观看| 国产美女91视频| 99精品影院| 亚洲婷婷丁香| 欧美一区中文字幕| 午夜少妇精品视频小电影| 精品剧情v国产在线观看| 国产精品福利在线观看无码卡| 亚洲清纯自偷自拍另类专区| 国产在线精品人成导航| 国产成人av一区二区三区| 婷婷亚洲视频| 亚洲综合第一页| 四虎精品国产永久在线观看|