999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據背景下的校園求職用戶畫像研究

2022-06-10 04:14:11陳偉東
中國新通信 2022年9期
關鍵詞:大數據

摘要:隨著大數據技術的發展和成熟,校園建設和管理方面可以使用大數據得到快速提升。本文通過對校園求職用戶研究,提出了大數據背景下校園求職用戶畫像研究的總體框架和實施方案。根據校園求職情況構建對應的求職用戶畫像,有效管理校園求職用戶,推動學生就業工作開展。

關鍵詞:大數據;校園求職用戶;用戶畫像

進入21世紀后,我國高等教育事業快速發展,高校畢業生數量也隨之高速增長。中商產業研究院數據顯示:2011-2020年畢業生人數按2%~5%的同比增長率逐年增長,近10年畢業生人數累計達7603萬[1]。數據證明當前高校畢業生的數量增長顯著,這一情況說明社會對文化知識的需求數量增加,同時也是當今社會發展的趨勢,但是,高速的畢業生數量增長也給社會各方面配套能力造成一定的壓力,逐年出現的“更難就業季”就是其中一大問題。

一、校園招聘的現狀

校園招聘是畢業生從學校步入社會的一個渠道,各類工作單位通過校園招聘的形式引進新員工,校園招聘在連接過程中發揮著重要作用。校園招聘不同于其他形式的招聘,其具有獨特的優勢,一方面,招聘成本不高,涉及的專業數量多,應聘率和簽約率都比較高,單位能夠通過校園招聘獲得一定的儲備人才,有利于提高品牌形象;另一方面,通過校園招聘錄用的員工,素質水平高,能夠具備一定的可塑性,有年輕活力,對公司的認同感強。因此,校園招聘在一定程度上吸引了大量用人單位,受到畢業生喜愛,具有顯著優勢。

但校園招聘也存在著一些痛點問題,學生對求職認知有限,很多學生僅限于“找工作”幾個字,沒有認真地去分析求職這件事;對于自己真正要找什么工作,什么工作最合適,分析不足;同時校園招聘紛雜繁多的招聘信息,學生往往會摸不著頭腦,無手下手,難以從招聘信息海洋中找全真正適合自己的職位;校園招聘信息亟需個性化推送服務,但個性化推送缺乏基礎模型[2]。

二、用戶畫像的定義與發展

用戶畫像是根據用戶社會屬性、生活習慣和消費行為等信息而抽象出的一個標簽化的用戶模型[3]。其核心是用戶標簽,在大數據技術支持下通過分析用戶信息提煉特征標識豐富用戶標簽,讓用戶畫像變得立體真實。

用戶畫像是由Alan Cooper提出,是建立在一系列屬性數據之上的目標用戶模型[4]。用戶畫像中分析的用戶信息主要是互聯網下的用戶信息,是隨著互聯網產生的,與網絡用戶行為密切相關,根據用戶的行為提取用戶的特征,將用戶信息標簽化。標簽是人為定義的高度精練的特征標識[5]。 其中可以對用戶的基本屬性進行標簽化,用戶基本屬性是指一些用戶的靜態屬性,例如性別、年齡、手機號碼、文化程度、職業等;可以對用戶的動態屬性進行標簽化,這些屬性不是直接能得到,需要獲取信息后統計、計算、分析后才能得到特征值,例如消費時間、購買力、音樂內容偏好、上網活躍度等。

用戶畫像隨著大數據等技術的成熟發展很快,使原本大量沉睡的數據開始發揮商用價值。例如在電商領域,從以TB計的數據記錄中獲取消費行為、社交網絡、生活習慣等方面的標簽模型,指導商家個性化精確運營。

用戶畫像就是通過收集用戶生活習慣、社會信息、心理特征等信息,然后建立數學模型,將用戶信息標簽化,抽象出一個帶有標簽的虛擬用戶[6]。

鑒于以上背景,本文在針對用戶畫像的一系列研究基礎上,提出將用戶畫像應用到校園招聘場景,進而構建大數據背景下的校園求職用戶畫像的設想,通過采集相關數據、設計畫像維度與標簽體系、提取畫像標簽等工作實現對校園求職用戶的全面可信的刻畫描述,為大數據時代的校園招聘開展創造了一種新思路。

三、大數據背景下的校園求職用戶畫像研究總體框架

大數據背景下的校園求職用戶畫像研究總體框架分為三個部分。校園求職用戶畫像驅動力、校園求職用戶畫像構建和校園求職用戶畫像應用價值。

(一)對現有校園招聘存在的痛點問題進行研究,痛點問題主要集中在學生對求職認知有限、學生求職需求分析不足、招聘信息紛雜繁多無從下手、個性化服務缺乏基礎模型,確定了校園求職用戶畫像建設的必要性。

(二)利用適合校園招聘的畫像視角和方法,采集相關數據,對校園求職用戶進行數據建模分析并生成校園求職用戶標簽,構建校園求職用戶畫像。

(三)利用校園求職用戶畫像助力校園招聘的高效進行和良性發展,實現校園求職用戶畫像的應用價值。

四、大數據背景下的校園求職用戶畫像實施方案

實施方案主要分為四部分:校園求職用戶畫像模型構建、數據源獲取與數據采集、校園求職用戶標簽加工、校園求職用戶模型實際應用。

(一)校園求職用戶畫像模型構建

校園求職用戶畫像模型由基本屬性標簽、能力屬性標簽、求職環境標簽、求職類型標簽、求職行業標簽、求職單位標簽、求職行為標簽共七類用戶標簽組成,具體子標簽如圖1所示。

(二)數據源獲取與數據采集

用戶標簽的獲取與計算,離不開各類數據源。數據來源按渠道分,主要包括系統本源數據、外部采集數據、第三方數據[7];按終端分,主要是線上數據,線上數據包括移動端數據、電腦端數據,也有少量線下數據;按類別分,主要包括人口屬性數據、行為數據、設備信息數據、用戶興趣數據等[8]。

本項目需要用到的數據源包括學校本源數據和外部網絡爬蟲采集的數據,本源數據包括用戶基本信息、網絡訪問日志、用戶行為、用戶問卷等。其中構建校園求職用戶畫像的其他數據,包括招聘單位的數據等,由網絡爬蟲方式采集。流程如下:

1.首先根據用戶標簽屬性定位調研校園求職情境下的目標網站,分析目標網站下目標網頁特征,重點觀察網頁url變化規律,形成url列表,重點分析網頁DOM結構、網頁層次和目標數據規律,使得目標數據盡可能完整。

2.網絡爬蟲系統設計。選擇合適的爬蟲系統框架,可選取Scrapy爬蟲框架、Crawley爬蟲框架、PySpider爬蟲框架等框架,然后新增爬蟲系統輔助功能,輔助功能包括:URL管理,主要是URL的增刪改查操作;時間與頻率管理,主要是爬取時間定時,爬取次數定頻率。

網絡爬蟲系統完成后,選取一個或多個網頁作為網絡爬蟲程序的種子鏈接,從種子鏈接開始,將待爬蟲的URL鏈接列表移至待抓取隊列,依次讀取待抓取隊列URL,對該URL定位的網頁進行針對性的數據抓取并將目標數據并存入數據庫,之后把已經爬蟲過的URL移至已抓取隊列,在已抓取的網頁中如果還能獲取新的未爬取的URL則繼續移至待抓取隊列。支持定期爬取,可以設置定時器,自動觸發爬取。

3.數據分析處理和結構化存儲。對于爬取的數據進行解析、處理,去除無效數據,形成結構化數據,存入結果數據庫。

(三)校園求職用戶標簽加工

1.用戶標簽加工步驟

針對不同源的數據,如何獲取校園求職用戶畫像所需的用戶標簽數據,一般需要經歷4個步驟,包括數據采集、數據清洗、數據打通與標準化、標簽挖掘與驗證[9]。

(1)數據采集。如上文所提,校園求職用戶標簽所需的數據采集來源為學校本源數據和外部對應網站。采集用戶的靜態屬性,包括用戶的基本屬性、求職環境、求職行業等;采集用戶的動態屬性,包括用戶求職行為日志等[10]。

(2)數據清洗。第一步中采集的數據存在完整性、唯一性、權威性、合法性、一致性等質量問題[11],需要進行數據清洗。數據清洗的目的是為了解決這些質量問題,針對不同的問題采取不同的處理方式,例如針對數據完整性問題采用信息補全方法,針對唯一性問題采用去重方式,最終得到標準、正確的數據,使得數據適合做分析、計算和挖掘。

(3)數據打通與標準化。校園求職用戶數據來自不同的系統,數據比較分散,關聯度低,而且不同系統間數據標準有可能不一樣,而對于用戶畫像來說,數據打通與標準化非常關鍵,需要尋找具有關聯性的用戶標識,這一類標識有身份證號、手機號、設備id等,利用用戶標識進行信息關聯,整合多源數據,建立統一標準完整標識實體。

(4)標簽挖掘與驗證。分析加工校園求職用戶信息,獲取目標要素,通過數據挖掘算法,計算用戶標簽值,如果數據量非常大,可以利用大數據平臺并行計算。挖掘加工后的用戶標簽,使用真實案例進行驗證,以保障用戶標簽值挖掘的有效性、準確性。

2.動態標簽的加工

動態標簽的標簽值隨著時間推移可能會發生變化,因此需要建立實時更新或者定期更新機制。以“企業價值”用戶標簽為例。如何計算企業價值,根據Wikipedia 上的企業價值公式進行簡化:

企業價值 = 市值 + 負債 - 現金

市值、負債、現金三個數據需要使用網絡爬蟲技術獲取。首先爬取天眼查、東方財富網等網站上企業數據,利用代碼解析獲取目標原始數據,然后清洗分離市值、負債、現金三個數據,最終計算企業價值。

因為市值、負債、現金會定期發生變化,所以“企業價值”也是動態發生變化的,需要定期爬取,定期更新數據與計算值,本文中企業價值根據財報周期時間,按季度進行更新。

(四)校園求職用戶模型實際應用

校園求職用戶畫像具備七大領域用戶標簽信息,可以應用在推薦、分析等多個領域。

應用1:校園招聘信息個性化推薦。當招聘單位輸入相關信息后,系統根據企業的招人要求,比如:學歷、專業、求職地、技能、崗位名稱等要求,將智能去匹配求職用戶畫像,在眾多紛雜的招聘信息中為求職者推薦最合適的招聘信息。

應用2 :求職者求職分析報告。根據求職用戶畫像,通過分析算法,輸出用戶全方位分析報告,內容涉及用戶求職心態分析、適宜職位、求職策略等。

五、結束語

本文從四個方面闡述了大數據背景下的校園求職用戶畫像研究,提出了校園求職用戶畫像驅動力、校園求職用戶畫像構建和校園求職用戶畫像應用價值的總體框架,制定了校園求職用戶畫像模型構建、數據源獲取與數據采集、校園求職用戶標簽加工、校園求職用戶模型實際應用實施方案,有力支持校園就業用戶管理和就業工作開展。

作者單位:陳偉東? ? 杭州職業技術學院信息工程學院

參? 考? 文? 獻

[1]李艷軍.論地方高校大學生就業維權意識的培養[J].商情,2019(48):204.

[2]王鵬遠. 基于大數據的高校圖書館個性化推送服務研究[J]. 內蒙古科技與經濟, 2016(19): 159-161.

[3]沈金波. 用戶畫像在互聯網金融中的應用[J]. 現代商業, 2017(33): 55-56.

[4]林燕霞. 網絡輿情中網民屬性及行為分析[D]. 廣東工業大學, 2019.

[5]趙剛, 姚興仁. 基于用戶畫像的異常行為檢測模型[J]. 信息網絡安全, 2017(7): 18-24.

[6]仲瑋, 李志琛. 基于機器學習的網絡教育系統研究[J]. 通信學報, 2018, 39(A01): 135-140.

[7]薄明霞.基于大數據的安全威脅情報分析與共享平臺技術架構研究[J].電信技術,2019(11):5-9.

[8]丁偉.基于大數據技術的手機用戶畫像與征信研究[J].郵電設計技術,2016(3):64-69.

[9]甘偉.大數據臨床科研平臺的設計與實現[J].中國數字醫學,2019(2):40-43.

[10]王傳清.面向用戶的科技期刊智能內容生產模型構建[J].中國科技期刊研究,2020(5):541-549.

[11]郭宏毅. 大數據在金融風控和精準營銷中的應用及大數據項目風險研究[D]. 山東大學, 2017.

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 在线视频亚洲欧美| 青青青国产在线播放| 日韩在线视频网站| 亚洲国产精品日韩av专区| 亚洲综合天堂网| 午夜福利免费视频| 国产亚洲欧美日韩在线一区| 国产欧美日韩视频一区二区三区| 日本午夜视频在线观看| 国产尤物在线播放| 男女猛烈无遮挡午夜视频| 欧美在线一二区| 亚洲色无码专线精品观看| 国产你懂得| 第一页亚洲| 免费全部高H视频无码无遮掩| 无码内射在线| 色悠久久久久久久综合网伊人| 亚洲色图欧美视频| 97国产精品视频自在拍| 88av在线| 成人av手机在线观看| 精品黑人一区二区三区| 青青草国产在线视频| 老色鬼欧美精品| 高h视频在线| 全裸无码专区| 91国内外精品自在线播放| 亚洲综合第一区| 亚洲乱强伦| 无码AV高清毛片中国一级毛片| 国产精品视频导航| 国产精品亚欧美一区二区| 国产一级在线观看www色| 亚洲综合第一页| 另类专区亚洲| 九九视频在线免费观看| 久久精品中文字幕少妇| 亚洲午夜久久久精品电影院| 99久视频| 欧美伊人色综合久久天天| 免费观看成人久久网免费观看| 婷婷亚洲天堂| 无码 在线 在线| 国产在线观看第二页| 亚洲国产综合自在线另类| 伊人久久大香线蕉成人综合网| 毛片三级在线观看| 在线播放国产一区| 一本久道热中字伊人| 日本午夜精品一本在线观看 | 成年人视频一区二区| 又黄又湿又爽的视频| 免费看的一级毛片| 国产精品福利尤物youwu| 毛片网站在线播放| 日韩欧美91| 亚洲欧美人成人让影院| 亚洲伊人天堂| 国产99热| 免费看黄片一区二区三区| 久久久久久国产精品mv| 国产小视频a在线观看| 亚洲成人动漫在线观看| 国产精品区视频中文字幕| 999国产精品| 中文字幕久久波多野结衣| 久久综合色天堂av| 国产精品不卡片视频免费观看| 国产在线自揄拍揄视频网站| 在线观看精品自拍视频| 看av免费毛片手机播放| 国产福利免费视频| 色网站在线免费观看| 全部免费特黄特色大片视频| 区国产精品搜索视频| 久久综合色视频| 伊人久久大线影院首页| a毛片在线| 亚洲午夜福利精品无码不卡 | 免费国产黄线在线观看| 91年精品国产福利线观看久久|