禤 鮮
(柳州城市職業學院,廣西 柳州 545036)
大數據在物理學、生物學、環境生態學等領域以及軍事、金融、通信等行業早有運用。近年來,大數據技術廣泛滲透于人們生活的方方面面。大數據技術通過對海量數據的挖掘、獲取、篩選、分析,能夠更精準地進行決策。目前,我國的大數據技術走在國際前沿,成為全球大數據應用的先鋒。大數據技術作為決策參考已逐漸應用到商業運行中,全國各大招聘網站在自己內部實現了大數據決策,但大多是以企業視角、基于數據統計的方法分析人才資源,例如分析求職者的數量、求職意向、薪資意向、工作技能等,使用大數據技術分析后得出求職者“畫像”,方便用人單位做人力資源規劃。但從地區人力資源儲備與規劃視角、高校人才培養視角、求職者精準求職視角去分析人力資源信息的做法相對較少,面對各類人才資源網站的數據,政府決策層無法從此類招聘網站中獲得崗位需求分析、崗位技能分析等可以進行人力資源投資規劃和人才培養決策的數據分析結果,求職者也無法從求職招聘網站獲得相關信息,造成巨大的資源浪費。大數據技術在異構數據庫的基礎上,使用聯機分析處理(OLAP)的多維分析方法,分析數據倉庫中的相關數據,能夠獲得相關信息,以輔助決策。
目前,招聘網站都是營利性網站,大多數是為企業和求職者服務的。大數據時代下,企業依托大數據技術,人力資源管理部門可以對企業崗位設置有清晰全面的定位,以及整理出企業發展所需要的崗位信息和人員數目、崗位所具備的能力,以簡化招聘流程。大數據技術在近兩年開始應用到招聘系統中,其建立起的生態模型主要是作為一個交流的平臺,為求職和招聘服務。但即便是應用了大數據技術,也大多僅涉及數據統計技術,用于“用戶畫像”、人才需求多元分析等為企業服務的業務、網站系統生態數據信息的收集、分析也限于企業招聘。而對政府或企業決策層所需的一些人才趨勢報告、人才流動報告、行業崗位人才需求分析、專業領域薪酬分析等分析結果,仍然依靠“領英”“麥可思”等專業的調研公司單獨調研,沒有形成規模以上的招聘網站信息收集、大數據分析一體化智能系統,使用聯機分析處理(OLAP)技術對崗位進行分析并輔助上層機構對人力資源進行決策的軟件也并不多見。
輔助決策系統可以由政府人力資源部門主導,也可以是高校管理部門,比如教育廳招標投標系統建設。系統建成后,組織單位企業在上面發布招聘信息,求職者在互聯網上注冊使用,企業填寫招聘信息時,可以獲得企業崗位需求數據,求職者填寫求職信息時,可獲得求職者信息,通過對供需雙方的大數據分析,可以獲得某時、某區域內某行業領域的供需關系,或者某區域、某崗位技能要求,政府在人力資源政策制定、高校建設、行業資源投入時參考分析結果,能得到較為準確的行業人力資源供需信息。高校在專業建設時,參考區域崗位供求關系、崗位技能要求占比等可影響人才培養方案制訂,快速準確地獲得課程內容、教學要求。綜上所述,研究招聘網站中的聯機分析處理技術(OLAP)和大數據技術有積極作用。
隨著大數據技術的發展,大數據逐漸成為人們獲取對事物和問題更深層次認知的決策資源,特別是人工智能技術與大數據的深度融合,為復雜決策的建模和分析提供了強有力的工具。利用大數據分析能夠總結經驗、發現規律、預測趨勢,這些都可以為輔助決策服務。掌握的數據信息越多,決策才能更加科學、精確、合理。在人力資源儲備、管理上,同樣可以通過崗位大數據的多維分析,提升管理、決策水平,提升社會效益、經濟效益。
目前覆蓋面甚廣的招聘網站不能僅僅是一個用人單位與人才的交流平臺,而應當成為人力資源信息大數據分析的數據來源,以原生招聘網站為主,結合網絡招聘網站進行數據抓捕收集,通過聯機分析技術和大數據技術對信息進行分析和處理,獲得人力資源投資規劃分析數據,輔助政府或高校進行決策。因此,在對招聘網站做系統設計時,不能僅僅考慮用人單位和應聘個人的信息需求,而應當以大數據分析的角度,設計招聘系統及數據倉庫,獲取有助于數據分析的數據,以人力資源市場決策者的視角進一步分析、盤活數據,并將分析結果可視化,根據分析結果,獲得人力資源管理、規劃、培養的決策參考意見。同時,招聘網站與崗位信息數據分析相輔相成,構建可持續的生態系統有利于整合盤活招聘網站數據,充分利用數據分析結果指導人才培養規劃、定制。
崗位信息多維分析輔助決策系統是集招聘功能與崗位信息大數據分析功能為一體的平臺。系統不僅提供給企業和個人招聘和應招的功能,招聘信息還會成為崗位信息大數據分析的數據來源,對招聘網站進行數據抓捕收集,對數據進行分析和處理,獲得人力資源投資規劃分析信息,輔助政府或高校進行決策。因此,在做系統功能設計時,以大數據分析的角度設計招聘系統,除分析求職者的數量、求職意向、薪資意向、工作技能外,還可以進一步分析年齡與薪資關系、工作熟練度與薪資關系、地域與崗位供求關系,同一領域不同崗位內各技能點重合情況、各技能點熟練度、需求分布及職業教育人才培養與市場供需關系等,以多維視角對崗位數據進行分析。以人力資源市場決策者的立場進一步分析、盤活數據,并將分析結果可視化,根據分析結果,獲得人力資源管理、規劃、培養的決策參考意見。同時,招聘網站與崗位信息數據分析相輔相成,構建可持續的生態系統平臺。
基于OLAP技術的崗位信息多維分析輔助決策系統總體設計如圖1所示,系統的數據來源由兩部分構成:第一部分是系統自帶的招聘網站中的用戶信息;第二部分則是較大型的招聘網站數據,此部分可通過企業協議、網絡合法抓捕獲取。此時獲得的數據庫需要建模重組,依據模型進行數據篩選、清洗、轉換,才能進入數據倉庫,成為有效數據。數據倉庫中的數據此時尚不能成為決策參考,需經過OLAP技術處理,建立多維數據模型,然后根據用戶需求,經過鉆取、切片、切塊等技術,轉化為可視化圖表,提供給用戶以輔助決策。

圖1 基于OLAP技術的崗位信息多維分析輔助決策系統總體設計圖
3.2.1 用戶角色
頁面用戶包括招聘企業、應聘個人、決策機構3種角色,面對不同的用戶,系統呈現出不同的功能。面向招聘企業和應聘個人角色時,該系統就是一個招聘系統。不同的是,系統提供更為智能化的功能,通過各種維度的分析使得企業和個人獲得精準信息,能夠影響招聘結果的判斷,提高招聘效率。而對于決策機構來說,該系統主要提供分析后的數據,以備各類人力資源管理、培訓機構作為決策參考。
根據角色需求,設計了不同的功能界面。“應聘個人”角色包括填寫個人信息、求職信息、簡歷編寫、崗位信息收藏、我的消息、虛擬面試官、查看數據分析等。用戶可以在平臺中查看招聘信息、發送求職信息;在“我的消息”中與企業聯系人直接對話,使用多維數據分析入口查看崗位各類信息分析結果,并使用“虛擬面試官”功能進行云面試。“招聘企業”角色設計了簡歷收集、歷史招聘、共享面試官、多維數據分析入口等功能,在平臺中可以填寫企業相關信息、發布招聘崗位信息、與用戶交流并通過數據分析入口查看應聘人員相關歷史資料。“決策機構”角色主要包括政府人力資源管理機構、教育管理機構、各類面向職業的中高等學校。決策機構通過查看各崗位分析,了解人力資源配置情況。
3.2.2 人力資源大數據分析模塊
人力資源大數據分析模塊,主要是對崗位信息、崗位技能、崗位薪酬及相關崗位人力資源的儲備進行多維分析,以可視化的形式展示給客戶。
(1)崗位需求分析。崗位需求分析包括崗位類別分析和崗位數量分析。在該功能中,可以看到崗位的分類和每類崗位不同時間、不同地點的需求數量、薪資情況、技能要求、資歷要求等。多個不同維度的崗位數據分析可以作為企業招聘方案的參考,提高招聘效率,幫助求職者了解區域崗位情況,提高入職成功率。
(2)崗位技能分析。崗位技能分析是針對某崗位所需技能進行多維可視化分析。例如,統計某地區2022年Java軟件開發工程師崗位所要求的技能,95%的崗位提到java語言,80%的崗位提到開源框架Spring和Spring-Boot,70%的崗位提到SQL數據庫,65%企業提到VueJS技術等。系統將這些分析數據用柱狀圖的形式呈現出來,求職者能清晰了解各區域的技能要求,有針對性地選擇區域企業和崗位。如果分析時加上時間維度,對比不同歷史時期某個崗位所需技術的占比,總結出該崗位技術要求的歷史趨勢,有助于決策機構把握人力資源投資方向,也有利于高校制訂人才培養方案。
(3)崗位薪酬分析。崗位薪酬分析包括區域薪酬、領域薪酬、崗位薪酬、資歷薪酬的數據分析。通過不同區域維度、時間維度、崗位類別維度、工作資歷維度的分析,可以看到薪資變化,有助于招聘企業和求職者共同協商,給出符合實際情況的薪酬。相關部門也可通過分析結果對人力資源市場薪酬情況有精準的了解。
(4)人力資源分析。人力資源分析主要是針對求職者信息進行分析,包括區域人才分析、領域人才分析、人才技能分析等功能。通過統計分析,獲得某區域或某領域人才的數量、年齡、技能、資歷數據,分析數據加上時間維度后,還可以獲得人才流動趨勢,這類信息對政府決策機構在人力資源分配、人才引進政策導向、區域高校人才培養專業配置等方面有參考意義。
(5)人力資源儲備分析。人力資源儲備分析針對高校人才培養方案給出參考意見。主要通過求職者所填信息及高校作為決策者注冊用戶后所填信息分析人力資源儲備情況。包括區域高校分析、專業分布分析、人才培養方案分析、就業趨勢分析。人才培養機構通過地點維、時間維數據分析,可以獲得某區域高校分布、專業分布、高校學生就業趨勢等動態數據作為人才儲備、培養政策參考。
3.2.3 崗位信息與其他維度分析匯總模塊
除了針對崗位和人才信息的分析可以獲得決策支持,崗位信息與其他維度分析同樣能夠提供決策參考意見。多維分析能夠使數據獲得最大限度的利用。在崗位信息的基礎上,系統還設計了企業與求職需求數據分析、區域與求職需求數據分析、薪資與人才資歷數據分析、各崗位技能點分布、高校專業設置與崗位需求供需平衡數據分析、崗位勝任能力模型分析、企業(個人)招聘成功率分析等不同維度的分析。這些分析將在崗位招聘、個人求職、人才政策制度、人才培養方面提供決策參考。
大數據多維分析輔助決策系統的核心是數據倉庫及用何種工具算法進行訪問。在崗位多維分析決策支持系統中,數據倉庫用于數據的存儲和組織,它從應用系統中抽取相關數據,同時對數據進綜合、集成、轉換后,提供面向全局的數據視圖;OLAP則可視為數據庫訪問工具,主要負責數據的分析。在本案例中,數據來源有兩個:一是本系統中用戶注冊信息,企業和求職者使用本系統作為求職應聘的平臺。在用戶使用過程中,系統即可獲得各類崗位相關信息。二是通過各類協議和網絡爬蟲,在合法合規的基礎上,獲得其他同類網站的崗位相關數據信息。
由于數據來源不同,形成異構的數據庫系統,而對于決策制定,只需關心宏觀的、全局模式所描述的信息,所以本案例中,數據倉庫可以以崗位信息多維分析系統的數據庫模式作為基本模式,從異構數據庫系統中收集信息,并建立統一的全局模式。同時收集的數據還支持對歷史數據的訪問,用戶通過數據倉庫提供的統一數據接口進行決策支持的查詢。
與關系數據庫相比,多維數據庫增加了一個時間維,它的優勢在于可以提高數據處理速度,加快反應時間,提高查詢效率。OLAP查詢引擎的概念模型可以看作數據倉庫的多維視圖,在多維數據模型中,有一組信息作為分析對象的數字度量方式。在本系統中,崗位分類、崗位數量、崗位技能、資歷要求、區域名稱都可以看成數字度量方式。多維數據把一個度量視為維的多維空間內的一個值,每維由一系列屬性來描述,崗位維可以由4種屬性組成:分類、區域、時間、數量。崗位名稱可通過維的層次關系與分類和區域屬性相關聯。這種數據組織方式消除了大量數據庫表中由于空穴造成的空間浪費,以及在每個元組中存儲的外鍵信息,它由統一的維與數組的對應系數限定數據,大大減少了存儲空間。
聯機分析處理OLAP是一種軟件技術,它使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達到深入理解數據的目的。它具有FASMI(Fast Analysis of Shared Multidimensional Information)特征,即共享多維信息的快速分析的特征。根據上述用戶分析的功能進行應用分割,例如崗位信息分析、崗位技能分析、就業趨勢分析等,每個分析就是一個OLAP應用,所有的OLAP應用實際上是所建立的數據倉庫系統的一部分。
OLAP的基本多維分析操作有鉆取、切片、切塊、旋轉等。鉆取是改變維的層次,變換分析的粒度。它包括向下鉆取(Drill-down)和向上鉆取(Drill-up)/上卷(Roll-up)。Drill-up是在某一維上將低層次的細節數據概括到高層次的匯總數據,或者減少維數;而Drill-down則相反,它從匯總數據深入到細節數據進行觀察或增加新維。圖2是一個崗位信息模型,向下鉆取和上卷的過程。此數據模型由崗位分類維、時間維、地區維構成,數據上卷后,減少了地區維,所看到的僅為江蘇某時間崗位情況。

圖2 使用OLAP對崗位信息數據模型進行鉆取、上卷、切片操作
切片和切塊是在一部分維上選定值后,關心度量數據在剩余維上的分布。如果剩余的維只有2個,則是切片;如果有3個或以上,則是切塊。旋轉是變換維的方向,即在表格中重新安排維的放置。崗位信息數據模型切塊和旋轉操作后如圖3所示,其意義在于更為細致地剖析崗位數據,獲得更多的信息資源。

圖3 使用OLAP技術對崗位信息數據模型進行切塊、旋轉操作
本文對基于OLAP技術的崗位信息多維分析輔助決策系統設計進行了探討。論述了相關系統的現狀,分析了系統角色分類、系統需求,對系統功能進行了詳細設計;探討了數據倉庫建設方法,并對基于OLAP技術的崗位數據分析做了剖析。有利于指導企業建立基于OLAP技術的崗位信息分析系統,以OLAP為基本框架的決策支持系統有助于企業、求職者、政府決策機構、高校從更廣泛、更全面的視角對崗位信息和人力資源數據進行有效、快速的分析,幫助決策者了解情況,掌握有效、精準的決策信息,提高決策水平。