文/金健宇 韓霖 方丹丹
大數據讓就業有跡可循
文/金健宇 韓霖 方丹丹

本文就美國大學學生就業模型作了分析,提出了我國高校就業服務生態模型,通過學生在校期間產生的數據,形成學生數據生態閉環,輔助學生進行職業生涯規劃,提高學生整體就業質量。綜合利用大數據技術和數據挖掘技術,搭建高校學生就業大數據框架體系,對學生數據進行分析,提高就業服務質量,輔助管理機構的決策。
美國是世界上最早開展職業指導服務的國家,美國高校的大學生的就業服務機制在提高大學生成功就業和減少人為失業等方面取得了不少的成功經驗,從美國高校大學生就業服務可以一窺其對促進就業的各種努力。主要包括以下方面:
1.“以學生為本”的就業服務
以學生為本是就業服務的教育價值觀、教育發展和教育人才的根本性的理論基礎。就業服務指導部門作為大學生就業和聯系社會的一個平臺,不僅要提供就業服務,還要通過完善的職業生涯指導服務幫助高校的學生認識自己和社會,做好職業生涯規劃,在此理念之下,充分發揮學生的主動性、積極性、創造性。
2.擴展學生就業服務的范圍
美國高校的就業指導服務是與學生的四年學生規劃相關的:(1)第一年幫助大學生了解市場和專業的特性;(2)第二年在有一定的價值觀認識的基礎上,不斷挖掘學生的興趣愛好、潛力和特長;(3)第三年幫助學生深入了解學生的專業市場需求,提供實習機會;(4)第四年強化技能訓練,提高市場競爭力,提供就業服務信息。
3.就業服務多樣式
就業服務是集服務、管理、教學和研究四維一體的多元化的活動方式,目前國內高校重管理和服務,在教學和研究方面投入較少,很多高校的學生在大一到大三基本沒有就業的投入,缺少對大學生技能的培養、潛力的挖掘、職業生涯規劃、心理健康服務等全方面的了解和培養學生。而美國高校在此也有一定的經驗,通過一些工具和計算機針對學生進行測試和培養。
4.專業性的就業指導隊伍建設
美國高校針對學生就業方面成立了專業的就業管理服務部門,按照與學生1∶200的配比進行人才隊伍建設,而且人才隊伍按照不同崗位招聘專業性的博士或者碩士,這就提供了研究性人才隊伍的基本保障,實現實踐與研究相結合,提供專業、專家型的指導服務。

圖1 就業服務生態模型
5.就業導向的信息化服務
美國高校除了基本的就業信息推送和管理之外,主要注重人才的培養,尤其是交叉學科人才的培養。美國把高等教育作為為經濟建設服務的三大目標之一。優勢主要體現在交叉學科滿足社會的需要,同時能帶動學校傳統的專業,最終受益的學生本身在社會的激烈競爭中能脫穎而出。
以上可以看出國外高校在就業服務方面取得了一定的成績,而我國高校就業服務的理念、過程、方式、隊伍建設等方面和國外還存在一定的差距。然而“互聯網+”概念給了高校提高就業服務質量的一個契機,傳統的管理模式已經不能滿足高校的需求,大數據時代的到來,已經引起了社會以及高校的重視,對高校的改革起到了一定的帶動作用,改變著以往人們對業務的認識。
因此在此基礎之上,結合高校現有的業務,根據“數據來源于學生,服務于學生”的理念,建立學生就業服務生態模型,如圖1,此模型主要圍繞學生來校之后在大學期間產生的個人行為數據不斷地積累,借助高校信息中心的大數據平臺技術,對高校積累的數據進行采集、清洗、轉換,建立就業數據倉庫,通過數據挖掘技術提供全面、客觀、科學的分析,提高就業管理部門科學管理與學生的職業生涯規劃能力。
就業大數據框架體系是建立在學校的大數據框架的基礎之上,有著共同的數據來源、數據平臺,就業大數據分析應用是大數據框架的一個基礎應用。大數據框架體系主要包括三個層面:數據來源層、數據平臺層、數據應用層,同時在數據平臺層要進行運維管理、數據安全管控。如圖2所示。
數據來源層是數據應用的基礎,包括了結構化與非結構化數據、學生在校數據與網絡數據、學生第一課堂數據與二三課堂的數據,是一個多角度多層次的來源,因此數據具有種類繁多、價值高、數量大、要求處理速度高等特點,符合大數據的顯著特征。
數據處理主要是對學生的數據進行大數據處理,包括語境搜索、數據倉庫、Hadoop系統。語境搜索指對信息進行索引與聯邦搜索,在上一步信息整合的基礎上進一步實現上下文協作洞察。數據倉庫是檔案數據按照預定規則進行存儲,進行先進的數據庫分析。Hadoop系統是一個分布式基礎架構,實現一個分布式文件系統,適合超大數據集即大數據,可以經濟高效的方式分析PB級的結構化與非結構化信息。可視化顯示利用最佳的可視化組合,收集、提取并探索大數據的處理結果。數據分析包括BI報告、預測分析、內容分析、輔助決策分析等。在企事業單位,預測、BI、輔助決策更為有幫助。

圖2 就業大數據框架體系
就業數據源
學生的基本數據來源大致分為兩方面:
1.學生在校數據,主要包括學生的第一課堂學習、二三課堂學習、參加社會實踐、消費軌跡、學習軌跡等數據,這些數據是目前高校要攻克的難點,大多數高校都在“十二五”期間完成了高校數據中心的建設,但從實際情況來看,高校的數據質量參差不齊,也就無法做到真正科學的、全面的學生素質評價,因此,高校的數據質量是一個不可逾越的鴻溝,是所有數據應用的基礎,因此在校學生數據就需要高校信息化部門從整體考慮,進行頂層設計,積極地協調各個部門與業務疏通,打破傳統的業務習慣牢籠,建立新的信息化秩序。
2.學生網絡數據,此類數據主要包括學生的上網行為數據、上網學習行為軌跡、網絡資源等數據,網絡數據目前高校的學生比較敏感,信息化部門應該做足充分準備和溝通,循序漸進地推動學生網絡數據應用,要對學生的數據進行篩選,抽取有效信息,去除臟數據,這樣既保證學生的隱私問題,使學生不會對此類數據敏感,又保證學校的信息化順利進行。
數據平臺層
數據平臺層是對數據整合和治理的過程,從松散的、異構的、孤島的數據到標準化、有機聯系的、科學的數據,主要包括對數據進行抽取、清洗,數據共享和轉換,數據標準化、結構化的處理等操作,最終把數據存入相應的數據倉庫,為不同的數據分析提供不同的角度。
總之,信息技術手段提供了高校實現針對大學生就業質量和就業率這一指標,反過來分析其在學校的行為軌跡,把學生個人因素與學校的客觀因素區分開來,更加透徹地挖掘深層次的影響,才能深入了解到影響學生就業的因素是哪些指標,影響的權重,對于決策者可以針對這些指標和因素進行調整高校的決策,從而提高學校的競爭力。
(作者單位為對外經濟貿易大學)