薛云霞 ,陳宓宓 ,韓 茜
(1.江蘇科技大學 信息化建設與管理中心,江蘇 鎮江 212003;2.江蘇科技大學 經濟管理學院,江蘇 鎮江 212003)
高校的發展關鍵在于人才隊伍建設和優化,而如何利用信息化為高校人才隊伍的建設和管理服務是目前非常值得關注的課題。大多數高校內部業務系統積累了人才的大量數據,但這些數據呈現出碎片化和零散性的特征,這些碎片化的數據只能直接或間接反映人才的某一或某些屬性。只有將這些數據進行有效整合,才能完美地抽象出一個人才的信息全貌。目前有些學者對大數據下人才的服務和管理進行了研究,比如李曉東[1]分析研究了大數據對高校人才評價、人才引進和人才培養等人才隊伍建設課題的積極作用,并對人才管理的政策方面提出了建議。李藝全[2]闡述了大數據時代下高校人才管理面臨的機遇和挑戰,并在人才引進、人才服務、人才培訓和人才評價等方面提出了建設性意見。石緯林[3]等介紹了目前高校師資管理遇到的問題和挑戰,并在大數據框架下提出了幾個高校師資管理的應用方面。方丹丹[4]基于大數據構建了高校教師職業生涯發展框架,為高校留住人才、發展人才、評價人才提供了參考思路。
但是目前鮮有基于大數據框架下的高校人才服務平臺架構研究,本文將通過整合這些業務系統的人才數據和互聯網數據,消除高校各個職能部門“人才數據孤島”,并且對這些數據進行深度挖掘和統計分析,尋找其中有價值的關系和規律,構建人才服務平臺,通過平臺實現高校人才挖掘、人才推送、人才評價、人才管理和人才服務,提高各個職能部門管理效率,給人才的學術研究和課程教學提供人性化的服務。
前期各個學校積累的數據既有人事系統、科研系統、教務系統、圖書借閱系統[5]、一卡通消費系統、一卡通門禁系統和人才個人主頁管理型業務產生的結構化數據,又有視頻、音頻、圖像等教學資源非結構化數據;另外還有CNKI、IEEE收錄的論文數據和科研論壇數據等。本文基于大數據構建高校人才服務平臺,通過應用支撐層的工具將這些系統進行集成,解決“數據孤島”,實現應用集成和人才信息的深度互聯。同時通過人才數據和互聯網數據進行重構和集成[6],對高校領導者和各職能部門提供人才挖掘、人才推送、人才評價、人才管理和人才服務的功能。因此高校人才服務平臺的總體架構從下到上由網絡基礎設施層、數據中心層、應用支撐層、應用層和用戶層組成,如圖1所示。

圖1 高校人才服務平臺總體架構
(1)網絡基礎設施層
由大學機房虛擬平臺提供系統運行所需要的基礎設施,包括應用系統運行基礎支撐環境,包含主機、存儲、網絡、系統軟件,以及考慮到平臺的訪問量可能很大,單個服務器節點可能無法滿足要求,因此要使用負載均衡[7]等。
(2)數據中心層
數據中心層是以云存儲為核心,為獲取的龐大數據提供存儲環境,構建大數據。由于獲取到的數據涉及到人才數據的方方面面,因此要構建多類型、多維度的數據庫。數據中心層不僅包括為應用系統層提供數據來源,還包括數據治理和結構化數據、非結構化數據存儲的數據庫。對于本文系統的文件,選擇Hadoop分布式文件系統(HDFS)[8]進行存儲。
(3)應用支撐層
應用支撐層是數據中心層和應用層的橋接層,主要包括企業服務總線ESB、推薦算法、挖掘算法、BI工具、模型工具、自定義表單等等。應用支撐層一方面應用了先進的數據庫技術,另一方面封裝了應用軟件系統各子系統都會用到的通用組件。
(4)應用層
應用層主要為用戶提供各種應用,比如人才挖掘、人才推送、人才信息瀏覽、人才評價、人才個性化推薦和綜合分析,同時應用層還包括為其他異構異地系統定制開發服務接口。將接口封裝在本層,使得數據不直接被暴露給用戶,一定程度上提高安全性。
(5)用戶層
用戶層主要負責直接跟用戶進行交互,一般是指用戶通過賬戶登錄到系統看到的系統界面,用于數據錄入、數據展示等。為了便于應用軟件系統的使用,為用戶提供風格一致、操作方式統一的操作界面。平臺用戶包括人才、高校管理者、高校各職能部門、平臺維護人員和平臺操作人員。
標準規范體系、運行管理體系和安全保障體系為高校人才服務平臺的各個層面提供可靠的保障;運行管理體系負責各個層次中系統的運行管理工作,是保障高校人才服務平臺安全正常運行必不可少的運行保障體系;信息安全體系以具體應用與實際效果為主導,以安全管理與安全技術為手段,建立綜合防范機制,保障信息平臺安全、高效、可靠的運行[9],保障高校人才服務平臺總體架構五個層次的整體安全。
高校人才服務平臺為不同用戶提供人才挖掘、人才推送、人才評價等服務,為高校人才提供人才信息瀏覽、個性化推薦服務,以及為高校職能部門和高校校級決策者提供多維度的統計分析功能。
運用網絡爬蟲工具從互聯網上自動抓取知網空間以及IEEE收錄的論文數據,作為挖掘分析進而“發現人才”的基礎數據。設計網頁解析模塊從抓取的網頁中提取數據,數據預處理模塊用于統一數據格式,過濾無效數據,為進一步分析打好基礎,運用數據并行挖掘算法實現人才數據的挖掘。
通過人才挖掘的結果,用戶提前設計好推送的條件,根據用戶查詢的話題找出相關領域的權威專家。系統自動從文獻庫中發現作者的論文信息,并從論文信息中抽取出文章標題、摘要、作者單位、文章分類號等信息。通過構建包括作者發表的論文、論文發表的期刊、作者的合作者以及作者社交關系等信息在內的異構信息網,綜合考慮論文標題、發表期刊、分類號等信息,科學設計權重算法,給用戶返回所關心領域的作者列表。
由于高校教師人數比較多,因此每年的人才評價工作對于高校人事部門和各個學院來說工作繁瑣、任務繁重。本文設計的人才評價系統融合了高校人事、科研和教學信息,高校人事部門人員只需要定義評價指標和評價權重,全面通過集成教學量、科研成果以及師德評分等結構化數據和情感以及以往的行為記錄等非結構化數據,在進行人才績效評價時,根據人才的ID,系統可以從標簽數據庫中直接抽取評價指標數據,輸入評價指標的權重,人事管理人員只要一點擊,就能得到全校人才的綜合得分和排名,可以實現對全校人才的綜合評價,從而節約人事等職能部門和學院行政人員的工作時間。
以往人才的個人信息都存儲在不同的系統中,即使通過統一身份認證和系統集成,用戶仍需要點擊每個系統查看自己的信息。通過本平臺數據的集成和融合,可以以列表的形式全面展示人才的各類信息。如人才職稱、學歷等基本信息,學習和工作經歷,教學課程數據,科研成果和專利數據,項目情況信息、資產數據,工資數據、一卡通消費數據等等。人才登錄到服務門戶中,可以隨時查看自己的完整信息以及數據,無需跨系統操作。
(1)圖書推薦
對讀者和資源按照讀者和資源的基礎屬性對它們進行分類和聚類分析,分析讀者和資源的匹配,便于給讀者推薦書籍。其中根據讀者的性別、年齡、出生年、籍貫、民族、教育程度等基本屬性形成讀者畫像[10],并按照基本屬性進行聚類,資源則是根據學科、專業、媒體類型、資源庫、資源類型、出版社和資源標簽等形成資源畫像,并按照資源的基本屬性進行聚類,然后根據相關行為特征使用關聯分析找出讀者與資源互聯的規律,給讀者推薦圖書。
(2)科研圈推薦
通過提取研究人員科研方向、以往完成的項目信息、發表論文、申請專利的關鍵字,分析不同學科的相似研究主題,發掘交叉學科的研究方向,建立不同學科、不同學院之間研究相似主題的教師的學術交流圈子,通過建立科研圈,向科研人員提供科研圈和交叉方向科研人員的推薦,幫助學校的研究人員碰撞出更多的研究方向和研究成果。
(3)研究熱點推薦
研究熱點發現需要綜合考慮兩個方面的因素,以年度數據為分析周期,根據分類號統計出各研究領域發表文章數量的變化趨勢,同時提取所有文章標題的關鍵字,統計各關鍵字的詞頻,根據詞頻與研究領域對應文章數量綜合評定研究熱點,人才可以根據自身的研究方向選擇分類號,系統根據研究分類號給用戶自動推送研究熱點,幫助用戶了解研究的前沿方向。
(1)相關性分析
通過教職工職稱與科研成果、教職工年齡與科研成果、教職工來校年份與科研成果、教職工引入人才方式與科研成果、教職工教學任務量與科研產出和科研投入與科研產出[11]等變量的相關性分析等發掘影響科研產出的因素。通過發掘影響高校科研成果的因素,為提高科研產出提供精準的決策依據。
(2)趨勢分析
通過分析以往年份學校總體科研情況、不同學科、不同學院成果情況,預測未來幾年學校、不同學科、不同學院的科研產出情況等。
(3)基本信息統計分析
本文對教職工基本信息進行多維度的統計分析,為校級領導、學院領導以及各職能部門提供決策依據,基本信息的統計分析主要包括以下幾個部分:①分析不同學院、不同學科的教職工職稱、教職工年齡、性別等基本情況信息,整體掌握學院、學科的人員質量和數量,便于及時補充人才,提高人才隊伍。②按照年度統計分析不同學院、不同學科人員招聘、離職的人數、職稱、性別等基本情況信息,便于預測下年度不同學院、不同學科的人員招聘情況。③利用大數據可以嘗試分析不同屬性教師的教學質量,從而為學校教師招聘決策服務。
通過在大數據環境下構建高校人才服務平臺,集成人才各個維度的數據,可以大大提高工作效率和管理效益,主要體現在以下幾個方面:
平臺提供了各個維度以及跨維度的統計分析功能以及人才評價功能,各職能部門不需要像以往一樣用傳統的分析工具以及通過統計軟件進行統計分析,只需要按照自己的需要在平臺上設置條件,系統自動出現統計結果以及評價結果,節約了辦公時間,提高了辦公效率。另外平臺提供了人才實時信息瀏覽功能,不需要像以往一樣登錄到各個系統查閱信息,可以直接登錄到平臺進行信息查閱,另外平臺提供了搜索功能,可通過關鍵字、日期等條件搜索出自身想要的數據。
通過高校人才服務平臺的實施,大量的人才數據集成在平臺數據庫上,數據能夠充分進行共享,打破了系統之間的信息壁壘,消除了“數據孤島”,并且通過提供人才管理和人才服務等功能,可以充分利用高校和互聯網上人才的數據,幫助高校挖掘人才、留住人才以及更好地服務人才。
該平臺集成了人才各個維度的數據,校級領導、學院領導及各職能部門只需要登錄平臺,就可以查閱人才各個維度的數據,而不像以往一樣需要登錄各個系統查閱數據,提高了管理效率。平臺提供了各個維度以及跨維度的數據統計功能,領導做決策時,只需要登錄到平臺查看統計結果,而不需要像以往一樣在各個部門搜集數據進行統計分析,省去了繁瑣的環節,提高了管理效率。另外系統是直接從業務系統抽取和運用爬蟲技術從互聯網上得到的一手數據,更加準確和實時,提高了決策依據的精確性。
本文在大數據環境中高校人才服務平臺架構下分析了各個模塊的功能,規劃了平臺的總體架構。采用網絡爬蟲技術獲取人才互聯網上的數據,運用大數據技術融合互聯網上和高校業務系統的人才數據,集成人才的論文、基本信息、圖書館借閱信息、一卡通消費信息和科研論壇上的信息,不僅有效地解決了高校各職能部門的“人才數據孤島”問題,降低信息化建設成本,而且實現了信息的集成和應用,可以提高決策和管理的效率。