譚保華,任志鵬,趙建平,王鵬
(1.長春理工大學 校友(基金會)工作辦公室,長春 130022;2.長春理工大學 計算機科學技術學院,長春 130022)
校友資源是學校最寶貴的人才資源,近年來,各高校不斷加強和重視校友工作,智能信息系統、微信公眾平臺、APP等現代化的系統相繼應用到校友的管理工作中,有效地提高了校友工作的管理層次,高校對校友資源的管理更加科學化、智能化[1]。
隨著校友信息數據進入大數據時代,如何將大數據分析技術更好地應用到校友信息的管理和維護中,實現智能化、科學化管理,使校友工作更具創新思路和工作方法,將給高校校友工作者一個機遇和挑戰,也將為今后的高校校友工作提供一個有用的參考。
大數據作為時下最火熱的IT行業詞匯,隨之而來的數據倉庫、數據安全、數據分析、數據挖掘等圍繞大數據的商業價值的利用逐漸成為行業人士爭相追捧的利潤焦點。隨著大數據時代的來臨,大數據分析也應運而生。
大數據分析在體育、經濟、教育、文化等多方面領域進行應用,促進了人類社會科技、文明的飛速發展。基于大數據分析技術的高校校友工作同樣具有非常重要的意義。
通過對校友信息的分析,智能提取校友企業產品與重點研究方向,結合學校具體專業,給出科學的合作方案和重點合作研究方向,助推高校與校友企業開展產學研深度合作。從而建立與校友企業的產學研合作長效機制,不斷增強學校培養人才能力,科研能力,為祖國建設可持續性輸送人才。
系統將校友按從事行業、工作地域、興趣愛好等數據信息智能的分析和提取出來,使學校有針對性地與校友進行雙向的溝通交流,使各地校友隨時掌握了解母校發展動態,為母校建設提供各種幫助。使學校能夠及時聯絡并成立相應的地區校友組織,為校友搭建資源共享,合作共贏的平臺。實時動態信息交互聯絡圖如圖1所示。

圖1 實時動態信息交互聯絡圖
根據信息智能提取出相同行業、相同興趣愛好的校友,使同行業及共同興趣愛好的校友們能夠快速有效地實現跨區域精準互聯,從而能夠經常組織起形式多樣的利國益校活動。
根據學校每年的就業數據,將畢業生分地區推薦給當地的校友組織,地區校友組織聯絡人可以準確獲取信息內容,及時與新校友取得聯絡,安排接送站以及迎新服務,不斷充實壯大校友組織。使年輕校友能夠盡早的得到校友組織的關懷和幫助,有利于他們的快速成長。
通過對捐贈校友的信息分析,充分挖掘校友對母校的情感聯系,能夠最大限度地發揮校友對母校的捐款及奉獻,以及帶動校友邀請同學以班級為單位捐款捐物,形成校友與學校可持續共同發展。按組團捐贈統計分析數據圖如圖2和圖3所示。

圖2 按組團捐贈統計分析數據圖

圖3 按捐贈次數分類統計數據圖
設計思想旨在為校友建立一個在大數據技術基礎上的信息整合分析平臺,為校友信息收集、信息管理、信息交流等提供一體化服務[2]。
平臺主要包括校友基本信息、校友行為需求預測、校友行為大數據關聯、校友行為大數據交互等模塊。基本數據模塊示意圖如圖4所示。

圖4 基本數據模塊示意圖
校友的信息從入學時即建立起來,包括招生、學籍、培養、畢業論文及就業等信息智能動態的搜集整理好,最后與就業當地校友會數據進行整合匹配,形成完整的校友信息數據庫。校友在校期間與工作期間的重要活動、經典瞬間及各種獲獎證書等均可分類存儲到校友信息庫中,隨時進行智能的檢索及分析。
通過大數據分析技術,分析校友的專業、從事行業及興趣愛好等,構建出符合校友需求的行為模式方法,預測校友需要從事的工作及活動,將校友企業的人事信息、產品信息及校友活動信息及時推送,為校友開展事業助力[3]。
將各地具有相關行業及興趣愛好的校友信息關聯提取,研究校友行為模式與業績的關聯性,智能提醒和指導校友加入同行業校友商業圈,形成資源共享,合作共贏的良好行為模式。
利用大數據技術融合校友數據,實現校友跨地區跨行業數據互聯,對校友信息共享平臺的數據檢索、更新和數據庫智能分類存儲進行科學管理,完善校友檔案信息嵌入式交互。
智能信息搜索以對象為中心,通過用戶循環搜索完善對象描述模型,從而獲取到關聯對象信息來提高校友信息獲取的全面性與準確性。根據校友登錄系統后產生的數據信息,利用知識圖譜與邏輯推導技術,對已有的校友信息進行相似度匹配,并通過機器學習、容錯檢測及分析量化,將數據庫中的校友信息不斷完善,對重復的校友信息給出合并提示并刪除冗余信息[5]。

圖5 智能搜集結構圖
校友信息智能挖掘技術以基于Web挖掘技術為平臺,為了應對校友數據海量與動態的特點,采用動態數據挖掘技術,將來自動態數據庫與實時數據庫的數據進行采集、預處理、挖掘、結果評估與應用解釋,構建出一個科學完善且長期的數據采集模式[4]。基于web挖掘技術的校友信息資源智能分析模型如圖6所示。

圖6 基于Web挖掘技術的校友信息資源智能分析模型
在數據層中,從動態數據庫與實時數據庫中獲取校友信息的初始化信息;在挖掘層中,對初始化校友信息資源庫中的素材進行Web的內容、結構、應用挖掘;在分析層中,將挖掘的校友信息處理后進行知識化信息描述,以此來識別與聚類;在應用層中,用戶通過軟件平臺來查看校友信息挖掘分析結果。
通過對校友相關信息行為的挖掘與需求分析,將校友的各個特征屬性信息進行聚合,同時進行相關信息的精準推薦。首先利用聚合方法對校友多源信息特征進行主要特征提取,對其主要特征進行深層次、多屬性的挖掘與聚合,將校友信息構建成校友關系網,對特征關聯進行挖掘是聚合的優勢體現,這為校友關系網的構建創造既可橫向拓展又可進行縱向深入分析的有利條件,從而實現校友特征多角度的個性化推薦,完成特定主題的相關信息推送。精準信息推送服務如圖7所示。

圖7 精準信息推送服務
融合多種校友信息數據,建設統一的數據模型,其復雜數據涉及一些數據的清洗與建模,其中對數據進行清洗,能夠保證數據質量,同時根據時間的推移不斷的進行數據更新,以完善其數據實體間的關聯。在信息積累的基礎上利用數據分析技術,建立預測與決策支持平臺,該平臺依據積累的大量校友數據,對校友特征進行數據挖掘,發現關聯信息,從而構建校友關系網,挖掘潛在的價值信息,為校友關系網建設與學校的可持續建設挖掘更富有價值的決策信息。多數據分析技術模型如圖8所示。

圖8 多數據分析模型
隨著數據獲取方式的不斷發展,所能獲得的校友數據信息量也越來越大,所涉及數據的整合、調度也有了更高的要求。通過一種并行化正向最大匹配去冗余過濾處理方法,利用Map對多數據進行掃描將屬性特征暫存,根據數據特征的相似度進行數據關系判斷,將提取的特征進行向量化表示,利用Reduce實現冗余去除操作,從而進行數據處理、整合以及修復,并且使用多連接查詢優化算法,解決多數據的查詢優化問題,進而完善多數據調度問題。數據整合與調度流程圖如圖9所示。

圖9 數據整合與調度流程圖
高校校友資源是學校的寶貴資產,大數據分析技術為校友工作創新提供了科學的支撐,從關聯數據中獲取校友的重要信息,充分挖掘校友的潛在信息,制定科學合理的方案,不斷創新校友工作思路和方法,對促進校友與學校共同可持續發展具有非常重要的意義。