【摘要】本文基于職業院校大數據平臺建設中缺乏共享的校本數據中心、大數據支撐平臺和大數據分析應用等問題,論述加強職業院校大數據平臺建設的對策,包括強化校本數據中心建設和框架設計、加強大數據支撐平臺建設及開展數據分析與預警應用,以現有信息資源為基礎,在數據方面進行有效整合及利用,提供多樣化的數據服務,為教學診改科學決策提供數據支持。
【關鍵詞】職業院校 診改 大數據平臺
【中圖分類號】G64 【文獻標識碼】A
【文章編號】0450-9889(2022)09-0077-04
職業院校在內部質量保證體系診斷與改進工作進程中,不斷加快完善數字化建設管理,各大院?;就瓿稍谛畔⒒A設施、軟件與數字資源、智能化信息平臺方面的建設,建成一批業務平臺和應用系統,基本滿足了學校基礎業務的信息化需求。但在信息化不斷深入發展的過程中,也存在一些突出的問題,主要體現在數據的有效整合及利用上。因所建系統的時間不一、開發方式不合理和技術路線不成熟等原因,不同系統基礎數據和公共數據大多存在標準不夠統一等問題。業務系統各自存儲運行,基礎數據、公共數據缺少同步和共享,不能實現集中關聯、數據融合分析應用,不能滿足對數據進行橫向、縱向多維度靈活分析的要求,不能為學校決策提供足夠的數據參考依據。高職院校應針對這些問題采取相應的措施,加強職業院校大數據平臺建設,為教學診改科學決策提供數據支持。
一、大數據平臺建設的問題
診改的目的是要促進職業院校內部質量保證體系建設更加完善,能夠建立保證人才培養質量的常態化機制。要常態化、實時掌握學校、專業、課程、教師和學生五個層面的發展動態,實現教學、管理、服務等全要素信息化自我診改,就要以校本數據中心為依托,實時、常態化采集校本數據,整合優化學校、專業、課程、教師、學生五個層面涉及多部門、多用戶、多系統的信息資源。目前大數據平臺建設主要存在以下問題。
(一)缺乏共享的校本數據中心
大數據平臺不只是單獨建設某個系統那么簡單,更是一個幾乎覆蓋所有核心業務系統,從底層數據打通,系統綜合集成數據共享應用的大平臺。各業務系統多年來積累了海量數據資源,如教學資源、科研資源和各學科資源等,但這些數據未能共享,不能有效地進行數據信息資源的整合及數據采集、加工、管理與利用的全過程管理。數據得不到有效利用,不能發揮應有的價值,而學校內部質量診改需要數據支撐,需要通過現實數據統計、分析、挖掘、評價,才能更好地為學校診改決策與發展服務。
(二)缺乏大數據支撐平臺
在診改視域下建成大數據平臺等一系列信息化平臺的過程中,對數據方面也提出了迫切需求,數據的治理和應用集成不充分,特別是現有各業務系統部分是業務部門自建的,系統之間數據對接困難。數據標準不統一、源頭數據來自不同部門和不同系統,如何將數據進行有效治理和集成共享,保證數據的一致性和準確性是關鍵。傳統的業務系統很難支持持續增加的數據源、不斷變化的數據分析和展示方式。所以需要建立能夠綜合運用大數據智能整合各類數據資源,集大數據存儲、加工、信息推送為一體的大數據支撐平臺。
(三)缺乏大數據分析應用
雖然各校建設了教務、學工、人事、科研、財務等服務學校教育教學和綜合管理的多個主要業務系統,但是主要的業務重點方向也是更趨于業務工作的信息化管理,匯集的數據不能被充分有效利用,使得數據應用在實際工作中體現不出價值,校園信息化管理和大數據的創新應用開發成效不明顯。學校各業務部門都有將業務數據進行分類統計、匯總、分析并可視化展示的需求,通過自動化呈現、數字化描述的方式,建立出數據模型,并用個性化報表進行展示。如此,才能運用數據分析結果對預測評估和科學決策提供有力支撐。
二、解決問題的對策
(一)以校園信息化為基礎,建設校本數據中心
要實現人人參與、處處覆蓋、時時共享的人才培養工作數據采集與管理,需要以校本數據中心建設為核心,消除信息孤島問題,實現數據資源共享。數據來源于學校信息化基礎平臺系統,各業務部門建設涵蓋教學、管理、學工、科研等各種信息管理系統,這些系統積累了大量的基礎數據,將所有業務系統數據匯聚、集成到數據中心,根據不同工作需要提取數據。在內部質量診斷與改進工作中提供全面、智慧化的數據平臺和信息服務,實現多個部門、多個業務系統協同完成任務的工作場景。
1.建設校本數據中心
基于大數據平臺建設校本數據中心,首先要實現數據統一存儲和統一管理,通過完善數據的采集、加載、存儲等過程,進行數據分析和數據應用,提供數據資源的共享服務。建立不同業務主題的專題數據庫,支撐業務系統應用。形成三個統一:統一入口,用戶通過統一的入口,進入統一的信息門戶,實現單點登錄;統一識別,用戶身份統一識別,提供多種認證方式,如數字證書認證、賬號密碼認證、第三方平臺認證等;統一授權,平臺集中授權,從系統入口控制訪問權限,認證內容實現各業務平臺互通(如圖1)。
建立校本數據中心,要制訂統一的數據標準,建設中心數據庫和共享智能交換平臺,通過數據采集、清洗及轉換,消除信息孤島,為內部質量診改各類應用提供海量數據基礎。通過完成部門業務系統與中心數據庫的對接,充分采集、融合各業務子系統的數據,形成標準數據庫。同時根據需要分類,構建各專題診斷分析庫。
2.進行校本數據分析及數據中心框架設計
(1)基礎數據源。由學校現有數據庫、各大業務管理系統提供原始數據,統一數據標準。將各業務系統數據經過采集、清洗轉換、抽取至大數據平臺,實現海量數據存儲,搭建大數據倉庫。
(2)校本數據倉庫。統一數據標準,把校內各業務系統數據集成,抽取可以共享的數據進行統一存儲和管理,以保證數據交換過程的穩定與安全,提升數據集成過程的管理能力。
(3)數據類型。支持結構化數據如MySQL、SQL Server等關系型數據庫表示和存儲、獲取信息;非結構化、半結構化數據,如文檔、文本、圖片、圖像和音視頻、HTML、各類報表等。
(4)數據接入與共享。由于校內接入數據繁多,也存在不同類型的數據,需要有效處理各種數據庫,通過可配置的原則,對海量的數據進行實時接入??梢酝交虍惒椒绞竭M行數據之間的交換,實現各應用系統的數據在交換和共享時能夠保持一致性和準確性。
(5)數據的應用。統一信息門戶,面向校內各級領導、管理人員、教師和學生等不同角色,分角色進行權限管理和提供各項信息資源服務,并形成常態化的質量監控管理機制(如圖2)。
(二)以數據治理為基礎,建設大數據支撐平臺
對原有信息系統的基礎數據進行梳理,加強數據治理,保障業務部門提供的源頭數據的質量。建設大數據支撐平臺,消除“信息孤島”,整合挖掘校內各大業務系統(教學、政務、人事、財務、科研等)的數據,有效集成、存儲、處理、共享各類校園大數據,平臺實現數據獲取能力最強、數據處理能力最快、數據服務能力最精準,為學校人才培養、科學研究和管理決策提供數據支撐。完成對學校數據資產的統一清理和管理,通過對底層數據采集、存儲和管理,實現對外可提供統一的可視化數據分析和展示應用。構建以下六個中心。
數據采集中心:通過業務系統的數據同步、日志同步等手段匯集全量數據,收集各類數據到大數據平臺,規范數據格式,構建統一的數據標準要求,保證數據的生命周期完整性。
數據治理中心:通過治理工具、治理報告、治理規則和標準化等手段,對數據進行格式轉換、缺失值及內容、邏輯錯誤、非需求錯誤清洗和整治,進行垃圾過濾,實現標準化和統一化,解決學校數據經常出現的數據不一致、不準確和重復等問題。
存儲檢索中心:通過HDFS、HIVE、全量數據備份、建模分析和索引檢索等技術手段,完善數據的存儲和檢索等功能。
實時計算中心:針對數據的實時采集、實時統計、實時查詢展示等要求,進行技術方案的擬定與實現。
挖掘算法中心:通過教育信息化的典型應用模型、通用基礎模型、基礎算法庫,以及DV建模、星型模型和雪花模型等建模方法和分類、聚類、預測等相關技術手段,達到對現有數據的挖掘和分析。
統一數據服務中心:將前期經過收集整理、加工整合和挖掘分析的高價值數據,經過統一的API接口,嚴格按照使用權限和內容提供給各個業務系統使用和展示。共享數據資源,可為學校各部門、師生提供個性化的數據服務。
(三)以數據應用為基礎,進行數據分析與預警應用
大數據平臺建設主要實現數據共享和應用,通過對各類業務基礎數據進行深度挖掘,進行數據分析和實現數據的有效利用。在診改中,按分類指標快速統計、匯總不同角色和不同業務的需求,對學校管理工作進行多維度數據融合分析。最終數據以智能化、直觀化的各種動態圖表的方式展示給數據用戶,通過信息化平臺數據被深度挖掘,有效利用,可視化展現,為學校管理者科學決策提供大數據支撐,發揮重要作用,同時提升信息化服務水平。
1.建設大數據分析應用中心
數據分析應用主要是通過數據動態呈現感受和體驗大數據應用,通過數據分析結果展現出數據應用,為學校管理決策提供基礎支撐作用,為各業務部門提供數據應用服務,優化學校師生管理工作。大數據方面:數據分析層面包括招生專題分析、就業專題分析、教工專題分析、學生專題分析、特殊人群分析預警、生源質量分析、就業情況分析、貧困生分析、學習成績因素分析、圖書館借閱分析、輿情專題分析等功能。
(1)學校校情。如學校師生比,按專業、學生人數排序,學校教師年齡分布,各級師資占比,各部門教職工數統計,各科研項目和論文等成果統計排序,學校資產、經費分類統計等。
(2)學校招生。如招生生源分布,分析近年新生生源分布情況;新生類別、政治面貌類別信息,分析不同學院新生的類別占比情況;招生概況分析,展示學院近年招生概況;招生專業錄取情況分析,展示當前年份的錄取專業情況,包括各個批次各個專業錄取的具體人數,錄取分數,最高分、最低分等情況;院校招生情況分析,展示當前年份的報到情況,包括在各個批次各個專業上的具體人數,錄取分數,最高分、最低分等情況;學校近年招生男女比例的變化。
(3)科學研究。學??蒲许椖繑盗俊⒖蒲薪涃M統計和管理,在各類期刊發表的論文數量統計,各系部獲得專利數量統計等。
(4)人才培養。學校的學科專業數量、師生比、重點專業等人才培養重要指標統計,國際交流情況統計,學生競賽、活動等獲獎情況統計,全校精品課程資源統計等。
(5)師資隊伍。學校重要人才引進,教師年齡、職務級別分布,教師學習經歷、晉升、海外經歷情況統計,師資來源類型分布等。
2.進行大數據分析及智慧應用
(1)智能畫像。一是刻畫學生畫像,通過心理健康、經濟情況、就業、學生發展指標,建立學生畫像。心理健康方面,全維度分析學生發展特性,深層次挖掘潛在的成長困惑影響因素;經濟方面,完整匯集學生家庭信息、學費繳納、貧困認定信息,實現精準認定、精準資助;就業方面,全面分析學生學業成長階段記錄,根據個體成長發展軌跡提供綜合就業傾向建議,根據專業特點提供畢業前就業指導;學生發展方面,綜合分析學生成長過程中學業成績數據、第二課堂數據、社會實踐鍛煉、實習實訓數據,根據學生不同成長階段特點為學生提供綜合服務,促進學生全面發展。二是刻畫教師畫像,通過績效考評、教師發展、人才引進、科研成果指標,建立教師畫像。全面量化教師工作,科學評估教師績效,分析教師成長和個性引導發展方向,培養優質人才資源,領航科研發展方向。
(2)精準資助。整合學生在校數據,深入解析學生經濟水平,客觀評價學生的貧困程度,結合貧困生認定資助工作,形成校內量化困難等級,精準挖掘困難學生,識別虛假貧困,發現隱形貧困學生并進行幫扶,代替部分學生“比慘”的方式,尊重學生隱私,讓資助更人性化。
(3)危機干預。分析學生在校行為,結合心理咨詢、心理測試結果,判斷學生是否存在潛在的心理危機,及時給予心理疏導和干預,幫助學生盡早化解心理問題。
(4)失聯告警。通過實時監測學生在校數據,了解學生請銷假情況,幫助輔導員高效開展假期管理工作,關注失聯高頻學生狀態。并可實現畢業去向預測,通過對比往屆畢業生的畢業去向,能夠預測應屆畢業生就業方向,教師可以提前幫助有就業困難的學生做好就業準備。
職業院校大數據平臺建設主要致力于解決數據的問題,進行數據的匯集、治理、分析、發布和應用,最終打通數據壁壘,實現數據信息共享,進一步進行數據分析,并圍繞數據生命周期需求打造數據服務平臺,實現流程便捷化、過程透明化、記錄可視化的智慧應用效果,通過挖掘數據價值,洞悉發展趨勢,實現預測、預警等智慧管理。
參考文獻
[1]黃志成,莫丹.基于大數據分析的課堂教學診改研究[J].江蘇科技信息,2021,38(27).
[2]蔣黎妮,唐洋.基于大數據的高職院校教學診改工作信息化研究:以重慶電力高等??茖W校為例[J].重慶電力高等專科學校學報,2021,26(4).
[3]蔣紅軍.診改理念下校本數據分析及診斷的大數據平臺建設研究[J].廣西教育,2020(7).
[4]李文強.基于Hadoop的電子商務大數據分析綜合實訓平臺建設[J].現代工業經濟和信息化,2018(11).
[5]孫唯特.高校智慧校園建設中的數據平臺設計[J].信息通信,2019(1).
[6]薛峰.高校大數據平臺的構建與應用[J].信息與電腦(理論版),2019(24).
[7]王立友.高校智慧校園大數據平臺的設計與實現[J].河北民族師范學院學報,2020(2).
注:本文系自然科學研究與技術開發推廣項目-廣西高??蒲许椖俊啊\改’視角下,基于大數據平臺的校本數據中心建設研究”(YKJ1912)的研究成果。
作者簡介:馬朝霞(1986— ),講師,現就職于廣西農業職業技術大學圖書與信息中心,主要研究方向為計算機信息管理。
(責編 秦越霞)