寇 贇 徐 建 嚴軍峰
(1.陜西機電職業技術學院科研信息處,陜西 寶雞 721001;2.陜西機電職業技術學院電子與信息學院,陜西 寶雞 721001)
智慧校園的建設使得高校產生了大量的數據,在智慧校園建設的中后期,為了能實現數據的有效挖掘,對管理層、師生做好服務工作,需進一步推進數據治理,建立數據管理機制、標準體系。對各應用系統產生的業務數據匯聚共享。進入“十四五”階段,智慧校園的建設需要進一步升級,從數據的有效性、應用方面、依靠人工智能技術等不同角度與智慧化、智能化應用融合進行探索,不斷拓展學校各項工作的覆蓋面和融合度。而在智慧校園持續推進的過程中,數據是智慧校園建設成果中的“黃金”產物,數據是產生智慧的源泉——無數據、不智慧[1]。因此,為進一步突出智慧校園建設的效果,本文從智慧校園數據治理面臨的瓶頸與對策進行探討分析。
各高校在信息化建設的基礎上,隨著系統的更深一步使用,為了更好地服務師生,進一步開展智慧校園建設,各業務平臺如人事、學工、教務等業務平臺積累了大量有關學生信息、學習活動軌跡信息、教師信息等方面的數據,如果對該數據不能有效地進行挖掘、探索,則不能達到智慧校園建設的目的,不能為管理層提供決策機制,不能為師生做好服務工作。2020年年初,新冠肺炎疫情席卷而來,改變了高校傳統的線下教學模式,開始轉向學生在線聽課情況、在線課堂等,這也是當下越來越多的學校正在嘗試開展數據治理的原因之一。如西北工業大學從頂層設計、數據治理環境、數據管理體系和數據價值體系四個方面先行,利用構建、運行、監控、評價等方法逐步展開數據治理工作[2]。上海海事大學以實現數據完整采集歸集、建設學校數據“湖”、實現公共數據按需共享、加快提高數據服務能力為目標提出數據治理[3]。中國人民大學利用數據共享中心的建設,整合多年信息化發展形成的數據,重組現有數據標準,構建學校共享數據庫[4]。華西醫院通過平臺實現高質量、高可用性數據,結合數據挖掘方法和共享技術,實現醫療數據資源的高效利用[5]。范德比爾特大學采取了一系列的數據治理策略,充分利用了數據的價值,為學校在教學、管理、科研、服務、醫療等方面提供了科學決策依據[6]。以上各高校數據治理實踐表明,高校智慧校園經過建設后,要進一步加強數據治理建設,將數據變成互聯互通狀態顯得十分重要。
智慧校園建設過程中的數據治理工作是一項非常有意義的數據資產挖掘工作。要真正實現數據治理的目的,需要各業務系統相關部門,如學生處、教務處、人事處等業務部門管理者提出需求,提出相關部門在處理工作中想利用數據解決的問題,對數據的標準建立、數據的質量等相關過程積極參與進來。而不是把自己作為消費數據的人員,只依賴于技術團隊提供的可直觀操作的界面工具。同時需各級管理者積極參加相關培訓,培養數據分析思維。
首先,智慧校園在建設的過程當中,在各業務部門建立了對應的業務系統,容易出現在不同的業務系統獲取到的數據不一致的情況,如學校在校生人數,在招生系統里可以查詢到報考本校的所有學生,在教務系統里查詢到的是在籍學生人數,兩個系統產生的數據因有部分學生退學等相關原因,導致數據不一致;其次,在工作展開收集相關數據時,因更新不及時會存在獲取到的數據不可靠的問題,影響數據的決策性。因此,獲取到的數據來源要有源可查、要及時更新。
學校在進行數據治理的時候,會遇到各業務部門之間共享數據的問題。一方面,有些業務部門對于分享數據有抵觸心理,認為本部門有擁有這些數據的特權,沒有達成“數據共享是必須,不共享是例外”的共識,或擔心數據的安全問題;另一方面,部分業務部門進行數據共享時,業務信息系統之間進行數據互通可能會存在技術障礙。如學校的某些業務系統是定制或者采購,在學校資金充足的條件下,則會要求供應商提供數據開放或數據導出接口服務,但學校要花費大量的時間與供應商對接需求。當然,也會存在部分學校在數據治理工作上投入的資金有限,則數據治理就會相對比較落后。如果部分系統有數據導出功能,可以定期導入到數據分析工具中。因此,數據需要在整個學校各業務部門互通,不應該以豎井的形式進行,也不應該被視為某業務部門的獨有特權。
數據治理是集中人、過程和信息技術的數據管理過程或方法,要確保高校各業務部門數據資產得到合理的使用。同時其也是技術與制度相結合的一套持續改善管理機制。
數據治理的技術路線如圖1所示:數據治理技術層面首先要對對應的數據標準進行數據采集,協同各業務部門,圍繞核心業務工作,找出哪些數據是關鍵數據,或者說關鍵指標。關鍵數據、指標要切中要點,能夠對學校辦學提供重要支撐,比如學科建設和專業建設。其次要對采集的數據進行梳理與質量初檢,可通過實現數據源頭實時采集,做到準確可靠,并針對目前人工智能背景下的神經網絡、網絡爬蟲等智能挖掘技術在數據采集方面的應用特點與差異,制定校本化的數據采集質量標準,強化教育數據采集的規范性。再次要進行數據清洗與整合交換,建立共享數據中心,可依托主數據管理平臺,融合教務、人事、學工、圖書、一卡通、財務、網上教學等應用。最后要進行數據管理與質量評估、可用服務接口設計,對數據價值模型建立及展示,進行多維度數據分析和呈現,對師生日常行為進行畫像,從而在數據中發掘應用價值。
建立數據治理體系是數據治理工作的基礎,為了有序實施數據治理,應采用規劃先行的原則,制定適合各校業務特點的管理流程。相比較數據治理技術路線,結合建設智慧校園的實踐經驗,更應該從以下制度層面展開數據治理。
3.2.1 提升數據統一管理意識
為了提升學校數據治理能力,需要管理層認識到數據是流通的、共享的、有價值的,要將各業務系統產生的數據進行物理或邏輯的集中存儲、整理、分類、分級和發布,并提供相應的授權訪問,從而發揮數據的最大效用。
數據中心的建設首先要完成數據整合和內容整合工作,提供數據集成和管理、個性化數據服務、針對互聯網和內部網的數據搜索功能等。各業務部門依據業務職責提出各種內部數據需求,并分別按本部門形成和管理的數據、需要其他部門提供的數據分別匯總,確定數據內容、數據同步周期和數據提供方式等。同時數據中心對各種數據進行歸類,對各部門需要其他部門提供的數據歸納為部門間共享數據。對于跨業務系統的數據共享應根據需求,協調共享數據資源,其他業務部門有義務實時提供本部門業務系統所產生的權威數據到學校數據中心。
3.2.2 制定數據治理相關制度和規范建設
為充分利用數據為教學、科研、管理和決策服務,規范各信息系統數據管理,保證各類數據完整合理、有序流動,以及數據安全,規范數據治理相關制度顯得非常重要。各業務系統可結合本部門實際情況,制定數據維護與管理規范,明確數據維護的權限和職責,制定數據維護的規程。對數據新增、刪除和修改應記錄審計日志,同時提供方便簡捷的日志查詢功能。同時各業務系統部門應建立各自完整的數據存儲和安全策略,從而保障數據資源的安全可靠性。如有新系統上新,則在系統投入使用之前,應建立統一的數據質量標準、管理標準以及數據標準體系,可提高各部門數據共享效率,避免形成孤島。
3.2.3 加強數據資源的開放和安全使用
各業務系統產生的數據均為學校所有,任何部門無權獨占。各業務系統有義務確保各自所維護數據的及時性和準確性,按照需求向數據中心共享數據。同時數據的流通需要建立安全機制,因此需建立數據審核機制,可保證數據的規范和準確。各數據產生業務部門應當建立完整的數據錄入和審核制度,明確責任人,做到數據的錄入和更新應及時進行,確保與實際業務同步。及時審核新產生的數據,做到錄入、審核過程可追溯。
3.2.4 加強數據質量監控和考核
為了保證數據管理的科學性,保證數據的提供的準確性、及時性、便于利用,符合安全、保密要求,必須建立健全數據質量反饋制度,以保證數據的質量。可指定部門對產生的數據質量進行考核,各業務部門有義務監督其他業務部門所提供數據的質量是否符合準確、及時和規范性要求,將數據質量反饋也納入各學校信息化建設考核當中。同時數據使用部門可以提出關于數據準確性、時效操作性和一致性的意見,并送達數據提供部門,協助和督促數據提供部門不斷提高共享數據的質量,同時不斷完善數據平臺的性能和功能,并定期檢查、跟蹤反饋記錄。從而保證數據治理工作常態化開展,推動數據質量不斷提升。
本研究從數據治理技術路線和制度層面展開分析、探討,突出智慧校園建設中數據治理的重要性。數據治理工作的展開需要進一步加強頂層設計、制度健全以及建立統一的數據標準體系。當下疫情的防控工作,對學校數據治理能力提出了更高的要求,因此在“十四五”規劃階段,數據治理工作應該更深入同時也需結合人工智能相關技術進一步探索數據治理,挖掘數據的豐富價值。