涂慶華 崔聰 束乾倩


由于早期數字化校園建設背景的限制,各大高校在數據層面均處于較為薄弱的階段,主要存在以下難題:
1.數據不可知:傳統的數據平臺僅含部分人財物等結果型主數據,并不包含過程數據,無法得知真實的數據資產情況;
2.數據不可管:缺少對于多源異構數據的可視化處理平臺,對廠商的依賴程度較大,難以擁有自主權;
3.數據不可控:數據開放程度不足,同時缺乏數據全脈絡的監管,不能規范數據的全生命周期流程;
4.數據不可信:信息標準不一致、數據不完整、數據錯誤等問題造成數據不可信,導致分析結果的偏差,影響數據的共享交換;
5.數據不可用:缺少對于業務場景的研究,很難產生實際價值。
當前,智慧校園建設對于底層數據的需求更為急迫,因為沒有準確全面的數據,智慧校園就無法達到預期的高度。
因此,南京理工大學啟動了數據治理體系建設,以數據的“采、管、用”為目標,以全量數據中心建設和數據中臺服務為依托,旨在提升智慧校園數據服務能力,為學校提供全面、高效、精準的數據支撐。
數據治理體系建設實踐
1.構建校級的數據管理組織架構:數據治理需要率先建立管理的組織架構,明確決策流程、權責關系、配合方式。學校建立起重大決策和協調推進、技術開發支持、承擔配合的數據治理體系,保障了數據治理工程的快速推進。
2.制定學校數據標準規范:數據標準規范是智慧校園頂層設計,能夠保障數據的一致性,破除數據難以打通、利用等弊端。
通過部門調研、比對迭代,形成權威信息標準?;诮y一的編碼規則,為數據的全面打通和業務系統實時同步更新數據標準奠定了基礎。
3.數據資產摸底與識別:學校提出并實踐了“先集中、后治理”的數據治理方式,即建設近源數據層,將數據的原始形態充分進行暴露和識別,從而實現數據資產的盤點,形成對于數據資產管理的統一視圖。
4.構建全量數據平臺:智慧校園建設需要更多高價值數據源,例如記錄行為的日志數據、線下表格數據、外部互聯網數據,以及視頻監控和人臉識別等非結構化數據。此類數據的體量、結構、處理方式與業務數據完全不同,存在很大的使用難度。
為實現低門檻的利用,學校設計了全量數據平臺架構,能夠支持多維數據源,實現高校全量數據的“實時可采集、全面可管控、處處可復用”,真正實現“數入一庫,數出一庫”。
(1)業務數據:新建的業務系統不再單獨構建數據庫,原有業務系統按11備庫到全量數據中心。
因此,實現了招投標系統、智慧團建、第二成績單等12個新建系統數據集中存放;實現了對人事、學工、教務、科研、資產、研究生、一卡通等25個核心系統數據的全量采集和治理,生成了學校概況、學生管理、教學管理、教職工管理等13個數據倉庫子集,共計沉淀5億多條結構化數據。
(2)日志數據:基于Hadoop和Spark大數據框架,實現了對上網URL、防火墻、無線Wi-Fi、WAF等7大類核心日志數據的分布式采集、解析、存儲工作,月體量近TB級。針對此類高校普遍未有效利用的行為數據構建了成熟的處理方案,為大數據應用提供了多維度數據源。
(3)線下數據:設計并落地了對學工處、人事處、教務處、國資處等10個部門線下表格數據的一站式采集治理方案,在兼顧部門人員維護數據習慣的基礎上,實現線下數據源的補充。
該方案為高校審計數據上報工作提供了便利,為各大高校業務系統未建或使用效果不好,又需要將線下數據進行整合和共享的需求提供參考。
5.推動數據質量回溯,堵疏并用:對于數據質量這類老大難問題要綜合評估其影響程度、改進難易程度,制定了以下解決辦法。
(1)明確數據源頭部門,提供可視化數據質量報告。對于影響范圍較大的主數據,采用可視化數據質量報告推送的方式,讓源頭部門明確數據質量問題,并對原始問題記錄進行重點標注,推動其核對和改善。
(2)推行數據與人見面。遵循“個人對數據負責”的原則,建立師生個人數據中心,提供糾錯補錄功能。通過集中式的個人數據查閱和核對,保障個人數據更新的及時性,為各類業務申報提供可信數據源,避免重復填報。
(3)推動業務系統整改。業務系統設計的不完備性是數據質量問題的根源,學校制定了數據治理提升措施,實現從源頭解決數據質量問題。
打造數據中臺 以開放促應用
為構建更為開放的數據服務生態,學校設計了集 “發布、申請、管控、監測”為一體的數據中臺。
統一發布中心:面向各平臺和系統提供統一的數據出口方式,可快速實現數據共享接口的發布,降低數據共享門檻;統一申請中心:繼承數據治理的成果,開放校內數據資源目錄,目前已有近20類、400+種數據資源上線使用;統一管控中心:可視化處理數據申請,從而保障學校對于數據的自主可控;統一監測中心:對于數據運行情況實現全鏈路監測,改變以往數據交換的“黑盒狀態”。
面向業務場景落地大數據分析應用
大數據分析的建設不能閉門造車,要深入了解各部門、各群體的真實需求,以精準的大數據分析結果全面輔助領導決策、校務管理及流程優化,推動學校的長遠發展。
目前,已為人事處、學工處、校友會、后勤服務中心、校園管理與保衛處、發展規劃處等部門提供大數據分析服務,以下是部分亮點應用。
1.暖心飯卡:通過分析食堂消費數據實現精準扶貧,將善款直接打入進餐低于平均水平的學生飯卡內。在保護學生尊嚴的前提下,保證困難學生能夠吃飽飯。
2.智慧網絡:基于產生的海量歷史數據和實時數據,實現IT資源運行分析、異常檢測、智能預測等功能,從而解決高校IT架構復雜、運維困難的問題,提升學?;AIT運維能力。
近年來,如何在破解高校數據頑疾的基礎上,充分挖掘和發揮大數據的價值,是高校信息化領域面臨的新課題。
南京理工大學通過數據治理體系的規劃和實踐,打造了以全量數據中心和數據中臺服務為核心的智慧校園數據支撐體系,為當前和未來信息化建設提質增效夯實了數據基礎。