吳馳 毛文卉 劉雅琴


摘? ?要:隨著教育信息化2.0時代的到來,高校的信息化工作也正經歷著從“業務數據化”到“數據業務化”的轉變。通過基礎數據共享消除數據孤島,進而提升數據質量并發揮數據價值,最終實現“智慧校園”,已成為高校信息化建設關注的熱點。文章針對高校信息化建設和管理過程中面臨的基礎數據復雜度高、一數多源及共享交換難等問題,從基礎數據的來源確定、共享途徑、共享范圍和有效利用等四個方面,結合數據的生命周期,提出相應的管理策略,并介紹華中科技大學基于該策略,在制度建設和具體實施方面的實踐成果。實踐表明,只有根據高校特點,科學制定適應信息化發展規律的管理制度,以先進的信息化技術手段為支撐,找準典型應用,才能形成學校基礎數據管理的長效性策略,真正促進學校的信息化發展。
關鍵詞:基礎數據;高校信息化;數據共享;數據管理
中圖分類號:TP393? ? ? ? ?文獻標志碼:A? ? ? ? ? 文章編號:1673-8454(2022)09-0083-06
隨著高校信息化的發展,歷史上由各業務管理部門主導、分散建設的信息系統已無法滿足學校需求,消除信息孤島,讓數據共享、系統互通已成為師生共同的強烈訴求,也是高校信息化部門工作的重中之重。而無論采用何種治理模式和技術架構,基礎數據的管理都是一個必須面對的問題[1-7]。
一、基礎數據的特點
高校信息化建設過程中會產生各式各樣的數據,而什么樣的數據才是基礎數據還尚無定論。有高校從學校管理或高基表統計填報需求出發,認為反映學校教學、科研、學科、管理等各領域基本情況的數據是基礎數據;有高校以教育部2012年頒布的“教育管理信息系列標準”中的相關代碼和數據集作為學校基礎數據標準。不論各高校對基礎數據的范圍或標準的定義有怎樣的理解,一個普遍存在的共識是,高?;A數據存在以下一些特點。
(一)數據類型復雜多樣
高校涉及管理、教學、科研、生產、生活等方方面面,隨著各個方面信息化建設的發展,其產生的數據類別也更加復雜多樣。
(二)各部門數據既高度依存又相對獨立
數據是由業務產生的,高校業務部門在進行信息化建設的過程中,幾乎不可能去考慮其他部門的需求。甚至大的業務部門內部,能做到基礎數據的標準、結構等統一也并非易事。然而,各業務部門之間的數據依存關系又非常緊密和復雜。例如,幾乎所有的業務部門都會用到學生的個人、學籍基礎等信息 ,而學生的基礎信息很有可能又分屬幾個部門管理產生。
(三)一數多源情況普遍存在
由于歷史、管理職能交叉重疊等復雜原因,高?;A數據普遍存在權威數據源不明的情況,往往會出現領導要一個簡單的全校學生總量數據,教學、學工等部門拿出的數據有差異、不統一的情況。
(四)共享和交換需求強烈
隨著信息化建設的進一步推進,由原來根據管理職責條塊分割的數據產生和交換模式已遠遠不能適應互聯網時代的要求,各部門開始意識到數據共享和交換的重要性,需求日益強烈。
二、基礎數據管理存在的主要問題及其應對
與其他所有事物相同,數據也有生命周期,一般可分為采集(生產)、存儲、處理、傳輸、交換及刪除(銷毀),特定數據的生命周期由實際業務場景決定,并不一定所有數據都經歷上述完整的周期[8]。基礎數據的管理,就是要基于其生命周期特點,解決好以下幾個問題。
(一)基礎數據從哪里來
數據是由相關部門在各項實踐活動中采集的,使用信息系統的目的是提高采集、存儲和處理的效率。要解決好“從哪里來”的問題,必須首先根據“誰產生、誰負責”的原則,確定權威數據源,避免“一數多源”“有數無源”“有源無數”等問題。權威數據源的確定,是基礎數據管理的第一步,也是學校信息化部門不可推卸的責任。當然,權威數據源的確定必然是一個動態而非靜態的過程,既要適應學校管理的機構劃分和變革,又要實事求是地確定真正“有能力產生、有意愿負責”的數據源管理部門。此外,確定權威數據源不僅僅是劃分責任的過程,在把責任交給相關部門的同時,也要尊重其對數據的所有權利,如數據共享的審批權等。通過權責對等的管理,才能真正得到各部門的理解和支持。
(二)基礎數據怎么來
站在學校信息化部門的角度,基礎數據必須進行共享和交換才有可能打破信息孤島。建設學校基礎數據庫(中心數據庫),已成為絕大多數學校信息化部門的共識與職責。但從數據的生命周期來看,基礎數據庫中所有數據的采集(生產)過程,都是在學校其他部門而非信息化部門進行。因此,數據來源成為所有學校信息化部門必須解決的一個問題。一些高校信息化部門采用了自頂向下的方式,制定并頒布非常全面和詳細的基礎數據結構及標準,試圖建成大而全的學?;A數據庫,要求各部門將相關數據入庫;另外一些高校信息化部門則借用管理全校信息化基礎設施的“優勢”,直接將學校各部門業務系統中的所有數據“抽取”到基礎數據庫中,再進行展現和分析。
無論采用上述哪種方式,在實踐過程中都鮮有成功的案例,只能說“理想很豐滿、現實太骨感”。究其原因,可以歸結為沒有解決好“怎么來”的問題。作為學校的信息化部門,優勢在于掌握先進的信息化基礎設施和技術手段,短板則在于不能很深入地理解相關業務。數據都是有其業務背景的,不能很好地理解數據的業務背景,數據的整合、分析、展現就無從談起。如果對數據采用“搶來”“偷來”的方式,必定很難得到各業務部門的主動配合,要管好基礎數據,基本上是不可能的。所以,基礎數據的獲得,一定要征得權威數據源部門的同意,其范圍也必須有理有據,不能抱著“越多越好”的思想隨意擴大。
(三)基礎數據到哪里去
要實現基礎數據的共享和交換,需要面對的另一個問題是數據到哪里去。答案似乎顯而易見,應該是學校的其他部門。但“怎么去、去何處”卻是學校信息化部門在這個過程中需要解決好的問題。究其根源,其實是要回答誰申請、誰審核、誰操作的問題。一個較好的解決方案是,由需要共享的部門申請,數據源負責部門同意,學校信息化管理部門審核,學校信息化技術部門負責使用技術手段操作。而且,當同一項基礎數據被不同部門提出共享需求時,也應采用“一事一議”的審核方式。這樣既尊重了數據源負責部門對于數據共享和使用的知情和審批權,又由學校信息化管理部門站在全校信息化建設的全局角度,對數據共享中的范圍風險進行把關。
(四)基礎數據怎么用
基礎數據管理中需要解決的最后一個問題是“如何使用”。在使用過程中,一定要避免“泛化”和“隨意”的傾向,掌握好“最少夠用”的原則?;A數據的泛化、隨意使用一方面會帶來極大的安全風險,另一方面也會影響數據源負責部門的積極性,從而使得信息化部門在推進基礎數據建設和管理過程中舉步維艱。因此,作為學?;A數據庫的建設管理單位,信息化部門一定要在基礎數據的共享和使用上慎之又慎,謹記自己只是“數據的搬運工”而非“數據的生產者”。當然,基礎數據必須“好用”,即數據質量必須良好?;A數據質量提升是一個動態的過程,基礎是“通”,即必須實現學校各類基礎數據的互聯互通;手段是“用”,即必須在基礎數據的共享使用過程中,才能真正發現數據質量的問題,從而督促數據源部門通過有效手段進行修正;目標是“準”,即基礎數據最終必須完整準確?!巴ā谩獪省笔且粋€循環迭代的過程,能夠真正長效地保障基礎數據質量的不斷提升。
三、華中科技大學的實踐
(一)制度建設
為解決好學?;A數據管理問題,華中科技大學在“十三五”信息化規劃中的“十個一”工程中明確提出,建設“數據一個庫”,并于2016年5月制定并頒布了《華中科技大學基礎數據庫建設與管理暫行辦法》(以下簡稱《辦法》)?!掇k法》從以下幾個方面明確了學?;A數據管理的基本策略。
1.基礎數據的定義
《辦法》對基礎數據和基礎數據庫進行了明確定義。基礎數據是指學校各單位在管理和服務信息化過程中產生的,具有確定的權威來源,且可被其他業務信息系統或公共信息系統使用的數據?;A數據庫是學?;A數據的集合,通過統一數據交換與共享平臺,實現數據共享和一致性管理,是學校重要的信息化基礎資源。上述定義明確了基礎數據范圍以共享為基礎,實事求是地反映了學校信息化建設的階段特點,有效地杜絕基礎數據庫建設過程中的泛化問題,避免學校信息化部門盲目追求“大而全”的建設目標而導致的失敗風險。
2.基礎數據的范圍
在基礎數據具體范圍方面,《辦法》規定“基礎數據主要包括組織機構、人事、學生、財務、資產、教學、科研、網絡、總務、后勤等管理和服務數據。基礎數據范圍根據基礎數據庫建設進度和信息化工作需要逐步擴展,具體由網絡與信息化辦公室確定?!边@樣既明確了基礎數據的具體內容,又從制度上尊重了基礎數據的動態性和基礎數據庫建設的階段性,為未來的發展保留了空間。
3.權威數據源的認定
在權威數據源認定方面,《辦法》規定“網絡與信息化辦公室根據業務歸屬情況,負責確定基礎數據的權威來源,明確其產生和維護部門”,同時還對各類基礎數據的內容及責任部門進行了明確的劃分。有了權威數據源負責部門及其認定部門,基礎數據的來源和質量才有基本保障。
4.數據的共享和使用
在數據共享和使用方面,《辦法》規定“基礎數據使用單位根據業務系統需求,在嚴格遵循‘最少夠用原則下,提出數據共享申請并提供接收數據的中間庫。在經數據源產生單位審批同意后,由網絡與計算中心運用數據同步工具,將共享數據推送至中間庫,并由使用單位完成中間庫到業務庫的同步。基礎數據庫的同步操作僅限于校內進行,中間庫必須與業務庫之間邏輯隔離,不得使用校外服務器作為中間庫。基礎數據使用單位只能將獲取的共享數據,用于經數據源產生單位審批指定的業務信息系統,不得私自擴大使用范圍或作為他用?!边@樣既明確提出了“最少夠用”的使用原則,又規定了數據的使用必須經過數據源產生部門審批同意,同時,還對信息化部門共享數據的技術手段進行詳細規定。
5.數據的安全與保護
在數據的安全與保護方面,《辦法》規定“基礎數據的產生單位、使用單位和管理單位,應嚴格遵守國家、地方及學校關于信息安全和個人信息保護的相關法律規定和規章制度,制定本單位基礎數據管理細則與使用規范,保障學校基礎數據的使用安全,確保信息不濫用、不泄露。各單位應明確基礎數據信息安全責任人及數據管理員,發生人為或技術原因導致數據泄露、竊取、破壞等信息安全事件,由該單位及相關人員負責,并應按照信息技術安全事件報告與處置流程向學校報告”。數據安全是基礎數據管理的“底板”,在基礎數據全生命周期都應重視并保護數據安全[9]。因此,從制度上明確責任單位、責任人員及安全事件處置流程是非常必要的。
(二)具體實施
1.基礎數據服務平臺
為做好基礎數據庫建設及基礎數據的共享與交換,學校建設了基礎數據服務平臺。平臺總體架構如圖1所示,主要包含以下模塊:①數據交換平臺。采用ETL等技術[10][11]實現學習各業務數據庫與基礎數據庫的共享交換,在交換過程中,通過數據清洗和轉換實現基礎數據的標準化。為滿足不同業務場景對數據交換頻率的要求,平臺提供實時交換與定時交換兩種模式。②數據開放平臺。通過接口技術為學校各類信息系統提供基礎數據調用服務,信息系統獲得權限后,可通過API獲得相關數據。③數據查詢平臺。滿足學校各部門對基礎數據的查詢需求,平臺提供拖拽式數據查詢開發界面,基礎數據管理人員可快速為相關部門開發所需的數據查詢頁面。④數據標準管理平臺。對學校數據標準進行信息化管理,支撐基礎數據庫的運行,為各類應用數據庫建設提供查詢和指導。⑤數據質量管理平臺。針對從各類業務數據庫交換而來的數據,依照平臺配置的標準,進行準確性、合規性、一致性、重復性、及時性、完整性的自動監測,并生成告警及質量報告。網絡與信息化辦公室依照報告,督促相關職能部門改善數據質量。⑥數據監控平臺。對數據交換等業務進行實時監控,保證平臺的可用性。
基礎數據服務平臺自建成以來,已收錄人事、教務、研究生、科研、資產、財務、后勤等7大類近70萬條數據記錄,實現全校近160個信息系統之間基礎數據的共享與交換,日均數據記錄共享交換量達6千萬條,有效地消滅“信息孤島”[12]。
2.基礎數據共享流程
根據基礎數據管理的相關制度,學校依托“網上辦事大廳”制定“基礎數據共享申請審批”流程,具體如圖2所示。
基礎數據使用單位的具體負責人員只需登錄學校網上辦事大廳,根據需求并遵循“最少夠用”原則,從已有的基礎數據目錄中,選擇所需共享的數據類型及具體字段即可。如果所需數據不在目錄中,則可以在流程中的“其他數據”欄目中填寫和說明。流程經申請單位負責人審核并承諾合規使用后,系統根據所申請的數據類型自動分發至對應的數據源部門審核。數據源部門負責人根據申請單位填寫的相關信息審核后,決定是否同意共享。如果同意共享,再由網絡與信息化辦公室根據學校信息化相關管理和技術規定進行審核,審核通過后,由網絡中心使用學?;A數據服務平臺實施共享。
3.基礎數據典型應用建設——“一張表”平臺
為進一步推動數據質量的提升,發揮數據價值,實現教師各類數據“最多填一次”,華中科技大學從2018年開始啟動“一張表”平臺建設。平臺以解決重復填表為出發點、提升數據質量為目標、學院業績考核為驅動、可視化配置平臺為支撐,實現個人數據自動匯集、集中維護、可視化展現,學院考核方案個性化配置,績效分配自動化計算,報表自動生成等功能。目前,該平臺已在全校20個學院推廣應用,預計2022年全校覆蓋。通過“一張表”平臺的實施,使得原來分散在各業務系統中的數據,以教師個人為核心進行匯集,并通過學院業績考核等手段,由教師本人對數據進行核對、補充及完善,進一步提升了數據質量。目前,一張表平臺數據已達七大類共21.5萬余條。通過對這些數據的可視化展現,教師個人和學院可以全面、準確地了解和分析個人及學院發展情況,為學院提供決策依據。同時,這些數據也成為教師未來進行各項填報的基礎,通過信息化手段實現校內各項業務辦理時相關數據的自動填充。此外,通過“一張表”平臺提供的自動報表功能,學院和學校各業務部門也能根據學科評估等各類業務的要求,基于數據自動生成相關報表。
四、結語
隨著教育信息化向2.0時代邁進,高校的信息化工作也正經歷著“業務數據化”到“數據業務化”的轉變。如何進一步提升基礎數據的共享程度、提高數據質量、發揮數據價值,已成為各高校關注的熱點。華中科技大學的實踐表明,只有根據高校特點,科學制定適應信息化發展規律的管理制度,以先進的信息化技術手段為支撐,找準典型應用,才能形成學?;A數據管理的長效性策略,真正促進學校的信息化發展。
參考文獻:
[1]張笑琪,龐鐳.高校數據共享分析與應用研究[C].中國計算機用戶協會網絡應用分會2018年第二十二屆網絡新技術與應用年會論文集,2018:3.
[2]彭雪濤.美國高校數據治理及其借鑒[J].電化教育研究,2017,38(6):76-81.
[3]周南平,賈佳.大數據背景下的高校信息化建設路徑研究[J].中國電化教育,2018(9):75-80.
[4]許曉東,彭嫻,周可.美國通用教育數據標準對我國高等教育數據治理的啟示[J].高等工程教育研究,2019(1):103-108.
[5]許曉東,王錦華,卞良,等.高等教育的數據治理研究[J].高等工程教育研究,2015(5):25-30.
[6]余鵬,李艷.大數據視域下高校數據治理方案研究[J].現代教育技術,2018,28(6):60-66.
[7]余鵬,李艷.智慧校園視域下高等教育數據生態治理體系研究[J].中國電化教育,2020(5):88-100.
[8]吳信東,董丙冰,堵新政,等.數據治理技術[J].軟件學報,2019,30(9):2830-2856.
[9]劉蓁蓁.智慧校園建設背景下高校數據安全管理的研究[J].網絡安全技術與應用,2021(1):102-103.
[10]俞春,袁芳,劉乃嘉,等.高校數據共享與交換技術的應用研究[J].實驗技術與管理,2012,29(11):109-112+122.
[11]孫秋瑞,陳平,黃洛穎,等.高校校務管理數據共享服務平臺建設路徑研究[J].中國電化教育,2016(3):69-74.
[12]毛文卉,劉雅琴,李凱,等.高校數據共享的若干實踐研究[J].中國教育信息化,2021(1):39-42.
作者簡介:
吳馳,副主任,高級工程師,主要研究方向為教育信息化,郵箱:wuchi@hust.edu.cn;
毛文卉,工程技術人員,碩士,主要研究方向為數據治理,數據庫設計與運維,郵箱:maowh@hust.edu.cn;
劉雅琴,講師,碩士,主要研究方向為教育信息化,郵箱:liuyaqin@hust.edu.cn。
Research and Practice of University Basic Data Management Strategy
from the Perspective of Informatization
Chi WU, Wenhui MAO, Yaqin LIU
(Network and Computation Center,Huazhong University of Science and Technology, Wuhan Hubei 430074)
Abstract: With the advent of education information age 2.0, informatization of colleges and universities is undergoing the transformation from “business data” to “data business”. It has become a hot topic for the construction of information technology in colleges and universities to eliminate the data island through basic data sharing, improve the data quality, give full play to the data value, and finally build “smart campus”. In order to solve such problems as high complexity, multiple sources and difficult sharing and exchange of basic data in the process of information construction and management in colleges and universities, this paper, combining with the life circle of data, puts forward the corresponding management strategies from four aspects, including source determination, sharing way, sharing scope and effective utilization of basic data. In addition, the practical results of this management strategy in the implementation and system construction by Huazhong University of Science and Technology are introduced. Practice shows that only by scientifically formulating the management system that adapts to the law of information development according to the characteristics of colleges and universities, taking advanced information technology as the support, and finding typical applications, can the long-term strategy of school basic data management be formed and the information development of schools be truly promoted.
Keywords: Basic data; University informatization; Data sharing; Data management
編輯:王曉明? ?校對:李曉萍