張 聰



摘? ?要:數據標準是保障數據使用和交換一致性、準確性的規范性約束,對提升數據質量、促進數據互聯互通、釋放數據價值等起到至關重要的作用。然而,不少高校在教育信息化初期缺乏統籌規劃,對數據標準的制定和落地造成嚴重障礙。文章依據國內外數據標準執行經驗和筆者實際工作經驗,探索符合高校實際的數據標準制定和落地方案。
關鍵詞:數據治理;數據標準;編碼規則;數據標準落地
中圖分類號:G647;TP393 文獻標志碼:A 文章編號:1673-8454(2021)15-0048-04
一、引言
高校信息化是教育信息化的先鋒隊,對教育信息化起到引領和示范作用[1]。教育部2018年頒發的《教育信息化2.0行動計劃》中指出,應繼續深入推進實現“三通兩平臺”,促進教育資源和信息的交流與共享,達到提速增智、提質增效,促進教育資源公共服務平臺和教育管理公共服務平臺的融合發展[2]。
當前,借助信息化力量減少信息重復填報,便利師生校內的教學和生活,促進高校教學和行政改革,指導學校發展決策成為越來越多高校的共同需求,這對系統間的數據流轉提出了高要求。然而,在信息化發展初期,許多高校開發信息系統由業務部門各自為戰,缺乏統籌規劃,造成一個個“信息孤島”和“應用孤島”,各信息系統中的數據定義、格式、規則等大相徑庭,為數據的交換共享帶來極大阻礙[3]。因此,探索一套符合高校實際的數據標準制定、落地方案,是一項緊迫而重要的任務。
二、高校數據標準發展現狀
我國的教育信息標準化工作已進行多年。2002年,教育部成立“教育信息化標準委員會”,同年更名為“全國信息技術標準化技術委員會教育技術分技術委員會”,負責組織全國教育信息化的標準編制工作,并于8月6日發布《教育管理信息化標準》(教發[2002]27號)。2012年,教育部在此基礎上,對各編碼集進行了增加、修改、刪除、歸并等操作,發布了《教育管理信息 教育管理基礎代碼》,成為各高校信息系統信息代碼依據的行業標準[4]。
2019年,中國信通院(CAICT)和大數據技術標準推進委員會聯合發布《數據標準管理實踐白皮書》(以下簡稱《白皮書》),結合國內外數據標準管理理論和實踐的成功經驗,對數據標準的制定、管理提出了實踐建議,對相關行業的數據管理者具有一定的借鑒意義[5]。
隨著高校數據深度融合的推進,許多高校都開始先后制定本校的數據標準[1][3]。但是部分高校的數據標準代碼在制定時脫離實際情況,難以落地使用,成為空中樓閣。本文參考《白皮書》的理論和操作建議,提出一種符合高校實際的數據標準制定和落地的方法。
三、數據標準落地方案
1.數據標準管理組織架構
《白皮書》中指出,數據標準管理的組織架構是以推動數據標準化工作為目標,負責落實和監督數據標準化工作的組織體系[5]。高校應由校級層面成立統籌數據標準工作的數據標準制定執行委員會,負責統籌數據標準的調研、制定、執行和監督等各項事宜。其成員包括負責高校信息化的校領導,負責數據標準管理的組織和協調部門,數據提供和使用的業務部門,以及相關領域的專家等。數據管理組織依據工作職責劃分為決策層、管理層和執行層。
(1)決策層
決策層是全局把握的決策組織,負責解決數據標準的政策制定、規章制度、執行監督等方面全局性、方向性問題,由校級領導及數據領域的專家構成。
(2)管理層
管理層是數據標準管理的組織協調部門,負責依據相關管理制度和操作規定,推進和監督數據標準的落地工作,定期向決策層匯報數據標準的落實情況、出現的具體問題,由數據標準管理部門(如負責信息化建設和管理的部門)的主要成員構成。
(3)執行層
執行層是負責數據標準落地工作的各數據源頭部門,需依據制定好的數據標準政策和管理文件,全力配合管理層落實數據標準規范,由各數據源頭部門和數據使用部門的負責成員構成。組織架構分層如表1所示。
2.數據標準制定原則
數據標準是統一數據平臺(數據中臺)進行數據交換的規范,應當由管理層負責數據管理的信息化部門進行制定,交由決策層修改、審核后通過。如前所述,在信息化建設前期,高校已建立許多信息系統,這些系統或是仍在使用,呈現一個個信息孤島的狀態,或是雖然廢棄,但產生了許多遵循一定代碼標準的歷史數據,且這些歷史數據仍存在一定的使用價值,替代系統需要沿襲原系統的代碼標準。在制定標準時必須考慮到高校使用數據的現狀,盡量彌合不同系統中現存數據的標準差異。
在這樣的情況下,在數據標準的制定過程中應堅持幾個原則:
(1)對單源頭的數據字段,應盡量采用數據源頭部門的代碼標準。數據源頭部門的代碼標準是數據源頭部門正在使用的,隨著數據進入數據共享交換領域,可最大程度減少數據改造可能帶來的問題。
(2)對多個源頭都在使用的數據字段,如存在標準不一致的情況,應以數據交換使用頻率較高的數據源頭標準為基礎進行改造。對于一些常用個人信息字段(如性別、政治面貌、籍貫、國籍、學生類別等)信息,應盡量向國標、行標靠攏,以方便對接未來更多系統。
(3)如果某些數據需要自行建立代碼標準,應首先研究是否可采用相應的國標、行標,如與本校情況差異較大需自行建立標準的,建立標準時應遵循一定的代碼規范,盡量滿足共享性、唯一性、穩定性、可拓展性、前瞻性和可行性等代碼標準規范要求。如果數據存在層級結構,應當體現在代碼上。
(4)指標類數據標準應當在基礎類數據標準的基礎上建立。基礎類數據是指業務流程中直接產生的、未經過加工和處理的基礎業務信息,指標類數據是指具備統計意義的基礎類數據,通常由一個或以上的基礎數據根據一定的統計規則計算得到[5]。對于指標類數據的定義、統計范圍、統計方法等,應結合基礎類數據的特點制定,以保證統計數據含義和內容的確定性、唯一性。
3.數據標準落地模型
在數據標準管理組織架構確定,人員就緒后,由負責數據管理的信息化部門負責數據標準情況的調研,形成初稿后征求意見,將征求意見稿交由決策機構進行討論、修改、審核,最終通過并予以發布。流程如圖1所示。
標準文件發布后,數據管理部門和各業務部門按照相關規范進行數據采集、生產和清洗等工作。在一定時長的過渡期后,逐步讓數據格式、內容等符合數據標準要求。
對于改動較大,無法滿足數據標準要求的接入業務系統,需要由業務部門維護代碼轉換表。如果同時有數據的轉入和轉出,需要同時維護轉入和轉出表,如圖2所示。
對于未來學校新上線的信息系統,強制要求需要的信息必須通過統一數據平臺接入,以確保數據標準的一致性。
4.數據標準輸出文檔
數據標準相關輸出文檔包括管理規定、標準規范和操作指南。
(1)管理規定
規定高校數據標準制定、落地的工作辦法,以及開展數據標準管理的組織架構、職責分工、審核匯報機制等。
(2)標準規范
規定各個業務域的數據字段標準,包括基礎類和指標類數據標準。標準規范的格式和內容可參考國家標準《標準化工作導則 第1部分:標準化文件的結構和起草規則》進行擬定。
(3)操作指南
規定業務部門根據管理規定所制定的在本業務域開展數據標準化工作的具體實施方法。
四、數據標準制定和落地實例
筆者以深圳大學部門數據標準代碼為例,闡述數據標準從制定到落地的全過程。
組織架構是高校核心數據之一,具有極高的流通價值,幾乎是每個業務必需的字段。但是在人事、教務、研究生、科研、固定資產等業務管理系統中,相應的部門名稱、分類等五花八門,對數據的交換流通和統計分析等造成嚴重障礙,統一標準迫在眉睫。
1.數據使用現狀調研
要先就部門使用現狀到業務部門調研,包括數據源頭部門和數據使用部門。根據對各主要數據相關部門的調研,得到以下結論:
(1)多數業務部門對于業務系統更換部門代碼和分類方式持否定態度,因為部門數據是業務系統的基礎數據,更改部門代碼表將影響業務正常運作和報表統計結果,可能造成不可預測的錯誤和后果。
(2)部分業務系統現有的部門代碼有層次結構,部分沒有。學校雖然有實際設立的一級部門和二級部門,但一些業務系統不需要區分,體現的是一種扁平化的組織架構;有一些業務系統進行了層級劃分,但名字與層級設立與實際架構有差距。
(3)一些業務系統因為自身業務需要,無法與標準組織架構和部門名稱完全匹配。例如因為組織架構的調整,出現一些部門更名、合并或撤銷等情況,業務系統不能完全與部門現有標準名稱一致,而需要逐步過渡。
2.數據標準基準選定
根據調研反饋結果和數據交換需求判斷,最終決定選擇以人力資源部的部門代碼作為數據標準的基準表,理由如下:
(1)人力資源部掌管教職工數據,教職工數據交換的范圍最廣,幾乎所有業務系統都會用到,標準落地難度最低。
(2)人力資源部對部門變更敏感,在學校部門調整時會迅速進行調整,其部門代碼的時效性較高。
(3)人力資源部的部門代碼有分層至二級部門,與真實組織架構較為吻合,且其代碼較為規范。
3.數據標準的制定與審議通過
調研完成和基準表確定后,經過初稿形成、征求意見、交由數據標準決策機構審議、通過等步驟,最終以紅頭文件形式公布,成為校級標準,以后定期修訂、迭代更新標準。部門代碼標準如表2所示(節選)。
組織架構的標準名稱由專門部門進行維護。在統一數據平臺抽取信息后,參照組織架構的標準結構和名稱進行部門數據的清洗,最終形成標準的部門代碼和名稱后用于數據共享交換。另外根據一些業務系統交換的需求,清洗前的部門數據也需要保留。
4.制定數據標準轉換表
數據標準代碼表確定后,即可逐步使用圖2的數據流轉模型進行數據抽取、清洗和交換工作,對于沒有自己部門標準的業務系統,可直接將標準的部門代碼表傳送給業務系統使用;對于有自身部門標準的業務系統,則要制定代碼轉入和轉出表,將標準的部門代碼和業務系統自身的部門代碼標準連接起來。其中如果業務既需要轉入又需要轉出數據,那就需要同時制定這兩張表,原則上不能合并為一張。以教務部的部門轉換表為例,轉入和轉出表(節選)如表3、4所示。
五、 結語
數據標準是進行數據標準化的主要依據,構建一套完整的數據標準體系是開展數據標準管理工作的良好基礎,有利于打通各系統的“信息孤島”,是促進數據互聯互通,促進數據挖掘分析和價值發現的關鍵一步。本文在管理和技術層面提出了一套數據標準的制定和落地方案,在各自建業務系統存在各自的數據標準,滿足各自系統數據完備性的情況下,構建起適合數據交換的全校性數據標準,以達到盡可能減少業務系統改造,讓交換數據能平滑過渡到全校性標準的目的。
參考文獻:
[1]王高梁.數字化校園統一數據平臺關鍵技術研究[D].武漢:湖北中醫藥大學,2016.
[2]李華,劉波,龔藝,等.高校教育管理數據標準建設實踐[J].安徽電子信息職業技術學院學報,2017(2):97-102.
[3]孫思.高校智慧校園信息標準的規劃與設計[D].武漢:武漢輕工大學,2017.
[4]教技[2012]3號.教育部關于發布《教育管理信息 教育管理基礎代碼》等七個教育信息化行業標準的通知[Z].
[5]中國信息通信院云計算與大數據研究所.數據標準管理實踐白皮書[R].北京:中國信通院,2019.
(編輯:王曉明)