


摘 "要 "數據是現代化學校治理模式建構不可或缺的要素和核心驅動力,通過對25所高職院校進行調研,提出面向價值實現的數據治理策略是以實現數據資產價值最大化為目標,以教育業務發展是否需要為基點,通過讓數據易于發現和使用來規范并促進數據的開發利用,逐步形成教育業務和教育數據的共生關系,實現數據整合和數據開發利用的良性循環。
關鍵詞 "教育數據;數據治理;數據資產;職業院校;數據消費
中圖分類號:G728.8 " "文獻標識碼:B
文章編號:1671-489X(2022)14-0036-05
Research on Value Realization Oriented Data Governance Strategy in Vocational Colleges//LYU Gang, ZHU Xiaogang,
LUO Chenyu
Abstract " Data is an indispensable element and core driving force for the construction of modern school governance mo-
del. Through the investigation of 25 secondary and higher vocational colleges, this paper puts forward a value realiza-tion oriented data governance strategy, which aims at maxi-mizing the value of data assets and takes whether the develop-
ment of educational business needs as the starting point, stan-
dardize and promote the development and utilization of data
by making data easy to be found and used, gradually form a
symbiotic relationship between educational business and edu-
cational data, and realize a virtuous cycle of data integration and data development and utilization.
Key words "educational data; data governance; data assets; vocational colleges; data consumption
0 "引言
大數據在各行各業的普遍應用是信息化發展進入新階段的重要標志。數據信息作為生產要素,連接物質和能量,催生產品和服務,促進經濟社會發展越來越數字化,正深刻地改變著人類的生產和生活方式。我國高度重視大數據的應用和發展,自2014年以來,大數據連續六年進入國務院政府工作報告,2020年3月頒發的《關于構建更加完善的要素市場化配置體制機制的意見》中,首次把數據要素與土地要素、勞動力要素、資本要素、技術要素并列為我國經濟的生產要素之一,在新基建的基礎上,數據將成為推動我國經濟和社會發展的重要資源。《中共中央關于制定國民經濟和社會發展第十四個五年規劃和二〇三五年遠景目標的建議》(以下簡稱《“十四五”規劃》)中指出:“要推動數據資源開發利用,建設國家數據統一共享開放平臺。”[1]浙江省2021年開始實施“教育魔方”工程,提出“構建1個主體單元、完善3大支撐體系、提升6項關鍵能力、創建X個場景應用”的建設路徑,其中,1個主體單元就是教育大數據倉。
學校是教育大數據倉的主要數據源,學校數據的豐富程度、數據質量的高低、數字化場景的師生接受度直接關系著教育大數據倉的建設成敗。隨著國家對職業教育的投入越來越大,職業院校數字校園建設日趨完善,數據采集和存儲的成本越來越低,教育數據越來越豐富和完整,職業院校的數據資源開始呈現大數據形態。然而,教育資源的整合和利用在實踐中還存在諸多困難,尤其是如何對教育數據進行開發利用,仍然是一個亟待研究的課題。鑒于此,對浙江省、廣東省、福建省部分目前已經在開展和近兩年計劃開展數據治理工作的職業院校信息部門負責人進行問卷調研,并實地走訪調研數據治理工作比較成功的幾所高職院校數據治理項目組,對目前職業院校數據治理面臨的主要問題、背后原因、應對策略進行探討,以期為我國的教育數據治理工作提供借鑒。
1 "數據治理相關研究
數據治理相關研究是從對數據倉庫、數據集成、數據規范、數據清洗、數據交換、數據質量等領域的研究中發展而來的。數據治理需求隨著數據倉庫的建設而凸顯,但不能把數據倉庫的建設和數據治理混為一談。現在一般認為數據治理是一種質量控制規程,在機構數據管理中分配決策權和相關職責。數據治理的目標總體來說就是提高數據質量,在降低風險的同時實現數據資產價值的最大化[2]。美國通用教育數據標準(CEDS)是教育數據治理較為成功的一個例子,構建P20W各層次的教育數據模型,促進數據在不同系統的流通,還提供一系列工具為數據系統開發者和管理者、教育研究者、教育決策者等在建立數據庫、進行數據轉換集成以及研究教育問題等工作中提供支持[3]。我國教育部在2012年發布教育信息化的行業標準[4],該標準涵蓋教育統計信息標準、高校管理信息標準、中職學校管理信息標準、普通中小學校管理信息標準、教育行政管理信息標準、教育管理基礎信息標準、教育管理基礎代碼等七個子標準。目前,教育系統數據中心的建設基本依托這個標準進行,但實際使用過程中,財務、科研、資產等比較專業的系統還是要做較大的改動。
2 "數據治理實踐的主要問題
設計一份在線問卷,包含職業院校數據治理開展情況、信息化部門對數據治理的認知程度、對教育數據開發利用的態度等三個維度八道題目。回收有效問卷29份。從問卷的信效度分析,Cronbach α系數為0.759,KMO值為0.669,問卷的結果有一定的信息提取價值。
從數據治理開展情況來看,79.13%的學校已經開始數據治理工作,55.17%的學校能通過學校數據平臺獲得工作中需要的其他部門數據,但是有自己專門的數據服務團隊的學校只有20.69%。從開展數據治理工作的目的來看,44.83%的學校開展數據治理工作的出發點是解決數據共享問題,只有20.69%的學校是從對數據開發利用的角度來規劃和開展數據治理工作。從數據治理的工作內容來看,只有13.79%的學校認為數據治理最重要的內容是數據的應用和服務,68.97%的學校認為數據治理最重要的工作是制定數據標準,做好數據頂層設計,理清數據資產。
除了問卷調研,還走訪調研金華職業技術學院、揚州職業大學、陜西工業職業技術學院等幾所目前數據治理工作開展得比較好的職業院校。綜合問卷分析和走訪調研,認為目前職業院校數據治理過程中主要存在以下幾個問題。
2.1 "業務系統開放程度不高,基礎數據共享依然不
通暢
《教育信息化2.0行動計劃》中提出推進教育政務信息系統整合共享,以“互聯互通、信息共享、業務協同”為目標,完成教育政務信息系統整合工作[5]。經過近三年的實踐,業務系統仍然多而雜,基礎數據共享難度依然較大。如圖1所示,調研中44.83%的受訪單位開展數據治理的目的還是解決數據共享問題。如浙江某中職雙高學校,目前在用的業務系統有17套,其中屬于上級部門管理,學校沒有自主權的業務系統有九套(人事相關系統三套、學生相關系統三套、財務資產相關系統兩套,教學診斷與改進數據填報系統一套),平臺化軟件學校較難進行個性化定制的產品有六套,而學校自行定制開發的系統只有兩套。同時,因為業務系統來源復雜,不同口徑有不同的應用系統,不管是數據輸入端還是數據輸出端,不同口徑的系統數據結構不相同,同一個數據不同口徑的元數據定義也不盡相同。這17套系統中,需要用到教師或學生基礎信息的系統各有九套,除了釘釘以外,其他平臺基本不開放數據接口,只能以Excel表格的形式導入導出數據,因為各系統之間數據共享不通暢,各自維護一套師生基礎數據,數據變更后不會相互通知,最終演化出九個版本的師生基礎信息。
2.2 "數據開放程度不高,數據消費的習慣尚未形成
我國2015年9月發布的《國務院關于印發促進大數據發展行動綱要的通知》中提到,2018年中央層面構建形成統一的互聯網政務數據服務開放政府平臺,推進公共機構數據資源統一匯聚和集中向社會開放。2020年10月發布的《“十四五”規劃》中進一步明確要推動數據資源開發利用,擴大基礎公共信息數據有序開放,建設國家數據統一共享開放平臺。目前,國家層面可查的教育數據主要是教育部發展規劃司在教育部網站上公布的自1997年以來的教育統計數據[7],對從幼兒園到高等教育各階段的學生、教職工、資產情況等做了按省分類匯總統計。我國建立職業院校質量年度報告制度,高職院校自2014年起,中職學校自2016年起,每年發布質量年度報告,加強職業院校人才培養狀態數據采集與分析[8]。職業院校質量年報數據雖然對社會開放,多數是學校各自以文本格式發布,數據加工利用的難度很大。
上述這些統計性的數據只是冰山一角,海量的過程性數據還沒有被開放和利用。例如:福建某學校已建成業務系統18套,但與數據中心完成對接的只有30張表、200萬條左右的數據,數據中心數據存儲量不到5 G,這些數據沒有開放給全校師生訪問,管理員從來沒有對這些數據進行分析挖掘,數據基本處于“沉睡”狀態。
調研中發現,職業院校在數據應用上還存在一些問題:1)沒有形成利用數據的組織慣性,需要決策數據時主要來自各業務部門掌握的數據,經常出現各部門數據“打架”的情況;2)學校對數據的價值還不夠重視,如對歷史數據沒有進行合理有效的歸檔保存,多個業務系統甚至運行在普通PC上,沒有數據自動異地備份機制;3)有些包含敏感信息的業務系統還運行在第三方公共平臺上,對于平臺上的數據,學校既沒有管理能力,更無法充分利用,無法掌控第三方平臺如何利用這些數據。
如表1所示,職業院校對數據的開發利用還不夠關注,大多數職業院校數據治理的關注點還在制定數據標準上,只有13.79%的受訪對象認為數據的應用和服務最重要。
2.3 "數據質量低,數據反哺業務發展的能力還沒有形成
數據質量是指數據符合數據消費者的使用目的,能滿足業務場景具體需求的程度[6]。數據的質量直接影響著數據的價值,并且直接影響著數據分析的結果以及以此作出決策的質量,一般從準確性、真實性、完整性、全面性、及時性、即時性、精確性和關聯性八個維度來評價數據質量。在不同的業務場景中,數據消費者對數據質量的需要不盡相同。目前,職業院校數據質量低的主要表現為業務系統中數據的完整性不高。如對照教育部JY/T 1005—2012標準,學生管理數據子集(ZZXS)有23張表230個字段,招生管理數據子集(ZZZS)有四張表37個字段。調研中發現,大部分受訪的中職學校業務系統中只能提供大約1/5字段的數據。有記錄的字段存在記錄不全的問題,如教職工的學歷記錄,有的教職工填了,有的沒填;有的填得比較完整,有的只有最初的一條記錄。其次表現為數據的關聯性不高。數據的關聯性是指各個數據集之間的關聯關系,如果有任何的數據集不能連接到其他數據集,就會存在數據割裂或者數據孤島,各個系統之間除了系統初始化的時候需要依賴其他系統的原始數據,后面的運維過程中就再沒有相互間的數據交換和審核校驗,導致數據質量低下,在實際業務中沒有多少應用價值。
沒有專職數據管理團隊是造成學校數據質量低的主要原因。調研發現,大部分學校的業務系統是由不同的服務商開發和維護的。數據治理隊伍建設情況如表2所示,有完整數據服務團隊的學校只占兩成。
3 "面向價值實現開展數據治理的策略及
建議
美、英、日等國在設立專門的教育數據機構來開展教育數據治理的同時,還通過“政府開放數據計劃”開放國家教育數據(美國政府開放數據平臺:data.gov。英國政府開放數據平臺:data.gov.uk。
日本政府開放數據平臺:data.go.jp),鼓勵對國家數據的開發利用[9]。在整個歐盟,開放政府數據憑借更簡易的數據訪問渠道和更低的使用壁壘最終能夠創造共計2 000億歐元的經濟價值,這占據歐盟整體GDP的1.7%[10]。實現數據資產價值最大化的關鍵在于讓數據容易被發現和使用,學校數據治理工作可以面向價值實現,以學校業務發展是否需要為基點,圍繞數據的開發和利用來展開,具體有以下三方面的建議。
3.1 "從開始就要重視數據安全,推動數據回歸學校
2021年6月,全國人大審議通過《數據安全法》,該法案提出堅持維護數據安全和促進數據開發利用并重,以數據開發利用和產業發展促進數據安全,以數據安全保障數據開發利用和產業發展。教育數據涉及學校師生隱私,尤其要重視數據安全問題,在數據開發利用的同時一定要做好數據安全工作。技術層面需要利用數據加密、數據脫敏、實時熱備、邊界安全、訪問控制等技術來保障數據中心的運行安全,數據中心需要定期采集業務系統的數據,為了避免業務系統數據庫的公網IP地址和賬號暴露,建議業務系統和數據中心最好在同一個局域網內。制度層面需要完善制度建設,通過建立數據安全審查制度、應急處置制度以及定期開展風險評估等措施來化解數據使用過程中的安全風險;對于運行在第三方公共平臺的系統,學校需要防范業務系統數據被非法濫用的風險,厘清和第三方平臺的權責關系,如建立起數據所有、使用單位與應用服務提供單位之間的對等共享通道,推動第三方教育數字化應用的數據回歸學校。
3.2 "把數據作為學校的資產來管理,探索建立數據
資產價值評估制度
在《國民賬戶體系2008》(SNA2008)中,數據庫被劃分為固定資產下知識產權產品的一個子項目,這一劃分為數據資產的核算提供了一定的理論基礎[11]。實踐中,由于數據的動態性以及數據價值量化難,把數據進行資產化管理的單位還不是很多,但數據作為新的生產要素,將成為推動我國經濟和社會發展的重要資源,數據資產化是一種必然趨勢。當前,數據資產化管理可以從四個方面進行嘗試。1)建立數據資產目錄,確定數據的采集、使用、管理部門,并定期開展數據資產清查工作和編制年度數據資產報告。2)做好數據分級工作,按照權限盡可能地開放數據給師生和社會使用。數據只有用起來,才能實現價值,對于屬于自己的數據,更需要可以便利地行使數據維護、查詢和使用的權利。3)嘗試開展數據資產價值評估和交易,通過市場化的手段加速數據的開發和利用,比如以學校數據資產入股開展校企合作。4)設立數據管理崗位,加快形成業務和數據形成共生關系。數據的利用需要一定的數據庫、統計學知識,在當前技術水平下,設置專門的數據管理崗位有利于加快數據的開發利用,加快業務和數據形成共生關系。數據管理崗位主要負責數據規劃和數據的收集、報送以及沖突解決,負責數據確源確權工作,建立合理的數據流動路徑,實現數據內循環。目前,貴州、四川、福建等多個省市已經為大數據從業人員開通專門的職稱通道,今后數據分析和數據管理工作會越來越凸顯其重要性。
3.3 "加快省域教育數據治理,構建省域一體化數據
管理平臺和共享機制
“要運用大數據提升國家治理現代化水平”“要建立健全大數據輔助科學決策和社會治理的機制,推進政府管理和社會治理模式創新”,習近平總書記
的重要論斷,為推進國家治理體系和治理能力現代化打開一條技術賦能的路徑[12]。當代管理學家邁克爾·波特曾指出,信息革命正在橫掃整個經濟體,獲取和處理信息的能力是最重要的競爭力[13]。我國正處于數據智能化和治理現代化的交融交匯階段,現代的信息化技術融合先進的服務理念,能夠推動數字政府進一步發展,助力治理現代化。數據治理在電子政務、醫療健康、金融等行業取得突出成效,教育領域也需要加快數據治理工作[14]。
以數據治理引導教育信息化,實現數據采集全覆蓋、業務系統全覆蓋:1)做好省域教育數據規劃工作,建立省域教育數據標準和模型,確定省域教育治理關鍵核心指標,以核心指標的數據采集、融合來推動整體智治工作,通過數據支撐改變目前按年度進行的發展評價考核機制,建立起長效的實時的教育發展評價機制;2)加強省域數據整合能
力,可以把學校的數據記錄條數作為衡量一所學校信息化發展的關鍵指標,引導學校向省域數據中心開放數據接口;3)校內業務系統的數據共享對于數據的開發和利用作用是有限的,在確保數據安全的前提下加強省域教育信息化平臺的統建力度,推進省域各單位業務系統開放數據接口,有利于加快省域一體化教育教學平臺構建。
4 "結束語
相比電子政務、醫療健康、金融等行業,教育數據的開發和利用還處于探索階段,但數據是現代化學校治理模式建構不可或缺的要素,數據治理的重要性必將越來越凸顯。職業院校的數據治理工作還處于起步階段,但發現的問題和面對的困難已經非常多,關鍵的原因是教育行業數據的開發和利用不夠,數據治理的內在驅動力不足。實現數據資產價值首先要讓數據容易被發現和使用,學校數據治理工作可以在保證數據安全的前提下,從省域層面圍繞數據的開放和利用來展開,通過規范數據標準、完善數據共享機制、提升數據質量、建立數據資產目錄、對數據資產進行價值評估等手段規范和促進數據的開發利用,逐步形成業務和數據的共生關系。
浙江省已經把教育大數據倉建設作為主體單元,納入浙江省教育領域數字化改革工作方案,通過對教育數據的匯聚、治理和分析,必將驅動教育業務和教育管理服務的創新,逐步形成教育業務和教育數據的共生關系,實現數據整合和數據開發利用的良性循環。
參考文獻
[1] 國務院關于印發“十四五”數字經濟發展規劃的通知
[A/OL].(2022-01-12)[2022-03-15].http://www.gov.
cn/zhengce/content/2022-01/12/content_5667817." " htm.
[2] 吳信東,董丙冰,堵新政,等.數據治理技術[J].軟
件學報,2019,30(9):2830-2856.
[3] 許曉東,彭嫻,周可.美國通用教育數據標準對我國
高等教育數據治理的啟示[J].高等工程教育研究,
2019(1):103-108.
[4] 教育部關于發布《教育管理信息教育管理基礎代碼》
等七個教育信息化行業標準的通知[A/OL].(2012-
03-15)[2012-05-13].http://www.moe.gov.cn/srcs
ite/A16/s3342/201203/t20120315_133140.html.
[5] 教育部關于印發《教育信息化2.0行動計劃》的通知
[A/OL].(2018-04-25)[2018-09-10].http://www.mo
e.gov.cn/srcsite/A16/s3342/201804/t20180425_3
34188.html.
[6] 巫莉莉,張波.高校數據治理中提升數據質量的方法
研究[J].重慶理工大學學報(自然科學),2019,
33(8):149-156.
[7] 教育統計數據[A/OL].(2019-08-08)[2020-08-08].
http://www.moe.gov.cn/jyb_sjzl/moe_560/jytjsj_"2018/.
[8] 教育部:2016年起實施中職學校質量年度報告制度
[J].職業教育,2015(10):36.
[9] 劉博文,吳永和,肖玉敏,等.構筑大數據時代教育
數據的新生態:國內外國家級教育數據機構的現狀與
反思[J].開放教育研究,2019,25(3):103-112.
[10] 武琳,劉珺.數據消費與孵化創新:開放政府數據
商業應用發展趨勢[J].情報資料工作,2016(3):90-94.
[11] 馬丹,郁霞.數據資產:概念演化與測度方法[J].
統計學報,2020,1(2):15-24.
[12] 葉戰備,王璐,田昊.政府職責體系建設視角中的
數字政府和數據治理[J].中國行政管理,2018(7):"57-62.
[13] 張鵬,蔣余浩.政務數據資產化管理的基礎理論研
究:資產屬性、數據權屬及定價方法[J].電子政務,2020(9):61-73.
[14] 洪偉,徐峰,任劍嵐,等.省級教育數據治理探索
與實踐[J].中國教育信息化,2020(3):7-12.