謝 君
習近平總書記指出:“要運用大數據提升國家治理現代化水平。要建立健全大數據輔助科學決策和社會治理的機制,推進政府管理和社會治理模式創新,實現政府決策科學化、社會治理精準化、公共服務高效化。”2015 年8 月,國務院頒布《促進大數據發展行動綱要》,提出“建立用數據說話、用數據決策、用數據管理、用數據創新的管理機制,實現基于數據的科學決策,將推動政府管理理念和社會治理模式進步”。
當今,教育信息化建設正經歷著由簡單到復雜、由單一到多元、由局部到整體的全方位一體化的發展過程。在全面提升自身教學、科研、管理服務水平的同時,高校日益重視快速發展的大數據技術,逐步將其上升為高校發展的重要戰略。大數據與云技術的結合使得教育資源的應用突破了原有格局,通過數據分析、數據挖掘等技術,能夠得出隱藏在其背后的數據信息。如何利用這些數據信息優化教育業務流程,提高服務效率?如何科學地制定決策,實現教育治理現代化?所有這一切,都離不開大數據治理。教育大數據治理體系的構建,無疑將進一步解決高校數據管理過程中的種種困境,并為優化數據質量,提升數據管理水平,實現學校數據資產的有效管理和數據的深度共享提供必要的基礎條件。大數據的深度治理促使教育大數據應用在高校遍地開花,將驅動高校由經驗式教學模式向數據服務教育模式轉變,由以管理為中心的管理模式向以用戶服務為主導的需求驅動模式轉變,由“拍腦袋”的主觀決策模式向數據分析的智慧決策模式轉變。
尤其近幾年,隨著“智慧校園”的落地生根,各高校都在積極打造智慧校園。2018 年6 月,國家標準化管理委員會發布國家標準《智慧校園總體框架》(GB/T 36342-2018),助力教育信息化發展,教育數據治理提上日程。同年發布國家標準《信息技術服務 治理 第5 部分:數據治理規范》,以此標準指導教育數據治理工作的開展,著力解決高校各業務系統長期以來存在的“數據不規范、不統一、不準確、共享難”問題,實現“業務驅動”轉為“數據驅動”,以達到提升數據質量、規范數據使用、支撐教育教學應用與決策的目的。
可見,在教育治理體系和治理能力現代化建設的推進下,高校檔案部門作為教育大數據的擁有者,也正面臨著從傳統管理向現代化數據治理的轉型,并呈現出“撤并與融合”等看似矛盾實則正常的趨勢。大數據時代下,檔案部門需要思考與業務部門、數據部門的協同合作,積極應用數字技術,參與、融合到教育大數據治理體系的構建中,發揮建言資政作用,找到自己的出路,做出自己的特色。
據統計,我校設置學生處、教務處、科技處、人事處、財務處等業務部門共計25 個,其中涉及的業務系統就約有60 個,如OA 辦公自動化系統、學生工作管理系統、數字迎新管理系統、教務系統、教學信息反饋系統、科研管理系統、人事管理系統、財務網上綜合服務平臺等,共計產生1300+張業務表、30000+個字段。這些互相獨立的信息管理系統孤立運行,各自生成大量數據,極易形成“信息孤島”。如何促使這些數字資源得以共享?
檔案部門作為這些業務部門數據資源的最終歸宿,應該以單軌制為契機,提升檔案部門與業務部門的協同合作[1]55。對于高校來說,就是實現檔案信息管理平臺(以下簡稱檔案平臺)與前端業務系統無縫對接,讓各單位歸檔的電子數據可以直接對接到檔案平臺。從技術上來說可行,由系統開發商進行功能模塊設計,增加接口即可。但非常遺憾的是,目前多數高校鑒于安全性等種種原因基本都未啟用電子印章和簽章,這就限制了電子文件的歸檔,阻礙單軌制的實施,并且造成“業務系統形成無章電子版——打印成紙質版蓋章(歸檔)——再掃描成電子版(歸檔)”這一波無奈之舉。
就我校而言,2018 年啟動“數字化檔案信息資源共享平臺建設”項目,目前已完成檔案信息系統的架構設計,并且設置歸檔接口,理論上可與各業務系統進行技術上的對接,但由于電子印章問題,無法進行實際上的對接。基于這種現狀,檔案部門只有做好系統之間技術對接的準備,待時機成熟之際,真正實現與業務部門的協同。
目前,我校已在現代教育技術中心成立信息化建設工作辦公室——數據中心。目標定位是建立校級全量數據中心,制定數據標準,規范數據格式,實現數據共享,為學校教學、科研、管理和服務工作提供基于數據的輔助決策支撐。這不是和檔案部門的大數據管理重合嗎?難道檔案部門真的如一些專家所說今后要撤銷或并入其他部門嗎?帶著這些疑問和思考,筆者認真研讀數據中心的數據資產信息服務平臺(以下簡稱數據平臺)發現,相對于檔案平臺與各業務部門系統對接困難的現實,數據平臺卻已成功對接學校的人事、研究生、教務、科研、學工、圖書館、OA、設備、財務等所有業務部門系統。但是仔細分析,其對接的數據和檔案部門的數據還是有本質區別的。
第一,字段不同。數據平臺對接的數據是學校各項現行數據,字段繁多,重復嚴重。檔案平臺保存的是有保存價值、辦理完畢的數據,字段有所取舍,沒有重復。從數量來看,檔案平臺收集的字段肯定不如數據系統的全面。如,檔案平臺保存的本科教學數據只包括了學籍卡、成績單、錄取名冊、畢業名冊這四個方面,涉及學院、專業、學制、姓名、班級、學號、性別、入學日期、課程名稱、學分、學時、成績、績點、所得學分、評語、畢業設計成績、等級考試成績、畢業證書號、學位證書號等約50 個字段。數據平臺的本科教學數據卻囊括了教務系統的專業信息、課程信息、學籍異動信息、成績管理、校區信息、教師信息、專業信息、班級信息等共計812 個字段。值得考究的就是,這812 個字段并不是全部都屬于檔案保管范疇,但在數據為王的時代,未來財富取決于誰擁有數據資源,所以檔案部門對大數據的定義范疇也正受到“量”的沖擊。從質量來看,數據平臺的數據只是通過初步對接形成的,準確性、完整性、時效性、一致性不足,呈現出“有量無質”的局面。而檔案平臺的數據是經過鑒定流程歸檔后形成的,具有真實性、原始性、價值性,不可替代。
第二,呈現方式不同。數據平臺的數據是以字段形式顯示,更像一個完全意義上的數據庫,只能以表格的形式展示字段信息,停留在目錄級別。檔案平臺的數據是以可視化、固定化的友好界面呈現,除了能以表格形式導出字段信息,最突出的是以文件、圖片的方式。如,展示一個班級的成績信息,數據平臺只能導出一張數據表格。而檔案平臺除了可以導出數據表格,還能以一張張成績單的固化形式呈現信息,體現出檔案的原始記錄價值和憑證價值。也就是說,檔案平臺除了達到目錄級,更具本質意義的是深入到全文級,更有利用價值,這也就決定了數據平臺無法替代檔案平臺。
第三,利用方式、對象不同。數據平臺的數據只能與各部門固定系統對接,導入到系統中才可以查看,并且只能面向校內單位,經過申請審批后才可以查詢,流程煩瑣。檔案平臺的數據是可以直接利用的原始數據,面向社會,可通過上門、來電、來函等方式查詢,更加靈活方便。
教育大數據治理的核心就是利用。數據平臺的數據卻面臨著不可知、不可控、不可取等諸多問題,并不能代替檔案資源進行利用。相反,檔案部門一直以來都在執行檔案開發利用工作,經驗豐富,應主動承擔起把握教育大數據利用范圍和方式的重任,實現數據平臺的數據為檔案平臺所用。
數據挖掘是人工智能和數據庫領域的熱點問題,是指從數據庫的大量數據中揭示出隱含的、先前未知的并有潛在價值信息的非平凡過程。數據挖掘是一種決策支持過程,它主要基于人工智能、機器學習、模式識別、統計學、數據庫、可視化技術等,高度自動化地分析數據,作出歸納性的推理,從中挖掘出潛在的模式,幫助決策者減少風險,作出正確的決策。其中,數據粒度是指數據的細化和綜合程度。根據數據粒度細化標準,細化程度越高,粒度越小;細化程度越低,粒度越大。數據粒度細化值直接影響數據轉換成信息再轉化為知識的進程,以及輔助教育決策和教育信息化管理的進程。
高校檔案部門保存著大量高價值的教育大數據,但一直以來都是粗顆粒度開發,并未充分挖掘出檔案數據中的有效信息。教育大數據治理環境下,應對這些數據進行語義級細顆粒化開發,從以往的全宗級、案卷級和文件級管理轉向語詞級的管理[2]23,以實現教育大數據治理,助力高校進行科學決策。
綜上,檔案部門作為教育大數據的提供者、參與者、開發者,應當積極參與融合到教育大數據治理體系的構建中,實現教育決策科學化、校園治理精準化、公共服務高效化。但從實踐和技術來看,目前檔案部門參與教育大數據治理的水平和能力還有待提高,需要加強自身數據管理能力,加快與業務部門和數據部門的協同合作,開創參與教育大數據治理的新局面。