林宇帆 卜心田/浙江開放大學
檔案治理著重于攻克數字化時代檔案信息化等關鍵難題,通過信息化檢索工具,融入現代化、信息化數據管理模式,更加精準、有效、客觀地向社會大眾開放檔案[1]。而在高校檔案治理中,有以下數據問題:一是檔案數據資產歸屬不明。具體表現在高校檔案數據雜亂繁多且存放于各級學院與部門,源頭數據發布時間、質量、準確度、歸口部門、責任老師等信息不明確。二是檔案數據標準規范缺失。不存在統一代碼標準、程序規范、數據治理等管理制度。三是檔案數據質量參差不齊。缺乏數據質量準入和考核標準,對于矯正與提升檔案數據質量的支持不充足,檔案數據難達到最低使用要求。四是檔案數據共享機制落后。受傳統檔案管理模式慣性影響, 檔案信息資源建設與服務的傳統思維弊端依舊存在,檔案數據的流通性極低且都是以被動共享的形式被其他部門所了解,缺乏時效性與準確性。
針對上述問題,基于數據中臺的高校檔案管理系統的解決模型要素可被歸納為以下幾類:人才隊伍建設、資源整合投入、高新技術支持、系統數據梳理、扶持機制完善。高校首先應做好檔案信息化人才隊伍建設,開展檔案信息化、數據中臺等其他實用新型工具的相關使用培訓。檔案數據資產歸屬不明主要體現在對接OLTP(事務處理)和OLAP(報表分析)的基礎過程中,相關使用培訓可在源頭環節減少歸屬不清的OLTP。為改善檔案數據標準規范缺失及檔案數據質量不佳的弊端,高校可依托高新科技企業,建設數據共享平臺,這是平臺建設投入的可取方式,平臺應包含數據可視化、用戶畫像BI分析等決策支持模塊。推動檔案數據質量整體進步的關鍵是匹配支持數據中臺的高新數據處理平臺工具,如Hadoop及阿里的odps[2]。高校數據在進入數據中臺前,可根據隱私等級實施對稱或不對稱加密,并通過標簽設置進行初步分類。進入中臺后,在海量共享數據的收集基礎上,通過一系列數據清洗、定向分類,豐富數據字典和數據倉庫,進一步擴充中臺數據維度和廣度。系統數據梳理方面,在數據模型管理的輔助下,高校可進一步規劃管理元數據與主數據,做好表管理與數據集管理。高校檔案數據要確保能轉化為數據資產,在經過計算邏輯封裝后通過API接口等形式對外開放服務并支持業務系統的便捷使用,數據可轉化為服務能力,最大程度釋放數據價值,反向激活整個數據中臺。還可配備相應的扶持機制并主動完善已有的數據保護機制。其中,動態反饋和效果評估機制是對檔案質量的矯正保障,在ETL數據處理的過程節點中就做到必要的矯正干預,從而節約處理成本。另外,數據安全處理與應急機制為服務網絡編研建立起網絡安全屏障。
數據中臺通過數據服務化的流程,進一步減少數據的重復加工,提高數據的共享以及復用能力,從而盤活數據平臺及管理體系。在搭建研發全過程視圖過程中,增加涉及數據清洗和篩選的數據治理流程,以及對服務化升級的數據處理步驟。中臺通過有效聚合與治理,將海量數據抽象封裝成數據服務,并提供給高校業務系統使用。在統一數據中心中間件的銜接下,通過垂直數據中心、公共數據倉庫以及內部數據中心的相互配合,中臺對高校核心業務主體結構進行統一數據模型管理。中臺在高校檔案模型建構中,從數據標準、數據分析、數據交互、用戶畫像、BI分析中心、關聯預警、模型管理等方面發揮作用。隨著數據模型和流程學習更為豐富飽滿,中臺成為提供標準化數據資源的有效手段,同時也是后期海量數據共享共用的工具基礎。在數據中臺的運行保障和平臺的正向循環運維下,高校檔案管理系統在技術、機制、人力、資源的協調配備下,可逐步適用于以下5個高校場景模塊:數字黨建、數字圖書館、數字校務、數字科研及數字資源。

圖1:高校檔案管理系統模型技術架構圖
以現有的釘釘云上黨建為例,高校黨建模塊主要分為門戶管理、活動管理、會議管理、黨務工作、學習管理,呈現給用戶最多的是門戶管理。數字黨建主要完成黨委空間、總支空間、支部空間、個人空間、駕駛艙大屏、數據歸檔以及相應的后臺支撐功能。因此建立和完善一套高校黨建中臺數據標準迫在眉睫,可涵蓋定義、操作、應用多層次數據,分為基礎性標準和應用性標準。在中臺數據標準基礎上,堅持“一數一源”原則,確立黨建數據確權規則,深化黨建主題數據倉的數據歸集,實現黨建數據的統一運維和共享,建立有效聚合、共用共享、追蹤溯源的高校黨建數據共享服務機制。在中臺數據統計方面,根據個人黨員學習情況、支部活動和學習教育參與情況、志愿者服務情況等生成個人黨員積分數據,根據黨員積分數據、黨員發展數據、黨建活動數據、黨建考核數據和黨建輿情數據等,生成集體黨建指數。在中臺數據分析方面,實現關聯分析、預警分析、趨勢分析,根據高校需求自主拖拽統計數據實現相關數據分析,智能預測關鍵指標近期發展趨勢,預警提醒采取干預行動,實現對高校黨建數據精準督導。通過事先設定彈性數據指標,中臺通過云計算實現各類黨建工作數據自動預警、主動提醒和及時反饋。基于關鍵指標的歷史數據,數字黨建進一步搭建基層黨組織和黨員畫像檔案庫,強化數據挖掘深度與維度,實現自動用數據對基層黨組織和普通黨員精準畫像,繪制各類性格標簽。該檔案庫可有效掌握學校黨員的思想認知、工作作風、能力水平、黨性修養等信息,服務高校精細化人才管理模式,并可針對不同性格標簽的黨員開展個性化黨員教育和相關職務調配。數字黨建還涉及針對中層及以上領導干部的干部檔案管理庫的建設與運維,信息類型除包含與黨員情況類似的基本情況外,校外工作經歷、職務任免等隱私性強的考核信息也被涵蓋。
隨著圖書館每日吞吐的數據量急劇飆升,涉及數據的品類和形式也日趨豐富,傳統運行機制顯然難以滿足。因此,人們提出了數字圖書館的創想,它是用數字化高新工具處理并篩選各類圖文文獻材料的多媒體相關的分布式數據處理平臺[3]。在數字圖書館的搭建基礎上,從中臺數據共享角度,高校圖書檔案數字管理模塊重新梳理可提供的綜合功能,包括用戶訪問、數據管理、資料編目、利用查詢、安全運維等。用戶訪問可沿用高校之前的統一門戶跳轉單點登陸的方式,內網用戶實現一鍵式快捷登錄;外網用戶通過vpn設備實現安全校驗。中臺管理主要涉及對圖書檔案的過程數據資源二次處理、存放、引用等。一是將原有紙質檔案轉化為易維護的電子版本,二是對電子檔案做好存儲、編目、借閱管理。按照國家和高校有關規定,過程中還涉及對業務系統及數據庫的維護、開發和數據備份工作;數據庫資源、網絡資源的建設及日常維護工作;圖書館Web網頁及移動端的建設和日常更新、運維工作等。其中,隨著數據處理插件的日漸進步,有關數字圖書檔案版權的侵權行為變得隨處可見。因此在前期數據錄入中臺前做好版本管理和版權人明確變得尤為重要。應在獲得電子授權的基礎上進行數據編輯工作,并明確版權人及錄入負責人。資料編目、利用查詢功能可參考原先的高校圖書館編目規則,并在編目中增設查詢關鍵詞搜索子功能。利用查詢上可對電子圖書檔案劃定精確的關鍵詞管理,用戶可通過檢索相應明顯關鍵詞獲得與之密切相關的文獻資料。模塊同時提供在線咨詢服務和光盤檢索服務,服務用戶檢索查詢到所需的數據文獻。
高校的業務缺乏細致數據梳理以及后期的流程檔案管理,導致出現電子簽章流程混亂及與線下流程互相矛盾的情況。為響應高校“最多跑一次”的數字改革,齊全校務功能建設,提升網上辦事效率,高校校務流程檔案管理模塊勢在必行。該模塊需借助數據中臺完善與各類業務系統的數據認證對接,包括公文、數據申報、數據分析等系統。該模塊在界面設計上需最大程度與業務系統對接,界面上初步設定排列以下板塊:上線辦事流程、流程審批事項、處理流程總耗時、校內公告、一周安排、公文處理。以“日常報銷審批”為例,需填寫預約單號等報銷事由,經過是否會簽、實物購置的判別,到達經費部門負責人審核、財務審核,最后閉環回到申請人閱知。此類高校業務部門涉及的流程繁多,需在前期調研過程中充分了解相關需求,做好數據流程梳理工作,使電子流程真正替代原有線下流程并循環使用起來,在后期以教職工工號為存儲標簽歸入數據中臺管理。在數據中臺的管理存儲中,對類似流程可采用數據歸納收集,統一測算流程報表,在后臺中導出子節點流程具體數量,以及對處理流程總耗小時數的精確掌握,做到流程量化、工作量可預估。在中臺數據分析上,進一步為業務部門流程工作量的精確把控提供數據支持,輔助高校管理層了解業務部門的涉外流程實際數量及現階段的工作重點,可有針對性地進行業務側重及資源投入調整。同時,于高校校務而言,滿足教職工移動辦公需求的移動端建設也需中臺的數據服務支撐,要求與PC端的校務流程保持實時數據交互。
按《高校科研經費監督系統數據規范1.0(試行)》要求,數字科研進一步延伸系統數據的梳理工作。在原系統基礎上,嵌入科研檔案預警監督模塊,并通過與財務、采購及人事管理系統等對接,構建數字科研數據資源池,實現數據互通共享。在模塊上增設數據監督平臺,在中臺原有模型基礎上設計對應預警模型,開展與中臺的數據分析、歷史比對;完善問題處置流程機制,將異常狀況按照分管部門、程度情況分級分類地推送至高校各部門開展核實處理,從而形成覆蓋數字科研全周期的科研檔案監管平臺。系統數據梳理的歸集數據步驟,遵照全員、全量、全流程、全要素的原則,同步推進監察、人事信息共享。中臺資源池應包含以下基礎數據元素:科研機構、項目人員、具體項目信息等。中臺服務于模塊建設,梳理監督需求,建立預警規則,不斷充實問題需求清單,打造高質量的預警模型集群。預警模型的初期建設需找出高校科研與違紀問題之間的因果關聯,建立分色塊預警模型。預警模型清單需根據學校自身情況進行定制,數據元素包括預警模型名稱、預警規則、數據基礎邏輯關系、對應處置單位等要素。
為規范模塊使用,高校還應建立科研人員檔案中臺信息庫,對存在違規行為的科研人員向歸口部門發出預警,為責任單位的審批提供依據。科研檔案數據共享和加密機制的完善也是必要的機制支持,按照上層部門的數據要求,通過高校DSC大數據鏈路系統向總倉傳輸科研檔案數據,并提供較完善的數據加密機制,確保科研數據存儲和傳輸的安全性。該模塊在管理模式上采用中臺分級分權的規則,對不同級別用戶默認限制不同操作權限和數據訪問范圍,并可根據學校實際情況靈活調整。模塊的架構設計兼容各類系統升級,并根據中臺用戶畫像提供匹配的操作界面。
課程資源檔案共享模塊的邏輯設計可參考杭州國家版本館。在保障數據安全方面,該館承擔中央總館的異地容災備份,并作為江南地區的版本檔案匯聚中心[4]。該模塊的中臺應用為資源檔案中心,為高校學習者提供多元化資源、多終端課程、多媒體教學、個性化學習的數字資源檔案支持,涉及人才培養方案、課程注冊、學生照片管理、學籍數據統計、畢業結果統計等。在課程注冊及學生注冊的基礎上完善學籍管理,可存儲并自動查詢檔案中心的學生學籍信息,并批量導入學生入學和畢業照片,做好照片的檔案分類管理。學籍數據統計和畢業結果統計則使用中臺的BI分析中心,從不同數據維度統計具體招生及畢業情況。在模塊的框架搭建上,統一學習門戶與標準體系,為各類數字資源平臺的功能對接提供統一API,聚合數據中臺,實現檔案、資源和數據的共享。在相關高新工具的運用上,模塊重點研究基于中臺規則的個性化推薦和基于協作過濾的數據分析。前者利用數據挖掘來記錄學習者的個人資料、瀏覽規律,以及關鍵詞的資源搜索,不斷擴充設置的規則,從而根據學習者的專注狀態、瀏覽興趣等相關行為數據推薦匹配的學習資源并歸入數據中臺的運維。在中臺的學習規則完善后,可自動為其他相似學習者推送個性化的學習資源。后者通過資源檔案中心主動記錄學習者的學習狀態,包括登錄時長、有效學習時間、論壇交流情況、師生在線溝通情況、積分累計情況等。將不同空間與時間的數據納入檔案數據中臺,研究基于協作過濾的數據分析,更深層次地對學習者的相關數據進行挖掘處理,為學習者提供改進在線學習建議,并為數字資源的形式升級提供決策依據。在扶持機制上,高校注重課程資源的實時開放共享,轉化精品資源為數據資產并投入市場,最大化地發揮數據資產價值。
數據中臺的本質是整合建設一套可讓數據真正有價值的機制,匹配可協調資源,做到從根本上提高數據質量,從源頭上節約數據運維成本,從機制上協同業務系統[5]。隨著模型和流程學習更為豐富飽滿,上述基于數據中臺建構的高校檔案系統模型場景也為未來高校檔案治理提供了新的思路與路徑參考,以數據引領高校檔案信息化,緊跟國家信息化戰略。