文/西南大學檔案館、校史館、博物館 姚恒
當前,隨著“智能”“數字”“網格”等新技術的推陳出新,數據作為國家基礎性戰略資源的地位日益凸顯:國家“十三五”規劃將“大數據戰略”納入其中,國務院2015年在《促進大數據發展行動綱要》中提出要全面推進大數據發展,加快建設數據強國。在這樣的背景下,以大數據為代表的第二次技術環境變遷導致了各行業的業務形態發生巨大變化:如浙江省政府依托大數據實現了“最多跑一次”改革……行業與大數據深度融合實現了跨越式的發展,擁有豐富檔案資源的高校檔案部門也正在面臨著新形勢的挑戰,迫使其踏上智能化、智慧化檔案管理的變革之路。
在以數據驅動為核心特征的大數據環境下,高校檔案管理向智能化、智慧化方向發展已然成為趨勢,而實現該目標所依賴的檔案數據目前還存在著諸多問題。
(一)高校檔案數據管理體制機制尚不健全。管理體制和運行機制是長期有效推動高校檔案數據標準化、規范化管理的保障。2008年8月《高等學校檔案管理辦法》(教育部27號令)第五條明確指出:“高校檔案工作由高等學校校長領導……將檔案工作納入學校整體發展規劃,促進檔案信息化建設與學校其他工作同步發展?!钡珦煌耆y計,真正能夠發揮高校檔案工作委員會協調解決檔案數據問題的高校屈指可數。除此之外,高校檔案部門也尚未與信息化部門建立起電子化檔案數據的歸檔協調機制,導致大量有價值的業務數據無法有效歸檔。
(二)高校檔案數據管理的技術環境尚不完善。從數據的全生命周期管理(DLM)不難看出,高校檔案數據依賴于所處的內外部技術環境而存在,而內外部技術環境的成熟度制約著檔案數據的質量。近年來,各高?!皵底中@”“智慧校園”建設如火如荼,也取得了一定的成效,但由于建設中數據管理標準規范應用不到位、高校信息系統建設缺乏頂層設計、分步實施的規劃性等問題,給檔案數據的真實性、完整性、可用性和安全性等要求帶來了巨大的挑戰。
(三)高校檔案數據的質量不佳。高校檔案數據質量是指高校檔案作為一種數據產品所具有的一系列屬性特征,包括準確性、一致性、完整性、規范性、穩定性等。2009年發布的《電子文件管理暫行辦法》(中辦、國辦廳字〔2009〕39號)也以歸檔電子文件的形式強調了對檔案數據的“真實性、完整性、可用性和安全性”的“四性”要求。目前,高校檔案數據從數據來源看,普遍存在著從各業務系統獲取的歸檔數據準確性和完整性不高、不同業務系統的交叉數據存在差異等問題;從數據類型來看,普遍存在著高價值密度的結構化檔案數據較少,低價值密度的非結構化檔案數據較多等問題;從檔案數據內容看,歸檔范圍尚無法滿足利用的需要,數據關聯性不高等問題。
鑒于高校檔案數據存在著以上問題,而以檔案大數據為支撐的檔案智能化、智慧化管理與服務是第二次技術環境變遷的必然趨勢,因此筆者認為可以引入數據治理手段,通過體系化、規范化治理方法,理順體制機制,優化內外部技術環境,嚴控新增檔案數據和存量檔案質量,逐步實現高校檔案信息化建設的跨越式發展。
(一)數據治理概述。2017年,國家發布《信息技術大數據 術語》(GB/T 35295)國家標準,將數據治理定義為對數據進行處置、格式化和規范化的過程。同年,我國的數據治理模型也應運而生——《信息技術服務治理》(GB/T 34960),該治理模型從頂層設計、數據治理環境、數據治理域、數據治理過程四部分進行了闡述,為組織在實現數據價值的過程中做到運營合規和風險可控提供了方法和思路。
(二)數據治理是高校檔案信息化跨越式發展的需要。當前高校檔案工作要實現跨越式發展,突破口就在于校史編研和檔案大數據服務,而這兩部分重點工作都有共通之處,那就是依賴于對細顆粒度的、具有多關聯關系的海量結構化檔案數據的深度挖掘。要實現這一目標,一是需要對已形成的檔案數據從元數據層面按照國家或行業標準進行規整;二是需要將非結構化檔案數據轉換為半結構化或結構化數據;三是需要多途徑匯集檔案數據構建檔案數據倉庫。以上目標的實現,無不依賴于數據治理。
數據治理作為一個系統工程,涉及決策層、管理層、業務層、技術層等多方協作才能實現,具體而言,主要歸結為構建高校檔案數據發展戰略、完善高校檔案數據治理環境、提升高校檔案數據質量三方面。
(一)構建高校檔案數據發展戰略。數據戰略是高校檔案發展戰略中的重要組成部分,是數據管理計劃的戰略,是保持和提高數據質量、完整性、安全性和存取的計劃,因此需要通過制定中長期規劃和建立工作機構來構建高校檔案數據發展戰略。1.制定高校檔案數據治理中長期規劃。高校檔案數據治理中長期規劃包括高校檔案數據治理總體目標和階段目標、治理理念和治理重點以及分階段的主要治理任務等,其內容需要保持與高校檔案事業規劃、校園信息化規劃一致。通過制定高校檔案數據治理中長期規劃,數據治理工作可以在未來較長一段時間內按照預定的方向穩步推進。2.建立高校檔案數據治理工作機構。工作機構是高校檔案數據治理工作的組織保障,高??梢越Y合自身情況,建立檔案數據治理辦公室,掛靠高校檔案工作委員會或高校信息化建設職能部門,負責檔案數據管理規章制度審議、檔案數據質量管控、跨部門數據協同共享的協調等。
(二)完善高校檔案數據治理環境。發展戰略的構建從宏觀層面明確了高校檔案數據治理的方向,而治理環境的完善則從微觀層面奠定了高校檔案數據治理實施的基礎。完善高校檔案數據治理環境主要包括:檔案數據治理相關規章制度的制定與完善、人員職業技能的培訓與提升、信息系統的改造與優化等。1.規章制度的制定與完善。高校檔案數據治理作為一項復雜、長期的系統工程,規章制度的制定與完善是重中之重。筆者認為可以從標準、規范、流程、指南等方面進行建設:一是梳理形成由基礎和數據標準、管理和安全標準、技術和平臺標準構成的高校檔案數據標準支撐體系,如《數據管理能力成熟度評估模型》《文書類電子文件元數據方案》等。二是結合高校實際制定檔案數據治理管理規范或管理辦法,形成指導業務層面的規范化文件,如高校檔案元數據管理辦法、高校檔案數據質量管理辦法等。三是優化和完善檔案數據治理流程與指南,在操作層面上指導高校檔案數據治理的具體管理措施和技術行為。2.人員技能的培訓與提升。高校檔案數據治理工作涉及決策層、管理層、業務層和技術層,這就需要一支高素質隊伍作為支撐,因此要適應這項工作,人員技能的培訓和提升尤為重要。在人員類型上,高??梢詮墓芾韺?、業務層和技術層分別開展人員技能的培訓;在操作形式上,高??梢圆捎猛獬龆唐谂嘤?、專題講座、職業技能比賽、職業能力考核等多種形式促進人員技能的提升。3.信息系統的改造與優化。大數據環境下,隨著電子文件管理的不斷推進,對涉及高校主要檔案數據源的信息系統進行改造和優化也是高校檔案數據治理的重要一環。從高校信息系統的改造范圍來看,筆者認為除了涉及文書、學籍等傳統檔案歸檔范圍的辦公自動化系統、教務系統外,還可以涉及高校微信公眾號、校園一卡通系統等;從高校信息系統的改造和優化內容來看,主要涉及跨部門的業務流程引擎、數據可信認證等內容,打通高校各信息系統的業務流、數據流,構建起通暢的、安全的、可信的檔案數據流。
(三)提升檔案數據質量。檔案數據質量關乎高校檔案信息化建設的最終效果,影響著高校檔案管理水平和服務能力,同時也是當前電子文件歸檔和電子檔案管理的迫切要求。因此,高校檔案數據治理在完善內外部治理環境后,應該加快提升檔案數據質量。筆者認為提升檔案數據質量主要包括劃定檔案主數據范圍、全生命周期質量控制和提升檔案數據附加值三部分。1.劃定檔案主數據范圍。主數據是關于業務實體的數據,被認為是用于智能分析的“黃金”數據。從GB/T 18894中電子文件的歸檔范圍來看,廣義的檔案數據范圍較廣,要實現全覆蓋的檔案數據治理是不現實的。因此,高校檔案數據治理應根據高校檔案部門的職能范圍、核心工作來劃定檔案數據治理范圍,可以從高校的“人才培養、科學研究、社會服務、文化傳承創新”四大職能為出發點,以教學、管理和校園文化建設形成的檔案數據為主,逐步實現檔案的智能化、個性化服務和數據化的校史編研。2.全生命周期質量控制。數據的污染可能發生在數據產生、采集、傳輸、加工、存儲、交換等各個環節,因此要保證檔案數據治理目標的實現,就必須對高校檔案數據進行全流程的質量管控。在管理層面,可以引入戴明質量環提供的PDMA模型加強高校檔案數據的質量管控;在業務層面,可以通過高校檔案數據過程化質量指標和業務規則來強化檔案數據的標準化和規范化,如參照DA/T 46、DA/T 54等規范檔案元數據項和賦值規則等;在技術層面,可以通過檔案數據質量管理系統等手段來實現高校檔案數據質量問題的檢測、發現、處置、評價的全流程閉環管理。3.提升檔案數據附加值。檔案數據作為一種低價值密度的數據,高校檔案部門要實現智能化、個性化服務和數據化的校史編研等高質量檔案數據的利用需要,除了要求檔案數據的“四性”外,還需要通過各種手段提升高校檔案數據的附加值:可以在保留原有檔案實體分類體系的基礎上,引入新的電子檔案分類體系,以“人”“文件”“項目”等為數據主體對高校檔案數據進行重組優化,實現學籍檔案一人一件,文書檔案一文一件,科技檔案一項一件等;同時還可以在檔案系統中通過數據標簽的方式強化檔案數據的關聯性,實現高校檔案數據的有效組織和管理。