侯雪川、杜晴、吳俊杰 /航天科工防御技術研究試驗中心

保存大量的檔案資料是檔案業務部門最顯著的特色之一。檔案作為一種原始的基礎性記錄,包含各種信息與知識。在蓬勃發展的信息時代,信息已成為一種資源。如何根據社會或企業的需要,借助現代化手段和專業方法,分析、挖掘檔案資料中所蘊含的大量有價值的信息,已成為檔案資源開發利用的重點方向。檔案資源的開發主要包括編目、檢索、編輯與研究等,隨著互聯網、大數據、云計算等信息技術與各項事業加快融合,“中國制造2025”和“互聯網+”行動持續推進,檔案信息化與檔案信息資源集成、整合、利用成為發展趨勢,深刻影響檔案工作的理念、技術、方法和模式。如何確保檔案屬性的完整,保證檔案業務的嵌入,如何再造檔案工作流程使其滿足數字化、網絡化、智能化環境下的工作需求,如何創新思路,使檔案工作提供更加全面的信息、更加精準的服務、更加可靠的數據,是各單位轉型升級發展對檔案工作提出的迫切需求。同時,根據現實需要,系統、有效開發檔案資源,產生新的生產力、新的知識、新的社會效益、經濟效益,是檔案部門提高自身價值和專業水平的必經途徑。
本文結合某企業檔案管理工作中存在的難點和堵點,梳理、分析檔案管理信息化建設,選取元器件質量專題歸檔數據作為研究對象,對檔案信息資源開發利用進行了嘗試。
通過對檔案信息資源現狀進行梳理與分析發現,受到檔案資源分散性、歷史性和原始性的影響,與國內許多企業情況類似,該企業的檔案資源利用過程中主要存在以下問題。
深入開發檔案信息的前提條件是檔案信息資源必須進行一定程度的數字化、結構化以及資源有序化。許多企業對館藏檔案存量陸續開展實施數字化掃描。一方面促進了檔案資源的結構優化,另一方面增強了檔案資源的利用效率和服務水平。隨著企業或利用者對檔案服務要求的提高,檔案資源服務已無法局限于閱覽、憑證。單純的數字化掃描或著錄、標引等處理方法的數據加工途徑,已無法充分挖掘檔案中有用的潛在信息,進而有效發揮檔案的更大效能和價值。
檔案存儲位置分散,有些存儲在信息系統中,有的則分散到傳統聲像載體中,大部分領域由于歷史及客觀原因,受制于當時較為有限的信息化支撐程度,檔案資源以紙質文件形式進行存儲。檔案信息類型可分為結構化數據和非結構化數據。其中,結構化數據主要為各個工程或應用系統中歸集的業務數據。非結構化數據主要包括各類歸檔的工程試驗報告、管理類文件、科研實驗過程中產生的各類圖片等。隨著企業智能化改造的不斷推進,大量音頻、視頻數據也在不斷生成并納入到檔案資源范疇中。位置分散、格式多元,無法進行高效統一的資源管理,對信息的沉淀、應用、共享、利用等工作造成很大困擾。
深入開發檔案信息的前提條件是檔案信息資源必須進行一定程度的數字化、結構化以及資源有序化。許多企業對館藏檔案存量陸續開展實施數字化掃描。一方面促進了檔案資源的結構優化,另一方面增強了檔案資源的利用效率和服務水平。隨著企業或利用者對檔案服務要求的提高,檔案資源服務已無法局限于閱覽、憑證。單純的數字化掃描或著錄、標引等處理方法的數據加工途徑,已無法充分挖掘檔案中有用的潛在信息,進而有效發揮檔案的更大效能和價值。
隨著信息技術的飛速發展,各單位信息化建設不斷走向縱深。多類管理、工程信息系統建立,與檔案管理的系統集成,對檔案信息資源進行了有力的充實與提升。信息系統的不斷完善帶來了檔案業務數據量的激增,數據資源呈現出數據量大、結構多元化、數據增長速度快等特點,傳統的檔案信息資源管理平臺已經難以應對。早期信息化建設缺乏統一的規劃,多以迅速實現功能為主要目的,缺乏全局考慮,造成了原始數據分散、標準不一、數據廣度不夠和顆粒度較粗等問題。
在傳統概念中,檔案業務屬于相對封閉、獨立的狀態。在大部分企事業單位的機構配置中,檔案部門多被賦予基礎、保障職責,檔案信息資源的積累環節通常置于業務流程的末端,而檔案資源開發利用意識的不斷深化,歸檔過程中的“前端控制”勢在必行。這就需要在前端嵌入檔案相關標準,制定業務性規范,將檔案信息資源管理的頂層方案提前納入單位信息化建設總體規劃當中。同時,企業檔案信息資源管理工作的規章制度,各級職責的分配、協調,高素質專業人員的配置,配套條件的落實等距離實際需求均尚有差距。

圖1 檔案信息資源管理平臺功能架構示意圖
一是依靠現有檔案信息化基礎設施,引入先進的信息技術手段。建立完善檔案信息資源管理平臺;持續完善數字檔案資源建設,將電子文件接收、傳統載體檔案數字化轉換、信息資源有機整合、各類專題資源庫建立等納入例行常規性業務,不斷升級、豐富企業元數據庫和檔案全文數據庫,促進企業數字檔案資源體系深入、完整。
二是全面整合分散的電子信息資源,消除數據孤島現象,實現檔案的收、管、存、查、用自動化管理。建設數據資源集中、集約的管理模式;加快檔案信息化步伐,將檔案信息化納入單位信息化建設總體規劃及智能化改造專項建設,盡快解決檔案管理系統與辦公系統、業務管理系統、工程應用系統等的對接集成與資源整合,著力推進新增檔案結構化、數字化,加強數據關聯分析與集成化利用。
三是建立完善的數據協同方式,加強應用系統之間的數據融合。以數字檔案信息資源網絡化管理為手段,不斷拓寬信息資源利用的渠道,不斷提升信息資源共享服務的水平。
結合企業特點,對檔案信息資源進行整體梳理,形成一體化數據收集。明確各類信息資源重要程度、分類、內容、形式、顆粒度、來源,綜合考慮利用價值、數據完整性、收集工作量、關聯性等因素,準確定義各相關信息字段的含義、類型、長度,針對各個數據項的表述方式做出規定,統籌研究制定數字檔案數據采集規范、工作方法和實施細則。
以利用需求為依據,按照先進性、完整性和可調整性的原則,借鑒和采用成熟、相關的標準規范,著眼于檔案工作的發展,研究制定符合業務需求、利于后續開發利用、切實可行的標準規范體系,例如《檔案數字資源加工規范》《電子文件元數據標準》等。通過一系列規則的貫徹與實施,為各類檔案信息實體的科學收集、有效整理和規范加工提供指導,同時促進多元化檔案信息資源的組織協調。
健全檔案信息資源開發機構,突破傳統觀念,靈活優化檔案業務隊伍知識結構、技術技能。以單位實際應用場景需求為導向,補充具有信息化、專業知識等背景的信息資源開發人才力量,配套以制度保障、激勵措施,為檔案信息資源開發注入新活力,加速檔案信息增值。
在實際館藏存量檔案數字化過程中,應結合專業背景,以實際利用需求為切入點,多方式引入信息技術手段對存量檔案進行數字結構化處理,以期優化檔案信息資源的挖掘、加工、處置、存儲和利用。數字化加工、轉換的對象包括各類信息系統中形成并歸檔的電子文件、多媒體文件、紙質文件等多元格式載體。不同的數據格式運用不同的信息加工手段,并以數字形式進行存儲,盡可能地將檔案中的信息單元與數據分解,單獨析出、數據清洗,最大限度地提出檔案中的信息。建設豐富、集中、系統而有序的檔案數字信息資源庫,成為數字檔案平臺、搜索引擎的基礎。
對檔案信息資源增量實施數字化、結構化采集過程中,統一對各類數據的理解和使用,進一步推動數據的規范化和標準化。通過智能化改造、信息化層面的建設與升級,打通應用信息化系統間的壁壘,為知識數據收集、管理及后續應用提供基礎。由于檔案管理系統與工程應用、業務管理系統的陸續集成,電子文件歸檔已成為趨勢,標準規范的建設對于檔案數據集成至關重要。企業進行各類型數據集成過程中,需要采用通用性強、應用廣泛的集成協議,包括集成協議、集成接口設計、數據交換規范、異常處理規范等,避免個性化集成協議造成集成接口不通用、后期維護和使用困難。
某單位為元器件可靠性試驗檢測機構,試驗檢測檔案是該類型企業的主營業務活動產物中最重要的部分。元器件種類繁多、專業性強、涉及多個工程應用項目,其數據信息呈現“基數大”“類型多”“分布散”的特點。數10年積累的歷史試驗檢測資料所含信息極為龐雜,
某單位為元器件可靠性試驗檢測機構,試驗檢測檔案是該類型企業的主營業務活動產物中最重要的部分。元器件種類繁多、專業性強、涉及多個工程應用項目,其數據信息呈現“基數大”“類型多”“分布散”的特點。數10 年積累的歷史試驗檢測資料所含信息極為龐雜,如何根據目前單位的實際利用需求,對歷史檔案信息進行系統的、針對性的采集、梳理,依托大數據等技術分析手段進行數據關聯、數據挖掘,支撐智慧決策,助力企業發展,成為該單位面臨的問題。為此,企業依據物資裝備、供應鏈物資編碼規范,設計電子元器件質量可靠性信息管理規范等,建立了元器件可靠性試驗工程試驗系統,并已完成與檔管理系統的系統集成,數據收集的范圍、質量及管控能力得到保證;依據前期統籌策劃,檔案部門有計劃性地針對一部分庫存檔案進行了有效數字化處理,實現了潛在信息的分解與結構化。該業務數據資源已經具有結構有序化、系統化、規模化等特點,同時兼有較高的數據廣度和更細的粒度,具備較好技術的支撐條件;通過資源調配,檔案、信息化和質量與可靠性專業有機融合,以圍繞專業能力主線、挖掘內部專業數據價值、推進數據價值轉化為研究目標,結合實際應用場景,對元器件可靠性試驗檔案信息資源應用及利用進行了嘗試性研究工作。
具體應用案例:以積累大量的元器件復驗、篩選、DPA、失效分析、質量問題等數據資源,以及元器件新品替代信息、顏色信息、供貨穩定性信息、合格供應商/制造商認定信息等數據為基礎,建立元器件質量數據檢測分析專題數據庫;同時對數據信息進行有效分析,建立供應商評價模型,初步建設甄選機制,如圖2、圖3 所示。

圖2 元器件質量數據檢測分析階段數據流示意圖

圖3 供應商評價體系示意圖
傳統歷史檔案中分散、龐雜、原始的現實狀態與集中、規范、系統分析利用的要求仍存在巨大的差距。實際在具體實踐過程中,僅為歸檔數據單一專題業務領域的初步探索,數據分析通常是較為片面的、簡單的統計或多維分析,數據背后隱藏的大量信息未得到充分的發掘和利用。信息時代下賦予檔案管理更多開發與利用的職責是檔案部門面臨的新任務、新挑戰,將引導企業今后在信息化建設頂層設計、專業能力配置、知識資源統籌、制度保障和激勵措施配套等方面重新進行考量。