王永梅 張 穎
(江蘇省電力公司,江蘇南京,212400)
近年來,電力系統檔案數字化發展趨勢愈發明顯,信息技術的應用已成為提高檔案管理效率、促進檔案規范管理的重要手段和途徑。檔案編研本質上是對數據的分析、整理和再加工,是對原始檔案信息價值的進一步挖掘,通過加工整理使一些不系統、零散的檔案更加系統化、條理化。檔案編研工作主要目的是方便檔案的利用、擴大檔案的影響,是為領導決策提供依據、為業務部門提供信息支撐、為用戶提供針對性服務的有效途徑。目前江蘇省電力公司檔案系統條目數據達1371 萬余條,數據存儲量11.5TB。文檔信息數量巨大、類型繁多,通過人工整理無法及時發現有用信息并進行分析研究,傳統的檔案編研服務顯然已經不能再滿足企業發展的需求。然而,與之同時大數據時代也為海量數據信息價值的發揮提供了良好的契機與支持。我們需要正確認識檔案電子編研工作的必要性及其重要價值,積極探索檔案編研管理的信息化、科技化和數字化的發展軌道,為企業縱深發展提供重要支撐。
國家檔案局在《全國檔案事業發展“十二五”規劃》中提出的任務之一就是加強檔案編研工作,挖掘檔案信息資源,開發、提煉檔案信息產品,出版檔案史料匯編,把“死檔案”變成“活資料”,努力把“檔案館”建成具有特色的“思想庫”;通過網絡平臺和媒體發布檔案信息,檔案利用工作向基層延伸,逐步開展遠程共享服務。基于這些要求,企業檔案編研的價值主要體現在三個方面:
第一,企業檔案編研工作是企業提升自身發展水平的重要手段。企業檔案是企業在各項活動中形成的歷史記錄,在企業生產管理經營過程中起著不可或缺的參考和憑證作用。在企業改革和發展的新形勢下,做好檔案編研工作,盤活檔案信息資源,是讓檔案能夠更好地服務于企業活動的重要舉措。
第二,企業檔案編研工作是企業歷史文化傳承的重要渠道。企業檔案部門對企業活動中形成的各種材料進行集中統一的收藏、整理、保管與提供利用的過程,就是企業文化不斷積累、傳承和發展的過程。通過檔案編研,企業文化得以形成、傳播,對內可以增強員工的凝聚力、自豪感、責任感和使命感,對外可以顯示企業核心文化價值,提升企業的知名度。
第三,企業檔案編研工作是企業檔案工作價值的重要體現。企業檔案經過科學的編研整合,一方面,能夠豐富企業檔案室藏,增強企業檔案部門的檔案信息服務能力;另一方面,編研整合后的檔案信息可以更好地發揮原始檔案的價值,幫助企業上下更好地認識檔案工作對企業發展的重要作用,為企業檔案工作贏得更多的認同與支持。
1.傳統檔案編研的主要做法
雖然目前我們開發了檔案信息系統,也通過實體借閱、系統檢索展開了檔案利用工作,但還沒有充分意識到深層次挖掘檔案信息價值的重要性,目前檔案部門的工作重點依然停留在檔案的收集、整理、歸檔及提供普通利用服務等基本環節。傳統檔案編研主要依靠檔案工作人員及相關專業人員手工來完成,主要包括兩方面內容:
一是整理與集合。檔案部門在完成檔案的收集、整理等基礎工作的同時,圍繞企業工作重心,對頻繁使用的依據性文件進行匯編,對檔案中具有實用價值的信息進行抽取、整合,形成檔案編研材料。
二是分析與研究。按照選定的專題,對檔案資源進行深層次加工,通過編研人員自身的觀點、看問題的角度和解決問題的方法,對檔案信息進行挖掘與拓展,形成有借鑒意義的綜合分析或專題研究材料。
2.傳統檔案編研成果的種類
通過對各市供電公司檔案編研情況進行調研,統計目前共有各類編研材料390 種,累計4000 萬字。(如圖1)
傳統檔案編研成果的種類主要包括:
一是文件匯編。各類重要文件、標準規范匯編,涉及范圍較為廣泛,包括規章制度、人員任免、榮譽匯編等,主要為依據性編研材料,起到查考作用。
二是記錄資料。記錄和反映本單位基本情況、重大事件和主要生產經營活動及其成果,用于概要性介紹或一般性宣傳,包括大事記、組織機構沿革、工程簡介、工作報告專集、年報、電力工業統計資料等,主要起備查和提示作用。
三是研究材料。對企業發展具有一定研究價值的檔案材料編研,包括史志、專業手冊、經濟活動分析、設備運行分析、運營診斷分析等,起到專業研究和為領導決策提供參考的作用。(如圖2)
3.傳統檔案編研存在的問題及分析
在信息時代下,傳統檔案編研主要依賴于人工完成,這造成了許多問題,主要包括:
一是編研質量不高。目前檔案部門人員的知識結構并不盡如人意,檔案專業的人員較少,專業過于單一,綜合素質不高,思想觀念較為保守,很難意識到檔案編研工作的重要性,充分挖掘檔案信息的深層價值;另一方面,檔案工作人員普遍年齡較大,其中50 歲以上占28.67%,40-50歲占41.26%,僅能完成各類檔案的日常整理和入庫工作,進一步開展檔案編研的力量不足。這些因素使得企業檔案編研工作中存在“編多研少”的狀況,且題材單一,數量偏少,實用性不大,信息挖掘深度及開發利用程度并不理想。
二是時效性不夠。傳統檔案編研是在檔案節點后的一段時間,需要利用人力進行選題,對檔案信息進行收集、整理、加工的工作周期較長,使得編研工作大大滯后于企業對于檔案信息的利用需求,無法及時地為企業工作提供參考。
三是利用率不高。傳統的檔案編研方式是通過對大量檔案的查閱、整理、編輯、歸納,形成文件匯編,其產品形式固定,表現形式單一,傳播范圍有限,并沒有充分發揮數字化時代下的技術優勢,使得檔案編研產品往往難以獲得理想的利用效果。
檔案編研可以被看作是一項由檔案工作部門加工、研究、輸出檔案信息,最終實現主動全面地向目標用戶提供針對性、系統性的檔案信息服務的工作。大數據時代已經到來,對信息資源的開發利用能力已經成為企業競爭力的重要體現。基于企業快速發展的需求及長遠利益的實現,我們需認識到檔案智能編研的緊迫性和必要性。

圖1 江蘇省電力系統檔案編研情況統計圖

圖2 江蘇省電力系統檔案編研種類統計圖
1.應用大數據技術,全面提升檔案編研價值
大數據對企業發展的影響絕不僅僅局限于技術層面,它為我們提供了一種全新的方法,檔案編研加工有人力加工變為半自動化生成,更多的決策行為將基于數據分析,而不再是憑借經驗和直覺做出。從浩瀚的數據中提取有價值的信息變為可能,通過對檔案內容進行采集、整序、分析、加工而綜合制成的檔案電子編研產品,將檔案承載的信息從靜態的紙質轉為動態形式,從而實現深層次、多元化、實用價值高的開發編研。
2.應用大數據技術,全面提升檔案編研效益
處理速度快是大數據區分于傳統數據分析的最顯著特征。只有實現快速處理各種數據,才能及時挖掘信息價值并保證其短期內被利用,否則很多信息都將因為加工周期過長而喪失利用價值。大數據時代使得檔案信息快速的收集、整理、加工變為現實,這一環境下,檔案電子編研更能滿足當前企業發展的新形勢。
3.應用大數據技術,全面拓寬檔案編研平臺
公司各單位檔案信息化和數字化工作已啟動十多年,數字化檔案信息日益增多。檔案編研只需確定合適選題,即可進行相關素材的檢索,從整個公司系統得到相關信息。可以講,大數據時代的檔案編研,其工作平臺不再局限為某個單位室藏檔案,而是整個公司系統乃至整個社會公開的聯機檔案數據庫中的電子信息及其他相關信息,檔案編研也可以做到文字、聲音、影像、圖片等多種形式并用。同時,數字化形式的編研成果也能大大縮短分散式查找利用檔案信息的時間,最直接有效地服務于利用者,提高檔案利用效率,加快推進工作進程。
大數據技術,是從各種類型、未經加工的海量數據中快速獲得有價值信息的技術。目前,數據采集、存儲、處理和呈現等技術的快速發展更好地推動了大數據的發展。大數據處理的關鍵技術主要有:大數據采集、大數據預處理、大數據存儲及管理、大數據分析及挖掘、大數據展現和應用(大數據檢索、大數據可視化、大數據應用、大數據安全等)。(如圖3)
1.應用大數據技術開展電子編研工作思路
引入大數據概念,利用科學化方法,深度挖掘檔案價值,對歷史數據進行系統分析,深入開展電子編研研究。對用戶歷史借閱記錄、查詢記錄進行統計,分析用戶的查詢習慣、重點關注內容、借閱頻繁檔案等信息,有針對性地對檔案數據進行電子編研,主動推送給用戶查詢利用。通過對檔案的深度挖掘和編研,實現檔案價值實體化。
2.應用大數據技術開展電子編研工作模式
利用數據分析及挖掘技術,固化編研模式,完成電子編研展示。數據挖掘就是從大量的、未經加工的、隨機產生的、并不精確的實際應用數據中,找到潛在的、從表面發現不了的但又極可能具備利用價值的信息和知識的過程。數據挖掘是網絡信息服務實現智能、個性、精品化過程中不可或缺的手段。可針對目標用戶的信息需求或某項具體任務,系統地收集各種類型的數據,并加以分析、判斷、綜合、歸納,將最終成果以綜述、概述、進展報告、分析報告等形式呈現出來,形成電子編研材料,提供給決策部門和研究人員參考。數據挖掘還可跟蹤記錄用戶的訪問歷史,收集分析用戶的興趣愛好并反映用戶需求的變化與遷移,在用戶下一次訪問時,可以根據過往信息向用戶推薦其有可能感興趣的檔案編研信息,并提供個性化界面;當新發現相關文獻信息時,及時增補進入電子編研相應模塊并告知用戶。

圖3 大數據處理流程
3.應用大數據技術開展電子編研工作成效
檔案工作者可利用文本挖掘,運用關聯、分類、聚類等方法,打破原有的整理體系,從海量檔案信息中按照相關專題進行挖掘、分類、加工、整理和有序化重組,構建特色檔案編研信息庫及各類專題檔案編研信息庫等;為了彌補現有檔案數據庫在前期檔案信息收集過程中的不足,還可利用數據挖掘技術從檔案信息資源中提煉出與專題相關的文獻信息資料,分類、整合后形成知識性、系統性的二次、三次電子編研信息資源,并建立電子編研信息資源主題指南。(如表1)
目前,公司已經對大數據時代下的電子檔案編研工作展開了有意義的探索工作。2014年底“電網建設項目檔案大數據深化應用項目”研究通過國家檔案局科技創新項目驗收并獲得高度肯定。該項目即利用云計算、數據挖掘等先進技術,創新性地將編研成果利用系統進行展示。展示利用平臺將工程檔案涉及的文書、照片、實物等各類檔案信息進行融合,并利用電子圖冊技術進行展現,全面梳理公司系統工程檔案,繪制220 千伏及以上電壓等級變電站及線路工程分布圖,實現工程項目新建、改建、擴建、技改等數據自動關聯,全方位展示工程概況、建設過程、領導關懷、參建單位、榮譽、照片、工程檔案等內容,讓檔案查詢利用更快捷、有效、全面;將項目歷次建設投資、建設工期、建設內容、建設特色等通過時間這條主線貫穿起來,建立變電站投資規模與檔案收集情況對比表、歷年檔案增量圖、線路工程情況對比表、參建單位檔案完成情況表、參建單位檔案評分等統計分析圖表,為公司領導決策提供依據,為規劃、建設、檔案等各部門管理提供信息支撐,實現檔案價值實體化,在檔案信息化領域具有創新示范效果。通過將編研思路的固化,形成了更加便捷和簡單易用的電子編研成果,并通過系統進行在線展示,打破了原有紙質編研成果利用的局限性,開創了檔案開發利用電子編研新模式。

表1
檔案編研的意義就在于利用多種多樣的服務方式,盡可能地滿足利用者的各類需求。大數據時代為我們提供了先進的工具和各種技術手段,在政府支持以及社會檔案意識不斷增強的背景下,我們能夠更加充分地利用總量巨大、內容豐富的檔案信息突破檔案人員自身能力的限制,滿足檔案事業高科技化、專業化的發展趨勢,真正實現檔案信息的“大編研”。檔案信息資源的范圍也不再局限于傳統的紙制文件圖紙等,各種圖像視頻資料都可以被提供利用。檔案編研的信息資源將會得到很大的增長。在掌握充足編研資料后,編研人員就可以利用各種數據分析方法,對海量數據進行分析,找出數據之間的關系,發掘出其潛在的價值。然而我們也必須看到,快速增加的海量信息既是一種可貴的資源,同時也在技術、安全、資金、資源整合等方面給我們的工作帶來了不小的挑戰。在未來的工作中,我們不能放松對檔案信息收集保管的重視,必須調動公司各方面力量,為大數據環境下的電子編研工作奠定堅實的基礎。一方面我們要緊扣企業需求,豐富編研形式,提高檔案人員相關素質,充分利用大數據時代帶給我們的便利。另一方面,我們也要樹立起大數據時代的風險意識,努力探索電子編研工作的新途徑,注意工作過程中的信息安全,避免各種潛在的不利因素。
大數據時代的到來對檔案電子編研工作是一次難得的機遇。抓住這次機遇,將會大大提升檔案編研的水平,充分發揮檔案的社會價值和經濟價值,進而擴大檔案工作的影響力,為檔案事業的進一步發展做出貢獻。