大數據是繼互聯網、云計算之后的又一場信息技術革命,正在對各行各業產生深遠影響。大數據不僅數量巨大,而且類型多樣,具有Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值)4V特征。在大數據時代,數據已經成為繼土地、勞動力、資本、技術之后的第五大生產要素,誰掌握了數據,誰就掌握了發展的主動權。檔案是組織或個人在社會活動中直接形成的原始記錄,具有憑證、查考和保存價值,是一種特殊的信息資源。傳統檔案大多是紙質文件,隨著信息技術的發展,電子文件、數字檔案日益增多。如何適應大數據時代要求,充分挖掘和利用蘊藏在海量檔案中的價值,是擺在檔案工作者面前的一個重大課題。
大數據環境下檔案數據化管理的內涵
檔案數據化管理是指運用大數據理念和技術,對檔案收集、整理、保管、利用的全過程進行數據化改造,將檔案信息轉化為數據資源,提高檔案管理的精細化、智能化水平,更好地服務于決策和社會民生的一種新型管理模式。其核心要義在于三個轉變。一是從事后管理向事前防范、事中控制、事后監督的全過程管理轉變;二是從被動響應向數據感知、智能分析、快速反應的主動服務轉變;三是從單純的檔案保管向知識歸納、深度利用、價值提供的知識服務轉變。
具體而言,大數據環境下的檔案數據化管理主要包含以下幾方面。檔案數據的標準化采集,運用物聯網、移動互聯等新技術手段,開發個性化采集工具,提高檔案數據采集的全面性、準確性和時效性;檔案數據的規范化管理,建立科學的檔案數據分類體系和元數據框架,規范數據的編目、著錄、存儲格式,提高數據質量;檔案數據的關聯化整合,利用大數據技術,打破檔案業務系統間的壁壘,實現跨系統、跨部門、跨地域的數據匯聚融合,形成互聯互通的檔案數據中心;檔案數據的智能化分析,運用數據挖掘、機器學習等技術,對檔案大數據進行分析、預測、優化,提煉知識,發現規律,為科學決策提供參考;檔案數據的立體化利用,創新服務方式,開發特色數據產品,通過網站、App、自助終端、可視化大屏等渠道,為政府和社會提供個性化、精準化的檔案數據服務。
檔案數據化管理是大數據時代檔案工作的新模式,通過數據化管理,可有效破除檔案管理中的數字鴻溝、信息孤島等障礙,實現檔案信息資源的集約管理和高效利用,這不僅是提高檔案管理水平、適應信息化發展大勢的現實需要,更是主動融入國家大數據戰略、服務經濟社會發展的必然選擇。
大數據環境下檔案數據化管理面臨的挑戰
推進檔案管理數據化轉型,是大數據時代賦予檔案工作的嶄新使命,但從目前情況看,檔案數據化管理還面臨諸多亟待破解的難題和挑戰。
檔案數據采集標準不統一,數據質量參差不齊
檔案數據是開展檔案數據化管理的基礎,采集質量的高低直接影響后續管理和利用的效果。當前,檔案數據采集缺乏統一的標準規范,不同系統、不同時期采集的數據,在格式、編碼、屬性等方面差異較大,不同類型載體形成的檔案在數字化處理方面也缺乏統一要求,造成數據質量參差不齊,后續數據整合共享難度大。同時,重要的檔案信息如歷史檔案、紙質檔案等數字化程度不高,信息損失嚴重,海量的非結構化數據如音頻、視頻、圖像等,缺乏規范的元數據描述,數據價值難以發掘。
檔案數據治理體系不健全,數據共享利用難度大
科學完善的數據治理體系是保障檔案數據化管理有序開展的關鍵。然而,目前檔案大數據缺乏頂層設計,數據管理職責分散在不同部門,缺乏統籌協調,檔案數據標準規范不健全,數據質量控制和評估機制不完善。檔案數據共享機制不順暢,部門間信息壁壘突出,“數據煙囪”屢見不鮮,尤其是涉密、敏感檔案數據與開放數據的界限模糊,共享和安全的平衡點難以把握。再加上檔案工作人員整體的數據治理意識和能力不強,數據資產管理觀念淡薄,直接影響檔案數據開發利用的廣度和深度。
檔案數據安全面臨新的風險與挑戰
隨著檔案數字化進程的不斷加快,檔案數據逐漸從線下向線上遷移,由內網向外網延伸,接入點日益增多,攻擊面持續擴大,數據泄露、毀損、篡改等安全風險加劇。部分檔案部門的數據安全意識淡薄、制度不健全、措施不到位,存在賬戶權限混亂使用、日志審計缺失、身份鑒別不嚴、訪問控制不當等問題,內部人為泄密等現象也時有發生。同時,部分檔案數據脫敏不徹底,導致個人隱私、商業秘密等敏感信息存在被二次識別的風險隱患,特別是隨著移動互聯網、物聯網等新技術在檔案領域的滲透應用,數據采集環節的不確定性、開放性增強,黑客攻擊、病毒侵害等安全風險進一步加劇。
檔案數據分析利用水平不高,增值服務能力不足
檔案大數據蘊藏著巨大的應用價值,但目前檔案部門普遍存在數據分析不深入、開發利用不充分的問題。受制于專業數據分析人才匱乏、數據分析工具落后等因素,部分檔案部門難以從海量數據中及時挖掘有價值的信息,數據利用大多局限在檢索查詢層面,知識發現和深度分析能力不足,數據增值服務短板明顯。同時,檔案數據開放共享的廣度和便捷度不夠,社會公眾獲取和利用檔案的渠道不暢,傳統的檔案利用方式單一,服務模式陳舊,檔案的經濟效益和社會效益難以充分釋放。如何創新利用模式,開發有特色的檔案數據產品,提升檔案數據化管理的價值轉化能力,是新形勢下檔案部門面臨的現實課題。
大數據環境下檔案數據化管理的關鍵任務
應對挑戰、破解難題,需要系統謀劃、創新驅動、多管齊下、協同推進,筆者認為,要推動檔案數據化管理邁上新臺階,重點要抓好以下幾方面。
加強頂層設計,健全檔案數據治理體系
當前,大數據時代給傳統檔案管理模式帶來諸多挑戰,檔案工作必須與時俱進,站在戰略和全局的高度,通盤考慮、系統謀劃,科學制訂契合時代要求的發展藍圖和路線圖。這就要求各級檔案部門要把加強頂層設計擺在突出位置,統籌規劃、整體推進,構建權責明晰、運轉協調、制度完備的檔案數據治理體系,為檔案事業長遠發展提供根本遵循。
首要任務是制訂檔案數據治理總體方案,檔案部門要充分借鑒國內外大數據治理的先進經驗,立足本地區、本部門實際,研究制訂切實可行的中長期發展規劃和年度工作計劃。發展規劃要著眼長遠、統攬全局,明確未來一個時期檔案數據治理的指導思想、發展目標、重點任務,特別是要對標數字化發展趨勢,提出推進檔案數據治理數字化轉型的時間表、路線圖,年度計劃要細化量化規劃目標,突出階段性、操作性,為各項任務落地見效提供可靠抓手。規劃和計劃的制訂要堅持開門問策、凝聚共識,充分聽取各方意見建議。組織保障是頂層設計的關鍵一環,建議參照大數據管理的通行做法,成立由分管領導任組長、相關處室負責人參加的檔案數據治理委員會,作為統籌協調、指導推進的領導機構,領導小組要加強統籌謀劃和宏觀指導,及時協調解決工作中的重大問題,理順檔案、政務信息資源等相關部門的職責邊界,建立統一領導、分工協作、齊抓共管的工作機制,要明確牽頭部門,負責檔案數據治理的日常組織實施。
創新采集方式,提升檔案數據質量
檔案數據質量是大數據應用的生命線。當前,不少地方和部門的檔案數據存在著來源單一、質量不高、缺失較多等問題。提升數據質量,既需要創新思路、拓寬渠道,也需要規范流程、強化管理,多措并舉構建全方位、多層次的數據質量保障體系。統籌利用多渠道多方式采集是檔案數據質量提升的重要途徑,傳統檔案數據主要依靠人工采集,耗時費力、效率不高。大數據時代,海量數據無處不在、無時不在,檔案采集要順應時代潮流,借力物聯網、移動互聯、社交媒體等新技術和新渠道,通過智能設備自動采集、網上登記歸集、社會眾包等靈活多樣的方式,最大限度吸納第一手的真實數據。要堅持線上線下一體化采集,將實體檔案數字化采集與網上信息資源歸集相結合,確保檔案資料全覆蓋、無遺漏,為后續數據治理和利用夯實基礎。科技賦能是提高數據采集質量和效率的關鍵所在。當前,檔案數據呈現海量化、多樣化、非結構化的鮮明特點,傳統人工采集方式已難以為繼,迫切需要運用現代科技手段破解瓶頸制約。要緊跟信息技術發展前沿,綜合運用人工智能、語義分析、模式識別等新興技術,開發集成度高、識別準確率高的智能化采集工具,針對性解決檔案圖片、音頻、視頻等特殊載體檔案的采集難題,最大限度減少人為失誤,不斷提高采集的自動化和智能化水平。
完善共享機制,促進檔案數據開放利用
打通數據壁壘,營造數據要素自由流動的制度環境,最大限度地釋放檔案數據紅利,是新時期檔案工作的應有之義。建立健全檔案數據共享機制,制訂本地區、本部門檔案數據共享管理辦法,明確共享原則、共享內容、共享方式、共享程序等,依托政務信息資源共享交換平臺,加快檔案信息系統互聯互通,促進檔案與政務、公安、民政、人社等部門數據的共享交換。豐富檔案數據社會化開放途徑,主動對接“互聯網+政務”服務,將檔案數據服務事項納入網上政務服務事項清單。利用大數據、云計算等技術,建設功能完備的網上檔案大廳,開通網上查檔、掌上檔案等服務,讓檔案數據“走出去”,服務“跑得快”。創新開發檔案數據融合產品,聚焦黨史、軍史以及口述歷史、名人檔案、家譜族譜等專題,開發特色檔案大數據產品。面向智慧城市、智慧交通、智慧旅游等應用場景,開發檔案數據增值服務,提升檔案數據的經濟價值和社會價值,堅持安全與開放并重,分級分類編制檔案開放目錄,細化開放條件,做到應開盡開、應密則密。嚴格落實數據脫敏技術標準規范,防止隱私泄露,全面梳理數據共享開放的風險點,完善防控措施,筑牢數據安全防線。
強化安全防護,保障檔案數據安全
檔案數據是國家重要的戰略資源,其安全事關國家安全和利益,要把數據安全擺在檔案數據化管理的突出位置,強化風險意識,健全制度措施,全面提升檔案數據安全防護能力。健全數據安全管理制度,制訂數據分類分級、數據脫敏、個人信息保護、數據備份等管理制度,規范數據血緣管理,明確崗位數據安全責任,嚴格執行信息系統等級保護制度,常態化開展風險評估、安全審查、檢查整改等工作,加強數據全生命周期安全防護。在數據采集、傳輸、存儲、處理、交換、銷毀等環節嚴密防控,綜合運用身份認證、訪問控制、加密保護等技術手段,構建全流程數據安全防護體系,強化數據基礎設施安全防護,提高數據中心、機房等重要數據存儲與運行場所的物理隔離和訪問控制水平,及時更新防火墻、防病毒等安全軟硬件,加強僵尸網絡監測和網絡攻擊溯源,加大數據泄露監測力度,定期開展數據泄漏檢測,及時堵住各類數據泄露點。完善網絡輿情監測預警機制,加強對涉檔輿情的動態監測和應急處置,強化內部人員安全管理,加強保密宣傳教育,定期開展保密專項培訓,牢固樹立“保密意識人人有,保密責任個個擔”的思想。完善人員保密承諾、上崗資格審查等管理制度,強化內部人員行為監督管控。
深化數據分析,提升檔案數據價值
大數據時代,數據應用是檔案事業發展的生命線,要積極應用大數據分析技術,著眼經濟社會發展和民生保障的迫切需求,加強檔案數據的深度挖掘和價值轉化,促進檔案大數據創新應用。加強檔案大數據人才隊伍建設,大力引進和培養復合型人才,打造一支懂檔案、善技術、會管理的高素質檔案數據分析團隊,通過內部培養與社會化引進相結合,重點加強檔案數據治理、數據分析、數據安全等方面的人才培養。依托高等院校、科研院所等力量,建設檔案大數據聯合實驗室,搭建產學研用協同創新平臺。通過體制機制創新,集聚跨界人才團隊,開展檔案大數據前沿技術和應用模式研究。創新檔案數據分析應用,綜合運用關聯分析、聚類分析、演化分析等數據挖掘技術,深入挖掘檔案大數據的關聯性、周期性和趨勢性特征,為政府決策、企業管理、社會治理提供參考。在應急管理、信用體系、廉政警示教育等領域,創新開展檔案大數據專題分析和可視化呈現,探索建立新型檔案大數據服務模式。積極對接黨政機關、企事業單位需求,建立需求導向的大數據服務機制。在財政、審計、統計等部門建立數據分析服務站,為社會治理、民生服務等提供精準服務。
大數據時代,信息資源已成為推動經濟社會發展的戰略資源,檔案工作要主動順應時代變革,樹立大數據理念,創新工作思路,加快推進檔案管理向數據化轉型升級,為黨和國家事業發展提供優質高效的檔案數據服務。推動檔案數據化管理,需要系統謀劃、深入實踐,久久為功,要著眼長遠,加強頂層設計。以健全的數據治理體系為支撐,以嚴格的標準規范為抓手,分步實施、持續推進。要問需于民、問計于企,加強與各行業各領域的合作,主動融入經濟社會發展,創新開發更多“接地氣”、有溫度的檔案數據服務產品。要堅持安全與開放并重,在保障數據安全的同時,有序推進數據共享開放,讓檔案大數據在陽光下流動,在開放中增值。站在新的歷史起點,面對大數據浪潮的洶涌來襲,檔案部門唯有勇于變革、主動求新、接續奮斗,在數據化管理的道路上久久為功、善作善成,才能不斷開創檔案事業發展新局面,為服務黨和國家工作大局、促進國家治理體系和治理能力現代化作出新的貢獻。
(作者單位:廣州歷康信息科技股份有限公司)