李桂寧
摘 要:大數據的迅速發展正有效地推動著社會各個領域的變革,也為機關人事檔案信息化建設帶來重大機遇。文章分析了當前機關人事檔案建設中的實然現狀,檔案種類呈現單調性、數據形式缺乏結構性,檔案信息欠缺互補性。思考了大數據時代機關人事檔案數據的應然水平,需呈現豐富性、結構性、時效性和價值性。最后提出實現機關人事檔案從實然狀態向應然水平平穩過渡的“三步走”策略。
關鍵詞:檔案信息化;大數據;機關人事檔案
大數據的迅速發展正有效地推動著社會各個領域的變革,人們思考問題的方式、獲取信息的途徑、人際交往的行為傾向等皆因信息技術的介入發生巨大變革,其威力正深刻影響著檔案信息化建設的理念與方式。2016年,國家檔案局頒布了《全國檔案事業發展“十三五”規劃綱要》,首次在文件中提及“大數據”“云計算”等新興技術名詞,彰顯了國家對大數據時代檔案信息化建設的重視。
1 實然:機關人事檔案信息化建設的現狀
當前電子政務工作開展的如火如荼,檔案信息化建設也經歷了探索起步、迅速發展以及深化轉型階段。但是,就現實情況而言,目前機關人事檔案的信息化建設處于尚處于初步探索階段,建設水平良莠不齊。通過文獻分析與工作實際,發現機關人事檔案信息化建設中主要存在三大問題:
1)檔案種類存在單調性。當前機關人事檔案存在內容陳舊,結構單一的現象。人事檔案往往分為十類,以個人資料、政治背景為主,主要反映個人生平事跡等基本情況,有關個人考察考核、表彰獎勵、學業工作成就等材料較少且承載信息有限,難以反映用戶整體的工作狀態。這種千人一面的檔案材料不足以反映出用戶的人生履歷,缺乏全面性。大多機關單位人事檔案仍是紙質形式,依舊以人工操作為主,這種檔案管理形式往往效率低下,且難以實時增補檔案信息,缺乏動態性。
2)檔案數據忽視結構性。已有的機關人事電子檔案,往往采用OCR識別技術,將紙質版檔案轉化為電子檔案,存檔形式往往是非結構化的數據形式。因此這種直接掃描得到的電子檔案本質上是無序的,雖然能夠進行有序化整理,但往往沿襲傳統人事檔案編排方式,難以彰顯信息化的優勢。另外,這種形式的電子檔案由于沒有借助結構化的“實體—聯系”(E-R)數據庫模型,實際應用時,難以分析人事檔案之間的內在聯系,導致數據孤立形成信息孤島的現象。
3)檔案信息缺乏互補性。一些機關單位已經初步執行檔案信息化管理,從應用途徑與方式來看,大多數單位往往將電子檔案看作紙質檔案的拓展形式,并非將其與檔案管理平臺建立關聯,實現優勢互補,對現有檔案進行更新與增減時,檔案管理人員往往不僅需要對紙質檔案進行修改,也要對電子檔案進行完善。長此以往,在檔案管理工作中存在大量重復且冗余的信息,無形中延長了工作時間并消耗了大量精力,檔案管理人員對網絡管理平臺中的檔案缺乏分析與利用,導致網絡管理平臺成為孤立的空間,優勢難以體現。
2 應然:大數據支持下機關人事檔案信息化建設的追求
1)大數據。大數據最早出現于1997年,NASA兩名研究員針對飛機周圍的模擬氣流無法處理且可視化呈現,他們認為這種數據集相當大,對主內存和磁盤均產生挑戰的問題為大數據,主要應用領域涉及數據挖掘和數據分析。大數據的類型一般有非結構化、半結構化與結構化三種形式。非結構化的數據是那些沒有固定存儲格式的數據,如以pdf、word形成存在。半結構化的數據是經過一定加工處理的數據,如以XML、HTML形式存在。結構化的數據是經過處理、具備一定結構,并可進行存儲、處理及提取的數據,如數據庫中的數據。
2)大數據為機關人事檔案信息化建設提供新思路。檔案信息化是指檔案在不改變其實質的情況下,其結構與存在方式作符合信息原則的轉變。也就是說,不改變機關人事檔案內容信息,只改變檔案存儲的載體與結構,甚至在大數據技術的支持下,能夠借助信息化的手段,挖掘數據之間的內在關聯,并進一步預測其未來發展趨勢。而機關人事檔案信息是信息資源中的一部分,具有一般信息所具備的特征,因此借助大數據視角,審視檔案信息化建設也是有跡可循的。首先,機關人事檔案數據應體現豐富性,大數據能夠容納百萬兆字節甚至千兆兆字節的數據,解決數字化檔案資源難以存儲的困難;其次,機關人事檔案數據應體現多樣性,當前機關單位的數字化人事檔案往往是由紙質檔案掃描而來,采用pdf、word、excel等方式存儲而來的非結構化數據,形式較為單一。在大數據背景下,可支持記錄的數據類型多種多樣;再次,機關人事檔案數據應展現時效性,大數據時代的典型特征是對數據及時快速的處理,它能夠將檔案分門別類進行存儲,并設置相關索引,從而能夠實時查詢并更新數據,體現出數據處理的高效性、時效性和價值性。
3 可然:實現實然狀態向應然水平平穩過渡的策略
大數據在機關人事檔案信息化建設過程中,一方面需要考慮如何借助豐富的信息化手段,增補已有數據,并不斷豐富數據類型,拓寬數據采集的方式與途徑。另一方面,需要思考如何高效處理數據,挖掘檔案數據、用戶數據的價值,并分析數據之間的內在關聯,以預測趨勢走向。本文認為,從機關人事檔案信息化建設的實然狀態向應然水平轉向的過程,并非一蹴而就,而是逐層遞進的。因此,提出大數據背景下,機關人事檔案信息化建設的“三步走” 策略,實現從實然狀態向應然水平的平穩過渡。
1)全方位的機關人事檔案數據采集與處理,著力提升檔案管理的廣度。明確數據容量的豐富性和數據種類的多樣性,是機關人事檔案數據采集的前提,有意識的采集記錄用戶成長發展的音視頻檔案,可以豐富和完善已有的檔案類型,全方位、多角度記錄機關人員成長軌跡,實現機關人事檔案的全文著錄、數字化文件歸檔、數據庫構建以及標簽索引的建立等工作,幫助檔案管理人員通過普通檢索,高效查閱到不同人事檔案。
2)多層次的機關人事檔案數據挖掘與分析,著力提升檔案管理的深度。大數據關注的更多的是人,而非產生的數據,數據是為人的發展與進步所服務的,其內在價值在于數據挖掘與數據分析。對紙質檔案數據化后,容易出現信息超載現象,對檔案管理人員產生信息負荷。因此需要對人事檔案數據進行挖掘與分析,實現準確洞察與精準決策。數據挖掘與分析是指利用統計學、機器學習等手段與方式,對機關人事檔案數據進行處理與分析,挖掘用戶信息。通過對檔案管理人員的檢索記錄與瀏覽歷史進行挖掘,發現管理人員點擊率較高的檔案目錄并進行數字化。分析檔案管理人員檢索時選用的檢索詞,完善數據庫中索引關鍵詞,以提高檢索準確性。
3)個性化的機關人事檔案數據檢索與服務,著力提升檔案管理的效度。基于前兩步策略,可實現人事檔案資源的數據存儲、挖掘與分析,而第三步策略則是在已有的基礎上,達成智能化檢索與個性化推薦的目標。與普通檢索方式相比,個性化推薦系統能夠根據挖掘出來的檢索偏好數據,通過一定的優化算法,將符合檔案管理者檢索需求的人事檔案,個性化的推薦給檔案管理者,并引導檔案管理者發現自己的需求,從而極大的優化搜索流程,提高檢索效率。
總而言之,大數據技術為機關人事檔案的信息化建設提供多種可能性,數據的采集與結構化的存儲使得檔案的高效檢索成為可能。數據挖掘與數據分析技術能夠深入挖掘數據背后暗含之義,實現數據的增值。而檔案的個性化推送與服務功能,真正實現“以檔案工作者為中心”的理念,基于不同工作者的檢索差異提供個性化的推薦服務。三步走策略層層推進,有效幫助機關人事檔案信息化建設實現從實然狀態向應然水平的平穩過渡。
參考文獻
[1]張軍.試論“大數據”環境下檔案人應有的思維方式[J].檔案管理,2014(03):50-51.
[2]田偉,韓海濤.大數據時代檔案館服務創新研究[J].檔案學研究,2014(05):64-67.