李愛華
摘? 要:大數據時代已經到了,正在影響各個行業,檔案也不例外,高校檔案如何在大數據時代進行管理創新,將檔案中蘊含的數據價值凸顯出來,助力高校各項工作的開展成為高校檔案人面臨的挑戰。
關鍵詞:大數據;檔案管理;數據挖掘
高校檔案是高校在日常管理、招生教學、基礎建設、科學研究等活動中直接形成的對社會、學校和學生具有保存價值的歷史記錄;是對高校辦學歷史、辦學經驗、辦學成果全面真實的記錄;是反映高校黨政管理、培養人才、科學研究、服務社會、對外交流等各項工作的綜合記錄,從時間維度看,具有非常大的數據價值。
大數據時代,伴隨著高校智慧校園建設不斷推進,高校檔案的利用服務需求日益增長、利用方式日趨豐富,原有的管理模式已經不能滿足需求,迫切需要轉變管理機制、創新管理模式,將高校檔案中蘊含的數據價值凸顯出來,服務支撐高校各項事業的發展。
1 高校檔案電子化管理是必然性
1.1 檔案信息化是大勢所趨。近年來,網絡信息技術高速發展,我國檔案信息化的進程也不斷加快。據經濟日報報道,中國第一歷史檔案館、中國第二歷史檔案館數字化工作成效顯著,各級檔案館數字檔案資源的比例均有大幅提高,全國數字化檔案資源達2243萬GB。[1]
此次新的檔案法修訂草案新增“檔案信息化建設”一章,其中第28條規定,各級人民政府應當將檔案信息化納入信息化發展規劃,保障電子檔案、傳統載體檔案數字化成果等檔案數字資源的安全保存和有效利用。同時,修訂草案第30條還明確,電子檔案應當符合來源可靠、程序規范、要素合規的要求,不得僅因為電子檔案采用電子形式而否認其法律效力。具有法律效力的電子檔案可以以電子形式作為憑證使用。
1.2 高校各項工作要求驅使。目前,教育部對高校實行“五年一輪”的普通高等學校教學工作水平評估制度。在教育部對高校的評估指標體系中,每個評估點都與檔案密切相關,都需要規范完整的檔案材料支撐,在教學評估中,檔案發揮了極其重要的作用。
近年來,黨中央高度重視巡視巡察工作,紀委監察部門對高校的巡視巡察工作已經成為常態。在每次的巡視巡察中巡視組都需要查閱大量的檔案資料,比如黨政管理的文書檔案、干部職工人事檔案、財務會計檔案等。
校史展覽、學歷認證、教育部教學評估、紀委監察部門的巡視巡察等對檔案工作提出了高的要求,要求各類檔案收集全面、整理規范、查詢利用方便快捷,給傳統的檔案工作機制帶來挑戰,迫使檔案部門要將檔案進行數字化來適應高校各項工作開展要求。
1.3 智慧校園建設推動。進入21世紀以來,特別是近幾年,信息技術迅速發展,各種技術應用層出不窮;教育信息化、智慧化建設正如火如荼進行,教育部《2018年教育信息化和網絡安全工作要點》中明確指出要設立“智慧教育示范區”、引導各級學校開展數字校園和智慧校園建設與應用。河南廣播電視大學也在積極開展智慧校園建設與應用探索,檔案信息化建設作為智慧校園建設的一部分,得到前所未有的重視。借助智慧校園信息化建設,電子檔案管理機制有了技術保障。
1.4 各項關鍵技術的成熟應用。目前包括光學字符識別技術、自然語言處理、數據挖掘與分析技術等各項關鍵技術已經成熟。
高校的檔案數字化工作利用OCR識別系統,可以將紙質檔案掃描后的圖像檔案進行一個轉換,使圖像檔案內的圖片繼續保存,有表格,則表格內資料及圖像內的文字,一律變成計算機文字,識別出的文字可再使用及分析形成可編輯的電子文檔格式,減少因鍵盤輸入花費的人力與時間,從而提高工作效率。
自然語言指的是日常使用的語言,如漢語、英語和日語等。而自然語言處理(Natural Language Processing,NLP)則是指運用計算機技術對自然語言進行處理、理解并運用,它是人工智能和語言學的分支學科。作為人工智能領域研究的重要方向之一,自然語言處理的主要目的是通過自然語言的形式實現人和計算機之間的交互。將NLP技術應用到高校電子檔案的管理之中,將會極大地提升檔案查詢利用的效率和效果。
大數據挖掘技術的基礎應用功能是挖掘與分析數據信息。高校檔案信息的來源渠道非常豐富,門禁、監控、食堂以及圖書館等都是信息來源;數據內容十分冗雜繁復,比如學生學籍信息、教務信息、網絡瀏覽信息、校園采購、多媒體教室使用、校園出入以及實時監控等。大數據挖掘技術可以從上述數據信息中挖掘出關聯性較強的數據,將其分別轉化成獨特編碼,聯系大的信息規整為一類,例如某同學的校園出入記錄、食堂用餐消費、圖書館借閱信息等,便于校園管理者查詢,可以有效降低學校工作者和智慧系統的負擔。
利用大數據挖掘技術可以對檔案中的價值數據進行挖掘,助力高校各項業務工作的開展,為校領導的有關決策提供數據支撐。
2 高校電子檔案管理創新
2.1 紙質檔案數字化及電子文件歸檔。高校的檔案數字化工作的重點通常是紙質檔案的數字化工作,由紙質檔案而轉換形成的各種格式的電子文檔也成為數量最多、內容最廣泛、最為重要的數字檔案資源。一般高校紙質檔案的數字化工作分為幾個步驟:檔案整理、檔案掃描、圖像處理、圖像存儲、目錄建庫、數據掛接。很多高校的檔案管理部門通過以上六個步驟基本實現了紙質檔案的數字化,建立起了數字檔案目錄數據庫,由于與數字檔案目錄數據庫相關聯的數據格式為圖片格式,所以有的高校除了提供數字檔案目錄查詢的功能外,又提供了縮略圖查詢功能。
可以將高校檔案管理系統與高校辦公自動化系統及其他業務系統如教務管理系統等進行對接,在線實時進行電子文件的歸檔工作,既提升了檔案收集的效率,同時也降低了檔案數字化的工作量。
2.2 檔案數據化及數據清洗。在高校檔案管理工作中,需要以大數據為抓手,使傳統意義上的人工化、扁平化的管理模式有效改變,確保檔案管理工作從“數字化”向“數據化”的轉化。
在實際的檔案管理過程中,需要把僵化死板的檔案掃描全文和目錄,轉變成活靈活現的大數據檔案,從根本上實現檔案的數據化管理。[2]針對檔案全文的著錄,要有效進行數據化加工,針對文本和圖像中的數字內容要進行數據化的識別、分類、著錄和標引,通過這樣的方法,才能真正意義上提供更優質的檔案信息服務,使高校更好地利用檢索詞檢索到與之相對應的檔案信息內容。
高校在前期信息化建設中,搭建了數字化校園基礎平臺,完成了部分資源的共享互聯工作。隨著業務部門應用系統的增加,以及對信息化需求的不斷擴張,大量教學、科研、人事、行政、后勤管理等方面的業務數據資源日益積累下來。在保證學校原有IT資源的前提下,高校需要對這些資源進行充分合理的利用,通過數據清洗的手段,采用全面有效的、權威準確的信息數據,形成服務資源,分類型存儲在數據庫中,并對這些數據進行挖掘和分析,為高校檔案管理提供數據支持。
2.3 檔案數據挖掘與分析。數據挖掘分析在高校檔案管理中,主要應用于檔案分類、檔案收集、檔案保留,以及為檔案部門提供服務。高校檔案數據的挖掘與分析不僅可以提高高校檔案管理的效率、增強檔案管理的安全性、推動高校檔案管理體系的完善,還有利于提高高校檔案信息知識轉化能力、檔案信息知識服務水平,推動智慧校園信息資源建設等。
2.4 數據分析展現,為決策提供支撐服務。在大數據時代,高校比以往任何時候都面臨著更為復雜的生存環境,高校檔案數據分析可以對建校以來的數據進行挖掘分析,為高校的各項業務開展提供業務決策支撐。[3]可視化的數據分析展現結果可以很清晰地為決策提供服務支撐。
3 小結
在大數據時代,變化是不變的趨勢,創新檔案管理機制,以檔案信息化建設為依托,轉變服務理念,從傳統的館藏中心模式向服務中心模式轉變向業務決策支撐轉變,變“被動”為“主動”,緊密結合學校各項實際應用需求提供數據支撐服務,提升檔案工作在高校各項工作中的重要性,充分發揮檔案的數據價值,更好地服務于高校的各項工作開展。
參考文獻:
[1]牛力.數字時代檔案創新開發利用的幾點思考[C].中國檔案學會、中國文獻影像技術協會.2019年海峽兩岸檔案暨縮微學術交流會論文集.中國檔案學會、中國文獻影像技術協會:中國檔案學會,2019:53-57.
[2]劉永,龐宇飛.檔案數據化之原生數據源全鏈式管理分析[J].檔案管理,2018(05):11-18.
[3]趙旭,辛玉明.大數據背景下高校檔案信息化管理探析[J].蘭臺內外,2017(4).
(作者單位:河南廣播電視大學?? 來稿日期:2019-11-18)